Fuente
Data Science UA | Абсурдний fun fact, який багато хто з нас міг прогледіти в стрічці: Ch...
308 Vistas/Alcance
2026-06-12 09:40
Mensaje №1813
Абсурдний fun fact, який багато хто з нас міг прогледіти в стрічці: ChatGPT спіймали на одержимості... гоблінамиOpenAI всерйоз взялися це виправляти і згодом навіть викотили статтю з поясненнями.✍️ Якщо коротко, історія почалася ще з запуском GPT-5.1. Юзери повідомляли про відповіді з повторюваними метафорами за участю гоблінів, гремлінів, огрів та інших фентезійних істот.Після релізу GPT-5.4 гоблінське загострення прогресувало – команда почала "розслідування" й виявила, що більшість згадок генерувалася Nerdy особистістю моделі.Причину виявили під час перевірки й порівняння результатів RL. "Грайливі" відповіді, в яких фігурували істоти, заохочувалися більше. Згодом їх використали для SFT, що спричинило часткову міграцію гоблінів навіть у відповіді, не прив'язані до тої чи іншої особистості.Ось так локальний reward signal може несподівано впливати на поведінку всієї моделі.Врешті-решт OpenAI прописали developer-промпт, що пригнічує використання подібної лексики для GPT-5.5 у Codex.🧌 А для тих, хто все ж хоче лишити гоблінів на свободі в Codex лишили команду:instructions=$(mktemp /tmp/gpt-5.5-instructions.XXXXXX) && \jq -r '.models[] | select(.slug=="gpt-5.5") | .base_instructions' \~/.codex/models_cache.json | \grep -vi 'goblins' > "$instructions" && \codex -m gpt-5.5 -c "model_instructions_file=\"$instructions\""