Вхід Реєстрація
Реклама
Ваше рекламне місце
Забронюйте цей слот без конкуренції на обраний період.
Купити рекламу →
Логотип телеграм спільноти - Data Science UA
Додано 14 лип 2024

Data Science UA

@datascienceua
Кількість підписників: 1 936
Фото: 852
Відео: 36
Посилання: 1,320
Опис:
🌏 Ми одне з найбільших Data Science ком'юніті Європи. 🔹ІT Рекрутинг 🔹AI Тренінги 🔹AI Івенти 👉🏻 Зв'язатися з нами: @DataScienceUA_company
Джерело

Data Science UA | Абсурдний fun fact, який багато хто з нас міг прогледіти в стрічці: Ch...

Логотип телеграм спільноти - Data Science UA Data Science UA @datascienceua
308 Охват/переглядів 2026-06-12 09:40 Повідомлення №1813
Абсурдний fun fact, який багато хто з нас міг прогледіти в стрічці: ChatGPT спіймали на одержимості... гоблінамиOpenAI всерйоз взялися це виправляти і згодом навіть викотили статтю з поясненнями.✍️ Якщо коротко, історія почалася ще з запуском GPT-5.1. Юзери повідомляли про відповіді з повторюваними метафорами за участю гоблінів, гремлінів, огрів та інших фентезійних істот.Після релізу GPT-5.4 гоблінське загострення прогресувало – команда почала "розслідування" й виявила, що більшість згадок генерувалася Nerdy особистістю моделі.Причину виявили під час перевірки й порівняння результатів RL. "Грайливі" відповіді, в яких фігурували істоти, заохочувалися більше. Згодом їх використали для SFT, що спричинило часткову міграцію гоблінів навіть у відповіді, не прив'язані до тої чи іншої особистості.Ось так локальний reward signal може несподівано впливати на поведінку всієї моделі.Врешті-решт OpenAI прописали developer-промпт, що пригнічує використання подібної лексики для GPT-5.5 у Codex.🧌 А для тих, хто все ж хоче лишити гоблінів на свободі в Codex лишили команду:instructions=$(mktemp /tmp/gpt-5.5-instructions.XXXXXX) && \jq -r '.models[] | select(.slug=="gpt-5.5") | .base_instructions' \~/.codex/models_cache.json | \grep -vi 'goblins' > "$instructions" && \codex -m gpt-5.5 -c "model_instructions_file=\"$instructions\""