Login Sign Up
Advert
Your ad spot
Reserve this exclusive slot for the selected period.
Buy advertising →
Telegram community logo - Eugene K - the BA🇺🇦
Added 06 Jan 2025

Eugene K - the BA🇺🇦

@eugenekba
Number of subscribers: 661
Photos: 180
Videos: 11
Links: 192
Description:
Анонімний телеграм-канал Євгена Клюкіна. Робочі моменти, ідеї, роздуми, ексклюзиви, вільне спілкування. Адмін: @eugene27K Інфо: https://eugenekba.lovable.app/
Source

Eugene K - the BA🇺🇦 | Як народжується “асистент”: шлях від базової моделі до ChatGPT 🤖Навіть...

Telegram community logo - Eugene K - the BA🇺🇦 Eugene K - the BA🇺🇦 @eugenekba
251 Views/Reach 2025-06-05 05:08 Message №282
Як народжується “асистент”: шлях від базової моделі до ChatGPT 🤖Навіть найпотужніша LLM після тренування — це просто базова модель, яка вміє “доповнювати” текст. Вона може продовжити будь-яку послідовність токенів, але ще не розуміє, як ввічливо відповідати, допомагати, відмовляти чи вести діалог.⠀Щоб із “чернетки” зробити справжнього асистента, запускають post-training — донавчання моделі на спеціальних діалогах. На цьому етапі залучаються люди — лейблери (human labelers) 🧑‍💻. Вони створюють приклади “ідеальних” відповідей на питання, пишуть інструкції та моделюють багатокрокові діалоги (людина питає — асистент відповідає). Саме завдяки цим “еталонним” розмовам модель вчиться бути не просто автозаповнювачем, а дійсно корисним помічником 🤝.Як саме “програмують” поведінку мовних моделей?Цей процес нагадує навчання за зразком 📚. Люди створюють SFT (Supervised Fine-Tuning) датасети — це величезні набори діалогів, де кожна відповідь асистента ретельно підібрана експертами. Якість тут критично важлива: лейблери не лише придумують хороші відповіді, а й отримують докладні інструкції, як саме має поводитись майбутній асистент — бути коректним, корисним, безпечним і не розповсюджувати шкідливу чи неправдиву інформацію.Наприклад, одним із завдань для лейблерів може бути створення ось таких пар “запитання — відповідь”:— “Назви топ-5 визначних місць Парижа”— “1. Ейфелева вежа… 2. Лувр…”Або ще складніше: “Поясни економічний термін простою мовою для школяра”.Лейблер спочатку формулює якісний приклад відповіді, а потім перевіряє, чи асистент дотримується принципів допомоги, безпечності та правдивості.І от, коли ви ставите питання в чаті, відповідь генерується не “магічною AI-сутністю”, а є статистичною імітацією колективного досвіду тих експертів і лейблерів, які створювали датасети й писали інструкції. Модель прогнозує, яку відповідь дав би “ідеальний” асистент у такій ситуації, спираючись на мільйони зразків і настанов.🫂🤖⠀Отже, такі моделі як ChatGPT — це не таємничий розум, а складна “статистична симуляція” роботи досвідчених людей, які програмують стиль, поведінку та корисність своїми текстами та прикладами .#AIforBA