Вхід Реєстрація
Реклама
Ваше рекламне місце
Забронюйте цей слот без конкуренції на обраний період.
Купити рекламу →
Логотип телеграм спільноти - Mockingbird Shares
Додано 01 січ 2022

Mockingbird Shares

@mockingbird_shares
Кількість підписників: 124
Фото: 1,230
Відео: 71
Посилання: 1,020
Опис:
Ділюся посиланнями. Контент не генерую. Тематика: ML/AI/LLM, висєри на мера Києва, петиції, навколо наукова/освітня сфера Зв'язок: пишіть в коменти Шітпост: @mockingbird_shitposts Твітор (вмер): @007morf Тепер вже офіційні коменти: @mockingbird_chat
Джерело

Mockingbird Shares | GEPA: новий "еволюційний" оптимізатор підказок, який обходить RL у вла...

Логотип телеграм спільноти - Mockingbird Shares Mockingbird Shares @mockingbird_shares
25 Охват/переглядів 2025-08-14 09:02 Повідомлення №2206
GEPA: новий "еволюційний" оптимізатор підказок, який обходить RL у власній грі 🫣Дослідники з Berkeley, Stanford, MIT та Databricks представили GEPA – алгоритм Reflective Prompt Evolution, який оптимізує LLM-системи не через важкі тисячі rollouts у стилі Reinforcement Learning, а за допомогою “мовних роздумів” і генетичної еволюції підказок.🔍 Як це працює:GEPA дивиться на роботу всієї системи (chain-of-thought, виклики інструментів, помилки), викликає цю ж LLM та за допомогою неї описує, що пішло не так, звичайною людською мовою.Потім пропонує нову версію промпту, комбінує кращі рішення з різних спроб та при цьому всьому зберігає межу Pareto - набір промптів, які найкраще підходять принаймні для одного навчального прикладу.І як результат – швидке навчання з мінімумом запусків.👉🏻 З цікавого те, що на чотирьох бенчмарках (HotpotQA, IFBench, HoVer, PUPA) GEPA обійшов GRPO до +10.1% точності, використавши до 35× менше повних проходів системи.👉🏻 Проти MIPROv2 – +14% у середньому, і ще й промпти у 9 разів коротші.👉🏻 Показав потенціал і в генерації високопродуктивного коду для GPU та NPU.GEPA виглядає як must-have для оптимізації агентів, коли рахунок іде на сотні ітерацій виконання, а не сотні тисяч. Якщо так піде далі – RL може залишитися “олдскулом” для дуже специфічних кейсів 👀