Iniciar sesión Registro
Anuncios
Tu espacio publicitario
Reserva este slot exclusivo para el periodo elegido.
Comprar publicidad →
Logotipo de la comunidad de telegram - Ооо нейромережеве🐱
Añadido 14 jul. 2024

Ооо нейромережеве🐱

@oooneuro
Número de suscriptores: 25 355
Fotos: 3,670
Videos: 2,450
Enlaces: 4,090
Descripción:
COFFEE AI MEOW REPEAT По рекламі: @ad_kitty Інші питання: @neurokit Посилання для друзів: https://t.me/+bXCkQ_uagrozYzVi Навігація за хештегами: https://t.me/c/1591600888/2976 Монобаза: https://base.monobank.ua/EhJBDcb6zd52Ni
Fuente

Ооо нейромережеве🐱 | Я не боюся LLM, яка знає вирішення 10 000 задач. Я боюся LLM, які вирі...

Logotipo de la comunidad de telegram - Ооо нейромережеве🤖 Ооо нейромережеве🐱 @oooneuro
2 760 Vistas/Alcance 2025-11-30 21:02 Mensaje №6310
Я не боюся LLM, яка знає вирішення 10 000 задач. Я боюся LLM, які вирішувати одну задачу 10 000 разів. © я тільки но придумавПобачив серед фіналістів NeurIPS цікаву статтю, яка обережно натякає на те, що AGI з сучасними технологіями ми не отримаємо ☕️Що саме вони зробили:🪙 Взяли для тесту «думаючі» моделі, натреновані технікою RLVR (Reinforcement Learning with Verifiable Rewards) — це коли модель отримує винагороду за правильну відповідь і аж ціле нічого за неправильну відповідь. Зараз таким чином готують майже всі топові моделі;🪙 І порівняли їх з базовими версіями цих самих моделей, але вже без «думалки». Наприклад, DeepSeek R1 та DeepSeek V3;🪙 Порівнювали на задачках з математики, написання коду та інших різних точних наук;🪙 Досліджували два фактори: як багато завдань модель може вирішити з першої спроби і як багато завдань модель може вирішити взагалі. Для останнього тесту моделям давали просто божевільну кількість спроб на вирішення однієї задачки — 256;🪙 Результат несподіваний: чим більше завдань модель розв'язує з першої спроби, тим менше завдань вона може розв'язати взагалі;🪙 Базові моделі (типу DeepSeek V3) постійно пробували нові шляхи до вирішення й з 200+ спроби все ж знаходили правильниq підхід. «Думаючі» (типу DeepSeek R1) постійно обирали одні й ті самі методи розв'язання, за які отримували винагороду на RLVR. Навіть якщо ці методи не працюють 😁🪙 Якщо ж «думаюча» модель виходить за межі своїх патернів, то всі ідеї та формули здаються їй сміттям. Навіть якщо вони ведуть до правильної відповіді.Ну типу так, хочеться мати LLM, яка може з першої спроби обчислити квадратний корінь зі 125, але чи знайде така модель ліки він раку?ооо нейромережеве | Монобаза