Вхід Реєстрація
Реклама
Ваше рекламне місце
Забронюйте цей слот без конкуренції на обраний період.
Купити рекламу →
Логотип телеграм спільноти - IT Mindset
Додано 06 січ 2025

IT Mindset

@itmindset
Кількість підписників: 135
Фото: 42
Відео: 6
Посилання: 195
Опис:
Персональний канал Ігоря Томича про айті та інше
Джерело

IT Mindset | Вийшов дуже цікавий репорт від Apple про мислення в Large Reasonins Mo...

Логотип телеграм спільноти - IT Mindset IT Mindset @itmindset
190 Охват/переглядів 2025-07-04 13:31 Повідомлення №238
Вийшов дуже цікавий репорт від Apple про мислення в Large Reasonins Models https://ml-site.cdn-apple.com/papers/the-illusion-of-thinking.pdfАвтори ставлять під сумнів традиційні бенчмарки для оцінки мислення — такі як математика і програмування — стверджуючи, що вони можуть містити “забруднення” даних і не відображати справжніх процесів мислення, тому для експериментів використовуються моделі великих мов (LRM), що вирішують процедурні головоломки (наприклад, “Вежа з Ханою”) з контрольованою складністю.Вони виділяють три режими продуктивності: прості задачі, де моделі без справжнього “мислення” іноді перевершують LRMs; середньої складності, де перевага на боці LRMs; і високої складності, де обидва типи моделей втрачають точність до нуля.Дослідники виявили, що LRMs витрачають більше токенів (тобто демонструють більше “мислення”) у міру зростання складності, але лише до певного рівня — після чого, незважаючи на ще доступний ліміт, вони ніби “здаються”.Навіть якщо надати моделям чіткі алгоритми для вирішення цих головоломок, LRMs не можуть їх надійно застосувати, що вказує на обмеження у систематичному мисленні та здатності до узагальнення.Висновок дослідження полягає в тому, що поточні механізми “міркування” в LRMs насамперед віддзеркалюють складне розпізнавання узорів та паттернів, а не справжнє, масштабоване мислення — те, що здається “думанням”, насправді може бути лише ілюзією.