Login Sign Up
Advert
Your ad spot
Reserve this exclusive slot for the selected period.
Buy advertising →
Telegram community logo - IT Mindset
Added 06 Jan 2025

IT Mindset

@itmindset
Number of subscribers: 135
Photos: 42
Videos: 6
Links: 195
Description:
Персональний канал Ігоря Томича про айті та інше
Source

IT Mindset | Вийшов дуже цікавий репорт від Apple про мислення в Large Reasonins Mo...

Telegram community logo - IT Mindset IT Mindset @itmindset
190 Views/Reach 2025-07-04 13:31 Message №238
Вийшов дуже цікавий репорт від Apple про мислення в Large Reasonins Models https://ml-site.cdn-apple.com/papers/the-illusion-of-thinking.pdfАвтори ставлять під сумнів традиційні бенчмарки для оцінки мислення — такі як математика і програмування — стверджуючи, що вони можуть містити “забруднення” даних і не відображати справжніх процесів мислення, тому для експериментів використовуються моделі великих мов (LRM), що вирішують процедурні головоломки (наприклад, “Вежа з Ханою”) з контрольованою складністю.Вони виділяють три режими продуктивності: прості задачі, де моделі без справжнього “мислення” іноді перевершують LRMs; середньої складності, де перевага на боці LRMs; і високої складності, де обидва типи моделей втрачають точність до нуля.Дослідники виявили, що LRMs витрачають більше токенів (тобто демонструють більше “мислення”) у міру зростання складності, але лише до певного рівня — після чого, незважаючи на ще доступний ліміт, вони ніби “здаються”.Навіть якщо надати моделям чіткі алгоритми для вирішення цих головоломок, LRMs не можуть їх надійно застосувати, що вказує на обмеження у систематичному мисленні та здатності до узагальнення.Висновок дослідження полягає в тому, що поточні механізми “міркування” в LRMs насамперед віддзеркалюють складне розпізнавання узорів та паттернів, а не справжнє, масштабоване мислення — те, що здається “думанням”, насправді може бути лише ілюзією.