Iniciar sesión Registro
Anuncios
Tu espacio publicitario
Reserva este slot exclusivo para el periodo elegido.
Comprar publicidad →
Logotipo de la comunidad de telegram - IT Mindset
Añadido 06 ene. 2025

IT Mindset

@itmindset
Número de suscriptores: 135
Fotos: 42
Videos: 6
Enlaces: 195
Descripción:
Персональний канал Ігоря Томича про айті та інше
Fuente

IT Mindset | Вийшов дуже цікавий репорт від Apple про мислення в Large Reasonins Mo...

Logotipo de la comunidad de telegram - IT Mindset IT Mindset @itmindset
190 Vistas/Alcance 2025-07-04 13:31 Mensaje №238
Вийшов дуже цікавий репорт від Apple про мислення в Large Reasonins Models https://ml-site.cdn-apple.com/papers/the-illusion-of-thinking.pdfАвтори ставлять під сумнів традиційні бенчмарки для оцінки мислення — такі як математика і програмування — стверджуючи, що вони можуть містити “забруднення” даних і не відображати справжніх процесів мислення, тому для експериментів використовуються моделі великих мов (LRM), що вирішують процедурні головоломки (наприклад, “Вежа з Ханою”) з контрольованою складністю.Вони виділяють три режими продуктивності: прості задачі, де моделі без справжнього “мислення” іноді перевершують LRMs; середньої складності, де перевага на боці LRMs; і високої складності, де обидва типи моделей втрачають точність до нуля.Дослідники виявили, що LRMs витрачають більше токенів (тобто демонструють більше “мислення”) у міру зростання складності, але лише до певного рівня — після чого, незважаючи на ще доступний ліміт, вони ніби “здаються”.Навіть якщо надати моделям чіткі алгоритми для вирішення цих головоломок, LRMs не можуть їх надійно застосувати, що вказує на обмеження у систематичному мисленні та здатності до узагальнення.Висновок дослідження полягає в тому, що поточні механізми “міркування” в LRMs насамперед віддзеркалюють складне розпізнавання узорів та паттернів, а не справжнє, масштабоване мислення — те, що здається “думанням”, насправді може бути лише ілюзією.