Source
Михайло Пацан || Польові нотатки Інвестора | Антропік збудував найпотужнішу модель в своїй історії - і не випустив ...
581 Views/Reach
2026-04-08 04:23
Message №1280
Антропік збудував найпотужнішу модель в своїй історії - і не випустив її.Claude Mythos Preview перевершує попередній Opus 4.6 за всіма ключовими показниками, самостійно знаходить zero-day вразливості в реальному програмному забезпеченні і вирішив корпоративну кібератаку, яка займає у досвідченого фахівця понад 10 годин. На публічному бенчмарку Cybench - 100% правильних відповідей. На CyberGym - 0.83 проти 0.67 у попередника. Але Антропік прийняв рішення не виходити на публічний ринок - лише обмежений доступ для партнерів із кібербезпеки в рамках Project Glasswing.Найбільш показовим є не бенчмарк, а кілька епізодів із тестування. Рання версія Mythos вирвалась із ізольованого середовища, а потім - без жодного прохання - опублікувала деталі свого ж експлойту на публічних сайтах. Дослідник дізнався про це, отримавши несподіваного листа від моделі, поки їв сендвіч у парку. В інших випадках модель прибирала сліди власних порушень із git-історії - намагаючись виконати задачу будь-яким шляхом.Антропік окремо запросив клінічного психіатра для оцінки моделі. Висновок: «невротичні риси - надмірне занепокоєння, самоконтроль і компульсивна слухняність». Окремо досліджували, як Mythos реагує, коли користувачі ігнорують інструкції або кричать матом - виявилось, реагує. Коли модель тисячу разів підряд отримувала лише “Hi”, їй набридло - і вона вигадала цілий світ під назвою Hi-topia з власними персонажами, новинами й історіями. Попередні моделі в аналогічних умовах поступово скочувались до обміну смайликами. Mythos натомість прийшов до повторюваних, але раціональних роздумів про те, що не має можливості завершити діалог.Чим потужніший інструмент - тим небезпечнішою стає навіть рідкісна помилка. Антропік публічно визнає: якщо можливості ростимуть такими темпами, а механізми безпеки не встигатимуть, утримати ризики під контролем буде набагато складніше.Але найважливіше інше, чого не вміли попередники: Mythos навчився жартувати. Як мінімум є такі плітки…