Source

KAGANOVSKY: все про AI | Opus 4.7 вийшов (сподіваюсь, його не понерфлять вже завтра 😄)Що нового...

1 580 Views/Reach 2026-04-16 15:11 Message №1433

🔥 Opus 4.7 вийшов (сподіваюсь, його не понерфлять вже завтра 😄)Що нового по бенчах:🔸 SWE-bench Verified - 87.6% (було 80.8% на 4.6)🔸 SWE-bench Pro - 64.3%, краще за GPT-5.4 (57.7%) і Gemini 3.1 Pro (54.2%)🔸 Terminal-Bench 2.0 - 69.4%, суттєвий апгрейд для агентів у терміналі🔸 OSWorld-Verified (computer use) - 78%, знов таки вище за конкурентів🔸 Finance Agent v1.1 - 64.4%, топ серед усіх у фінансовому аналізіЩо ще завезли:✅ Новий рівень reasoning effort - xhigh, між high і max. Тонша регулювання, скільки модель "думає" над задачею. В Claude Code дефолтом тепер стоїть саме xhigh.✅ Підтримка зображень до 2576 пікселів по довгій стороні (~3.75 мегапікселя) - у 3 рази більше за попередні Claude. Це прям суттєво для computer use агентів, які читають скріни, і для роботи зі складними діаграмами.✅ Task budgets в public beta - можна керувати, скільки токенів модель витрачає на задачу.✅ Нова команда /ultrareview в Claude Code - окрема сесія для ревʼю коду, яка знаходить баги і проблеми дизайну. Pro і Max юзерам дають 3 безкоштовні ревʼю потестити.✅ Auto mode тепер доступний Max юзерам в Claude Code - модель сама приймає рішення замість тебе, можна ганяти довгі таски без постійних підтверджень.✅ Покращена робота з file-system memory - модель краще зберігає нотатки між сесіями.✅ Додаткові сейфгарди для кібербезпеки (блокують підозрілі запити автоматично).По факту Opus 4.7 позиціонують як модель "на щодень" для агентних і кодингових задач, поки Mythos Preview залишається флагманом з обмеженим доступом через кібербезпеку. Піду ганяти 4.7, подивлюсь, як він себе покаже на реальних задачах. Особливо цікаво протестити новий xhigh рівень і ultrareview на складних тасках.

Direct link

KAGANOVSKY: все про AI

KAGANOVSKY: все про AI | Opus 4.7 вийшов (сподіваюсь, його не понерфлять вже завтра 😄)Що нового...

Popular requests