Iniciar sesión Registro
Anuncios
Tu espacio publicitario
Reserva este slot exclusivo para el periodo elegido.
Comprar publicidad →
Logotipo de la comunidad de telegram - KAGANOVSKY: все про AI
Añadido 06 ene. 2025

KAGANOVSKY: все про AI

@kgnvsk_ai
Número de suscriptores: 8 494
Fotos: 780
Videos: 393
Enlaces: 431
Descripción:
🦾 Авторський канал про нейромережі та реальні кейси їх застосування в житті, бізнесі та контент-кріейтингу! Мій контакт: @kgnvsk Мій YouTube з гайдами і записами ефірів: https://www.youtube.com/@KGNVSKAI
Fuente

KAGANOVSKY: все про AI | Opus 4.7 вийшов (сподіваюсь, його не понерфлять вже завтра 😄)Що нового...

Logotipo de la comunidad de telegram - KAGANOVSKY: все про AI KAGANOVSKY: все про AI @kgnvsk_ai
1 580 Vistas/Alcance 2026-04-16 15:11 Mensaje №1433
🔥 Opus 4.7 вийшов (сподіваюсь, його не понерфлять вже завтра 😄)Що нового по бенчах:🔸 SWE-bench Verified - 87.6% (було 80.8% на 4.6)🔸 SWE-bench Pro - 64.3%, краще за GPT-5.4 (57.7%) і Gemini 3.1 Pro (54.2%)🔸 Terminal-Bench 2.0 - 69.4%, суттєвий апгрейд для агентів у терміналі🔸 OSWorld-Verified (computer use) - 78%, знов таки вище за конкурентів🔸 Finance Agent v1.1 - 64.4%, топ серед усіх у фінансовому аналізіЩо ще завезли: Новий рівень reasoning effort - xhigh, між high і max. Тонша регулювання, скільки модель "думає" над задачею. В Claude Code дефолтом тепер стоїть саме xhigh. Підтримка зображень до 2576 пікселів по довгій стороні (~3.75 мегапікселя) - у 3 рази більше за попередні Claude. Це прям суттєво для computer use агентів, які читають скріни, і для роботи зі складними діаграмами. Task budgets в public beta - можна керувати, скільки токенів модель витрачає на задачу. Нова команда /ultrareview в Claude Code - окрема сесія для ревʼю коду, яка знаходить баги і проблеми дизайну. Pro і Max юзерам дають 3 безкоштовні ревʼю потестити. Auto mode тепер доступний Max юзерам в Claude Code - модель сама приймає рішення замість тебе, можна ганяти довгі таски без постійних підтверджень. Покращена робота з file-system memory - модель краще зберігає нотатки між сесіями. Додаткові сейфгарди для кібербезпеки (блокують підозрілі запити автоматично).По факту Opus 4.7 позиціонують як модель "на щодень" для агентних і кодингових задач, поки Mythos Preview залишається флагманом з обмеженим доступом через кібербезпеку. Піду ганяти 4.7, подивлюсь, як він себе покаже на реальних задачах. Особливо цікаво протестити новий xhigh рівень і ultrareview на складних тасках.