Source

Михайло Пацан || Польові нотатки Інвестора | OpenAI випустив GPT-5.523 квітня OpenAI запустив GPT-5.5, кодова назва...

Михайло Пацан || Польові нотатки Інвестора @MichaelPatsan

587 Views/Reach 2026-04-24 03:56 Message №1299

Михайло Пацан || Польові нотатки Інвестора

OpenAI випустив GPT-5.523 квітня OpenAI запустив GPT-5.5, кодова назва всередині компанії - “Spud”. Реліз стався через шість тижнів після GPT-5.4 - рекордно короткий цикл навіть за мірками 2026 року. Модель вже доступна платним користувачам ChatGPT і Codex: рівні Plus, Pro, Business та Enterprise. API-доступ поки затримується - OpenAI пояснює це необхідністю додаткових засобів кіберзахисту, специфічних для роботи через інтерфейс розробника. Ключова інженерна особливість: модель вирішує багатокрокові завдання автономно, з меншою кількістю підказок від користувача, і робить це за тією самою швидкістю, що й попередній GPT-5.4. GPT-5.5 vs Claude Opus 4.7: де хто виграєOpus 4.7 з’явився тижнем раніше, 16 квітня. Обидві моделі позиціонуються як флагмани для агентної роботи. Але цифри показують два різних профілі.На Terminal-Bench 2.0, який тестує автономне виконання задач у терміналі, GPT-5.5 набирає 82.7%, Opus 4.7 - 69.4%. Якщо агент має самостійно розгортати, тестувати і виправляти код у середовищі командного рядка - GPT-5.5 зараз попереду.На бенчмарку MRCR, що симулює роботу з документами від 512K до 1M токенів, GPT-5.5 показує 74.0% проти 32.2% у Opus 4.7. Удвічі більше - і це означає, що аналіз цілої кодової бази або тисяч сторінок юридичних документів за один прохід поки є прерогативою GPT-5.5.Opus вигра в іншому - реальне програмне забезпечення. SWE-bench Pro, що тестує вирішення справжніх задач з GitHub-репозиторіїв, у Opus 4.7 становить 64.3%; GPT-5.4, попередник GPT-5.5, зупинявся на 57.7%. Даних GPT-5.5 на цьому бенчмарку поки немає, тому поки лідерство за Claude в оркестрації між інструментами, але це за бенчами. Будемо реально тестуватиКомп’ютерне керування - практична нічия: GPT-5.5 на OSWorld-Verified дає 78.7%, Opus 4.7 - 78.0%. Різниця менша за похибку реального застосування.Реальні кейси, не синтетика, але і не з нашої практикиМатематик збудував застосунок з алгебраїчної геометрії з одного промпту за 11 хвилин. Команди, що тестували GPT-5.5 до релізу, звітують про економію до 10 годин роботи на тиждень. З боку Opus 4.7 цифри не менш круті. Rakuten зафіксував утричі більше виробничих задач, вирішених у порівнянні з Opus 4.6. CodeRabbit отримав понад 10% покращення точності при аналізі складних pull request-ів. Vercel підтвердив нову поведінку: модель самостійно пише тести і верифікує власний код до початку роботи - без жодного запиту з боку розробника. Ціна - і де прихований нюансGPT-5.5 у API коштуватиме $5 за мільйон вхідних токенів і $30 за вихідні. Opus 4.7 тримає ціни Opus 4.6 - $5 вхідні, $25 вихідні. На перший погляд різниця невелика. Але є деталь: оновлений токенізатор Opus 4.7 може витрачати від 1 до 1.35 рази більше токенів залежно від типу контенту. Тож реальну вартість потрібно рахувати на власних задачах, а не за прайс-листом.Хто що обираєGPT-5.5 - якщо ваш агент самостійно виконує тривалі задачі в терміналі, аналізує великі масиви документів або підтримує наукові дослідження. Opus 4.7 - якщо будуєте багатоагентні пайплайни, де модель координує десятки інструментів, або вирішуєте складні задачі реального code review у великих репозиторіях.Цікаво інше: обидві моделі вийшли з інтервалом у тиждень, обидві б’ють рекорди - але жодна не домінує в усіх сценаріях одночасно. Ми перейшли від “яка модель найкраща” до “яка модель найкраща для цієї конкретної задачі”.

Direct link

Михайло Пацан || Польові нотатки Інвестора

Михайло Пацан || Польові нотатки Інвестора | OpenAI випустив GPT-5.523 квітня OpenAI запустив GPT-5.5, кодова назва...

Popular requests