Fuente
KAGANOVSKY: все про AI | GPT-5.5 в деталях. Що саме вміє нова модельGPT-5.5 (внутрішня назва Sp...
2 620 Vistas/Alcance
2026-04-23 20:29
Mensaje №1463
🧱 GPT-5.5 в деталях. Що саме вміє нова модельGPT-5.5 (внутрішня назва Spud) вже доступна в ChatGPT і Codex. Є дві версії: Thinking (з режимом роздумів перед виконанням) і Pro (топова, з більшим контекстом). І окремий режим 5.5 High — для задач, де треба думати особливо довго перед тим, як щось робити.У самому релізі OpenAI пишуть прямо: модель тягне задачі обсягом до 20 годин людської праці. І це поки що найчесніше формулювання того, що змінилось.На демо показали типовий сценарій. Користувач кидає в ChatGPT Excel-файл із квартальною фінансовою звітністю і просить зробити презентацію для керівництва. GPT-5.5 працює 14 хвилин 48 секунд. За цей час модель:- Читає Excel, витягує всі ключові показники.- Ходить у Gmail і Slack за додатковим контекстом.- Заходить у GitHub, відкриває pull request.- Генерує презентацію на 8 слайдів.- Вставляє живі цифри прямо в слайди: $15.2M виручки, $2.5M чистого прибутку, $63.4M Exit ARR, $18.4M кешу.- Будує резюме для керівництва, таблицю KPI, прогноз по пайплайну, рішення на наступний квартал.- Використовує рідні графіки PowerPoint, а не картинки.- Слайди залишаються редагованими, відкриваєш у PPT і правиш як хочеш.Модель не падає посередині цього марафону. Сама перевіряє проміжні кроки, сама обирає інструмент під задачу, сама вирішує коли спитати в користувача дозволу через окрему кнопку "Запит дозволу".Окремо показали кадр "Use Browser to solve the cube" — GPT-5.5 заходить у браузер і довбає задачу стільки, скільки потрібно. І ще одна нова штука — режим "Робота з локальними файлами" прямо в полі вводу. Модель читає файли на твоєму компʼютері без ручного аплоаду. Вказуєш папку або документ — вона підхоплює.Цифри з бенчмарків:- Terminal-Bench 2.0 (робота в терміналі): 82.7% у GPT-5.5 Thinking проти 69.4% у Opus 4.7.- GDPval (задачі на розумову працю офісного рівня): 84.9% проти 80.3%.- OSWorld-Verified (керування компʼютером): 78.7% проти 78.0% — практично ніздря в ніздрю.- BrowseComp (агент у браузері): 90.1% у GPT-5.5 Pro, 79.3% Opus, 85.9% Gemini 3.1 Pro.- FrontierMath (математика, рівні 1-4): 52.4% Pro проти 43.8% Opus проти 36.9% Gemini.- CyberGym (кібербезпека): 81.8% проти 73.1%.- SWE Pro (єдиний бенчмарк, де Opus 4.7 попереду): 58.6% у GPT-5.5 проти 64.3% у Opus.Ефективність: за тестами OpenAI GPT-5.5 видає той самий рівень якості з меншою кількістю токенів на відповідь, ніж попередні моделі. Але ціна за мільйон токенів у API піднялась — тобто економія токенів не означає економію в доларах за один виклик.Під капотом — нова базова модель, помітно більша. Чому не назвали GPT-6, офіційно мовчать. За кулісами, схоже, тримається негласна домовленість щодо неймінгу з Anthropic: не перестрибувати через цілі цифри.Формулювання самого OpenAI: "built to understand complex goals, use tools, check its work, and carry more tasks through to completion". Українською — модель, яка розуміє складні цілі, користується інструментами, перевіряє себе і доводить більше задач до кінця. Вперше явно розділяють модель під розмови і модель під роботу. GPT-5.5 — саме друге.Офіційний анонс: openai.com/index/introducing-gpt-5-5/