Source
Перша Айтішна Броварня | GPT-5: основне і цікаве• Єдине “гібридне” ядро в ChatGPT: модель сама ...
1 640 Views/Reach
2025-08-08 14:01
Message №340
GPT-5: основне і цікаве• Єдине “гібридне” ядро в ChatGPT: модель сама перемикає між швидким “main” і глибшим “thinking”, а коли впираєшся в ліміти - вмикаються mini-версії. В API все простіше: три моделі (gpt-5, mini, nano) + 4 рівні reasoning, включно з новим minimal. • Контекст/вивід: до 272k токенів на вхід і до 128k на вихід (враховуючи “невидимі” reasoning-токени). Вхід - текст+зображення, вихід - текст. • Лінійка оновилась: GPT-5 фактично підміняє більшість старих лінійок (gpt-4o → gpt-5-main, o3 → gpt-5-thinking і тд). Аудіо та генерація зображень залишаються в окремих моделях (4o Audio/Realtime, GPT-Image/DALL-E). • Ціни доволі непогані:– GPT-5: $1.25/млн вхідних, $10/млн вихідних– Mini: $0.25 / $2.00– Nano: $0.05 / $0.40Кешування токенів мінус 90% на близькі повтори (корисно для чат-UI) - в курсорі є дешборд в якому видно скільки за які токени ти мав би заплатити, якщо б не преміум (ну або скільки маєш заплатити, якщо на usage-based pricing) так от там кешування дійсно зберігає купу бабок.• “Pro” всередині ChatGPT: GPT-5 Pro (паралельне “test-time compute”) поки лише в ChatGPT і на тарифі $200/міс. • Менше “провтиків”, більше безпеки: введено safe-completions - замість тупо відмовляти, модель дає корисну відповідь у межах політики (особливо в dual-use темах: біо/сек’юріті). Також зменшили “підлабузництво” й галюцинації. • Трасування мислення в API: доступний reasoning: {"summary": "auto"} у /v1/responses, а reasoning_effort=minimal пришвидшує стрімінг. Я саме це й перевірив - працює як треба. • Prompt-injection ще не помер: у їхньому тесті для gpt-5-thinking атаки проходять у ~56.8% кейсів при k=10 - краще за інших, але проблему не закрито. • Cutoff: знання до 30 вересня 2024 для GPT-5 (mini/nano - до 30 травня 2024). Моє швидке враженняПоганяв “full” і mini: відчувається як адекватний дефолт - менше дурниць, краще слухає інструкції, а коли треба - “думає” довше. Для продуктивних тасків (код/тексти) ставлю плюсик; для агентських сценаріїв - цікаво, але ще нормально не тестив.Пишіть, які ваші враження від нової моделі (бо я бачив, багато хто називає їх презентацію "слабкою" і я не дуже розумію чому)