Fuente

Flow | Юра Гнатюк | Багато кому з вас, хто працює з Claude, скоріш за все, останніми тижня...

5 520 Vistas/Alcance 2026-04-17 08:27 Mensaje №584

Багато кому з вас, хто працює з Claude, скоріш за все, останніми тижнями могло здаватись: модель стала "лінивішою". Ну от, вам не здавалось.Мій кейс: рахував я по одній компанії річну дохідність з Claude. Коротко, модель видала цифру, яка мене реально засмутила, і пів дня я ходив сумний/не міг з цим погодитися, бо в контексті цієї компанії така цифра просто не мала сенсу.Вирішив перевірити. Виявилося, що Claude не ходив у відкриті джерела, не перевіряв реальну дохідність за останні роки, просто взяв "логічне на його думку" середньозважене значення і видав мені (це при тому, що в чаті були лінки звідки брати дані). Коли перерахували нормально, дохідність виявилася значно вищою.На моє "чому ти так затупив?" він чесно відповів: "Сорі, не перевіряв, не брав реальні дані, вигадав на середньому". Я собі після цього прописав окремий скіл для ресерчу саме такого формату з кількома раундами валідації. Але історія така собі.В чому проблема?- Стелла Лауренці, AI Director в AMD, 2 квітня опублікувала на GitHub аналіз 6,852 сесій Claude Code з висновком що глибина міркувань впала приблизно на 67% з кінця лютого.• Anthropic через Boris Cherny частину висновків оспорив, але визнав дві тихі зміни дефолтів саме в Claude Code: 9 лютого увімкнули adaptive thinking, де модель сама вирішує наскільки глибоко думати, а 3 березня знизили дефолтний ефорт з high на medium.- На деяких кроках модель реально виділяла нуль токенів на мислення і "не думала" перед відповіддю, це Cherny публічно визнав.Вчора Anthropic викотили Claude Opus 4.7. Схоже, фідбек дійшов.Що важливо:- Новий рівень xhigh між high і max, який Claude Code тепер ставить дефолтом на всіх планах;- /ultrareview, глибокий multi-agent перегляд коду де різні агенти шукають баги, дірки в безпеці, проблеми з логікою і перформансом паралельно;- +13% resolution на 93-task coding benchmark і +14% на complex multi-step workflows при меншій кількості токенів і третині tool errors (офіційні цифри Anthropic);- Vision у 3x вищій роздільній здатності, до 2,576 пікселів по довгому краю (~3.75 MP).Ми в Easyflow вже потестували 4.7 на реальних задачах, модель і справді менше придумує зайвого. Хоча на фото до посту скрін з логічною задачею для особистого використання, вже для Claude Opus 4.7, і результат бачите самі 😆. Але він вчиться.Як перевірити і підняти глибину міркувань у себе.- Claude Code через термінал. Виконайте`/effort xhigh` прямо в сесії. Якщо ви вже на 4.7 і нічого не чіпали, воно вже так стоїть за замовчуванням. Якщо раніше вручну ставили medium або high, різниця буде відчутна з першого ж завдання.- Веб або мобайл. Слайдера ефорту там немає, контроль виглядає по-іншому. Три речі які реально впливають:1. Переключитись у пікері моделей на Claude Opus 4.7. За офіційним твердженням Anthropic, 4.7 на low ефорті приблизно дорівнює 4.6 на medium. Якщо залишаєтеся на 4.6, отримуєте старі дефолти.2. Включити тумблер "Adaptive thinking" прямо в dropdown пікера моделей (клік по назві моделі внизу чату, тумблер під "Opus 4.7"). На 4.7 він працює адаптивно: модель сама вирішує коли думати глибше, а прості питання відпрацьовують швидко без зайвого "податку токенами на думання".3. Cтимулювати "глибину думки" промптом. У веб-версії не працюють ні API-параметри, ні `/effort`. В офіційному migration guide Anthropic радить додавати в промпт точкову вказівку формату "This task involves multi-step reasoning. Think carefully through the problem before responding". Це і є "ручний xhigh" для веб і мобайл. До цього добре додавати персональні правила типу "перевіряй цифри через web search, не вгадуй коли немає даних, роби self-review перед фінальною відповіддю". Також для уточнення раджу використовувати щось типу: "Задавай мені більше запитань. Заповни всі інформаційні прогалини. Не роби жодних небезпечних припущень".Ну і плюс: завести окремий Project з кастомною інструкцією, яка вимагає завжди перевіряти цифри через web search, не вгадувати коли немає даних, і робити self-review перед фінальною відповіддю.P.S мій епізод про Claude Skills ТУТ.

Enlace directo

Flow | Юра Гнатюк

Flow | Юра Гнатюк | Багато кому з вас, хто працює з Claude, скоріш за все, останніми тижня...

Consultas populares