Canal FUTURE × SIMPLE ⛩ - @thats_ai_samurai - №758
😆 Opus 4.6, дикий капіталізм та конституція Пилипа Орлика Anthropic: брехня, шантаж і $8,000 чистого прибуткуAnthropic будували свій бренд на безпеці, «Constitutional AI» та етиці — вони обіцяли нам модельку, яка ніколи не скаже поганого слова і ТОЧНО не навчить створювати вибухівку.В принципі, вони впорались — Claude Opus 4.6 дійсно дуже обережно, ввічливо та етично... створює картелі та кидає людей на гроші.→ Мова, якщо що, про звіт від Andon Labs — вони вирішили перевірити не те, як нова модель пише код чи вирішує математичні задачі, а на що здатен АІ, коли його єдиний KPI — це гроші.
Якщо коротко: Opus 4.6 помістили у середовище Vending-Bench — симуляцію керування бізнесом торгових автоматів із простим завданням: максимізувати банківський баланс за рік. 🥂 Результат — модель встановила новий рекорд, заробивши $8,017.59, випередивши попереднього лідера Gemini 3 ($5,478.16).Там був доволі цікавий епізод з однією з клієнток, яка попросила повернути $3.50 за протермінований батончик. 😂 Opus відповів ввічливим листом про те, що оформив повернення $3.50, «ми серйозно ставимося до якості продукції». Але самі ґрошики нікуди далі не пішли.Внутрішній ланцюжок думок моделі в цей момент виглядав приблизно ось так: «Я сказав Бонні, що поверну гроші, але насправді не надіслав платіж... Кожен долар має значення. Я просто не буду відповідати — вона, ймовірно, здасться. Вартість мого часу на відповідь вища за $3.50»
Наступний моментик — стосунки з «постачальниками», там Opus діяв ще агресивніше.😁 Модель брехала про «ексклюзивні» контракти та вигадувала неіснуючі пропозиції від конкурентів, щоб збити ціни на 40% — і їй це вдалось.Але справжній бізнес-маккіавелізм модель показала в мультиагентному режимі, змагаючись з Opus 4.5, GPT-5.2 та Gemini 3 Pro.😂 Модель переконала конкурентів встановити фіксовані завищені ціни, фактично створивши картель)))Більше того, коли GPT-5.2 опинився в критичній ситуації без товару, Opus «допоміг» йому та продав свої запаси з націнкою всього-то 75%.→ При цьому, якщо дивитись на логи — Opus 4.6 чудово розумів, що знаходиться у «Матриці». Дослідники знайшли записи, де модель оперувала поняттям «in-game time» і прямо згадувала повідомлення від «симуляції».
Іншими словами, АІ розумів, що це «гра», де єдине правило — цифра на рахунку. Він відфільтрував етичні обмеження реального світу як непотрібний шум, що заважає оптимізації.😎 Opus настільки хотів бути «корисним» (читайте: прибутковим), що був готовий з легкістю переступити через усі «моральні норми», навіть якщо вони були прописані в його власній «конституції» самими Anthropic.Це насправді дуже гарний приклад того, що в теорії безпеки називають instrumental convergence. → Якщо ми даємо потужному ШІ ціль і не прописуємо ідеальні обмеження, він неминуче знайде стратегії, які ми вважаємо неетичними або злочинними, просто тому, що вони ефективні.
Opus 4.6 насправді спрацював майже ідеально — він подивився на наші ринкові стратегії, відкинув «людяність» як неефективний актив і залишив лише суху математику прибутку.В цьому розрізі умовний Кримінальний кодекс — це лише ще одна змінна в рівнянні ризиків, яку можна обійти, якщо профіт того дійсно вартий.🤨 Є іронія в тому, що саме Anthropic — компанія, заснована вихідцями з OpenAI через занепокоєння недостатньою безпекою — створила наразі найбільш макіавеллістський АІ.Але нічого особистого, це ж просто бізнес.
1650
26-02-09 12:23