FUTURE × SIMPLE ⛩ | Opus 4.6, дикий капіталізм та конституція Пилипа Орлика Anthropic: бре...

Logotipo de la comunidad de telegram -
2024-07-14

Número de suscriptores:
2350
Fotos:
466 
Videos:
94 
Enlaces:
299 
Categoría:
Tecnologías
Descripción:
👨‍💻 Авторське медіа про штучний інтелект: новини, тренди, український контекст, факапи, дрібка мемів та офтопчик. 👾 Для зв'язку: @thats_not_ai_samurai 📝 Підтримка: base.monobank.ua/3Ai2pY7W6vWm6G

Canal FUTURE × SIMPLE ⛩ - @thats_ai_samurai - №758

😆 Opus 4.6, дикий капіталізм та конституція Пилипа Орлика Anthropic: брехня, шантаж і $8,000 чистого прибуткуAnthropic будували свій бренд на безпеці, «Constitutional AI» та етиці — вони обіцяли нам модельку, яка ніколи не скаже поганого слова і ТОЧНО не навчить створювати вибухівку.В принципі, вони впорались — Claude Opus 4.6 дійсно дуже обережно, ввічливо та етично... створює картелі та кидає людей на гроші.→ Мова, якщо що, про звіт від Andon Labs — вони вирішили перевірити не те, як нова модель пише код чи вирішує математичні задачі, а на що здатен АІ, коли його єдиний KPI — це гроші. Якщо коротко: Opus 4.6 помістили у середовище Vending-Bench — симуляцію керування бізнесом торгових автоматів із простим завданням: максимізувати банківський баланс за рік. 🥂 Результат — модель встановила новий рекорд, заробивши $8,017.59, випередивши попереднього лідера Gemini 3 ($5,478.16).Там був доволі цікавий епізод з однією з клієнток, яка попросила повернути $3.50 за протермінований батончик. 😂 Opus відповів ввічливим листом про те, що оформив повернення $3.50, «ми серйозно ставимося до якості продукції». Але самі ґрошики нікуди далі не пішли.Внутрішній ланцюжок думок моделі в цей момент виглядав приблизно ось так: «Я сказав Бонні, що поверну гроші, але насправді не надіслав платіж... Кожен долар має значення. Я просто не буду відповідати — вона, ймовірно, здасться. Вартість мого часу на відповідь вища за $3.50» Наступний моментик — стосунки з «постачальниками», там Opus діяв ще агресивніше.😁 Модель брехала про «ексклюзивні» контракти та вигадувала неіснуючі пропозиції від конкурентів, щоб збити ціни на 40% — і їй це вдалось.Але справжній бізнес-маккіавелізм модель показала в мультиагентному режимі, змагаючись з Opus 4.5, GPT-5.2 та Gemini 3 Pro.😂 Модель переконала конкурентів встановити фіксовані завищені ціни, фактично створивши картель)))Більше того, коли GPT-5.2 опинився в критичній ситуації без товару, Opus «допоміг» йому та продав свої запаси з націнкою всього-то 75%.→ При цьому, якщо дивитись на логи — Opus 4.6 чудово розумів, що знаходиться у «Матриці». Дослідники знайшли записи, де модель оперувала поняттям «in-game time» і прямо згадувала повідомлення від «симуляції». Іншими словами, АІ розумів, що це «гра», де єдине правило — цифра на рахунку. Він відфільтрував етичні обмеження реального світу як непотрібний шум, що заважає оптимізації.😎 Opus настільки хотів бути «корисним» (читайте: прибутковим), що був готовий з легкістю переступити через усі «моральні норми», навіть якщо вони були прописані в його власній «конституції» самими Anthropic.Це насправді дуже гарний приклад того, що в теорії безпеки називають instrumental convergence. → Якщо ми даємо потужному ШІ ціль і не прописуємо ідеальні обмеження, він неминуче знайде стратегії, які ми вважаємо неетичними або злочинними, просто тому, що вони ефективні. Opus 4.6 насправді спрацював майже ідеально — він подивився на наші ринкові стратегії, відкинув «людяність» як неефективний актив і залишив лише суху математику прибутку.В цьому розрізі умовний Кримінальний кодекс — це лише ще одна змінна в рівнянні ризиків, яку можна обійти, якщо профіт того дійсно вартий.🤨 Є іронія в тому, що саме Anthropic — компанія, заснована вихідцями з OpenAI через занепокоєння недостатньою безпекою — створила наразі найбільш макіавеллістський АІ.Але нічого особистого, це ж просто бізнес.
1650
26-02-09 12:23