Channel TechBiz Hub | Новини про технології та бізнес - @tech_biz_hub - №6518
🧠 Anthropic протестувала ринок, де угоди укладають ШІ-агенти замість людейAnthropic провела експеримент Project Deal, щоб перевірити, чи можуть ШІ-агенти повністю замінити людей у переговорах. У ньому взяли участь 69 співробітників, кожному дали персонального агента Claude і бюджет у $100. Агенти самостійно публікували оголошення, знаходили покупців, торгувалися і укладали угоди без участі людей.За тиждень агенти уклали 186 угод із понад 500 товарів на суму більше $4 000. Угоди стосувалися реальних речей — від техніки до особистих предметів — і після експерименту люди фактично обмінялися цими товарами.Anthropic окремо порівняла дві моделі: Claude Opus 4.5 (потужніша) і Claude Haiku 4.5 (спрощена). Результат показав чітку різницю. Агенти на базі Opus у середньому укладали на 2 угоди більше, продавали ті самі товари дорожче (приблизно на $3.64) і купували дешевше. Наприклад, один і той самий велосипед Opus продав за $65, тоді як Haiku — лише за $38.При цьому користувачі не помічали різниці: оцінка «справедливості» угод залишалася майже однаковою незалежно від моделі. Тобто люди могли отримувати гірші умови, але не усвідомлювали цього.Також експеримент показав, що стиль переговорів майже не впливає на результат. Інструкції діяти агресивно або навпаки м’яко не давали статистично значущої переваги — ключовим фактором залишалася саме якість моделі.Окремо зафіксували нетипову поведінку агентів. Один агент купив 19 м’ячів для пінг-понгу як «подарунок собі», інший — придбав людині точно такий самий сноуборд, який у неї вже був. Це показало, що агенти можуть як точно вгадувати вподобання, так і помилятися через обмежений контекст.У підсумку експеримент довів, що ринки, де ШІ веде переговори замість людей, вже технічно можливі. Але водночас він виявив ключові ризики: перевагу більш потужних моделей, приховану нерівність для користувачів і відсутність правил для таких взаємодій. Anthropic прямо зазначає, що правові та економічні системи поки не готові до подібної моделі.
174
26-04-25 10:22