ШІ ДВІЖ | OpenAI готує до запуску ШІ-агент Operator, який зможе за вас виконуват...

Telegram community logo -
2024-07-14

Number of subscribers:
5591
Photos:
604 
Videos:
34 
Links:
1910 
Category:
Technology
Description:
Все важливе про штучний інтелект, нейромережі, робототехніку на одному каналі + корисні IT-івенти. Зручний агрегатор ШІ-новин🤖 Про майбутнє, яке вже настало. Співпраця тільки через @DvizhPromoBot та @dvizh_promo_bot (переходіть лише через клік)

Channel ШІ ДВІЖ - @AI_Dvizh - №1766

OpenAI готує до запуску ШІ-агент Operator, який зможе за вас виконувати різні завдання на комп’ютері  OpenAI має незабаром представити інноваційний інструмент під назвою Operator, здатний самостійно керувати комп’ютером користувача і виконувати завдання. Про це пише Channel Tech.   Operator — це "агентна" система, яка може автономно виконувати різні завдання, включно з написанням коду чи бронюванням подорожей. За даними джерел, OpenAI планує презентувати Operator вже у січні.   Підтвердженням цієї інформації стали свідчення розробника ПЗ Тібора Блахо, який раніше неодноразово точно передавав дані про майбутні продукти у сфері штучного інтелекту.   Тібор Блахо виявив приховані функції у клієнті ChatGPT для macOS, серед яких є налаштування для "перемикання Operator" та "примусового завершення Operator". Окрім цього, OpenAI, за його словами, вже має на своєму сайті згадки про Operator, які поки що недоступні для широкого загалу.   Також у витоках фігурують таблиці з порівнянням продуктивності Operator із конкурентними ШІ-системами. Якщо дані правдиві, Operator демонструє результати нижчі за людські, але перевершує інших агентів у певних завданнях.    На OSWorld, платформі для моделювання реального середовища роботи комп’ютера, ШІ-модель OpenAI CUA (імовірно основа Operator) набрала 38,1%. Це більше, ніж у конкурента Anthropic, але суттєво менше, ніж у людей (72,4%).   На тесті WebVoyager, який оцінює здатність ШІ працювати з вебсайтами, OpenAI CUA перевершила людські результати, але не змогла досягти рівня людей на іншому вебтесті — WebArena.   Система також показала низькі результати у завданнях, які люди виконують легко. Наприклад, створення криптогаманця вдалось Operator лише у 10% випадків, а запуск віртуальної машини — у 60%.   OpenAI витратила значний час на розробку Operator, приділяючи особливу увагу тестам на безпеку. Відомо, що система успішно проходить тести на стійкість до "зловмисних дій" і пошуку конфіденційних даних.
821
25-01-22 08:15