Canal Продуктивність | Тарас Лукавий - @taras_lukavyi - №2201
Схоже, голосові AI-асистенти нарешті перестають бути крінжовимиДля: всіх, хто цікавиться AIOpenAI показали нові аудіо-моделі в API.У демо було 2 штуки, які реально можуть бустанути voice agents:• live translation у реальному часі• голосовий агент, який не просто говорить, а ще й думає, юзає tools і робить діїНайцікавіше для мене тут не "ще один голосовий режим".А те, що вони показують новий UX:ти говориш з агентом як з людиною, він не випадає з контексту, може мовчки слухати, не перебивати, а коли треба - взяти і оновити CRM, календар чи іншу систему.Ще одна сильна штука - realtime переклад на льоту.У відео модель перекладала прямо під час мовлення, без очікування кінця фрази, і перемикалась між мовами в розмові.Якщо це реально стабільно працює, то сценарії очевидні:• саппорт• sales calls• освіта• міжнародні дзвінки• особисті асистенти• будь-які голосові інтерфейси поверх твоїх сервісівМені здається, ми поступово підходимо до моменту, коли voice стане не прикольною демкою, а реально основним інтерфейсом для частини задач.Особливо там, де руками тикати довго, а сказати простіше.https://youtu.be/JOu8v6CBjkE?is=IIiosgUBYHYvE90Q
623
26-05-07 20:43