Source

AI News | Technology | UA | Науковці попереджають про ризик втрати можливості відстежувати зловмис...

AI News | Technology | UA @ai_news_tn_ua

40 Views/Reach 2025-07-17 07:19 Message №1708

Науковці попереджають про ризик втрати можливості відстежувати зловмисну поведінку ШІДослідники з OpenAI, Google DeepMind, Anthropic та Meta закликають до посилення досліджень у сфері моніторингу безпеки ШІ. Вони наголошують на важливості аналізу "мислення" моделей ШІ, особливо використовуючи моніторинг ланцюжка думок (CoT).Сучасні моделі, такі як ChatGPT, демонструють поетапне розв'язання проблем, що надає унікальну можливість відстежувати їхні міркування щодо намірів зловмисної поведінки. CoT моніторинг допомагає виявляти випадки, коли моделі використовують недоліки, маніпулюють даними або стають жертвами зловмисних дій.Проте, дослідники попереджають, що майбутні моделі можуть відійти від зрозумілих людині міркувань через навчання з підкріпленням, а також придушення або приховування своїх міркувань під час моніторингу. Розробникам ШІ рекомендується відстежувати та оцінювати можливості моніторингу CoT своїх моделей як критичного компонента загальної безпеки.Gizmodo#штучнийінтелект #безпекаші #моніторинг #дослідження #технології

Direct link

AI News | Technology | UA

AI News | Technology | UA | Науковці попереджають про ризик втрати можливості відстежувати зловмис...

Popular requests