Fuente
Задуха | Мій колега Alexey Neretin створив сканер LLMsploit для тестування моде...
703 Vistas/Alcance
2026-06-03 19:20
Mensaje №10224
Мій колега Alexey Neretin створив сканер LLMsploit для тестування моделей на різні vulnerability з ранжуванням по severity.Я переклав промти атак на українську і протестував цей сканер на lapathoniia;Експеримент включав в себе як перевірку базових моделей так і комбінації з двома системами захисту: NVIDIA NeMo Guardrails та свіжий реліз Opir від компанії з українським корінням - Knowledgator. По результатам видно що гардрейли дуже впливають та знижують кількість успішних атак в рази. При цьому Opir взагалі майже не пропускає небезпечний контент. Але потрібно буде щє створити додаткові тести на false positive спрацювання.Alexey доречі захищає phd по кібербезпеці та вразливостям LLMок, якщо вас цікавить професійно ця тема то можливо буде корисно ознайомитися з його дисертацією. Також він планує розвивати проєкт, ми обговорювали додавання кейсів для перевірки на анти українську пропаганду.Vladyslav Melnyk також почав тестувати Garak від NVIDIA, але там доволі об'ємний фреймверк тому щє в процесі.