Вхід Реєстрація
Реклама
Ваше рекламне місце
Забронюйте цей слот без конкуренції на обраний період.
Купити рекламу →
Логотип телеграм спільноти - Задуха
Додано 06 гру 2025

Задуха

@zaduha
Кількість підписників: 1 282
Фото: 3,990
Відео: 599
Посилання: 4,400
Опис:
Вітаю, я Богдан, Deep learning інженер. Роблю всякі кастомні штуки з трансформерами. Прибічник ідеї трансгуманізму, мрію зробити внесок в збільшення тривалості життя людини. В каналі: авторський контент, етика, естетика, спілкування і срачі в коментарях.
Джерело

Задуха | Мій колега Alexey Neretin створив сканер LLMsploit для тестування моде...

Логотип телеграм спільноти - Задуха Задуха @zaduha
703 Охват/переглядів 2026-06-03 19:20 Повідомлення №10224
Мій колега Alexey Neretin створив сканер LLMsploit для тестування моделей на різні vulnerability з ранжуванням по severity.Я переклав промти атак на українську і протестував цей сканер на lapathoniia;Експеримент включав в себе як перевірку базових моделей так і комбінації з двома системами захисту: NVIDIA NeMo Guardrails та свіжий реліз Opir від компанії з українським корінням - Knowledgator. По результатам видно що гардрейли дуже впливають та знижують кількість успішних атак в рази. При цьому Opir взагалі майже не пропускає небезпечний контент. Але потрібно буде щє створити додаткові тести на false positive спрацювання.Alexey доречі захищає phd по кібербезпеці та вразливостям LLMок, якщо вас цікавить професійно ця тема то можливо буде корисно ознайомитися з його дисертацією. Також він планує розвивати проєкт, ми обговорювали додавання кейсів для перевірки на анти українську пропаганду.Vladyslav Melnyk також почав тестувати Garak від NVIDIA, але там доволі об'ємний фреймверк тому щє в процесі.