IASAedu 🇺🇦 | Junior MLOps Engineer interview: Model & Concept Drift#Edu_prepara...

Logotipo de la comunidad de telegram - IASAedu 🇺🇦
2024-07-14

IASAedu 🇺🇦

Número de suscriptores:
955
Fotos:
17 
Enlaces:
573 
Categoría:
Educación
Descripción:
Освітній проєкт для початківців у ІТ від @IASA_Student_Council Зворотний зв'язок: @IASAsuggestionBot Проблеми з навчанням: @iasa_stud_support_bot #Edu_recommends #Edu_professions #Edu_preparation #Edu_quiz #Edu_Academic #Edu_internship #IASA_stars

Canal IASAedu 🇺🇦 - @iasa_edu - №1123

Junior MLOps Engineer interview: Model & Concept Drift#Edu_preparationЩо таке дрейф моделі і як його виявляти?Дрейф (Drift) — це явище, коли продуктивність розгорнутої ML-моделі з часом погіршується, оскільки реальні дані починають відрізнятися від тих, на яких вона навчалася. Розрізняють два основні типи дрейфу:• Дрейф даних (Data / Feature Drift):Змінюється статистичний розподіл вхідних даних. Наприклад, цільова аудиторія вашого сервісу стала старшою, або змінилися масштаби цін. Закономірності ті самі, але самі дані виглядають інакше.• Дрейф концепцій (Concept Drift):Змінюється фундаментальний зв'язок між вхідними даними та результатом. Те, що модель вважала правильним раніше, більше не працює. Класичний приклад: зміна купівельної поведінки клієнтів або поява нових, раніше невідомих схем шахрайства.Як виявляти дрейф у продакшені?Для цього налаштовують моніторинг, який працює в реальному часі або за розкладом. Основні методи:1. Порівняння розподілів: Система постійно порівнює свіжі дані (inference data) з еталонними даними, на яких тренували модель (baseline).2. Статистичні тести: Щоб математично довести наявність дрейфу, використовують такі метрики та тести, як:• KS-test (тест Колмогорова-Смірнова)• PSI (Population Stability Index)• Дивергенція Дженсена-Шеннона3. Автоматизація (Tools): Замість ручного написання скриптів MLOps-інженери використовують готові інструменти: Evidently AI, WhyLabs або Fiddler AI.Коли інструмент фіксує дрейф, що перевищує допустимий поріг, система надсилає алерт і може автоматично запустити пайплайн перенавчання (retraining) моделі на свіжих даних.
422
26-04-23 07:01