Channel Блог економіста - @economist_blog - №3965
Паралельно Мінцифра координує створення національної великої мовної моделі (LLM) спільно з «Київстаром». Модель не створюють “з нуля”, вона базується на відкритих вагових параметрах і донавчається на великому корпусі українських даних. Зараз Мінцифра збирає тексти від центральних органів влади для формування бази.Проєкт курирують чотири ради - етична, технічна, мовознавча та культурно-історична, щоб врахувати український контекст і уникнути перекосів, властивих глобальним моделям. Мета не лише у створенні однієї моделі, а у формуванні відкритої екосистеми, яку зможуть використовувати і бізнеси, і університети, і державні установи.Попри наявність потужних відкритих моделей від OpenAI, Anthropic чи Meta, створення української LLM має цілком прагматичний сенс. По-перше, більшість глобальних моделей погано працюють із українською мовою. Вони не розуміють контексту місцевого законодавства, культурних реалій чи навіть назв установ. По-друге, використання іноземних API у державному секторі створює ризик залежності від зовнішніх серверів і юрисдикцій, що прямо суперечить вимогам цифрового суверенітету. І, нарешті, національна модель - це інвестиція у власну експертизу: гроші, які могли б піти на оренду обчислювальних потужностей за кордоном, залишаються в українській науці та ІТ-секторі. Як зазначають у Мінцифрі, в перспективі така модель може стати основою для десятків галузевих ШІ-рішень від медицини до освіти і сформувати новий експортний сегмент високих технологій, а не лише державну інфраструктуру.4. MamayLM - перша українська мультимодальна відкрита модельПоки Мінцифра розвиває державний напрямок, приватний сектор теж не пасе задніх. MamayLM v1.0 - це відкрита українська мультимодальна LLM, яка розуміє українську й англійську мови, працює з текстом та зображеннями й доступна у версіях 4B і 12B параметрів.Модель розповсюджується відкрито, має квантизовані варіанти для запуску навіть на звичайних комп’ютерах і фокусується на локальній роботі без передачі даних у хмару, тобто на конфіденційності. Фактично, це перший реальний крок до українського відкритого штучного інтелекту, який не залежить від API закордонних гігантів.5. Di-agnostics - “Шазам” для промисловостіЩе один напрямок - індустріальний ШІ. Українська компанія a-Gnostics, заснована у 2016 році Андрієм Старжинським, Андрієм Столбовим і Ярославом Недашковським, створила систему Di-agnostics, яка аналізує звуки роботи машин і визначає потенційні поломки.Працівник записує аудіо з обладнання і модель визначає, чи є відхилення від норми. Це дозволяє передбачити збої до того, як вони стануть аваріями, і значно скорочує витрати на ремонт.a-Gnostics уже має два основних продукти: Di-agnostics - система технічної діагностики за звуком (контракти готуються навіть у Сінгапурі) та Pro-gnostics - прогнозування споживання електроенергії, з яким компанія вже вийшла на ринок США.Крім того, команда розробила чат-бот для “Нової пошти” та подала перший патент на інтелектуальну систему моніторингу стану обладнання. Це приклад того, як українські розробники працюють не в «копі-паст» форматі глобальних LLM, а створюють індустріальні ШІ-рішення світового рівня.Я не є спеціалісткою з ШІ, і цей текст написано на основі відкритих джерел: інтерв’ю команди Мінцифри, публікацій DOU.ua і подкасту House Podcast. Але навіть з відкритих даних видно: Україна поступово переходить від споживання технологій до їхнього створення. І це вже не про додаток. Це про цифровий суверенітет.
324
25-10-18 12:17