Джерело
ШІ: Від теорії до практики | Google навчила мовну модель думати як дифузійний генератор — і отримал...
40 Охват/переглядів
2026-06-12 11:59
Повідомлення №12249
Google навчила мовну модель думати як дифузійний генератор — і отримала 1000 токенів за секундуВсі сучасні мовні моделі генерують текст однаково: слово за словом, зліва направо. Google вирішила спробувати інший принцип.DiffusionGemma — 26B модель на архітектурі Gemma 4 з активними ~4B параметрами, яка обробляє великі блоки токенів одночасно, а не послідовно. Спочатку створює чернетку тексту, потім кілька разів уточнює і покращує результат — як дифузійні генератори зображень.Результат по швидкості: понад 1000 токенів за секунду на NVIDIA H100 і близько 700 на RTX 5090. Для порівняння — більшість топових моделей видають 60-150 токенів за секунду.Підтримується vLLM і Unsloth для локального запуску.Але є чесний нюанс: це експериментальна розробка. За якістю відповідей модель поки поступається класичним Gemma 4. Тобто це не заміна — це доказ концепції: дифузійний підхід до тексту технічно працює і дає радикальне прискорення.Якщо якість вдасться підтягнути до рівня звичайних моделей — архітектура може змінити стандарт.👉 Демо на HuggingFace 👉 Модель 👉 Блог Google#Корисні_нейронкиПідписатись на канал: ШІ: Від теорії до практики