Вхід Реєстрація
Реклама
Ваше рекламне місце
Забронюйте цей слот без конкуренції на обраний період.
Купити рекламу →
Логотип телеграм спільноти - Думки, про які ніхто не питав
Додано 14 лип 2024

Думки, про які ніхто не питав

@youneverasked
Кількість підписників: 10 103
Фото: 278
Відео: 26
Посилання: 493
Опис:
Мої думки, про які ніхто не питав Авторський канал Діми Малєєва YouTube: https://www.youtube.com/channel/UC20M3T-H-Pv0FPOEfeQJtNQ По питанням - @rude_d
Джерело

Думки, про які ніхто не питав | Google випустив TurboQuant - новий алгоритм квантизації, який обіцяє в...

Логотип телеграм спільноти - Думки, про які ніхто не питав Думки, про які ніхто не питав @youneverasked
7 680 Охват/переглядів 2026-03-27 12:12 Повідомлення №914
Google випустив TurboQuant - новий алгоритм квантизації, який обіцяє використовувати в 6 разів менше пам'яті для LLM, і пришвидшувати роботу аж в 8 разів, без втрати точності. Квантазиція - це зменшення точності чисел, для того, щоб економити пам'ять. Ці числа здебільшого використовуються для того, щоб вибрати якомога вирогіднішу послідовність токенів. Зменшення точності чисел зазвичай приводить до зменшення точності вибору цього токену, але при тому швидкість пошуку його збільшується :) TuboQuant викоористовує декілька алгоритмів щоб сильніше стискати, а потім швидко відновлювати дані. Таким чином, теоретично, швидкість пошуку збільшується, а точність залишається. Для нас, як для користувачів, це значить що токени стануть дешевшими, ціни на AI доступнішими ( може, ще й локальні моделі легше буде запускати ), а ціни на пам'ять по ідеї мають впасти :) Акціі Micron який закрив консьюмерський напрямок, і перейшов на повністю enteriprise вже впали на 20%.Але знов ж таки - це все поки теорія, а ринок, як завжди, реагує, як ваша мама, коли кажете що без шапки. Хоча, якщо TurboQuant дійсно буде використаний в наступних генераціях моделей, і точність не зменьшиться - буде класно :)