Iniciar sesión Registro
Anuncios
Tu espacio publicitario
Reserva este slot exclusivo para el periodo elegido.
Comprar publicidad →
Logotipo de la comunidad de telegram - Думки, про які ніхто не питав
Añadido 14 jul. 2024

Думки, про які ніхто не питав

@youneverasked
Número de suscriptores: 10 048
Fotos: 278
Videos: 26
Enlaces: 492
Descripción:
Мої думки, про які ніхто не питав Авторський канал Діми Малєєва YouTube: https://www.youtube.com/channel/UC20M3T-H-Pv0FPOEfeQJtNQ По питанням - @rude_d
Fuente

Думки, про які ніхто не питав | Google випустив TurboQuant - новий алгоритм квантизації, який обіцяє в...

Logotipo de la comunidad de telegram - Думки, про які ніхто не питав Думки, про які ніхто не питав @youneverasked
7 680 Vistas/Alcance 2026-03-27 12:12 Mensaje №914
Google випустив TurboQuant - новий алгоритм квантизації, який обіцяє використовувати в 6 разів менше пам'яті для LLM, і пришвидшувати роботу аж в 8 разів, без втрати точності. Квантазиція - це зменшення точності чисел, для того, щоб економити пам'ять. Ці числа здебільшого використовуються для того, щоб вибрати якомога вирогіднішу послідовність токенів. Зменшення точності чисел зазвичай приводить до зменшення точності вибору цього токену, але при тому швидкість пошуку його збільшується :) TuboQuant викоористовує декілька алгоритмів щоб сильніше стискати, а потім швидко відновлювати дані. Таким чином, теоретично, швидкість пошуку збільшується, а точність залишається. Для нас, як для користувачів, це значить що токени стануть дешевшими, ціни на AI доступнішими ( може, ще й локальні моделі легше буде запускати ), а ціни на пам'ять по ідеї мають впасти :) Акціі Micron який закрив консьюмерський напрямок, і перейшов на повністю enteriprise вже впали на 20%.Але знов ж таки - це все поки теорія, а ринок, як завжди, реагує, як ваша мама, коли кажете що без шапки. Хоча, якщо TurboQuant дійсно буде використаний в наступних генераціях моделей, і точність не зменьшиться - буде класно :)