Джерело
Нейромережі | Mistral оновили CodestralНова версія 25.01 значно розумніша і вдвічі ш...
779 Охват/переглядів
2025-01-14 18:05
Повідомлення №1642
📌Mistral оновили CodestralНова версія 25.01 значно розумніша і вдвічі швидша, через оновлений токенізатор і поліпшену архітектуру. Вікно контексту розширили до 256к токенів. Заявляють перше місце на Copilot Arena, але результати поки що не опублікували.З бенчами знову бешкетують - Qwen 2.5 Coder у порівнянні відсутній, сімейство Llama тут представляє не Llama 3.3, а Codellama 70B півторарічної давності. З моделями DeepSeek цього разу все ж порівнюють, але тільки з моделями, меншими за 100B параметрів, через що сильні MoE моделі з порівняння випадають. Але ж Codestral коштує на рівні знижкових цін DeepSeek V3 - $0.09/$0.30 за вхід/вихід, не на рівні моделей поменше. Але у Mistral немає context caching, що сильно підвищує ціну при реальному використанні моделі в кодингу (у Copilot сценаріях часто вхідних токенів 95%+). Чекаємо незалежних бенчів, щоб зрозуміти реально співвідношення ціни та якості.Терезів у відкритий доступ не дають, навіть за кастрованою ліцензією. Спробувати безкоштовно можна через плагін continue.dev, він доступний для VS Code і JetBrains.➡️Запроси друга до Neirom🇺🇦