Поки сьогодні всі чекають AI революцію від Apple на WWDC 2026: Покажу вам «Siri здорової людини», яку вже може створити кожен в кого є ПК і трошки досвіду в AI FineTuning 🫴🏻 Mac-1 Це донавчений на синтетичному датасеті Qwen 3.5 4b + 2b merge модель + 700 мільйонний датасетНа виході маємо 6.6 мільярдну модель, яка може працювати з більш ніж 450+ tools на Mac і працюватиме локально на кожному макбуці з 8 gb RAM🤌🏻Ця SLM обходить по точності:> Gemini Flash 3> GPT 5.4 mini> Claude HaikuВідео використання, для розуміння того як виглядає автономний AI пошук файлів на MacBook за допомогою локальної натренованої моделі Mac-1 🫴🏻 Реліз моделі відбудеться вже після WWDC 2026, від результатів презентації Apple, залежить чи вийде ця SLM безкоштовно чи буде продаватися доступ всім бажаючим тут Ось такий цікавий кейс finetune моделі 👀Якщо ж ви хочете створювати свої синтетичні датасети та кастомні моделі вам сюди: Приєднуйтесь до нас, навіть якщо у вас до цього було 0 досвіду. AI вже зараз виконує всю «чорну технічну роботу», а поріг входу неймовірно низький і далі буде лише зменшуватись…Встигніть розібратись і зайняти вільну нішу разом з правильними людьми Мені насправді цікаво чи зробить Apple сьогодні нарешті шось краще, з того, що вже робить open source комюніті 🤔Які ваші ставки?)
Гарні новини для Local AI:Google випустили Gemma 4 12B і зробили потужний локальний ШІ неймовірно доступним.Модель запуститься на ноутбуці з 16GB RAM або на бюджетній відеокарті рівня RTX 3060.Погляньте на цифри:Порівняння з їхньою попередньою флагманською великою моделлю Gemma 3 27B:Математика: 20.8% → 77.5% (+272%)Агентність: 16.2% → 69.0% (+326%)Кодинг: 29.1% → 72.0% (+147%)В два рази менше параметрів, а приріст у сотні відсотків 🫴🏻 В чому головний феномен?Раніше, щоб зробити мультимодальність – компанії запихували різні моделі в одну одночасно. Vision encoder + Audio encoder + Text. Це те саме що підіймати 3 моделі в 1 і перераховувати їхні інпути всередині – на що йшло понад 30% пам'яті та заліза.А тепер немає енкодерів = немає проблем.Модель прямо «з коробки» чує ваш голос (до 30 секунд), бачить зображення і відеоряд покадрово. Все в одному швидко і енергоефективно.Але є підводний камінь, про який мало говорять 👇Gemma 4 12B використовує Sliding Window Attention – модель «бачить» повністю тільки останні 800 слів діалогу. Все що раніше – обробляється лише частково. Для коротких задач непомітно. Але для довгих розмов або великих файлів – може губити початок. 🫠І тут слід згадати конкурента – Qwen 3.5 9B від Alibaba.Менша, швидша і займає 5–6 GB проти 8–10 GB у Gemma. На найважчих задачах PhD-рівня бере 30%, поки Gemma видає 5%. І пам'ятає весь контекст діалогу без обривів – бо використовує звичайну повну увагу (attention) без вікон🤌🏻Підсумуємо:Потрібне аудіо, 140 мов, мультимодальність, fine-tune під свій домен → Gemma 4 12BПотрібний глибокий reasoning, менше VRAM, довгі діалоги без втрат і кращий tool calling → Qwen 3.5 9BДуже непоганий вибір для локального ШІ 👏А як ваш досвід використання? діліться в коментарях 👇
Навчання AI-моделі більше не коштує як квартира Завдяки революційному Token Superposition MethodМи всі чули: “натренувати свою LLM – це мільйони доларів і місяці роботи”. І це правда… для GPT-4 чи Llama 3 70B.Але що якщо нам потрібна невелика, своя, спеціалізована модель з нуля – наприклад, на 2 мільярди параметрів?Ось я вам приніс реальні цифри і дуже цікавий, не побоюсь цього слова «революційний» метод 👇Спочатку по базі: Повноцінний pretrain 2B-моделі на 500B токенів на хмарних GPU (H100) обійдеться приблизно в $3,000–5,000. Якщо хочеш “нормальну” якість на 2T токенів – вже $15,000–20,000.З новим методом від Nous Research - Token Superposition Training (TST):Ті самі результати за вдвічі менше часу і грошей🤌🏻Поясню як це працює: Замість того, щоб вчити модель передбачати один наступний токен - на початку навчання їй дають “пачки” токенів одразу. Це як читати текст абзацами замість по одному слову. Модель швидше вловлює патерни мови.Після 30% тренування – повертаємось до звичайного режиму. На виході отримуємо абсолютно стандартну модель, яка нічим не відрізняється від натренованої класичним способом. Але витрачаємо вдвічі менше ресурсів.Реальний виграш для 2B-моделі:500B токенів: $4,800 → $2,5502T токенів: $19,200 → $10,200А якщо тренуєш на власній відеокарті локально –замість 90 днів отримуєш 50. Нічого не змінюється в архітектурі моделі і токенізаторі, лише логіка першої фази навчання.Для тих, хто хоче будувати власні AI-рішення - це дуже і дуже хороша новинаМетод опублікований сьогодні ⏰Я рекомендую його дослідити всім хто має амбіції не тільки до навчати готові open-source моделі, а й створити свою LLM з нуля 👉🏻 https://nousresearch.com/token-superposition/
Перша open-weights модель, яка одночасно обігнала Claude Opus 4.6, GPT-5.4 і Gemini 3.1 Pro на Humanity Last Exam з інструментами (54.0) і SWE-Bench Pro (58.6). Впевнено можу сказати, що наразі, закриті гіганти програли відкритій моделі – Kimi K2.6Чому я так думаю і на які пункти варто звернути увагу: Toolathlon (tool decathlon) підскочив з 27.8 до 50.0 (+22 пункти за півроку). Зазвичай моделі ростуть на 3–5 пунктів за покоління. Це не просто «кращий tool-use» - це реальний стрибок у стабільності довгих агентних ланцюгів. Прям реально довгих. Модель не масштабує thinking, а масштабує parallel. Замість одного довгого ланцюжка – рій гетерогенних агентів (Parallel-Agent RL). Це архітектурна ставка, якої поки немає в OpenAI/Anthropic.Архітектура: 1T параметрів загалом, але лише 32B активних (MoE, 384 експерта, 8 на токен). 256K контексту. Тренували на мільйонах синтетичних мульти-тур траєкторій з реальними інструментами — тому модель не «забуває» план через 12 годин роботи.Ціна – просто вбиває топових конкурентів: input у 4–8 разів дешевше GPT-5.4/Claude Opus, output у 6–10 разів. + Локально можна запустити через GGUF (Unsloth вже готує)Тестити безкоштовно тут - ttps://www.kimi.comДоступ для агентів по API тут - https://platform.moonshot.ai/Скачати модель можна тут - https://huggingface.co/moonshotai/Kimi-K2.6PS:Щоб запустити модель локально вам треба кластер з 8x NVIDIA L20 по 48gb VRAM (сумарно, ця найкраща в світі станом на зараз SOTA модель, потребує 384gb VRAM)Для AI інженерів і тих хто займається деплоєм LLM, ось вам гайд як її підняти локально - https://huggingface.co/moonshotai/Kimi-K2.6/blob/main/docs/deploy_guidance.mdНу показуйте і розказуйте, діліться враженнями в коментарях як вам ця нова State Of The Art модель 👇🏻
Локальний AI знову перетворився на нішу для гіків?Після виходу мультимодального Gemini 3 це питання стало актуальним. Навіщо оркеструвати різні моделі та налаштовувати складні пайплайни, якщо є Google? (Reasoning, текст і відеострімінг — усе «з коробки»).Це дійсно було так до сьогодні Бо тепер кожен може мати свого персонального мультимодального «монстра» рівня GPT-5 або Gemini Flash 2.5 Pro в себе локально на пристрої. Модель, що бачить відео в реалтаймі і працює на народній RTX 3060 🤌🏻Компанія Stepfun релізнула Step3-VL-10B. І для мене це не просто модель, а сенсація і ось чому:▫️Модель має всього 10 млрд параметрів (у 20-30 разів менше за конкурентів), але в складних математичних задачах обходить GPT-5.◽️Повноцінне розуміння відеопотоку в реальному часі без надсилання даних у хмару.◽️Це open-source модель з ліцензією Apache 2.0. Важливий крок до розвитку Embodied AI та автономних систем.Тож виходить, що локальне залізо знову дає відсіч хмарним гігантам.😁Фан факт: модель навчена на 1.2 трильйонах токенів даних, це приблизно 3 мільярди сторінок А4Якщо б ви читали 1 сторінку за хвилину, вам знадобилося б – 5000 років (Ось настільки це багато) Інфа для гіків: Там використаний механізм пералельного мислення з внутрішніми перевірками (PaCore) це нова парадигма мультиоркестратора мультиагентної системи в одній моделі з коробкиЦе вже більше про режисуру поведінки агентів всередині однієї моделі ніж про кількість параметрів і потужність заліза Посилання на модель: https://huggingface.co/stepfun-ai/Step3-VL-10B
ТЕРМІНОВО: n8n під ударом – критична вразливість 10/10Друзі, ви зі мною, тому хочу, щоб ви дізналися про це першими і встигли захиститися, поки інші «експерти» мовчать.Виявлено діру в n8n з максимально можливим рейтингом небезпеки — CVSS 10.0. Це «червоний код».Коротко, чому це катастрофа:🫴🏻 Доступ без пароля: Хакери можуть отримати повний контроль над вашим сервером дистанційно.🫴🏻 Витік усього: Оскільки n8n — це центр вашої автоматизації, у зловмисників опиняться всі ваші API-ключі від CRM, банків, Telegram-ботів та клієнтських баз.🫴🏻 Масштаб: Це стосується всіх, хто використовує self-hosted версію (Docker, npm).⚠️ ЩО РОБИТИ ПРЯМО ЗАРАЗ:1. ОНОВІТЬСЯ: Негайно підтягніть останню версію n8n (розробники вже випустили патч).2. ЗМІНІТЬ КЛЮЧІ: Якщо ваш сервер був відкритий в інет без VPN – вважайте, що ключі вже скомпрометовані. Перевипустіть найважливіші токени.3. ЗАКРИЙТЕ ДОСТУП: Не тримайте n8n у відкритому доступі. Використовуйте Cloudflare Access, VPN або обмеження по IP.Поки інші обговорюють успішні кейси, ми дбаємо про безпеку своїх клієнтів та близьких друзів. Перешліть цей пост колегам, які працюють з автоматизацією!Деталі тут: The Hacker Newshttps://youtu.be/JZAADc8rF9Q