FUTURE × SIMPLE ⛩ (@thats_ai_samurai) — 2 355 suscriptores

👁 769 26-07-08 09:53

🐈‍⬛ Планував якраз під зникнення Fable 5 з підписки опублікувати допис про те, скільки він орієнтовно обійдеться за API-рейтами.Але Anthropic буквально під дедлайн подовжили доступ до 12 липня. → Новина насправді чудова — і наводить на думку, що GPT-5.6 Sol вже дууууже близько (апдейт: вже завтра), бо роздавати речі просто так не дуже лягає в бізнес-стратегію Anthropic, а конкурентний тиск — єдиний відомий спосіб змусити корпорацію бути щедрою)))) Але реальні, хоч і доволі приблизні, цифєркі від цього нікуди не ділись.😀 Отже, якщо вірити оцінкам комʼюніті, одна повна шкала Fable на підписці x20 ($200/міс) — це приблизно 150 мільйонів токенів. API-рейт Fable: $10/MTok на вхід, $50/MTok на вихід — вдвічі дорожче за Opus 4.8.Робимо не хитрі операції з множенням, і отримуємо, що:→ Якщо використати 100% інпут (теоретичний мінімум) — це вам обійдеться в 1500 американських ґривень→ Якщо використати використати 100% аутпут (теоретичний максимум) — $7500 Реальна цифра десь поміж цими значеннями, залежно від вашого розподілу input/output.😗 Іншими словами, за $200 підписки ви отримували Fable на суму від $1,500 до $7,500 — субсидія від x7.5 до x37.5.Кожен підписник, який витискає максимум з лімітів Fable, коштує Anthropic від $1300 до $7300 упущеної вигоди.🤵 Помножте на базу платних акаунтів — і стане зрозумілим, чому Fable їде з підписки перед IPO, яке Anthropic таргетують на жовтень з оцінкою під трильйон.💻 Але це якщо ми сприймаємо, що «x20» — це дійсно x20. Адже, якщо вірити нещодавньому позову проти Anthropic, Claude Max x20 на практиці видає лише 6–8x від Pro, а Max x5 — приблизно 3.5x замість пʼяти)))

Versión web Enlace directo

FUTURE × SIMPLE ⛩

👁 829 26-07-06 17:14

🤑 Про Upwork, брунатні штанці та брехню бенчмарківКожен реліз нової моделі супроводжується одним і тим самим ритуалом: їй влаштовують іспит — задачі з кодингу, тести з медицини чи права — і потім звітують, що модель «обійшла людину». 🤡 Проблема в тому, що сам «іспит» — це зазвичай стерильна задача, чіткі умови та одна правильна відповідь (або, як це часто буває, взагалі задачі, які модель бачила на тренуванні).Але якщо вам хоч трішки більше, ніж 10 років, то ви розумієте, що реальна робота виглядає, мʼяко кажучи, інакше))→ В умовах коли клієнт пише «зроби красіво, як у конкурентів, тільки інакше... і не як у конкурентів» модель, що отримує 90% на бенчмарк-тестах, зазвичай розсипається об перший же реальний бриф. 🤵 Але є цікавий бенчмарк, який якраз присвячений цим реаліям та ринку праці — Remote Labor Index.Дуже коротко зупинимось на тому, як цей бенчмарк створювали.→ Восени 2025-го Center for AI Safety разом зі Scale AI зробили річ, до якої чомусь ніхто не додумався раніше: замість вигадувати задачі — пішли на Upwork і викупили у фрилансерів їхні реальні завершені проєкти. Не просто описи, а повні проєкти: бриф від клієнта, вхідні файли й готову роботу, за яку їм заплатили ґроши.🤯 Загалом так набралося 240 замовлень із 23 категорій: ювелірні 3D-моделі, архітектурні плани, рекламна анімація, монтаж, аудіо, геймдев, дашборди. Медіанна ціна проєкту — $200, медіанний час виконання — 11.5 годин, а весь цей кошик роботи разом коштував замовникам понад $140 тисяч. → При цьому у продавців цих проєктів у середньому 2 300+ відпрацьованих годин і по $23K заробітку на платформі — ну тобто в більшості випадків це не просто рандомний підробіток. Далі кожному агенту дають рівно те, що колись отримав фрилансер — бриф і файли, — і він видає власний результат.🥃 Результат оцінює жива людина — кладе поруч дві роботи й відповідає на одне питання: чи прийняв би адекватний клієнт це замість людської роботи? Варіанти відповіді: «так» або «ні» — альтернатив немає.→ Щодо можливого включення цих проєктів до тренувальних даних — 230 з 240 проєктів лежать у приватному сеті, брифи не гугляться, а для робіт, що колись світилися онлайн, ведуть окремий блокліст доменів. В таких умовах найкращі моделі станом на осінь минулого року закривали 2.5% проєктів — тобто 6 із 240.😨 І ось нещодавно CAIS прогнали через бенчмарк свіжі моделі, результати: GPT-5.5 — 6.3%, Opus 4.8 — 8.3% та, найбільш очікуана модель, Fable 5 від Anthropic — 16.1%. З 2.5% → 16% за неповний рік, і найбільші зміни саме там, де було найгірше — 3D, CAD, відео.☺️ Для розуміння контексту: Fable 5 встигли протестувати лише на 218 задачах із 240 — далі доступ до моделі обмежили. Але навіть якщо всі непрогнані кейси зарахувати як «невдача», вийде 14.6% — все ще перше місце з єбать яким відривом.→ Це все дійсно чудово, але щоб коректно сприймати результати цього бенчмарку важливо проговорити один нюанс. Ось ці 16% — це не про те, що AI поглине шосту частину фрилансу. Це радше про те, що у 16% проєктів оцінювач не зміг сказати, що згенерована робота гірша за людську.🔫 Якщо ваші штанці стали наближені до бруна́тного кольору — не поспішайте. Самі ж CAIS визнають: жодну з робіт Fable 5 замовник як фінальну б не прийняв.Але тут важлива не точка, а вектор руху.😎 Бо в світі, де моделями рівня Fable 5 чи ну бодай Opus користується крихітна частка людей, досвід усіх інших — це безкоштовний ChatGPT чи AI Overview в видачі Google.→ Тобто більшість бачить технологію в її найдешевшій версії — звідси й суспільне нерозуміння: людині поза нашою чудовою АІ-бульбашкою розповідають про якісь мільярдні інвестицій і загрозу автоматизації цілих робочих кластерів, а вона у підсумку бачить якусь шляпу, що плутається у чотирьох абзацах. RLI, як бенчмарк, міряє якраз ось цю верхню планку — моделі, до яких у більшості поки не дійшли руки та бюджети. Але верхня планка має звичку дешевшати і за рік-два спускатися в масові продукти.🖕 Приблизно тут за класикою жанру я мав би написати щось заспокійливе, типу «але не перейматесь — AI лише інструмент у ваших руках». Не напишу — лякайтесь, бійтесь, панікуйте. Мені нравиця, як воно горить, як люди суєтяться, пожарки приїжджають…🙅‍♂️ В будь-якому разі у вас (та й в мене) є приблизно стільки часу, скільки майбутній (!) верхній планці треба буде, щоб здешевіти до масового продукту.💻 Перейматись можна, звісно, і вже, але рекомендую дочекатись трішки кращих та дешевших моделей)))

Versión web Enlace directo

FUTURE × SIMPLE ⛩

👁 759 26-07-02 11:57

😎 «Хочеться в це вірити» — Mistral та європейський АІ два роки по томуЯ раніше писав про Mistral — тодій мій допис закінчувався буквально словами «хочеться в це вірити».☺️ Так от, минуло два роки — пропоную подивитись, що з тієї романтики лишилось.Спершу про хороше.🌚 Оскільки це по суті єдиний притомний розробник власних моделей у Європі, то ґрошей в них кидали чимало: seed-раунд на €105 млн у 2023-му, далі — €385 млн, потім €600 млн.→ А потім ще €1,7 млрд під ручкою від ASML— тих самих ASML, що роблять літографічні машини для всього світового виробництва передових чипів (без EUV-літографії ASML — взагалі жодного сучасного чипа на планеті, ні в Nvidia, ні в когось ще не буде). Цю деталь запам'ятайте.Зараз, якщо вірити Bloomberg, Mistral ведуть переговори про ще один новий раунд — оцінка під €20 млрд.😱 Щодо доходу — ARR зі слів менеджменту (це не аудована цифра!) виріс із ~$20 млн на початок 2025-го до понад $400 млн на початок 2026-го. 20х стрибок, об'єктивно — потужно.Cеред клієнтів: армія Франції, Airbus та BMW, а асистентами Mistral вже користуються 10 000 французьких чиновників.🧠 Тобто як бізнес-історія Mistral виглядає чудово: єврики є, контракти є, оцінка летить вгору.Але є нюансик)))→ Поки оцінка росте — розрив із фронтиром не те, щоб відчутно зменшився. 🤵‍♂ Якщо дивитись на Artificial Analysis Intelligence Index, то найкраща модель Mistral, Medium 3.5, має 30 балів. Фронтир (Opus 4.8, GPT-5.5) — 55-56.→ І якщо ви думаєте «адмін йобнувся і порівнює Mistral з Anthropic — дуже обʼєктивно та коректно», то навіть відкриті китайські моделі знаходяться ближче до «закритих» американських капіталістичних інновацій. Той самий GLM-5.2 має 51 бал, тобто майже вдвічі більше за найрозумнішу модель Mistral. А DeepSeek V4 Pro і Kimi K2.6 — моделі, які всередині самого китайського опенсорсу вже навіть не лідери — тримають ±43–44 бали. 😒 Проговорю це словами через рот: китайські моделі, які програють іншим китайським моделям, все одно обходять найновішу та найкращу розробку Mistral із запасом у 13+ пунктів.Отже, маємо ситуацію, коли капітал подвоюється-потроюється, а технологічна дистанція лишається тою ж самою — десь ±20-25 пунктів.🤯 І тут варто розділити дві речі: оцінка компанії — це ставка на майбутнє, а AA Index — це вимір теперішнього.→ Але якщо ви думаєте, що «Mistral — ґавно, а не стартап» — нагадаю: на момент мого минулого допису це була контора на два десятки людей, яка виросла в щось притомне, і це справді єдиний живий європейський розробник власних frontier-моделей. А проблема ж насправді не в команді, адже для закриття цієї дистанції потрібен, перш за все, compute, якого в Європи є аж цілих 5% світових обчислювальних потужностей.😊 І, судячи з усього, самі ж Mistral цей розрив відчувають просто чудово, бо у квітні цього року, замість чергового релізу моделі, вони релізять маніфест під промовистою назвою «European AI: a playbook to own it».→ На першій ж сторінці слова Менша (СЕО Mistral якщо ви з контексту не поняли) про те, що без рішучих дій Європа ризикує отримати «surveillance threats, economic decline, strategic weakness, and even the erosion of our democratic freedoms». Документ насправді доволі цікавий та місцями ґрунтовний, якщо є настрій — раджу пробігтись очима.Загалом там аж 22 конкретні заходи для того, щоб Європа набула субʼєктності на АІ-ринку.😭 В цьому ж маніфесті Mistral, до речі, підтверджує, що 80%+ цифрової інфраструктури Європи — не-ЄС постачальники, а на весь континент припадає лише 5% глобального venture capita.У США, для порівняння, цей показник — 52%.💪 Іншими словами — сама компанія і є тим єдиним активом, на який вся ця «суверенність» має спертись — і водночас найкращим доказом того, чому у Європи з проблеми compute.→ Бо навіть «суверенний» стек самого Mistral — це десятки тисяч Nvidia GPU у французьких дата-центрах, а найбільший акціонер компанії — та сама ASML з початку допису, чиї машини нікуди не їдуть без експортних ліцензій: формально — нідерландських, фактично — Вашингтонських)) 😁 Тобто європейська незалежність фізично зібрана на американо-тайвансько-нідерландському апаратному ланцюжку. І це не тому, що Mistral щось робить не так — просто іншого заліза в природі не існує.💃 На думку Менша, яку він озвучив у травні з трибуни Національних зборів Франції, виграє той, хто контролює чипи та електрони — у Європи є +- 2 роки, щоб не стати «васальною державою» в плані АІ.Ну але ок — виглядає все так, ніби план є, дедлайни є, навіть бюджетик попередньо прописаний. 😡 Лишається тільки одне питаннячко — чи встигне цей євроремонт спрацювати раніше, ніж станеться щось, що перевірить цю «суверенність» на практиці?А ой.......

Versión web Enlace directo

FUTURE × SIMPLE ⛩

👁 706 26-07-01 11:00

Практичний воркшоп Agentic Engineering Workflow з двох частин:📅 3 липня, пʼятниця, 19:00 - теорія: контекст, CLAUDE.md, субагенти, Ralph loop, переключення моделей📅 4 липня, субота, 13:00 - практика: повний шлях фічі від ідеї до коду в production, наживоВеде Кирило Сулімовський - Head of Engineering GameInspire, керує 6 інженерними командами на highload (10k+ RPS, 200+ мікросервісів). Показує не «як має бути в теорії», а свій щоденний production-процес з Claude Code.На воркшопі - повний цикл від ідеї до коду:🟢 Spec-Driven Development як основа керованої AI-розробки🟢 контекст-інженерія: щоб агент не «забував» проєкт між сесіями🟢 субагенти в паралель: код, тести, рев'ю, security🟢 верифікаційні гейти, щоб агент не зламав усе одним рухомБуде корисно: Senior і Middle спеціалістам, Tech Lead'ам, Engineering-менеджерам, CTO і техфаундерам, які вже працюють з AI, але хочуть побудувати системний workflow в роботі.Два дні, живі демо на реальному проєкті. Практику можна проходити разом із Кирилом: він ділиться власним репозиторієм, тож ти не просто дивишся, а і робиш.🔥 Лише сьогодні діє найкраща ціна. Встигни зайняти місце - далі вона підніметься. Запис воркшопу теж буде.Деталі, наповнення і реєстрація 🔗

Versión web Enlace directo

FUTURE × SIMPLE ⛩

👁 740 26-06-28 14:57

🔫 Закрив кришку — вбив агента: production-проблеми, на які ми заслуговуємоЦей допис — про застосунок, який робить рівно одну і доволі просту річ, але я майже впевнений, що це буде найкорисніше, що тут виходило за останній місяць. Мені є над чим подумати щодо решти контенту, але це потім)))→ Тож, якщо пропустити всі сльози та слюні, і почати говорити по суті — якщо ви запускаєте Claude Code, Codex чи будь-який інший coding agent на MacBook 💅 і закриваєте кришечку — агент лягає спати разом з маком💅. Себто або ваша робота стопається і допобачення, або ходи з напівзігнутим ноутбуком, лох.Можливо хтось згадає caffeinate або якийсь аналог, але вони/він тримає power assertion типу «prevent idle sleep» — іншими словами, не дає маку 💅 заснути, коли ви його не чіпаєте. 🧠 Але закриття кришечки — це не idle, це не «не чіпають». Це фізична подія, і Apple Silicon ставить її в ієрархії пріоритетів вище за будь-який софтверний assertion.В ядрі macOS є модуль IOPMrootDomain — центральний контролер живлення, і датчик кришки шле сигнал напряму туди. 😡 Фактично єдине, що може цьому модулю сказати «нє спать» — конкретний прапорець SleepDisabled, якого умовний caffeinate не має.До речі, загалом Apple офіційно підтримує роботу з закритою кришкою, щоправда для цього потрібні зовнішній монітор, клавіатура та живлення.→ Сценарій, коли «за монітором» сидить LLM, якій ваш 14-дюймовий Retina не всрався від слова зовсім в Apple поки не передбачили. Але нічого страшного, доведеться просто почекати ще років 5-7. Але оскільки я пишу цей допис — є варіанти вирішити цю ганебну прикрість от прям вже.Один з +- відомих — Hold My Lid, платна апка за $9.99. Можливо ви навіть про неї раніше чули — наскільки памʼятаю то на 9to5mac щось про це точно публікували.🧠 Абоооо, якщо не тягнути, є другий варіант — Lidless, безкоштовний і з відкритим кодом під MIT. От якраз йому цей допис і присвячений.→ Він, по-факту, якраз і перемикає той самий SleepDisabled через привілейований root helper — фонову програму з максимальним рівнем доступу до системи. Сам застосунок в ядро лізти не може, тому делегує цю одну дію їй.👍 Що зручно — застосунок автоматично зупиняється, якщо мак 💅 перегрівається або батарея сідає. → І watchdog — якщо застосунок впаде чи крашнеться, helper сам повертає нормальний режим сну. Мак 💅 фізично не може залишитись в стані безсоння. Щодо безпеки, бо це root-helper і було б дивно не запитати: збірки підписані Developer ID та нотаризовані Apple, є SHA-256 для перевірки DMG. 💁‍♂ Так, застосунок не sandboxed, проте по-іншому ця функція взагалі неможлива — App Store такий рівень доступу не дозволяє. Але, якщо бути відвертим, то застосунку тиждень, менше ста завантажень — комʼюніті ще не встигло його як слід перевірити. Якщо хочете перестрахуватись — shasum -a 256 та spctl -a -vvv перед встановленням.🤵 Мій звичайний юзкейс виглядає ось так: закрити мак 💅, кинути в рюкзак і їхати кудись по справах, поки агент працює через хотспот.→ Відразу поділюсь моментиком з досвіду: якщо тримати мак увімкненим із закритою кришечкою під нормальним навантаженням — перегрів завітає до вас на чайочок доволі швидко. Тому тримайте ваш макбук 💅 на зарядочці й з хоч якоюсь вентиляцією, особливо якщо ви хеві юзер. ОСОБЛИВО якщо у вас Air.🤨 Насправді це не якийсь вау-проривний застосунок, але цікаво, що кодинг-агенти створюють попит на інфраструктуру, про яку рік тому ніхто не думав.Хто б подумав, що тримати ноутбук увімкненим із закритою кришкою — це майже production requirement))))

Versión web Enlace directo

FUTURE × SIMPLE ⛩

👁 770 26-06-26 11:12

☺️ Раз уже підняв тему Fable — обсмокчемо її ще трішки, бо хто мені заборонитьКоротко згадаю хронологію та контекст ⬇️1️⃣ 9 червня — Anthropic релізять Claude Fable 52️⃣ 12 червня, 17:21 — уряд США видає export control директиву: відрізати доступ усім іноземцям. → Формально це бан лише для «foreign nationals», але лягла модель глобально — через доктрину «deemed export»: видача контрольованої технології іноземцю — навіть тому, хто фізично на території США, включно з співробітниками Anthropic без громадянства США — юридично рахується як експорт у його країну. 👀 Перевіряти громадянство сотень мільйонів користувачів на момент блокування у реальному часі було неможливо — тож єдиний робочий варіант був вимкнути мобель для усіх. Але, щоб ви не переймались, наразі питання з верифікацією вирішується — буквально нещодавно Anthropic оновила свою політику конфіденційності. 😁 Тепер компанія зможе попросити користувача завантажити фото держ-документа (з номером і датою народження), а також своє фото або відео, з якого знімається facial geometry template — тобто, якщо без евфемізмів, біометрію. Запрацює це з 8 липня.→ При цьому Anthropic офіційно заявляють, що збір ID та біометрії «не повʼязаний з Fable чи Mythos» — це ж просто збіг у часі, ви ж розумієте.😎 До речі, що цікаво: провайдер верифікації — компанія Persona. За нею стоїть Founders Fund Пітера Тіля, який заодно інвестує і в саму Anthropic. Дам невеличкий спойлер: про Тіля згодом буде окремий допис — людинка більш ніж цікава.Але повернемось до Fable — за 90 хвилин після втручання уряду модель стає недоступною для усіх.3️⃣ 15–17 червня — Трамп перетинається з Даріо Амодеєм на G7, діалог США та Anthropic ніби став менш напруженим, але директиву так офіційно ніхто й не скасував.4️⃣ 26 червня (тобто сьогодні!) — дедлайн, до якого міністр торгівлі Латнік має письмово відзвітувати Конгресу щодо цих export controls.На що Anthropic розраховували коли продавали свій Mythos як «надто небезпечну зброю»? → Сам Амодей раніше розповідав, що компанії, яким дали ранній доступ до Mythos, казали йому: «це супер-зброя, на неї має бути ліцензія як на вогнепал, бумласка, не релізьте». Уряд США просто офіційно з ними погодився — не більше, не менше — Anthropic досягли того, чого хотіли. 👏 Хоч і причини для блокування виглядають слабко, але моделі, як ви бачите, в доступі немає — це ж офіційно найнебезпечніша модель на ринку.Єдине, що пішло не зовсім за планом — зʼявилась модель, яку просто взяти і забанити не вийде, бо вона просто качається з гітхабу. 🤝🤝 Z.ai навіть подякували — використали весь кейс як рекламу для своєї GLM-5.2.

Versión web Enlace directo

FUTURE × SIMPLE ⛩

👁 849 26-06-25 07:52

😁 Fugu Ultra, «рівень Fable 5» та підміна понятьКілька днів тому японська Sakana AI показала нову модель — Fugu, і старшу версію Fugu Ultra.→ Подають її доволі сексі: «мультиагентна система, що поводиться як одна модель». Ти використовуєш один API-ендпоінт, а всередині Fugu сама вирішує — впоратися особисто чи зібрати команду моделей, роздати їм підзадачі, перевірити й зшити відповіді докупи. Якщо дивитись на бенчмарки, то меседж більш ніж амбітний: Fugu Ultra тримається дуже тісно з Fable 5 і Mythos Preview на найжорсткіших інженерних, наукових і reasoning-тестах.💁‍♂ В прес-релізах є кейси, де Fugu обходить Gemini 3.1 Pro, Opus 4.8 та GPT-5.5 на автоматизованому research, механічному дизайні й навіть розпізнаванні японського рукопису.Нюанс в тому, що цифри Sakana — самозвітні, незалежно не відтворені станом на зараз. 🥃 Але якщо вірити усім красівим графікам та впевненим стрілочкам вгору, то дійсно — навіщо нам з вами цей наднебезпечний та недосяжний Mythos, якщо є прекрасна та надійна тойота, яку не забанить уряд США в рандомний четвер?→ Буду відвертим: особисто я нічого не тестував, але якщо вони дійсно досягають заявлених показників — це може бути робочою альтернативою для тимчасово заблокованих моделей від Anthropic. Результат є результат, але допис насправді не про це.😠 Sakana ставлять Fugu Ultra в одну бенчмарк-таблицю з фронтир-моделями й заявляють паритет — але це порівняння, якщо трішееееечки подушнити, некоректне по своїй природі. Бо порівнюють різні класи об'єктів.Fable і Mythos — це монолітні моделі. Один набір ваг, навчений end-to-end, який сам тримає всі знання й сам виконує міркування. Звертаєшся до Fable — працює саме Fable.→ Fugu влаштована інакше: це теж мовна модель, але її спеціалізація — оркестрація: коли делегувати, кому делегувати, як зшити чужі відповіді в одну. Важку роботу виконують не її ваги, а пул сторонніх моделей. Прибери цей пул — і фронтир-система миттєво перетворюється на дуже посередню модель. І щоб одразу закрити очевидне питання: це НЕ Mixture-of-Experts. MoE (умовний Mixtral) — теж моноліт, де експерти живуть усередині одних ваг, навчені разом, маршрутизація внутрішня.Тут маршрутизація зовнішня — між окремими моделями, які тренувались нарізно й не ділять ваги.💁‍♂ І тут є ще один нюансик, який Sakana делікатно обходить: оцінка оркестратора — це не властивість оркестратора. Це властивість пулу плюс політики маршрутизації.→ Якщо в пулі ті самі Opus, GPT-5.5 та Gemini, проти яких його й порівнюють — то «Fugu Ultra ≈ Fable» означає рівно одне: «Opus + GPT + Gemini ≈ Fable». Тобто виміряли не Fugu, а пул, який вона смикає за ниточки — і героїчно довели, що хороші моделі хороші. Вражає, чесслово. Оркестратор — це, якщо тупо та доволі грубо спрощувати, хитровиєбаний менеджер, який самостійно робить не так багато, але чудово орієнтується, кому передати фронтенд, кому — безпеку, кому — бекенд, і вміє звести все докупи. 🤨 Але при цьому оркестратор має ступінь свободи, якого в моноліта немає: йому, очевидно, не треба бути найкращим у всьому самому — достатньо знати, хто з пулу що може потягнути, і роздати це все правильно по «руках».Але це, якщо що, не тупо if/else по ключових словах — Sakana навчили окремого координатора (їхні TRINITY/Conductor), який реально працює над тим, кому і що делегувати.→ Іншими словами, Fugu збирає верхню обгортку пулу — під кожен тест знаходить модель, що його виконує найкраще. Жодна модель поодинці так не вміє, а от їхній найкращий зріз — так. Найкраще це працює там, де профіль задачі передбачуваний — тобто на бенчмарках.На реальній, «брудній» задачі, де незрозуміло, це «код», «продукт» чи «похуй», сигнал для маршрутизації слабшає — і відрив від чесного моноліта тане.Тому оркестратор не = моделі рівня Fable.🚬 Оркестрація загалом — природна відповідь ринку на те, що тренувати все більші моноліти стає все довше й дорожче. Зібрати фронтир із готових шматків банально дешевше, ніж «виростити» свій.Під кінець проговорю ще раз: на практичному рівні різниця цілком може бути малопомітною. 🤵 Ти шлеш запит, отримуєш відповідь, і тобі, поклавши руку на серце, абсолютно всеодно, що відбувалося всередині — чи відпрацював там один Fable, чи естафета з актуальних моделей OpenAI, Google та Anthropic.💻 Але хто я такий, щоб шось засуджувати: в цьому точно є своя краса — Sakana, по суті, підтверджують, що правильний менеджмент чужих ресурсів має цінність.Я вже чекаю з нетерпівнням наступний прес-реліз, де хтось навчить оркестратор оркеструвати оркестратори і нарешті у людства буде цей ваш «AGI».🫥 Загалом, індустрія рухається туди, куди рухається, але це вже тема для наступного разу. Всіх цьом.

Versión web Enlace directo

FUTURE × SIMPLE ⛩

👁 1,260 26-06-15 21:53

🤑 Anthropic, Fable та Порошенко — бачите звʼязок?Панове, хочете трішки теорій змови? Ну шо ти киваєш «ні», я ж бачу збудження твоїх нейронів, сонце — собі хоч не бреши.Отже, поговоримо про ситуацію навколо Fable та Mythos від Anthropic.💃 Якщо зовсім коротко для контексту, можливо хто не в курсі: Mythos — це наразі найпотужніша модель Anthropic, яку вони самі побоялись пускати в широкий доступ. → Аргумент — вона знаходить вразливості мало не в будь-якому софті, тож «занадто небезпечно», тому Mythos роздали лише вузькому колу обраних (проєкт Glasswing). 💪 А для всіх решти зробили Fable — ту саму Mythos-class потужність, тільки з накрученими запобіжниками, і віддали в широкий доступ — на AWS і платформі Claude.Модель кілька днів повисіла в публічному доступі — усі встигли її потицяти, протестити й нахвалити. І рівно в цей момент її «забороняє» уряд США як занадто небезпечну.🤯 Ну бо блін, як так — модель можна «зламати» фразою «fix this code» і вона.... І ВОНА!!!!! знаходить у коді вразливості. Дивовижно, правда? Упускаємо той факт, що се саме вміють усі топові моделі, і це навіть не баг — це фіча для кіберзахисту. Тобто обʼєктивно банити нема за що.Але йдемо далі — хто «допоміг» цю модельку забанити? → Я тягнути довго не буду — це був Amazon. Точніше, особисто CEO Енді Джассі, який зателефонував міністру фінансів США та в Білий дім — мовляв, дивіться, яка небезпечна штука. І це той самий Amazon, який є одним з найбільших інвесторів Anthropic і власником хмари, на якій усе це крутиться.👏 Anthropic заходять на IPO з ціллю під трильйон доларів. Хто з цих двох НЕ зацікавлений, щоб лістинг відбувся на максимальних цифрах?Дорожча Anthropic = дорожча частка Amazon + більше грошей за компют на AWS.💀 І тут бан перестає бути проблемою й стає інструментом, бо рекламу то звісно можна купити, а от держсертифікат «ця моделька настільки потужна, що ми були змушені обмежити її як зброю» — нє.→ Сприймате це як «блокування для підтвердження переваги»: для й так вже прогрітого ринку просто ще раз зафіксували, що ось вона — найсильніша модель планети, і вона так далеко попереду, що держава злякалась. Цього тижня, до речі, Anthropic поїхали у Вашингтон домовлятися з урядом — а з тими урядовими аргументами для блокування модельки, які я бачив в публічному просторі — ставлю на те, що Fable відносно швидко розблокують.💻 P. S. Чи поїхав адмін кукухою? Можливо (я про себе в третій особі пишу, це вже не «можливо», а очевидно). Чи накрутив я собі зайвого? Теж можливо. Але чи можливо, що бан такої моделі під IPO на трильйон — це не баг, а фіча? Побачимо-побачимо. Але нейрокозацтво, вірте в мене, а я віритиму у вас теж в себе — дякую, лавкі, чмокі, спіть спокійно.

Versión web Enlace directo

FUTURE × SIMPLE ⛩

👁 1,390 26-06-10 13:28

😠 Нативка, агенти та чому цей допис — реклама (але дочитайте)Ситуація така: мені написали з KSE та попросили розповісти про їхню літню школу з агентного АІ.→ Я пів каналу витратив на дописи про cheap signals та АІ-слоп, тому вдавати, що це «органічна рекомендація від душі» було б смішно — ні, це на 100% нативка (за яку мені, до речі, не платили — а могли б!). 😁 Але є нюанс: зазвичай мені в особисті стукають з пропозиціями прорекламувати «курс по заработку на нейросетях» або чергове «інвестуй $100 — забери $10 000».А тут прийшло щось, що збігається з тим, заради чого цей канал взагалі існує. Тому я подивився — і так, воно виглядає притомно. Пояснюю чому.👏 Якщо ви тут не перший день, то могли помітити: куди не тицьни в стрічці каналу — майже всюди вилізе автономний агент.→ Індустрія перейшла від стану «моделька відповідає на наші питаннячка» до «воно автономно виконує роботу». І різниця між тими, хто вміє промптити, і тими, хто вміє ці системи проєктувати — це вже не суто скіл-геп. ⚫️ Так от, KSE відкривають Agentic AI Summer School — 10 тижнів саме про побудову автономних агентів: GPU-інфраструктура, агентний runtime, реальні задачі від партнерів та Demo Day перед живими технічними командами.Коротко по фактах:• 30 місць, конкурсний відбір (тест → онлайн-кваліфікація → співбесіда)• безоплатно + стипендія ~$600/міс + проживання в Києві• ментор, навчання українською та англійською, сертифікат після захисту проєкту• старт — 1 липня Окремий момент: бути кул-програмістом — необовʼязково. Математик, фізик, аналітик, економіст чи навіть юрист, який працює з даними — ви всі підходите КШЕ. 🗓 Дедлайн заявок — 20 червня🔗 university.kse.ua/agentic-ai-summer-school-2026✉️ [email protected]🧠 Резюмуючи: вам пропонують безкоштовно (ще й з гонораром) опинитись на правильному боці автоматизації.Якщо вам 17–25 і ви чекаєте на якийсь знак — можливо це він (нагадаю ще раз: скіл + стипендія + нульова вартість!!!).

Versión web Enlace directo

FUTURE × SIMPLE ⛩

👁 1,890 26-04-18 16:49

🤑 Про АІ-блеклисти, автентичність та лексику — та шо вже й тут не так?Після попереднього допису про costly signals логічно було б написати щось типу «окей, а як тоді писати, щоб текст не смердів АІ». ⚫️ Найочевидніша відповідь — писати його самому, але ви ж точно не шукаєте складних шляхів, тому розберемо це все з точки зору досліджень та, що ще важливіше, моєї субʼєктивної думки. Перший же гайд, який ви на цю тему знайдете в інтернетах даватиме стандартну пораду: уникайте слів-маркерів АІ, які вкрай легко зчитуються.🤔 В англійській мові це, наприклад: delve, meticulous, realm, adept, underscore, bolster, tapestry, commendable, pivotal (поки що фіксуємось саме на англійській, бо там далі буде аргументарне підкріплення). Звучить ніби як логічно, але нюанс в тому, що це застаріло ~3 роки тому — пояснюю чому.→ У вересні 2024-го команда з Max Planck Institute for Human Development виклала на arXiv препринт (з оновленням влітку 2025-го) з назвою, яка вже сама по собі цікава: «Empirical evidence of Large Language Model's influence on human spoken communication» — іншими словами, емпіричні докази впливу LLM на людське мовлення. В чому суть: дослідники прогнали через свій аналіз 360 000 академічних YouTube-відео та 771 000 подкастів — дані до й після виходу ChatGPT.🤨 Результат: у спонтанному, неписаному мовленні типові GPT-words на кшталт «delve», «comprehend», «boast», «swift», «meticulous» почали звучати на 25–50% частіше, ніж до листопада 2022-го.І нюанс в тому, що вибірка — це здебільшого живі лекції, подкасти чи звичайні розмови, а не AI-ютуб-канали з синтезованим голосом поверх згенерованого скрипту.→ Саме дослідження почалось з особистого спостереження одного з дослідників, який помітив «delve» у власному щоденному мовленні й вирішив перевірити, чи лише йому так здається. Виявилось, що ні — і ця підміна відбувається не на етапі редагування, а до нього. 😨 Ці всі маркери просто першими спливають у голові, і ми не можемо їх «не написати», бо вони вже знаходяться в активному словнику. ⚫️ Тому логіка блеклистів і ламається, адже якщо дотримуватись логіки «просто викреслити delve і сходити за людину», то тоді десь має існувати окремий «АІ-словник», від якого можна відсторонитись. А дослідження показує зворотне — відсторонятись немає від чого. 🖕 Бо ваш «автентичний голос» — це вже збірний компост усього, що ви поглинали останні років десять. В доШІшну епоху — книжки, Реддіт, статті ще щось. Після — все те саме, але + тексти, створені та/або редаговані нейромережами. 🤖 По суті, ми і є нейромережі — просунуті біологічні машини з розпізнавання шаблонів — що споживаємо, те й відтворюємо.Ніякого «чистого» вас, куди можна повернутися, почистивши лексику — не існує.⌨️ Людина, яка в житті не відкривала умовний СhatGPT, але скролить Medium, буде писати приблизно так само, як та, що генерує все через GPT-5.x. Відрізнити неможливо тому, що на рівні слів відрізняти вже нема від чого.→ Раніше, до речі, ніхто особливо не переживав, що «пишу в стилі Кінга, бо прочитав його в 9-му класі». Змінилось лише джерело впливу — механізм той самий. 💡 І тут виходимо на петлю — на наратив минулого допису, тільки трішки ширше: cheap signal це не про «писати словами-маркерами», а про текст, у якому автор нічим не ризикнув.🔻LLM тренуються на мінімум сюрпризів — семплінг додає трохи випадковості, але нахил у бік передбачуваного лишається.А в теорії інформації є стара ідея, яку зараз варто почути: інформація — це лише те, чого ви не могли вгадати. ⚫️Передбачуване речення за визначенням не несе майже нічого. І коли автоматичне читання зустрічається з автоматичним письмом, посередині лишається форма без змісту. 😁 Ось це і є, як на мене, наразі єдиний робочий маркер авторства — чи є в тексті хоч одне речення, яке модель не витягне сама з розподілу.→ Якщо є — забийте на блеклисти→ Якщо нема — ніякий блеклист вже не допоможе Бо проблема ніколи й не була в тому, що ви пишете «як АІ» — вам просто нема чого сказати. Шо поробиш.

Versión web Enlace directo

FUTURE × SIMPLE ⛩

👥 Número de suscriptores

👁️ Vistas promedio por mensaje

📊 Mensajes por Día

Historial de cambios de logotipo

Historial de cambios de nombre

Historial de cambios de estado

Muro

Consultas populares