🔥 Midjourney V7 - вийшов! Ураааа (ніт). Вбудована персоналізація. Персоналізація? Без можливості відключити? Ну окей, але оцінювати вручну сотні (а може й тисячі) картинок, щоб модель нормально працювала — сумнівне задоволення. Відчуття, що команда просто знайшла спосіб отримати безкоштовну розмітку даних від користувачів.Новий Draft-режим, коли ви можете створити "набросок" зображення в 10 разів швидше, а потім якщо сподобалось вже переробити в основне зображення повноцінне. І нашо воно треба?Навіть додали голосовий ввід (як у ChatGPT), але за голосом воно не редагує вже створене зображення, а тільки перероблює промпт. Тобто генерує заново. Ну ок))Нормальнї генерації тексту, звичайно, немає — для цього все ще йдете до GPT-4o чи Gemini. Здається, Midjourney остаточно вирішили залишитись у ролі «естетичного генератора», хоча навіть тут помітної різниці між v6 і v7 немає.Велика частина фішок ще не вийшла, обіцяють у наступні два місяці. Але на тлі останніх релізів від ChatGPT та Reve, Midjourney виглядає вже якось зовсім несерйозно й банально.Короче після GPT 4o, Gemini та Reve - просто шляпа як на мене.
Зробив одну дуже корисну автоматизацію, в якій нейромережа може "дивитися" відео 💃Так-так, не просто транскрибувати голос, що й так усюди є. А саме дивитись відео. Це автоматизація, яка може бути відозмінена та інтегрована у величезну кількість проєктів.Працює наступним чином — кидаєте відео в ТГ бота (скоро зроблю, що можна і посилання буде скидати, поки просто відео), а воно вам видає повний розклад, що було на відео по сценам.Перелік потенційних інтеграцій — нескінченний.Маркетинг:- Аналіз рекламних роликів конкурентів — розбір структури: початок-зачіпка, офер, соцдоказ, заклик до дії. - Розбір трендових відео TikTok/Instagram — зрозуміти, яка композиція/структура повторюється. - Авто-генератор Рілсів: завантажуєте відео в бота, а отримуєте на виході вашого аватара, який розповідає якусь новину, UGC тощо.Продакшн / Відеомонтаж:- Чернеткова розкадровка — відеографи можуть зняти rough-cut, а бот автоматично робить структуру і назви сцен. - Асистент сценариста — бачачи структуру, можна швидко редагувати або перебудовувати розповідь.Освіта / Курси / Навчання:- Таймкоди для відеоуроків — бот сам ставить розмітку на ключові переходи між темами. - Аналіз виступів — розбір риторики, мови тіла, сценічного руху.З вас 💯 реакцій — і викладаю шаблон в хаб.
🚀 Cursor AI ще більше, вище, сильнішеСтартап Anysphere, відомий своїм продуктом Cursor, залучив 105 мільйонів доларів інвестицій у Series B раунді від лідерів венчуру, таких як Thrive Capital та Andreessen Horowitz, також залетів і Benchmark.Cursor, заснований випускниками MIT Майклом Труеллом, Суалехом Асіфом, Арвідом Луннемарком та Аманом Сангером, амбітно прагне писати програмне забезпечення в три кліки.Минулого місяця стартап представив унікальну можливість часткової автоматизації кодування - AI-агенти здатні самостійно навігувати контексти та виконувати термінальні команди.Попередній раунд інвестицій у $60 мільйонів вже підняв оцінку компанії до $400 мільйонів. Cursor активно конкурує з GitHub Copilot, Codeium та іншими інструментами, демонструючи вражаючі можливості, як-от створення повноцінного додатку за одним текстовим промптом.Схоже, що моє рішення не працювати за вахом (моя вища освіта - програміст), а піти в бізнес - з часом тільки набирає підтверджень у правильності прийняття))Потикати тут - https://www.cursor.com
В GPT є таке поняття, як embeddings — векторне відображення сенсу слів, фраз і навіть цілих текстів.Якщо порівнювати (через косинусну відстань) ембеддинги двох схожих слів, то можна побачити, наскільки вони близькі за змістом, байдуже якою мовою.Наприклад, «пес», «dog» і «puppy» можуть мати відстань близько 0.05, що свідчить про їхню схожість.Та сама логіка застосовується і для великих текстів — можна знаходити схожі за змістом уривки або робити контекстний пошук.Так працюють векторні бази даних. Цікаво, що ембеддинги можна «додавати», поєднуючи сенси. Склавши «собака» + «синій», дістанемо «синю собаку». А в прикладі king – man + woman = queen це працює так: від поняття «король» віднімаємо «чоловік» і додаємо «жінка», отримуємо «королева».Якщо умовно від Лондона відняти Англію й натомість додати Україну, маємо Київ. Бо Лондон – Англія у цьому контексті означає «столиця», і столиця + Україна = Київ.Тепер уявімо, що ми “конвертуємо” товари в економіці теж у вигляді ембеддингів.Це відкриває шлях до бартеру, коли ми «міняємо» урок з танців на буханку хліба, відстежуючи не грошову вартість, а «векторну» цінність кожного товару чи послуги.Далі можна визначати різницю між «розбитим телефоном» і «справним телефоном», назвавши це «ремонтом телефону», або (токарний верстат + деталь) – «заточена деталь під втулку» = «процес заточки деталі на верстаті». Так ми описуємо всі можливі економічні перетворення в форматі векторів.І от так, можливо, виглядатиме «нова економіка» на базі ембеддингів. Я вказую, що в мене є, які маю навички, а система пропонує, чим я можу зайнятися сьогодні. Я пишу, що мені потрібно, а вона знаходить потрібні товари чи послуги й організовує процес.Це все, звичайно, теорії, але виглядає досить цікаво, враховуючи масштабний вплив АІ на ринок праці в наступні 5-10 років 🤔