Source
IT Пляшка | Короткий гайд по роботі з AI в 2025-2026.Якщо ви хочете інтегрувати AI...
327 Views/Reach
2025-09-10 21:28
Message №594
Короткий гайд по роботі з AI в 2025-2026.Якщо ви хочете інтегрувати AI в ваш проєкт, або взагалі побудувати навколо AI цілу апку, але не знаєте як і що робити, то цей пост для вас.Для початку поговоримо, як відбувається спілкування з AI на найнижчому рівні.Що треба, щоб скористатись генеративним AI:- файлик з вагами- відеокарта- python.Флоу такий: запускається все python скриптами, тобто ви передаєте вхідні дані в виклик python скрипту і цей скрипт видає результат від нейронки.Для чого python скрипт: він ваші вхідні дані (текст, картинка, відео, тощо), трансформує в тип даних, який можна прогнати через ваги моделі (.safetensors файлик), а потім вихідні дані трансформує в потрібні користувачу.Тобто комунікація зазвичай +- виглядає так:python run.py -p create image..., output.jpegЯкі у вас, як у розробника є проблеми:- ваш застосунок має бути доступним 24/7, а сервер з відеокартою дорогий- на сервер з відеокартою якось треба завантажувати вхідні файли (наприклад зображення) і викачувати вихідні- якось треба масштабувати і обробляти більше 1 запиту одночасно.Якщо ви почнете рахувати, скільки вам треба часу модифікувати скрипти запуску нейронки, щоб вони вміли викачувати файли з віддаленого сховища, а також результат завантажувати в віддалене сховище, писати свою чергу яка буде брати завдання з брокеру повідомлень і по черзі прокручувати на сервері з відеокартою, то вийде дуже сумне число з яким ви релізнетесь мінімум через пів року.Стало страшно? Якщо так, то це все інформація 5 річної давнини.Зараз же робота з AI це виключно інтеграція з готовими API сервісами де ви платите тільки за використання (найчастіше тарифи посекундні). Тобто вам достатньо зайти на hugginface, обрати нейронку яка вам подобається і прямо на її сторінці будуть приклади сервісів, які надають готове API зі зручною передачею вхідних даних (url, base64, text) і отриманням вихідних.Є також рішення, де ви можете завантажити свою модель + ранер і теж платити тільки за час, поки працює ваш застосунок. Наприклад популярний зараз ComfyUI. Так він не призначений для використання як API, але ж це вебзастосунок, а значить у нього є свій бекенд, а значить до нього можна робити запити без фронтенду.Наприклад для локальних LLM (нейронки які генерують текст), є Ollama, який має стандартизоване REST API. Підсумовуючи, щоб в 2025+ році, додати в резюме, що ви працюєте з AI, вам не треба вивчати ML, математику і тд. Достатньо базово знати які є види генеративних AI і про популярні сервіси, які надають до них serverless доступ (Replicate, Fal).