Canal Ключка – Product Growth від Семьонова - @klu4ka - №133
Вихідні були цікавими – порівнював перформанс топових LLM для генерації маркетингових матеріалів. Субʼєктивно оцінював якість по 10-бальній шкалі та додавав оцінки по пʼяти маркетингових промптах. Ось список:1. OpenAI O1: 402. DeepSeek R1: 383. Claude Sonnet 3.5: 364. DeepSeek V3: 345. OpenAI 4o: 28O3 ще не тестував, бо вийшла на вихідних. За DeepSeek не судіть строго – цікаво було дослідити. Але застерігаю, що її використання несе ризики по безпеці та приватності, детальніше за це писав тут. Взагалі найбільше операційно використовую для маркетингових завдань Claude Sonnet 3.5, бо у них дуже зручна фіча artifacts, яка має розмітку та може робити графіки. + Модель дуже швидка, і якщо додавати "думаючі" промпти формату "Think step-by step", "Take a deep breath" та "Take your time", то подекуди дотягує і до думаючих моделей. Чекаю взагалі реліз думаючого Соннета та оновлень модельки, бо Anthropic починає відставати. Загалом цікаво, як змінився флоу роботи по марктетингу – тепер руками пишу десь 20% інформації, все інше – це або з Aiter або "пінг-понг" з LLMками. Руками писати, доречі, залишається важливим, щоб мозок не атрофувався. Зараз проводжу цікавий експеримент з оптимізації промптів – роблю це, використовуючи загальнопоширені найкращі практики, а також комбінуючи пропозиції від O1, R1 та Claude. В результаті виходить пушка, наступний реліз Aiter має бути гарячим. А хтось ганяв уже О3 для маркетингу? Які враження?---Підписатись на канал: @klu4kaФоловити мене у інших соцмережах: Linkedin | FacebookПотестувати мій продукт: aiter.io
194
25-02-03 12:20