Canal ( ಠ ʖ̯ ಠ)☞ Я тестую: SEO та ШІ 🇺🇦 - @itest_ua - №4371
Токени в ШІ: розбираємося з основамиЩо таке токени і чому вони важливі?Токен - це мінімальна одиниця тексту, яку розуміє ШІ. Це може бути:- Частина слова- Ціле слово- Розділовий знак- Пробіл🔍 Цікаві факти про токени:1. Різниця між мовами:- Українська: 1 токен ≈ 2 літери- Англійська: 1 токен ≈ 4 літери2. Розмір промта (запиту):ChatGPT 4: 8 тис. токенівClaude: 16 тис. токенівGemini: 32 тис. токенів3. максимальна відповідь:- Українською: 4,096 токенів ≈ 8,000 символів ≈ 3 сторінки- Англійською: 4,096 токенів ≈ 16,000 символів ≈ 6 сторінокЦе пояснює, чому один і той самий текст різними мовами займає різну кількість токенів!Тут можна порахувати скільки токенів у вашому тексті, це офіційний токенайзер OpenAI https://platform.openai.com/tokenizerЯкщо хочете заощадити токени, формуйте запитання лаконічно, уникайте зайвих слів та обирайте мову залежно від об'єму тексту, і буде вам щастя!😎PS. Додаю фото, де наочно можете побачити вартість 1 млн токенів на вході та виході через API для різних моделей.Що таке контекстне вікно в ШІ і чому це важливо? Уявіть, що контекстне вікно - це як робоча пам'ять людини. Це те, скільки інформації ШІ може «тримати в голові» під час розмови з вами.Давайте порівняємо основні моделі:ChatGPT 4:- Пам'ять: 128 тисяч токенів- Українською: близько 256 тисяч символів- Це приблизно 100 сторінок текстуClaude:- Пам'ять: 200 тисяч токенів- Українською: близько 400 тисяч символів- Це приблизно 160 сторінок текстуGemini:- Пам'ять: 2 мільйони токенів- Українською: близько 4 мільйонів символів- Це приблизно 1600 сторінок тексту💡 Простий орієнтир: один стандартний аркуш А4 містить приблизно 2500 символів.Чому це важливо? Чим більше контекстне вікно, тим:- Довшим може бути ваш діалог зі ШІ- Більше документів можна завантажити для аналізу- Складніші завдання може вирішувати ШІЯкщо вам потрібно обговорити складні проєкти, аналізувати довгі документи або має бути робота з великим обсягом даних, зверніть увагу на розмір контексту під час вибору моделі, щоб потім не сваритися з ними)Якщо текст перевищує ліміти, модель забуває старі частини розмови, пам'ятайте про це!) 😎
549
25-03-22 08:38