Fuente
SEO Ideas | Як SEO-шник реверс-інжинірив Exa — і знайшов розбіжність між демо й ре...
740 Vistas/Alcance
2026-05-20 06:39
Mensaje №1117
🔍 Як SEO-шник реверс-інжинірив Exa — і знайшов розбіжність між демо й реальним APIНещодавня історія, яка варта вашої уваги, якщо ви хоч трохи в темі AI-пошуку.Google анонсував Grounding With Exa Web Search для Gemini (поки в приватному прев'ю на Vertex). Суть проста: Exa Highlights витягує зі сторінки тільки ті шматки, що релевантні запиту, — і LLM отримує на вхід у рази менше токенів. Дешевше, швидше, чистіше.Девід Максвіні (@top5seo) подивився демо й вирішив: а що, якщо спробувати це повторити?Що показувало демо Видобуток фрагментів на рівні речень і навіть підрядних частин — модель збирає відповідь буквально з різних кутків сторінки.Що зібрав Девід за пару днів Firecrawl тягне сторінку → розбиття на речення → Split HyDE (дешева LLM генерує гіпотетичну відповідь, її ембедінги стають «приманкою» для пошуку схожого в тексті) → косинусна близькість + n-gram boost → regex витягує підрядні. На SimpleQA вийшло 75% точності з гарним стисненням токенів. Непогано для версії «на колінці».А далі почалося найцікавіше Девід поставив свою реалізацію поруч із реальним API Exa — і виявив, що в більшості випадків Exa просто повертає абзац із початку статті. Жодного видобутку клауз із різних частин сторінки, як обіцяло демо. Тобто маркетинг і реальна поведінка API — це дві різні речі.Це розв'язало йому руки Раз еталон виявився не таким, як здавалося, можна йти далі своїм шляхом. Він додав класифікатор, який обирає стратегію залежно від структури сторінки й запиту:якщо це лістикл і відповідь у заголовках — повертаємо заголовки якщо відповідь в окремій секції — повертаємо секцію якщо інформація розкидана — конвертуємо в триплети (subject–predicate–object)
Саме триплети дали найбожевільніше стиснення: огляд на 2067 слів → відповідь LLM з 67 вхідних токенів, зібраних з різних місць сторінки.Чому це взагалі має значення для SEO Це search & retrieval у чистому вигляді — те, як AI-системи будуть діставати інформацію з ваших сторінок, щоб відповідати користувачам. Розумієш цю механіку — розумієш, як писати тексти, які ці системи реально побачать і процитують. Не магія, не чорний ящик — просто інженерія.До речі, сам Девід каже відверто: Exa як пошук — справді сильний продукт. Мільярди сторінок, попередньо обчислені ембедінги, видача за частки секунди. За таку інфраструктуру не шкода платити. Питання було лише до того конкретного фічера, який показували в демо.👉 Повний розбір + робоче демо: queryburst.com/blog/exa-highlights