Channel Devaka Talk - @devakatalk - №5383
Мері Хейнс проаналізувала документи з судового процесу між DOJ та Google, які розкривають внутрішні механізми роботи алгоритмів та фактори ранжування.https://www.mariehaynes.com/what-googles-trial-docs-reveal-about-clicks-links-and-other-ranking-signals/Коротке самарі:1. Google вдосконалюється, навчаючись із взаємодії користувачів: кожен пошук та кліки дають алгоритму інформацію про корисність результатів.2. Всі документи у індексі мають DocID — унікальні ідентифікатори з метаданими, які включають популярність, якість, спам-оцінки тощо.3. Ранжування базується на сигналах: кількості кліків, змісті, запитах та моделей глибокого навчання (наприклад, RankEmbed BERT).4. Google збирає дані з логів користувачів (Glue), що дозволяє передбачати, які результати будуть корисними, та покращувати пошук.5. Модель RankEmbed BERT — AI-система, навчені на відгуках рейтера та активності користувачів, для оцінки експертності, авторитетності і довіри до сторінки.6. Важливість самого веб-сайту перевищує значення PageRank: Google отримує більшу інформацію з контенту і сигналів з сайту.7. Дані користувачів визначають частоту і спосіб обходу сайту пошуковими роботами.8. Спам-оцінка впливає на частоту crawling: високий спам-скор може зменшити частоту обходу.9. Дані з Chrome використовуються в ранжуванні — активність користувачів (відвідування сайту, взаємодія) має значення.
2410
25-09-05 16:26