Source
Devaka Talk | Як парсити Reddit.Reddit має гарні json-ендпоїнти, типуhttps://www.red...
2 080 Views/Reach
2026-06-08 14:34
Message №5968
Як парсити Reddit.Reddit має гарні json-ендпоїнти, типуhttps://www.reddit.com/r/seo.jsonАле це не означає, що ви будете мати до них доступ. Reddit має систему захисту. Вона на рівні JS та на рівні визначення IP адрес. Спочатку Reddit за допомогою JS робить редирект юзера на спеціальний URL, де підставляє Cookies, і вже потім при наявності Cookies відображає контент. Але, якщо це робити зі свого хостінгу, то отримаєте 403 помилку (в доступі заборонено). Вони визначають провайдера IP адреси. Можливо, також є Rate Limits, але до цього я не доходив. Так як парсити? 1. Візьміть собі резидентський проксі. Можна мобільний, але то дорожче. Резидентський оптимально. Все інше працювати не буде. Деякі проксі-провайдери на сайті пишуть, що проксі саме для Reddit, але по факту воно не працює. Обирайте не для Reddit, а саме ISP/резидентські. 2. Встановить на сервер Puppeteer або Playwright (галузевий стандарт), та Chromium. Це допоможе вам мати звичайний браузер з JS, але керувати їм через ваші скрипти. 3. По суті це все. Парсіть Reddit як вам потрібно. Переходьте за редиректами, зберігайте куку в сессійний файл. Якщо надасьте цей пост своєму Claude Code, то він сам все налаштує як потрібно =)