Login Sign Up
Advert
Your ad spot
Reserve this exclusive slot for the selected period.
Buy advertising →
Telegram community logo - Devaka Talk
Added 14 Jul 2024

Devaka Talk

@devakatalk
Number of subscribers: 14 357
Photos: 1,620
Videos: 52
Links: 3,700
Description:
Канал по просуванню та оптимізації сайтів під Google. Hard SEO. Зв'язок зі мною: @devaka (Сергій Кокшаров) Реклама: @dv_adv Для донатів: @dv_donate Навчаю у групах. https://webpromoexperts.net/courses/seo-pro-online/
Source

Devaka Talk | Як парсити Reddit.Reddit має гарні json-ендпоїнти, типуhttps://www.red...

Telegram community logo - Devaka Talk Devaka Talk @devakatalk
2 080 Views/Reach 2026-06-08 14:34 Message №5968
Як парсити Reddit.Reddit має гарні json-ендпоїнти, типуhttps://www.reddit.com/r/seo.jsonАле це не означає, що ви будете мати до них доступ. Reddit має систему захисту. Вона на рівні JS та на рівні визначення IP адрес. Спочатку Reddit за допомогою JS робить редирект юзера на спеціальний URL, де підставляє Cookies, і вже потім при наявності Cookies відображає контент. Але, якщо це робити зі свого хостінгу, то отримаєте 403 помилку (в доступі заборонено). Вони визначають провайдера IP адреси. Можливо, також є Rate Limits, але до цього я не доходив. Так як парсити? 1. Візьміть собі резидентський проксі. Можна мобільний, але то дорожче. Резидентський оптимально. Все інше працювати не буде. Деякі проксі-провайдери на сайті пишуть, що проксі саме для Reddit, але по факту воно не працює. Обирайте не для Reddit, а саме ISP/резидентські. 2. Встановить на сервер Puppeteer або Playwright (галузевий стандарт), та Chromium. Це допоможе вам мати звичайний браузер з JS, але керувати їм через ваші скрипти. 3. По суті це все. Парсіть Reddit як вам потрібно. Переходьте за редиректами, зберігайте куку в сессійний файл. Якщо надасьте цей пост своєму Claude Code, то він сам все налаштує як потрібно =)