Вхід Реєстрація
Реклама
Ваше рекламне місце
Забронюйте цей слот без конкуренції на обраний період.
Купити рекламу →
Логотип телеграм спільноти - Devaka Talk
Додано 14 лип 2024

Devaka Talk

@devakatalk
Кількість підписників: 14 357
Фото: 1,620
Відео: 52
Посилання: 3,700
Опис:
Канал по просуванню та оптимізації сайтів під Google. Hard SEO. Зв'язок зі мною: @devaka (Сергій Кокшаров) Реклама: @dv_adv Для донатів: @dv_donate Навчаю у групах. https://webpromoexperts.net/courses/seo-pro-online/
Джерело

Devaka Talk | Як парсити Reddit.Reddit має гарні json-ендпоїнти, типуhttps://www.red...

Логотип телеграм спільноти - Devaka Talk Devaka Talk @devakatalk
2 080 Охват/переглядів 2026-06-08 14:34 Повідомлення №5968
Як парсити Reddit.Reddit має гарні json-ендпоїнти, типуhttps://www.reddit.com/r/seo.jsonАле це не означає, що ви будете мати до них доступ. Reddit має систему захисту. Вона на рівні JS та на рівні визначення IP адрес. Спочатку Reddit за допомогою JS робить редирект юзера на спеціальний URL, де підставляє Cookies, і вже потім при наявності Cookies відображає контент. Але, якщо це робити зі свого хостінгу, то отримаєте 403 помилку (в доступі заборонено). Вони визначають провайдера IP адреси. Можливо, також є Rate Limits, але до цього я не доходив. Так як парсити? 1. Візьміть собі резидентський проксі. Можна мобільний, але то дорожче. Резидентський оптимально. Все інше працювати не буде. Деякі проксі-провайдери на сайті пишуть, що проксі саме для Reddit, але по факту воно не працює. Обирайте не для Reddit, а саме ISP/резидентські. 2. Встановить на сервер Puppeteer або Playwright (галузевий стандарт), та Chromium. Це допоможе вам мати звичайний браузер з JS, але керувати їм через ваші скрипти. 3. По суті це все. Парсіть Reddit як вам потрібно. Переходьте за редиректами, зберігайте куку в сессійний файл. Якщо надасьте цей пост своєму Claude Code, то він сам все налаштує як потрібно =)