UZEIR
@UZEIR
Учусь. Пытаюсь развиваться.

Как сделать парсер статей?

Есть ли примеры? Какие не будь наводки или алгоритм действия. Хочу научится не знаю с чего начать.
Парсер с сайта на сайт
  • Вопрос задан
  • 274 просмотра
Пригласить эксперта
Ответы на вопрос 2
Beltoev верно все написал. Для реализации можно воспользоваться всякими готовыми библиотеками, например simplehtmldom.sourceforge.net
Ответ написан
@Beltoev
Живу в своё удовольствие
А что именно вызывает сложности?

Тут как бы алгоритм банальный:
  1. Берем список адресов всех нужных нам статей и проходимся по нему
  2. Получаем содержимое страницы (file_get_contents можно использовать)
  3. Определяем, какие данные нам интересны (например, всё, что внутри блока <div class="content">...</div>)
  4. Получаем эти данные какой-нибудь регуляркой и пишем себе в БД
  5. Профит


Это пример самого простого парсера.

Дальше можно наращивать функционал (автоматическое определение новых статей на сайте по cron-у, загрузка изображений на свой сервер и замена ссылок на них в статьях, либо подмена ссылок на изображения посредством .htaccess и т. д. и т. п.)

Уверен, есть готовые библиотеки для этого, но и самому это сделать не так уж и сложно
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы