@RR40

Какой стек технологий подойдет для автопостинга в блоги?

Привет знатокам!

Перед тем как начать подыскивать исполнителей для проекта, хотел бы услышать мнения опытных людей.

Задача проекта:
  • Создать модульный парсер контента из новостных изданий с авторизацией, зачастую на сайтах есть много JS, иногда требуется хитрый подход для работы с сайтом и сбора контента.
  • Создать систему для рассылок в блоги по API, очистки и рерайта контента
  • Создать платформу с N количеством блогов, которые будут принимать контент от системы рассылки (желательно в формате markdown)


Какие я вижу варианты:

  • Для блогов: Ghost (markdown, open-source, API, AMP, sitemap, meta, etc)
  • Для системы парсинга: Selenium WD, но что будет им управлять ?
  • Для системы рассылок контента: PHP ? Python ?
  • Вопрос задан
  • 286 просмотров
Решения вопроса 1
Sanasol
@Sanasol Куратор тега Веб-разработка
нельзя просто так взять и загуглить ошибку
парсер контента из новостных изданий с авторизацией, зачастую на сайтах есть много JS, иногда требуется хитрый подход для работы с сайтом и сбора контента.

Новостные как бы не против копирования, и там есть RSS чуть более чем везде.
А где нет RSS не стоит гемора в основном. Если речь прямо про новости, то так или иначе новости копипастятся на куче источников, и можно забрать в другом более дружелюбном с RSS.

Для системы парсинга: Selenium WD, но что будет им управлять ?

так что я бы сказал что это лишнее. Не говоря уже про сложность реализации и ресурсы для работы.

Для системы рассылок контента: PHP ? Python ?

исходя из прошлого пункта - рассылка не нужна, можно сделать RSS тот же самый и конечные потребители(сайты/блоги или что там у вас) будут сами запрашивать нужные данные.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
webinar
@webinar Куратор тега Веб-разработка
Учим yii: https://youtu.be/-WRMlGHLgRg
Для блогов: любой php framework, на котором удобно сделать мультисайтовую cms
Для системы парсинга: php, curl, куки, cron
Для системы рассылок контента: тут вопрос куда это надо рассылать? На почту? Если это связующее звено между первым и вторым, то это рудимент. Так как парсим в базу и берем из базы, зачем посредник, но если смысл есть, то тот же php.

Если надо семантически разбирать парсеный контент, то был openSource у yandex, на базе нейронных сетей. Хотел быстро найти и ссылку дать, но не нашел. Но он есть.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы