@Twindo

Архитектура приложений типа datanyze.com?

Как организованна архитектура в таких проектах как www.datanyze.com (приложение занимается тем, что обходит миллионы сайтов ежедневно и собирает информацию по технологиям, которая на этих сайтах используется) и т.п.

Интересует как архитектура в целом, так и конкретные моменты: работа с сетью (используются ли iocp (for windows)или epoll (для *nix) или какие-либо другие технологии), работа с БД (какая БД лучше подойдет для таких задач), фрэймворки для организации заданий и их мониторинг, перезапуск заданий после аварийного завершения и т.п.

Если у кого-то есть примеры, вообще было бы здорово.
  • Вопрос задан
  • 2460 просмотров
Пригласить эксперта
Ответы на вопрос 1
Neuroware
@Neuroware
Программист в свободное от работы время
не понятно кому такая информация нужна " в виде сервиса", ну собрали один раз.. в год , выложили в виде картинки с графиками дальше сервис теряет смысл, но если очень хочется задача не особо сложная, сбор данных в 99% случаев простейший парсинг по "отпечаткам" "технологий", с хранением проблем тоже нет ибо "миллионы сайтов" это 1 табличка с несколькими миллионами строк, любая БД это скушает и не подавится, фрэймвор нужно определять только после того как будет определено что именно он будет делать, для абстрактного коня в вакууме такое не советуют, в простейшем случае для своего фреймворка достаточно написать отдельный класс в управляемой среде (Java\.net), который будет держать выполняемое задание в блоке try и тогда "аварийное завершение" будет невозможно впринципе, т.к. любой крэш будет отлавливаться на уровне менеждера задач, на C# подобный написан строк в 50 максимум.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
Bell Integrator Ульяновск
До 400 000 ₽
Bell Integrator Хабаровск
До 400 000 ₽
Bell Integrator Ижевск
До 400 000 ₽
25 апр. 2024, в 16:12
2000 руб./за проект
25 апр. 2024, в 16:08
100000 руб./за проект