@maximifn
Пока ты спишь - твой враг качается

Как взять большое количество данных за промежуток времени?

Хотел написать простенький сайт со статистикой , собрал сверстал все ок.
Но как при помощи python брать данные 24часа в сутки, если их большое кол-во? Может какие материалы почитать или уже готовые примеры реализации есть?
Юзаю flask данные выводятся при помощи массива в js

Беру данные из поста инстаграм и нужно выстраивать график на собственном сайте по кол-ву лайков комментов в таймлайн.
  • Вопрос задан
  • 85 просмотров
Решения вопроса 1
@Stqs
senior software developer
В общем Flask тут не причем
Нужно разобраться с архитектурой такого рода задач
То что вы уже сделали - это только лишь слой представления(View) данных
Это все круто, но эта часть не должна заниматься сбором данных. Она должна читать их из какого-то хранилища в уже готовом виде.

Сбором данных должна заниматься другая система
Если вам хочется питон и не сильно хочется выдумывать велосипеды - я бы рекомендовал взять scrapy и нафигачить там нужных скреперов. В нем же можно организовать pipeline - в котором определить что делать с полученными данными.
Тут есть много путей но я бы рекомендовал вам наиболее простой - писать данные из scrapy в базу данных например mysql, а оттуда уже читать данные в вашем flask-приложении.
В зависимости от объемов может оказаться, что предложенное решение не эффективно.
Так как по сути вы интересуетесь сбором метрик то в боевых условиях я бы рекомендовал использовать специализированные инструменты для сбора и отображения метрик (например связку graphite-grafana)
Вряд ли Ваша связка mysql-самописнаявебморда переплюнет их по производительности качеству и стабильности.
Так что все действительно зависит от объемов и категории задачи ( я имею в виду "это завтра пойдет в продакшн" или "вот для себя пишу разбираюсь")
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через TM ID
Похожие вопросы
23 июля 2018, в 20:01
3000 руб./за проект
23 июля 2018, в 19:52
10000 руб./за проект