Где лучше сохранять парсенные данные через Scrapy?

Question

Bjornie @Bjornie

Изучаю Python

Где лучше сохранять парсенные данные через Scrapy?

Для начала сразу хотелось бы уточнить, что конечный интересующий меня формат данных это .XML. Но все-таки хотелось бы узнать куда лучше всего сохранять данные при парсинге, чтобы это было: наиболее быстро, надежно и удобно.

После чтения некоторых тем и уроков я понял, что структурированные данные вполне достаточно хранить в MySQL, обратное - в Mongo.
Также удобство БД в том, что можно на лету проверить есть ли уже в БД конретный товар (в нашем случае по ASIN), и в таком случае либо обновить его, либо добавить новый, либо ничего не делать.

Добавлю (если это важно): парсер планируется поставить на какой-нибудь VPS и будут парсится около 500к товаров (цены и наличие), т.е. очень важна скорость и стабильность.

P.S. Я ни разу не имел дела с NoSQL.

Вопрос задан более трёх лет назад
383 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+2 ещё

Простой
Срабатывает антивирус на скомпилированный файл python, как исправить?
- 1 подписчик
- 13 часов назад
- 118 просмотров
1

ответ
PostgreSQL

+1 ещё

Простой
Как добавить отношения «многие-ко-многим» между таблицами из разных баз данных?
- 1 подписчик
- 14 часов назад
- 95 просмотров
4

ответа
MySQL

+1 ещё

Простой
Как извлечь топ 15 очков из таблицы чтобы игроки не дублировались?
- 1 подписчик
- 16 часов назад
- 84 просмотра
1

ответ
Python

Простой
Почему не срабатывает if? как это пофиксить?
- 1 подписчик
- 17 часов назад
- 95 просмотров
3

ответа
Python

+2 ещё

Простой
Как транслировать аудио в микрофон, py, c#, c++?
- 1 подписчик
- 19 часов назад
- 124 просмотра
3

ответа
Python

Средний
Почему Низкий FPS анализ изображения yolov8 YOLO?
- 1 подписчик
- 19 часов назад
- 20 просмотров
0

ответов
Python

+2 ещё

Простой
Почему Планировщик задач Windows 10 не выполняет скрипт Python?
- 3 подписчика
- вчера
- 734 просмотра
2

ответа
Python

+1 ещё

Средний
Как переместить мышь вместе с элементом в pyppeteer?
- 1 подписчик
- вчера
- 84 просмотра
0

ответов
Python

+2 ещё

Простой
OK.RU, API приложений, не могу загрузить видео: User must grant an access to permission 'VIDEO_CONTENT'". Как получить этиправа для приложения?
- 1 подписчик
- вчера
- 50 просмотров
1

ответ
MySQL

Простой
Как сохранить mysql базу?
- 1 подписчик
- вчера
- 81 просмотр
1

ответ
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Настроить AmoCRM, сделать привязку телефонии

23 апр. 2024, в 11:14

5000 руб./за проект

Видеомонтаж тревел-влогов на Youtube

23 апр. 2024, в 11:13

10000 руб./за проект

Топик моделлинг заголовков новостей

23 апр. 2024, в 10:50

5000 руб./за проект

Answer 1 · 2017-10-13 19:22:17

Наиболее быстро - в память, надежно - в тетрадку, удобно - это зависит от привычек.
Все популярные БД достаточно быстры, чтобы не быть бутылочным горлышком на этой задаче.
А вот парсер вполне может им оказаться.

Где лучше сохранять парсенные данные через Scrapy?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт