@daMage

Почему при выборке из бд записи повторяются?

Добрый вечер. Пытаюсь получить изображения с сайта shutterstock, но при попытке грабинга попадаются записи с одинаковым id. Есть контроллер, который принимает в качестве параметров страницу, количество изображений на страницу и категорию.

ae4b32015d0b4433ae1b214892df115a.png
Сканирую 21 категорию: www.shutterstock.com/cat-21-Interiors.html, в которой 4296 страниц и ~429600 изображений, однако в бд заносится порядка 250000 уникальных записей. В чем проблема, не знаю, может быть, она кроется в параметрах src, search_source_id, tracking_id, предназначение которых мне неизвестно. Кто-нибудь сталкивался с похожей практикой? Данные получаю в таком виде:
acb22a48fc42426780c47c0d2f3ae77b.png
  • Вопрос задан
  • 2664 просмотра
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
YCLIENTS Москва
от 200 000 до 350 000 ₽
Ведисофт Екатеринбург
от 25 000 ₽
ИТЦ Аусферр Магнитогорск
от 100 000 до 160 000 ₽
26 апр. 2024, в 09:18
500 руб./в час
26 апр. 2024, в 06:46
1500 руб./в час
26 апр. 2024, в 05:31
1000 руб./за проект