Как ускорить обновление 700K записей из файла?

Question

kaxa3201 @kaxa3201

Как ускорить обновление 700K записей из файла?

Имеется файл примерно на 700 000 записей, мне необходимо периодически его проверять, если есть изменения то делаю update в базу,если нет то записываю в базу. Нужно как то ускорить этот процесс. и я не понимаю как сохранять это дело в моем случаи. уперся вот на этом моменте. не судите строго я новичок. Надеюсь код лучше объяснит.

DB::table('resources')->select('hash')->orderBy('id')->chunk(50000,
            function ($resources) use ($file, $updatedDate) {
                $lineCount = 1;
                echo 1 . '<>';

                while (!feof($file)) {
                    $line = iconv('cp1251', 'utf-8', fgets($file));
                    $csv = str_getcsv($line, ';');

                    if (count($csv) === 6) {
                        $ipPool = explode('|', $csv[0]);
                        foreach ($ipPool as $ip) {
                            $date = new \DateTime($csv[5]);
                            $hash = md5($csv[1] . $csv[2]);

                            foreach ($resources as $resource) {
                                if ($hash === $resource->hash) {
                                    DB::table('resources')->where('hash', $hash)->update([
                                        'version_date' => $updatedDate,
                                    ]);
                                    echo $lineCount++ . "<br>"  ;
                                }
                                // тут нужно записать если такой записи нет
                            }
                        }
                    }

                    $lineCount++;
                }
            });

Вопрос задан более трёх лет назад
542 просмотра

2 комментария

Подписаться 4 Простой 2 комментария

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

PHP

Простой
Почему не применяются настройки xdebug.ini после изменения?
- 1 подписчик
- 30 минут назад
- 14 просмотров
0

ответов
PHP

+1 ещё

Простой
Как получить публичную ссылку на изображение с чата Телеграм?
- 1 подписчик
- 44 минуты назад
- 18 просмотров
1

ответ
PHP

+1 ещё

Простой
Почему перестали отображаться новости на детальной странице новостей?
- 1 подписчик
- час назад
- 31 просмотр
1

ответ
PHP

Простой
Почему ломается передача по ссылке в foreach с указанием оператора опциональной последовательности для массива?
- 1 подписчик
- 3 часа назад
- 51 просмотр
1

ответ
PHP

+1 ещё

Простой
Почему ошибка 502 после миграции с PHP 8.2 на PHP 8.3?
- 1 подписчик
- 4 часа назад
- 93 просмотра
2

ответа
PHP

+1 ещё

Средний
Как получить телефон из Google OAuth 2.0 API?
- 1 подписчик
- 21 час назад
- 47 просмотров
1

ответ
PHP

+1 ещё

Средний
Как запускать PHP в терминале Netbeans?
- 2 подписчика
- 22 часа назад
- 213 просмотров
0

ответов
PHP

+1 ещё

Простой
Где ошибка в коде при создании древа в sql из файла?
- 1 подписчик
- 23 часа назад
- 95 просмотров
0

ответов
PHP

+1 ещё

Простой
Как в php формировать ответ на AJAX XMLHttpRequest запрос?
- 1 подписчик
- вчера
- 104 просмотра
0

ответов
PostgreSQL

Простой
Нужен ли первичный ключ в таблицах PostgreSQL?
- 1 подписчик
- вчера
- 141 просмотр
2

ответа
Показать ещё Загружается…

PHP Developer

YCLIENTS • Москва

от 200 000 до 350 000 ₽

PHP разработчик

Ведисофт • Екатеринбург

от 25 000 ₽

Midlle PHP developer (backend)

ИТЦ Аусферр • Магнитогорск

от 100 000 до 160 000 ₽

Лидсканнер\парсер для Telegram по поиску заказов по ключевым словам

25 апр. 2024, в 14:26

6000 руб./за проект

Разработать дизайн продающего лендинга

25 апр. 2024, в 14:21

15000 руб./за проект

Шаблон WP - настройка

25 апр. 2024, в 14:07

20000 руб./за проект

А нельзя ли проверять наличие изменения в файле до загрузки в базу?

Ещё я не понял, что происходит, если изменений нет - вы всё равно записываете данные?
ky0, проблема в том, что файл постоянно перезаписывается при выполнении скрипта, сначала файл скачивается с другого источника, потом мне нужно проверить записи те в что в файле со своими записями, если есть изменение, то я обновляю в этой записи 'version_date' , если нет , то записываю. Момент , где нужно записать данные в базу я не знаю как записать...

Answer 1 · 2019-06-08 21:55:12

Во-первых, почему выдергиваете записи именно по 50 000? Чувстую цифра стоит рандомная.

Короче супер оптимизация, прирост в разы гарантирую - достаете все записи из бд, собираете временную хешмапу, при этом убираете лишние orderBy, которые вам не нужны

$map = [];
DB::table('resources')->select('hash')->chunk(50000,
            function ($resources) {
                    $map[$resource->hash] = $resource; // сюда можнок класть только действительно необходимые данные, чтобы память не засрать
                }
            });

потом пробегаетесь по всему файлу

while (!feof($file)) {
                    $line = iconv('cp1251', 'utf-8', fgets($file));
                    $csv = str_getcsv($line, ';');

                    if (count($csv) === 6) {
                        $ipPool = explode('|', $csv[0]);
                        foreach ($ipPool as $ip) {
                            $date = new \DateTime($csv[5]);
                            $hash = md5($csv[1] . $csv[2]);
                            
                            if (isset($map[$hash]) {
                                // запись существует, делаете апдейт
                            } else {
                                // записи нет, добавляете в свою таблицу
                            }
                        }
                    }

Только представим, что у ваc идеальная хеш-функция без коллизий...

Answer 2 · 2019-06-08 11:26:20

сначала файл скачивается с другого источника, потом мне нужно проверить записи те в что в файле со своими записями,

вот ключ!
если я правильно понял из вашего сумбурного текста - вы сравниваете два ФАЙЛА?? ооооо
ЗАЧЕМ?
быстрее и проще и более способствует автоматизации - сравнивать в БД!

Как ускорить обновление 700K записей из файла?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт