Perl как ускорить работу скрипта?

Question

Сергей @Yestestvenno

Системный администратор

Perl как ускорить работу скрипта?

Нужно сравнить каждий елемент первого масива с каждым елементом второго и вывести на печать уникальные и не уникальные значения в разные файлы

#!/usr/bin/perl
.....
foreach $nn (@array0) {
$g=0;
foreach $mm (@array1) {
if ($nn==$mm) {
$g=$g+1
print FILE1 "$nn\n";
}
}
if ($g==0) {
print FILE2 "$nn\n";
}
}
.......
Как ускорить работу скрипта? обработка 10 000 х 1 000 000 = 10мин
а нужно сравнить примерно 1 000 000 000 х 1 000 000 000 000...... подскажите подход

Если использовать for то 10 000 х 1 000 000 = 37 мин

Уточняю
Сравнение не сильно замедляет.....
я запустил вот такую программу без сравнения:
foreach $nn (@array0) {
foreach $mm (@array1) {
$g=$g+1
}
}
в итоге время работы почти 10 мин
как можна сравнить значения по другому, не через foreach или for?

Вопрос задан более трёх лет назад
429 просмотров

6 комментариев

Подписаться 2 Оценить 6 комментариев

Решения вопроса 2

1 комментарий

4 комментария

Сергей @Yestestvenno Автор вопроса

Дело в том что сравнение не сильно замедляет.....
я запустил вот такую программу без сравнения:
foreach $nn (@array0) {
foreach $mm (@array1) {
$g=$g+1
}
}
в итоге время работы почти 10 мин

Написано более трёх лет назад
Сергей @Yestestvenno Автор вопроса

как можна сравнить значения по другому, не через foreach или for?

Написано более трёх лет назад
vaut @vaut

Сергей: сложность вашего решения n*m. Как не крутись на миллионе вашем количестве будет тормозить.

Вам нужно один из списков хранить в структуре с быстрым доступом и проверять вхождение в неё элементов из большего списка. Для начала попробуйте хеши встроенные в перл.

Написано более трёх лет назад
vaut @vaut

Сергей: я предлагаю что то вроде этого:
foreach ( $nn (@array0) ) { $nn{$nn} = true }
foreach ( $mm (@array1) ) {
if ( exists $nn{$mm} ) {
print FILE1 "$mm\n";
delete $nn{$mm};
}
else print FILE2 "$mm\n";
}
while ( ( $key, $value ) = each %nn ) {
print FILE2 "$key\n";
}

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Linux

+1 ещё

Простой
Как правильно передать значения к переменную внутри команды curl?
- 1 подписчик
- вчера
- 89 просмотров
4

ответа
Ubuntu

+1 ещё

Простой
Как запустить несколько команд в bash вместе, но не дожидаясь ответа?
- 2 подписчика
- вчера
- 211 просмотров
4

ответа
Android

+3 ещё

Средний
Как получить разрешение для автостарта (чтобы при старте оно загружалось) для приложения под Андройд (Android)?
- 1 подписчик
- 23 апр.
- 63 просмотра
0

ответов
Windows

+4 ещё

Простой
Программно гасить монитор в Windows (11). Как?
- 1 подписчик
- 20 апр.
- 273 просмотра
1

ответ
Linux

+1 ещё

Средний
Как переименовать файлы и папки с одинаковым именем, но разным регистром?
- 1 подписчик
- 18 апр.
- 130 просмотров
0

ответов
Linux

+1 ещё

Простой
Как проверить исход работы systemctl is-active в Bash-сценарии?
- 1 подписчик
- 09 апр.
- 74 просмотра
2

ответа
Git

+1 ещё

Простой
Git выдаёт ошибку Permission denied. Как исправить?
- 1 подписчик
- 09 апр.
- 145 просмотров
1

ответ
bash

+1 ещё

Средний
Как отфильтровать список ip в консоли?
- 1 подписчик
- 05 апр.
- 63 просмотра
2

ответа
Linux

+2 ещё

Средний
Как изменить консоль по умолчанию linux?
- 3 подписчика
- 03 апр.
- 946 просмотров
3

ответа
Автоматизация

+1 ещё

Сложный
Zigbee2mqtt как настроить отображение?
- 1 подписчик
- 27 мар.
- 58 просмотров
1

ответ
Показать ещё Загружается…

Программист C для Embedded Linux

Radiofid • Санкт-Петербург

от 120 000 до 180 000 ₽

Системный инженер

INFOTECH

от 150 000 до 150 000 ₽

DevOps-инженер (стажер)

Renue

До 40 000 ₽

Доработка Django приложения и исправление ошибок конфигурации

25 апр. 2024, в 20:14

1000 руб./за проект

Завершение разработки проекта на CS2

25 апр. 2024, в 20:02

100000 руб./за проект

Требуется завершить backend (проектная работа)

25 апр. 2024, в 19:42

49000 руб./за проект

какие значения в массивах, есть ли повторяющиеся значения?
Вопрос по примеру:
$nn==$mm Это точно то что вы хотите?
perldoc.perl.org/perlop.html#Equality-Operators
Shetani: пример "1079123123451", есть повторения
vaut: в этой задачи просто числа, но если использовать не числа, то я так понимаю оператор == не подходит?
Сергей: да верно, для сравнивания строк нужно использовать "eq"

Answer 1 · 2015-11-17 11:15:32

Можно воспользоваться готовым модулем:
search.cpan.org/~zmij/Array-Utils-0.5/Utils.pm
Модуль быстрый.
Примерно так.
Есть два массива. Сравниваем их и выводим уникальные значения:

my @a = qw( a b c d );
my @b = qw( c d e f );
my @c = array_diff( @a, @b );
say for (@c)

Результат:

a
b
e
f

Теперь находим элементы не уникальные.

use feature 'say';
use Array::Utils qw(:all);


my @a = qw( a b c d );
my @b = qw( c d e f );
my @c = intersect( @a, @b );
say for (@c)

Результат

c
d

Answer 2 · 2015-11-16 19:34:13

Совет дилетанта:
Меньшим списком заполняем хеш, и в один проход и большого получаем уников и дубли.
Забираем дубли в новый хеш и из меньшего списка получаем уников.
На небольших числах должно летать, упадет ли производительность на 10^6 записей не знаю.
Если будет падать меньший список нужно будет порезать на несколько.

Answer 3 · 2015-11-26 10:07:43

1. Простые и быстрые алгоритмы есть в Perl Cookbook
2. Массивы размером миллиард и триллион элементов так не сравнить - памяти просто не хватит.
3. Какой тип данных? Понятно что в Perl это вроде не так важно, но для решения задачи значение имеет.

Навскидку решение:
Допустим что у нас только целые числа - значения от 0 до 65535. Построим битовую маску имеющихся в массиве чисел, причем если число есть - соответствующий ему бит выставим в 1. Размер маски очевидно 65536 бит или 8192 байта, что совсем и не много.
Итак, идем по первому массиву и заполняем маску.
Теперь идем по второму массиву и если бит в маске для текущего числа выставлен в 1, то число не уникально.

Perl как ускорить работу скрипта?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт