Как максимально ускорить данный код на Python?

Question

keddad @keddad

Ученик

Как максимально ускорить данный код на Python?

Есть следующий код, который решает эту задачу

from array import array

n, m = map(int, input().split())

parent, weight, rank = array('i', [-1 for _ in range(n)]), array('I', [0 for _ in range(n)]), array('I', [1 for _ in
                                                                                                          range(n)])


def find_set(v: int) -> int:
    if parent[v] == -1:
        parent[v] = v
        return v
    if v == parent[v]:
        return v
    parent[v] = find_set(parent[v])
    weight[parent[v]] += weight[v]
    weight[v] = 0
    return parent[v]


def union_sets(a: int, b: int, cost: int) -> None:
    a = find_set(a)
    b = find_set(b)
    if a != b:
        if rank[a] < rank[b]:
            a, b = b, a
        parent[b] = a
        weight[a] += cost
        weight[a] += weight[b]
        weight[b] = 0
        if rank[a] == rank[b]:
            rank[a] += 1
    else:
        weight[a] += cost


with open("input.txt", "r") as inp:
    with open("output.txt", "w") as out:
        inp.__next__()
        for line in inp:
            st = line.split()
            if len(st) != 4:
                out.write(str(weight[find_set(int(st[1]) - 1)]) + "\n")
            else:
                union_sets(int(st[1]) - 1, int(st[2]) - 1, int(st[3]))

К сожалению, он несколько не укладывается в временные рамки. Теоретически можно было бы просто написать тот же алгоритм на C++, но мы не ищем легких путей! Какие еще оптимизации можно применить к коду выше, что бы уменьшить время работы при больших обьемах данных?

Вопрос задан более трёх лет назад
657 просмотров

1 комментарий

Подписаться 1 Простой 1 комментарий

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 2

5 комментариев

keddad @keddad Автор вопроса

Избавился от рекурсии, вместо Arrayев поставил обычные листы, действительно, получил большой выигрыш в скорости, пусть и не вполне достаточный. А что вы подразумеваете под "удалить typing"?

Написано более трёх лет назад
Roman K @deliro

keddad, (a: int, b: int, cost: int) -> None: вот это заменить на (a, b, cost):

Написано более трёх лет назад
keddad @keddad Автор вопроса

Roman Kitaev, но это разве затрагивает производительность? это же чисто декоративная вещь, нет?

Написано более трёх лет назад
Roman K @deliro

keddad, иногда влияет, но очень незначительно. В целом, я сомневаюсь, что это как-то повлияет на конечный тайминг

Написано более трёх лет назад
keddad @keddad Автор вопроса

Roman Kitaev, действительно, разница в районе статистической погрешности. Ладно, все эти ухищрения позволили пройти мне еще один тест, но на последнем все еще Time Limit :( пойду на плюсы перепишу

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

Простой
Как создать offline карту на python?
- 1 подписчик
- 5 часов назад
- 47 просмотров
0

ответов
Python

Простой
Какие модули есть в Python для целей анализа, форматирования, вывода текста?
- 1 подписчик
- 6 часов назад
- 30 просмотров
1

ответ
Python

+2 ещё

Простой
Как настроить ТГ бота, чтоб кидал посты с пабликов в мой паблик?
- 1 подписчик
- 7 часов назад
- 30 просмотров
0

ответов
Python

+1 ещё

Простой
Как изменить сообщение с текстом на сообщение с картинкой для тг бота в библиотеке py telebot?
- 2 подписчика
- 14 часов назад
- 190 просмотров
2

ответа
Python

+1 ещё

Простой
Пишу телеграм бота на пайтон и вылезает ошибка KeyError: 'recipes'. Как решить?
- 1 подписчик
- 15 часов назад
- 50 просмотров
2

ответа
Алгоритмы

Средний
Справится ли алгоритм с задачей по поиск слов в словаре?
- 1 подписчик
- 15 часов назад
- 58 просмотров
1

ответ
Python

+2 ещё

Простой
Как скрыть данные в кнопке KeyboardButton?
- 2 подписчика
- 16 часов назад
- 65 просмотров
1

ответ
Python

+1 ещё

Простой
Выбор: парсить на питоне с aiohttp, asyncio, bs4 или requests + bs4?
- 1 подписчик
- 22 часа назад
- 112 просмотров
2

ответа
Python

+1 ещё

Простой
Почему не срабатывает клик по элементу при открытии станицы selenium python?
- 1 подписчик
- вчера
- 42 просмотра
1

ответ
JavaScript

+1 ещё

Простой
Как подключить кошелёк к web3 сайту?
- 1 подписчик
- вчера
- 73 просмотра
0

ответов
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Графический дизайнер

18 апр. 2024, в 07:58

500 руб./в час

Разработать мини-приложение Windows 7-11, Linux,Macos

18 апр. 2024, в 07:22

45000 руб./за проект

Каталог AI tools

18 апр. 2024, в 01:12

150000 руб./за проект

Попробуй массивы из numpy они до 20. Раз быстрее

Answer 1 · 2019-07-26 09:49:57

Окей, в итоговой версии я избавился от рекурсии, типизации и Arrayев. Основной профит получил от рекурсии, конечно. Этого не хватило для решения задачи, но код заметно ускорился.

n, m = map(int, input().split())

parent, weight, rank = [-1 for _ in range(n)], [0 for _ in range(n)], [1 for _ in range(n)]


def find_set(v):
    while parent[v] != -1 and parent[v] != v:
        parent[v] = parent[parent[v]]
        weight[parent[v]] += weight[v]
        weight[v] = 0
        v = parent[v]
    if parent[v] == -1:
        parent[v] = v
    return v


def union_sets(a, b, cost):
    a = find_set(a)
    b = find_set(b)
    if a != b:
        if rank[a] < rank[b]:
            a, b = b, a
        parent[b] = a
        weight[a] += cost
        weight[a] += weight[b]
        weight[b] = 0
        if rank[a] == rank[b]:
            rank[a] += 1
    else:
        weight[a] += cost


def main():
    with open("input.txt", "r") as inp:
        with open("output.txt", "w") as out:
            inp.__next__()
            for line in inp:
                st = line.split()
                if len(st) != 4:
                    out.write(str(weight[find_set(int(st[1]) - 1)]) + "\n")
                else:
                    union_sets(int(st[1]) - 1, int(st[2]) - 1, int(st[3]))


main()

Answer 2 · 2019-07-26 06:38:27

1. Конструкция [-1 for _ in range(n)] уже создаёт список. Дальше этот список просто выкидывается и генерируется array.array. Итого в одной строчке сразу генерируются 6 потенциально огромных коллекций. Либо можно переделать на (-1 for _ in range(n)), либо отказаться от array.array, его преимущества здесь сомнительны:

In [3]: a = array("I", range(10000))                                                                                    

In [4]: b = list(range(10000))                                                                                          

In [5]: %timeit sum(a)                                                                                                  
206 µs ± 6.03 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

In [6]: %timeit sum(b)                                                                                                  
69.3 µs ± 367 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

In [7]: %timeit a[7777]                                                                                                 
49.5 ns ± 0.564 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)

In [8]: %timeit b[7777]                                                                                                 
33.6 ns ± 0.411 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)

2. Убрать рекурсию. Совсем.
3. Удалить typing

Answer 3 · 2019-07-26 07:45:29

Вы уверены, что у вас корректно выполняется сжатие путей?

Ну и от рекурсии лучше уйти, в питоне довольно дорогие вызовы функций.

Как максимально ускорить данный код на Python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт