Наибольший вклад в теги

SQL
- 12 ответов
- 0 вопросов
4 Вклад в тег
Базы данных
- 5 ответов
- 0 вопросов
3 Вклад в тег
PostgreSQL
- 5 ответов
- 0 вопросов
2 Вклад в тег
Oracle
- 12 ответов
- 0 вопросов
2 Вклад в тег
PL/SQL
- 5 ответов
- 0 вопросов
1 Вклад в тег
Алгоритмы
- 2 ответа
- 0 вопросов
1 Вклад в тег

Какую БД лучше всего использовать для хранения 100 млн записей и больше?

Артем Черепахин @AltZ

Добрый день. СУБД под ваши нагрузки и правда можете выбирать любую. Лишь бы секционирование таблиц поддерживало. Postgres- очень хороший выбор. Есть нюанс Postgres, в некоторых случаях, может зависит от прямоты рук(т.е. как вы составите sql запрос). Как и у любой другой БД, есть свои особенности, с которыми вы можете встретиться, а можете не встретиться.
Ключ category+key вместо ID - не очень хорошая идея. Хотя бы поскольку только category имеет 100 символов, еще и key в придачу явно не пустой. Т.к. это первичный ключ по ним будет построен индекс. Ну и представьте, как будут выглядеть листовые блоки в индексах- при поиске в индексе нужного ключа придется по-битово сравнить 100 символов. Не критично, но идея не очень.
Если category повторяется- нормализуйте таблицу(Т.е. значения category вынесите в отдельную таблицу(сущность)) и в таблице MainTable храните внешний ключ(id ключа).
Смысла в поле key не вижу.

Ответ написан более трёх лет назад

1 комментарий

Как в Oracle или Teradata разбить все строки таблицы на N равновеликие СЛУЧАЙНЫЕ выборки?

Артем Черепахин @AltZ

select t1. *, ntile(N) over (order by dbms_random.random) nbatch  from t1

А дальше выбираете нужные части nbatch.
ntile в Oracle используется для построения гистограмм, поэтому +/- должен работать быстро.

Ответ написан более трёх лет назад

Комментировать

Как максимально быстро найти точку на верном пути прохождения лабиринта?

Артем Черепахин @AltZ

Дополню ответ Сергей .
Алгоритм Флойда-Уоршалла оперирует при расчете расстояниями между 3мя точками и матрицу надо будет всю просчитывать. Алгоритм Беллмана-Форда в основном применяют для графов с отрицательными весами у ребер- он ищет циклы, применение его на этом примере- ну такое. Алгоритм Дейкстры использует обход в ширину(BFS), т.е. просчитывает весь граф просто с положительными весами в отличии от Беллмана-Форда.
Поэтому если вам не важен оптимальный путь(читай кратчайший), то воспользуйтесь обходом графа в глубину(DFS)- он в среднем быстрее скажет дойдете ли вы, т.е. за минимальное кол-во проверок при поиске.

Ответ написан более трёх лет назад

Комментировать

Как вы храните/генерируете нумерацию документов?

Артем Черепахин @AltZ

Можно воспользоваться функциями\функцией, которые генерирует номер для каждого типа документа включая дату, если необходимо, то хранить версию документа.
К примеру, номер документа для выделенной строки на скриншоте ид = 1156, может выглядеть 338-ПП-21-31012019(дата создания) -01(версия).
В принципе, опытный пользователь до открытия может сказать, о чем документ.

Ответ написан более трёх лет назад

2 комментария

Будет ли конфликт между версиями Python?

Артем Черепахин @AltZ

Все зависит от установите ли вы при установке крыж - "Add Path". При установки это крыжа по-умолчанию будет использоваться последний установленный.
В любом случае можно конкретную версию указывать при запуске- С:\\python37\python.exe c:\\projects\scripts.py
Пути поменять на свои: С:\\python37\python.exe - путь до конкретной версии, c:\\projects\scripts.py- сам скрипт.

Ответ написан более трёх лет назад

Комментировать

Артем Черепахин

Достижения

Наибольший вклад в теги

SQL

Базы данных

PostgreSQL

Oracle

PL/SQL

Алгоритмы

Лучшие ответы пользователя

Какую БД лучше всего использовать для хранения 100 млн записей и больше?

Как в Oracle или Teradata разбить все строки таблицы на N равновеликие СЛУЧАЙНЫЕ выборки?

Как максимально быстро найти точку на верном пути прохождения лабиринта?

Как вы храните/генерируете нумерацию документов?

Будет ли конфликт между версиями Python?

Войдите на сайт