Еще раз о логировании изменений и версионировании данных в БД

Question

Godless @Godless

Еще раз о логировании изменений и версионировании данных в БД

Доброго времени суток.
Я извиняюсь за еще один такой же вопрос.
Тема довольно избитая, алгоритмы решений известны (раз, два).

На работе встала задача изобразить софт для филиалов. Не буду вдаваться в детали. Суть примерно такая:
Есть *цать справочников. Некоторые справочники иерархические. Есть таблицы агрегаторы (далее ХХХ), в которых будут данные накапливаться.

Специфика предметной области такова, что справочники могут довольно часто меняться. Причем изменения могут быть как критичные (значит нужно заносить в историю), так и не очень (не заносить). А данные нужно в ХХХ иметь актуальные на дату внесения. Решается это версионированием данных в справочниках со ссылками в ХХХ на данные определенной версии. Еще есть один нюанс — опять же из-за специфики, довольно часто (4-6 раз в год) набор полей в справочниках может измениться (в ХХХ тоже).

Никак не можем определить как же лучше все это хозяйство хранить. Хочется чтобы и кодить было удобно, работало шустро (база заполнится довольно быстро), и для юзеров был простор по функционалу. Не хочется втыкать в программу промежуточный слой для обработки истории и логирования (для филиалов, когда для себя будем разрабатывать, там уже можно — объемы данных больше на порядок). Может быть, мы много хотим? Тогда помогите вычеркнуть лишнее…

Пользователи будут авторизовываться из таблицы в БД (иногда под одной учеткой в АД работают несколько человек). Права на разделы тоже в таблице.

Пока смотрим на такое решение:
1 таблица на справочник — текущие актуальные сведения
2я таблица на справочник — данные с версиями (ну сюда же можно добавить кто менял последний и когда) для ссылок из ХХХ.
+ триггеры или промежуточный слой в программе между софтом и БД.

Поделитесь, пожалуйста, опытом. кто как делает? Это действительно единственный правильный путь в такой меняющейся среде?

ЗЫ: БД будет MS SQL (в филиалах Express).

Вопрос задан более трёх лет назад
9315 просмотров

Комментировать

Подписаться 6 Оценить Комментировать

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

C#

+1 ещё

Простой
Между сборками и пространствами имён нет прямого соответствия. Что это значит?
- 1 подписчик
- 3 часа назад
- 35 просмотров
1

ответ
Python

+1 ещё

Простой
Как показать зависимость скорости от O(nlogn)?
- 1 подписчик
- 23 часа назад
- 76 просмотров
2

ответа
SQL Server

+1 ещё

Простой
Резервное копирование журнала транзакции ms sql. Автоматически. Растет журнал транзакций. Сжатие это удаление?
- 2 подписчика
- вчера
- 134 просмотра
2

ответа
Программирование

Простой
Как и на чем написать скрипт для клика мышкой?
- 1 подписчик
- вчера
- 101 просмотр
2

ответа
PHP

+1 ещё

Простой
Где ошибка в коде при создании древа в sql из файла?
- 1 подписчик
- 24 апр.
- 102 просмотра
0

ответов
MySQL

+1 ещё

Простой
Как извлечь топ 15 очков из таблицы чтобы игроки не дублировались?
- 1 подписчик
- 22 апр.
- 122 просмотра
1

ответ
Алгоритмы

Простой
Как внедрить алгоритм Дейкстры для игры змейка на java?
- 1 подписчик
- 22 апр.
- 80 просмотров
0

ответов
C++

+1 ещё

Средний
Как найти кратчайший путь в лабиринте, двигаться в котором можно только вперед и направо?
- 1 подписчик
- 21 апр.
- 118 просмотров
1

ответ
Алгоритмы

+2 ещё

Средний
Какие существуют методы сравнения качества изображения?
- 1 подписчик
- 21 апр.
- 108 просмотров
2

ответа
Алгоритмы

Простой
Какой алгоритм использовать, чтобы: разбить массив чисел так, чтобы суммарная разница между максимальным и минимальным числом была максимальна?
- 1 подписчик
- 21 апр.
- 142 просмотра
1

ответ
Показать ещё Загружается…

Python developer

Bell Integrator

До 350 000 ₽

Разработчик программного обеспечения авионики

Котлин-Новатор • Санкт-Петербург

от 50 000 до 150 000 ₽

Ведущий разработчик программного обеспечения авионики

Котлин-Новатор

от 150 000 до 250 000 ₽

8266 f12 требуется сделать ревью и оптимизировать работу

26 апр. 2024, в 20:42

2000 руб./за проект

Доработать и интегрировать модуль на WordPress

26 апр. 2024, в 19:53

5000 руб./за проект

Разработать Telegram mini app

15 апр. 2024, в 22:14

30000 руб./за проект

Answer 1 · 2013-08-19 16:19:13

Если вы хотите хранить меняющийся справочник — так храните его! Примерно как по первой ссылке:

Справочник (иерархично) -> Элементы справочника (уникальный код элемента, ссылка_на_справочник) -> Значения элементов во временном разрезе, т.е. версии по вашей терминологии (дата_начала, дата_окончания, реальное_значение, ссылка_на_элемент, + аудит по вкусу).

Вот последнюю сущность, собственно значения, и меняйте как вам угодно, имхо. Хотите — только значение (т.е. иногда это будет изменение «задним числом»), а хотите — заводите новую запись с датами.
В таком случае, запросом всегда можно получить реальное значение на любой момент времени.

Если встраивать же такие условия во множество запросов будет не очень удобно, то можно подумать про денормализацию — т.е. хранение ссылок на нужное значение элемента в агрегации.

Не совсем понятно, зачем вам текущие актуальные сведения — в чем профит? Ну т.е. если жесткий лоад — проще в памяти поднять, имхо, врядли там такая бесконечность справочников.

Answer 2 · 2013-08-19 16:50:20

noonesshadow @noonesshadow

Скорей всего велосипед уже изобретен.

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2013-09-30 22:01:18

Разрабатывал на двух способах.
1. Все изменения в одной таблице: одна строчка-один реквизит (обычно справочники меняют по 1-3 реквизиту за раз, реже — всё). Хранилось: когда, кто, какой реквизит, значение до изменения (varchar, которое в клиенте превращалось в нужное значение, в том числе если там были ссылки на документы/справочники отображалось текущее значение этого об'екта и значение на момент изменения) + в оригинальной таблице было два поля: кто и когда создал (в основном пользователей эта информация интересовала, а история — только при разборках). Вся структура БД была описана метаданными: справочники, документы и их физическое представление. Отсюда при изменении физической структуры генерировался триггер на изменение, который и вносил в таблицу истории значение до изменения. Физического удаления не было — признаком «удалён» и кнопка «показать удалённые». Решение было простым, но сложнее было когда требовалась история по документу: по шапке получалось так же быстро, а по зависимым таблицам — только открыв об'ект и просмотрев построчно. Плюс некоторые неудобства для пользователя (хранится кто когда изменил и значение «до изменения», а не «после изменения»).
2. Немного видоизменённый вариант: В данных хранится текущая строка + кто и когда последний её изменял. При изменении этой строки значение до изменения кто, когда, какой объект теперь уже предпоследним изменил и весь объект на момент изменения (вся строка таблицы в XML). Также всё описано метаданными: по нужным реквизитам просто проставляются признаки «хранить историю», остальное додумывает клиент: генерирует запрос сохранения текущих данных в XML и сохраняет их в таблицу истории, а потом изменяет данные (и обновляет две колонки: кто и когда изменил). Думал будет сложнее первого варианта (с XML да ещё и на SQL не работал), но вроде получилось компактнее + легче было реализовать историю по документам с зависимыми таблицами (всё отображается в одном окне). Справочные значения разворачиваются и хранится текущее значение, соответственно получить на какой объект ссылался тогда документ (и может проследить уже его историю) затруднительно. Отсюда прожорливость (при изменении одного битового поля в таблице с 30 полями сохранит все 30 полей, причём сджойнив все зависимости), ну и XML тоже отнюдь не для скорости был придуман.
В обоих вариантах при реализации можно потерять одно из изменений: создание, последнее изменение или удаление.
Лично мне понравился первый вариант — гибче и проще (кроме запроса на извлечение исторических данных — там очень высокая этажерка), но пользователям оказалось не очень удобно видеть пореквизитные изменения — хотели видеть всю строку (неудобно когда при очередном изменении меняется новый реквизит и приходится текущее значение держать в уме), но вредителей так было легче искать. Во втором варианте придётся думать над отображением каши в зависимых таблицах (все строчки будут в куче и сложно разобрать какая строка истории к какой строке данных относится) и раскраской изменений по сравнению с предыдущим вариантом (хотя может подумать как хранить только изменившиеся реквизиты без остальных и существенных затрат времени на реализацию? там вроде куча проблем автоматически отпадёт).
Про остальные способы хранения изменений — очень хорошая статья.

Еще раз о логировании изменений и версионировании данных в БД

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт