Как сделать правильную организацию «напоминаний» на уровне БД?

Question

lookingfor @lookingfor

Как сделать правильную организацию «напоминаний» на уровне БД?

Добрый день! Ребят, кто делал напоминания(задания по расписанию) в своих проектах!? поделитесь опытом, как лучше все организовать, хранить в БД, для того чтобы потом было удобно и быстро сделать выборку по записям.

Вот к примеру есть таблица TASK, и нужно чтобы он выполнялся по определенному расписанию. Соответственно нужна например выборка тасков которые будут выполнятся за сегодня или например за неделю в общем в зависимости от того как указал юзер.

Варианты которые с ходу пришли на ум:

1) Добавляем поле-строку в формате cron к примеру "0 0 * * *" - (каждый день в полночь)

Очень удобно, но как потом делать выборку, нужно средствами бд парсить вначале эту строку потом по результату составлять запрос, но самое главное когда таблица разрастется парсин плохо скажется на скорости выборки.

2) Тоже самое, но только каждый параметр выносим в отдельное поле и я так понимаю, если нужно указывать несколько месяцев или несколько дней, то храним их как битовую маску. Плюс в том что избавляемся от парсинга, но получаем новую проблему выборка по маске, на сколько она быстро и удобно будет работать?

3) Делаем полноценную структуру таблиц, под месяцы, дни, часы свою таблицу со связями.

4) Отдаем все серверу приложения, держим отдельный кэш для этих целей и синхронизируем его с бд в принципе можно использовать формат cron как в первом варианте

Ни один способ мне интуитивно не нравится. Посоветуйте, как лучше сделать те кто уже сталкивался с подобными задачами. Может есть более красивый и правильный способ.

База у меня postgresql.

Вопрос задан более трёх лет назад
2957 просмотров

2 комментария

Подписаться 2 Оценить 2 комментария

Решения вопроса 1

3 комментария

lookingfor @lookingfor Автор вопроса

@leahch спасибо за ответ!

Как я понял у вас вся логика выборки на стороне приложения выполняется? Т.е вы вначале из базы достаете по условию - "Выбираем все активные задачи, где старт меньше нужной даты и стоп равен нулю или больше нужной даты.", а затем уже на питоне высчитываете попадание и отсеиваете ненужное? Правильно я понял.

Я вот надеялся на то что есть способ сделать все это на стороне базы и на клиенте получить готовый данные)

Тогда у меня к вам еще вопросы))
Какое примерно количество юзеров и задач в вашей системе? и соответственно время выполнения выборки на ваших данных для среднестатистического запроса? если конечно вы подобные тесты делали.

Написано более трёх лет назад
Алексей Черемисин @leahch

@lookingfor
1. Да, всё правильно, выбираются только живые задачи, на питоне рассчитываются интервалы. Со стороны базы данных такое можно сделать толкьо хранимыми процедурами, так как в зависимости от даты выборки нам нужно считать как минимум длительность, исключения, ну и у меня еще прочее. Сами вычисления достаточно простые и практически не занимают времени процессора. В базе данных при этом хранится именно задача, а не сами интервалы, соответственно нагрузка на базу может быть очень маленькая.

2. На самом деле у меня нет совсем базы данных, задачи подгружаются из конфигурационных файлов, просто это специфика моего приложения. Если хранить в базе, то можно сделать хранимку, но зачем засорять базу лишними вычислениями, ведь эти вычисления гораздо легче параллелятся в приложении.

3. Задач относительно мало, не более 100, юзверей нет вообще! Тестировал на 100000 - работает не поперхнувшись! Но мне больше и не нужно, больше 100 один сервер уже не тянет, у меня очень специфическая задача, запускать в нужные интервалы видеопотоки, когда интервал оканчивается, поток умирает :-)

PS. Спрогнозировать Ваш случай достаточно легко, реализация примитивная, посчитать количество задач на юзера: например 100к юзеров с ~500 задачами, из них по 100 активных, итого таблица будет на 500к записей с выборкой по 100 записей на пользователя. Причем это именно активные задачи, которые ВСЁ равно нужно будет обслужить и/или выбрать. Таблица практически не будет расти, кешировать задачи можно где угодно, обосчитать 100 задач - милисекунда!

Написано более трёх лет назад
lookingfor @lookingfor Автор вопроса

Спасибо буду пробывать !)

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

2 комментария

lookingfor @lookingfor Автор вопроса

Давайте;)

Тоже думал над первым вариантом, но как вы уже и сказали нет возможности сделать выборку в будущем или прошлом

Второй вариант интересен, но вот только, как я понял объемы данных будут очень большие в таблице экземпляров. И еще при добавлении/изменении задачи нужно будет удалять и создавать все экземпляры? или я не совсем правильно понял идею.

Написано более трёх лет назад
Дмитрий Энтелис @DmitriyEntelis

@lookingfor По поводу второго варианта - да, если у прототипа меняется регулярность - то надо пересоздать все задачи.

Мне лично очень нравится функционал icloud - там есть удобная штука, что при изменении задачи он спрашивает - внести изменения во все задачи, только в будущие, или только в текущую. Мне кажется это реально удобно для планирования. Но реализовать это можно только таким способом

Объемы данных будут кстати не очень большие, можно во всех значимых полях кроме даты хранить null если они не отличаются от прототипа. Можно дополнительно схитрить, и задачи на сильно будущее время заранее не создавать, а задачи из сильно прошлого - убирать в какой то отдельный архив

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

PostgreSQL

Простой
Нужен ли первичный ключ в таблицах PostgreSQL?
- 1 подписчик
- вчера
- 136 просмотров
2

ответа
PostgreSQL

+1 ещё

Простой
Как добавить отношения «многие-ко-многим» между таблицами из разных баз данных?
- 1 подписчик
- 22 апр.
- 126 просмотров
4

ответа
Проектирование баз данных

Средний
Как хранить баланс пользователя в разных валютах?
- 1 подписчик
- 22 апр.
- 98 просмотров
2

ответа
PostgreSQL

+1 ещё

Простой
Как исправить неправильное отображение данных в csv после экспорта?
- 1 подписчик
- 17 апр.
- 105 просмотров
1

ответ
Java

+3 ещё

Средний
Пытаюсь подключиться к postgresql 16 через docker-compose, использую spring-boot 3.2.4, что не так?
- 1 подписчик
- 17 апр.
- 197 просмотров
3

ответа
PostgreSQL

+2 ещё

Простой
Где искать рекомендуемые настройки SSL-аутентификации для Docker-образа Posgres?
- 1 подписчик
- 17 апр.
- 62 просмотра
3

ответа
PostgreSQL

+1 ещё

Простой
Как поправить язык в SQL Shell (psql)?
- 1 подписчик
- 14 апр.
- 98 просмотров
1

ответ
Проектирование баз данных

Средний
Можно ли создать базу данных на одной таблице?
- 2 подписчика
- 14 апр.
- 415 просмотров
3

ответа
Python

+1 ещё

Простой
Как оптимизировать запрос?
- 1 подписчик
- 13 апр.
- 146 просмотров
2

ответа
PostgreSQL

Простой
Как взять значение из одной таблицы и прибавить к значению другой таблицы?
- 1 подписчик
- 12 апр.
- 81 просмотр
1

ответ
Показать ещё Загружается…

Разработчик баз данных PostgreSQL

Объединенные системы управления транспортом • Москва

До 220 000 ₽

Администратор PostgreSQL

Гринатом

До 200 000 ₽

DBA / Администратор баз данных PostgreSQL

СберТех • Москва

от 320 000 ₽

Создание и публикация короткого (reels) UGC-видео на YouTube-канале

25 апр. 2024, в 01:46

500 руб./за проект

Настроить перехват https-трафика для android-приложения

25 апр. 2024, в 01:02

10000 руб./за проект

Программа (скрипт) для автоматизации торговли Solana

25 апр. 2024, в 00:45

100 руб./в час

Перечитал 3жды. Уточните пожалуйста еще раз суть задачи: что должно получиться с точки зрения пользователя.
пользователь создает себе задания и время их выполнения, например

"Помыть машину" - выполнить 1-го числа каждого месяца
или
"Уборка в квартире" - выпонять каждую неделю в субботу

Далее ему нужно выбирать задание по заданному промежутку, например за сегодня или за неделю, соответственно система должна проанализировать текущую дату с заданием и сделать выборку

Answer 1 · 2014-07-15 10:40:17

У меня это так реализовано. Все даты храним в формате таймстампа, это проще для хранения и вычислений. Исключения храним в произвольной форме ключ/значение, у меня реализованы только часы ключами from to. Задания бывают в нескольких состояниях: активная, неактивная, просроченная, будущая, бесконечная.
Само задание выглядит примерно так (это как раз и есть запись в таблице):
- старт - дата старта (таймстамп)
- дельта - смещение реального старта от начала старта (это особенность моего приложения, нафиг не нужна, просто чтобы код не портить)
- период - период повторения (таймстамп в виде timedelta)
- продолжительность (должна быть меньше или равна периодутаймстамп в виде timedelta)
- стоп - дата окончания (может отсутствовать, таймстамп в виде timedelta)
- count - число повторений от даты старта (если есть, то обязана ставиться дата окончания, int )
- исключения (например без понедельников или только чётные часы, или время с 10 до 19)
- активна (да/нет)

Работает так.
- Выбираем все активные задачи, где старт меньше нужной даты и стоп равен нулю или больше нужной даты.
- Пробегаемся по всем заданиям и для каждого рассчитываем попадание в нашу дату.
- Если есть исключения, смотрим, не попадаем ли в них.
- Если есть count, рассчитываем его
- Если вместе с count стоят исключения, то пересчитываем count для каждого периода - самый ресурсоёмкий процесс, приходится пробегать по всем интервалам с начала старта.

Базовый класс (на питоне):

# функция преобразования питоновского класса datetime в timestamp
# возвращает timestamp (int)
def total_seconds(td):
    seconds = (td.microseconds + (td.seconds + td.days * 24 * 3600) * 10**6) / 10.**6
    ret = 0 if seconds < 0 else seconds
    return ret

class interval(object):
# здесь должно быть все понятно
# self  - указатель на сам класс, особенность питона, на другом языке этот параметр опускаем
# вместо self на других языках используем this или аналог
    def __init__(self, start, delta, duration, period):
        self.start = start
        self.delta = delta
        self.duration = duration
        self.period = period

# вычисление последнего интервала от нужной даты
# возвращает две даты от и до
    def last(self, date):
        _start = self.start+self.delta 
        mul = int(total_seconds(date - _start)/total_seconds(self.period))
        at = _start+(self.period*mul)
        to = at+self.duration
        return (at,to)

# является ли интервал активный на нужную дату
# возвращает true/false
    def isLive(self, date):
        at, to = self.last(date)
        f1 = date >= at
        f2 = date < to
        return f1 and f2

# вычисление следующего интервала от нужной даты
# возвращает две даты от и до
    def next(self, date):
        at, to = self.last(date)
        return (at + self.period, to + self.period)

Остальное, не привожу, так как много и надеюсь, допишите сами.

Answer 2 · 2014-07-15 08:46:06

Как бы я это реализовал:
В произвольном, удобном для Вас виде храним периодичность (можно как Вы написали в первом варианте, в формате крона). Дополнительно, отдельным полем храним дату следующего наступления события. Соответственно все выборки ведем просто по дате.
Это для случая если у задачи нет cтатуса выполнения, не нужно смотреть на прошлые/будущие задачи, итд.

Если хочется сделать как в google calendar / icloud - где каждый экземпляр этой повторяющейся задачи по сути достаточно независим - становится чуть сложнее.
Получается 2 таблицы: задача-прототип где хранится периодичность, дата первого запуска и опционально дата последнего, - и задача-экземпляр где хранится конкретная дата и ссылка на прототип.

Сумбурно получилось, не проснулся еще :)
Если что - давайте обсудим :)

Как сделать правильную организацию «напоминаний» на уровне БД?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт