Как обучать нейронную сеть по одной картинке за раз?

Question

yavaskript @yavaskript

Как обучать нейронную сеть по одной картинке за раз?

Недавно начал изучать Tensorflow ради интереса. Во всех примерах, которые я встречал, сетке скармливают целый датасет из 40к+ изображений для тренировки. Далее тестируют. Но мне стало интересно вот что. Допустим, я хочу научить сетку определять символы, для которых нет огромного датасета (я придумал собственные иероглифы). И собираюсь делать это так: в специальном окошке рисую свой символ, и говорю сетке, какой именно это символ. И так сотни тысяч раз, по одной картинке за раз.
Так как я еще не очень понимаю всю эту систему с нейронными сетями и Tensorflow, хотелось бы узнать следующее:
1) получится ли обучать нейронную сеть, скармливая ей по одной картинке, а не целый датасет? И как это примерно реализовать?
2) как именно скармливать сетке 1 картинку? Формировать датасет из 1 картинки?

Вопрос задан более трёх лет назад
767 просмотров

1 комментарий

Подписаться 6 Простой 1 комментарий

Пригласить эксперта

Ответы на вопрос 5

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Средний
Как навести мышь внутри приложения?
- 1 подписчик
- 43 минуты назад
- 10 просмотров
0

ответов
Python

+1 ещё

Простой
Как пройти авторизацию на youtube с помощью selenium?
- 1 подписчик
- 7 часов назад
- 28 просмотров
2

ответа
Python

+2 ещё

Простой
Как установить 2 версии libssl в kubuntu 22.04?
- 2 подписчика
- 16 часов назад
- 134 просмотра
0

ответов
Python

Простой
Как в библиотеке Flet при нажатии на кнопку сделать, чтобы появилось всплывающее окно?
- 1 подписчик
- 17 часов назад
- 22 просмотра
0

ответов
Python

+1 ещё

Сложный
Интерпретация результатов модели lambdamart?
- 1 подписчик
- 18 часов назад
- 29 просмотров
0

ответов
Python

Простой
Как в конце каждой строки файла добавить тэг?
- 1 подписчик
- вчера
- 133 просмотра
1

ответ
Python

+1 ещё

Простой
Почему asyncio.current_task() не передается в функцию?
- 1 подписчик
- вчера
- 92 просмотра
1

ответ
Python

+2 ещё

Простой
Срабатывает антивирус на скомпилированный файл python, как исправить?
- 1 подписчик
- 22 апр.
- 202 просмотра
1

ответ
Python

Простой
Почему не срабатывает if? как это пофиксить?
- 1 подписчик
- 22 апр.
- 150 просмотров
2

ответа
Python

+2 ещё

Простой
Как транслировать аудио в микрофон, py, c#, c++?
- 1 подписчик
- 22 апр.
- 172 просмотра
3

ответа
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Разработать HLTV HUD для стрима CS 1.6

25 апр. 2024, в 08:02

2500 руб./за проект

Вычислить размер объекта по карте глубин

25 апр. 2024, в 07:37

5000 руб./за проект

Спарсить TON PLACE: скрейпинг фото и текста с анкет по списку URL

25 апр. 2024, в 05:57

3000 руб./за проект

В чём проблема нарисовать 10 символов, а потом уже отдать сетке?

Answer 1 · 2019-10-08 15:10:08

Обучение и происходит по одной картинке.
То есть если размер партии = 1 картинка, то после просмотра 1 картинки полученные ошибки сразу запускают в backprop, чтобы изменить весы сети.
Если размер партии 10, то картинки просматриваются, но ошибка суммируется отдельно, и отдается в backprop только в конце. То есть твоя сеть смотрит 10 картинок не обучаясь, но потом суммарная ошибка применяется.
Главная причина, почему второй вариант применяется чаще - потому что рассчитывать backprop на сотне миллионов весов это затратная операция и при batch=10 ты сокращаешь время в 10 раз. При этом кол-во выученой инфы сокращается незначительно.

Answer 2 · 2019-10-08 17:37:11

При такой постановке вопроса, уже понятно, что ничего хорошего не получится. Хотя, формально ответы такие:
1) да
2) да
Но, повторю, так делать НЕ надо (сеть либо переобучится, либо не будет никакой сходимости функции потерь, в обоих случаях сеть превратится в бесполезный генератор псевдослучайных чисел). А что тогда делать? Хорошо бы точно определиться с задачей. Насколько я понял, речь о самой простой классификации (у нас есть M классов (твоих иероглифов) и каждая картинка принадлежит только одному из них). Это так называемая multi-label classification. Если так, то обучать лучше минибатчами (это набор из нескольких картинок). Минибатчи формируются путём случайного отбора примеров из обучающей выборки. Тонкостей и здесь довольно много. Например, минибатчи лучше делать несмещёнными (т.е. отбирать примеры так, чтобы метки всех классов были представлены в минибатче в одинаковом количестве). Если обучающих данных мало (1 пример на один класс это конечно вообще не для нейронных сетей задача, но тем не менее...), то данные дополняют искусственно. Можно случайный шум к картинке добавлять, поворачивать её немного, масштабировать, смещать параллельным переносом, цвет менять и ещё разные искусственные преобразования делать (см. https://github.com/albu/albumentations ).

Answer 3 · 2019-10-08 18:33:23

grinat @grinat

Сиамские нейросети. Там по моему как раз таки все примеры на иероглифах.

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2019-10-08 19:29:12

1) Да, но это будет медленнее. См. ответ на п.2
2) Точно так же, как и батч из N картинок, но для случая N=1. Грубо говоря, массив [img] из 1 картинки. Допустим, картинка img - это np.array размера (Y, X, D). Тогда сети надо подать img[np.newaxis, ...], что даст np.array размера (1, Y, X, D).

Answer 5 · 2019-10-09 19:24:50

Можно насоздавать изображения из одного растр-объекта (символа) динамически:
1.Вращение в 3D
2. Деформация в 3D.
3. Фильтры ("шум", размытие, пиксиализация и т.п.)
X. Комбинации всех предыдущих пунктов.
НО! обязательно с сохранением топологии объекта.

Как обучать нейронную сеть по одной картинке за раз?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт