Как реализовать синтез речи?

Question

dBegginer @dBegginer

Как реализовать синтез речи?

Хотелось летом заняться интересным проектом и остановился на синтезе речи. На выходе надеюсь получить что-то на уровне google-translate bot. Сначала без нейронных сетей, а потом уже с использованием глубокого обучения. Что можете посоветовать?

Вопрос задан более трёх лет назад
1386 просмотров

1 комментарий

Подписаться 5 Средний 1 комментарий

Решения вопроса 1

11 комментариев

Пригласить эксперта

Ответы на вопрос 2

6 комментариев

xmoonlight @xmoonlight

Я вот что думаю:
А ему точно нужен готовый код? Он вроде сам хотел разобраться.... (как я понял)

Написано более трёх лет назад
Люда MARMALADKA @tiwi

xmoonlight, лучший способ узнать как чтото писать, это смотреть как другие это пишут, более того, там он может найти связь с людьми которые это делают, и они могут помочь ему обучиться, если захотят, гитхаб это же не тостер, где тебя вечно посылают в гугл инфопомои глотать, ещё читать книги или мануалы написанные какимито ботаниками на понятном только им языке

Написано более трёх лет назад
xmoonlight @xmoonlight

Люда MARMALADKA, Вот кто так учится без понимания теории на исходниках - тот так и кодит потом...
Не нужно советовать плохого!

Написано более трёх лет назад
xmoonlight @xmoonlight

Люда MARMALADKA,
и самому врядли удастся добиться похожего результата в синтезе речи
По вашему совету - однозначно! ;)

Написано более трёх лет назад
Люда MARMALADKA @tiwi

xmoonlight,
По вашему совету - однозначно! ;)

Да, и не двузначно.

Написано более трёх лет назад
Люда MARMALADKA @tiwi

hint000, там ему быстро объяснят что к чему

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Средний
Как навести мышь внутри приложения?
- 1 подписчик
- вчера
- 46 просмотров
0

ответов
Python

+1 ещё

Сложный
Интерпретация результатов модели lambdamart?
- 1 подписчик
- вчера
- 39 просмотров
0

ответов
Нейронные сети

Простой
Что такое A2A_II_EXCH?
- 1 подписчик
- 21 апр.
- 19 просмотров
0

ответов
Нейронные сети

Простой
Какие нейросети имеют доступ к страницам сайте в интернете?
- 1 подписчик
- 20 апр.
- 60 просмотров
1

ответ
Аудио

+2 ещё

Простой
Какой программой можно сделать из текста рэп?
- 1 подписчик
- 20 апр.
- 686 просмотров
2

ответа
IT-образование

+3 ещё

Простой
Какая есть литература полезная и понятная по Data Science на русском?
- 3 подписчика
- 17 апр.
- 1061 просмотр
1

ответ
Нейронные сети

+1 ещё

Средний
Существует ли аналог GPTs?
- 3 подписчика
- 16 апр.
- 1077 просмотров
3

ответа
Нейронные сети

+1 ещё

Простой
Какие сейчас текстовые нейросети можно локально поставить?
- 1 подписчик
- 16 апр.
- 92 просмотра
1

ответ
JavaScript

+1 ещё

Простой
Как масштабировать число с идеальной точностью?
- 1 подписчик
- 13 апр.
- 164 просмотра
1

ответ
Алгоритмы

+2 ещё

Простой
Какая может быть формула для решения этой задачи?
- 3 подписчика
- 11 апр.
- 6753 просмотра
3

ответа
Показать ещё Загружается…

Преподаватель по олимпиадному программированию

CODDY • Москва

от 20 000 до 40 000 ₽

Программист-разработчик систем САУ

Альбатрос • Москва

До 200 000 ₽

Программист С++

KeenTools • Ереван

от 150 000 ₽

Devops для видео сервиса

26 апр. 2024, в 06:46

1000 руб./в час

Найти ошибку flutter_map

26 апр. 2024, в 05:31

1000 руб./за проект

Разработать электронику для весов с Wi-Fi

26 апр. 2024, в 01:22

1000 руб./в час

Answer 1 · 2019-07-27 03:29:59

Лучше сразу делать качественно с нейронными сетями.
Изучайте Python и НС.
Применяйте нужные библиотеки и пишите код.

Пакет от NVIDIA: OpenSeq2Seq

machine translation (GNMT, Transformer, ConvS2S, …)
speech recognition (DeepSpeech2, Wave2Letter, Jasper, …)
speech commands (RN-50, Jasper)
speech synthesis (Tacotron2, WaveNet…)
language model (LSTM, …)
sentiment analysis (SST, IMDB, …)
image classification (ResNet-50)

Озвучка (TTS) : Tacotron 2

Лекции:
Лекции 1
Лекции 2

PS:
Синтез и перевод - разные вещи.
Синтез - это текст в звук.
А перевод - это с одного разговорного языка на другой.

Answer 2 · 2019-07-27 04:43:48

Люда MARMALADKA @tiwi

Почитайте исходный код файлов тут: https://github.com/Olga-Yakovleva/RHVoice

Ответ написан более трёх лет назад

6 комментариев

Answer 3 · 2019-07-27 09:34:13

Сначала изучить теорию, затем посмотреть методы реализации, далее написать алгоритм.

Например, вы можете воспроизводить отдельные буквы, или фонемы, или слова, или словосочетания. Вы можете записать это все заранее или с генерировать робовойс как в телефоне. И ещё много чего.

Сейчас вы делаете как: "дайте мне ссылку на api гугла, я буду текст воспроизводить."

Как реализовать синтез речи?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт