Существует ли на мировом рынке софт для быстрой, автоматической коррекции правописания текстовых файлов?

Question

Вадим Соловьёв @VadimSoloviev

Человек из касты создателей

Существует ли на мировом рынке софт для быстрой, автоматической коррекции правописания текстовых файлов?

Ищу софт который позволит в считанные секунды выполнить коррекцию правописания спаршенного с форума текста на русском и английском языках.
Открыл текст, нажал 1 или 2 кнопочки для разных языков - получил готовый результат.
Ищу софт который действует по принципу не навреди и корректирует только те слова в опечатках которых он уверен с высокой долей вероятности и который не заставляет пользователя просматривать километровый текстовый файл предлагая ему вручную подтверждать коррекцию 1000 неверно написанных слов. В первую очередь он должен уметь автоматически корректировать орфографию и опечатки так как итоговый текст будет подвергнут речевому синтезу. И когда синтезатор речи читает текст с опечатками это прям очень критично. Волей неволей встаёт вопрос о том что бы уменьшить их количество настолько насколько это вообще возможно автоматическим способом.

Вопрос задан более трёх лет назад
231 просмотр

1 комментарий

Подписаться 1 Средний 1 комментарий

Решения вопроса 2

1 комментарий

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Windows

+4 ещё

Простой
Программно гасить монитор в Windows (11). Как?
- 1 подписчик
- 20 апр.
- 255 просмотров
1

ответ
Программное обеспечение и интернет-сервисы

Простой
Для чего такие сайты?
- 1 подписчик
- 20 апр.
- 2493 просмотра
6

ответов
Программное обеспечение и интернет-сервисы

Простой
Какую программу использовать для демонстрации материалов (изображений и иных) на втором экране?
- 1 подписчик
- 19 апр.
- 41 просмотр
0

ответов
Программное обеспечение и интернет-сервисы

+2 ещё

Простой
Как разговаривать с кошкой удалённо через веб-камеру и колонки?
- 1 подписчик
- 16 апр.
- 213 просмотров
3

ответа
Компьютерные сети

+1 ещё

Простой
Компьютерный клуб в селе? Реальность или Мечта?
- 1 подписчик
- 09 апр.
- 275 просмотров
6

ответов
Программное обеспечение и интернет-сервисы

+1 ещё

Простой
Как удалить отправленные письма на которые не пришел ответ?
- 1 подписчик
- 08 апр.
- 90 просмотров
1

ответ
Программное обеспечение и интернет-сервисы

Простой
Как запустить OPENAI API на NODE из РФ?
- 1 подписчик
- 04 апр.
- 192 просмотра
2

ответа
Программное обеспечение и интернет-сервисы

Простой
Как в Picso переключаться между страницами?
- 1 подписчик
- 04 апр.
- 32 просмотра
0

ответов
Python

+3 ещё

Средний
Какие существуют библиотеки Python для комплексной обработки текста, включая исправление ошибок и удаление лишних символов?
- 1 подписчик
- 01 апр.
- 85 просмотров
1

ответ
Python

+2 ещё

Простой
Как вывести текст без ошибок в файл с помощью SpellChecker?
- 1 подписчик
- 28 мар.
- 72 просмотра
1

ответ
Показать ещё Загружается…

Инженер по автоматизации тестирования

SpectrumData • Екатеринбург

от 150 000 ₽

Auto QA СберДруг

Сбер • Москва

от 200 000 ₽

Платформенный инженер

ИТ Плюс • Пермь

от 250 000 ₽

Фронтер - DevOps. Развернуть фронт на хостинге. Прокинуть в телегу-бот

25 апр. 2024, в 04:38

15000 руб./за проект

Приложение или модуль для Wordpress для учета поездок по QR

25 апр. 2024, в 03:58

10000 руб./за проект

Ошибка в 1с при выгрузке товаров на сайт на Битриксе

25 апр. 2024, в 03:08

3000 руб./за проект

Вадим Соловьёв дорогой пользователь, настоятельно рекомендуем еще раз обратить самое пристальное внимание на п. 3.1 регламента работы сервиса (и, в особенности, на его последний абзац).
В противном случае, ваши вопросы будут удаляться по причине тег-спама, а систематические нарушения приведут к блокировке учетной записи.

Answer 1 · 2018-12-15 22:01:36

На английском есть www.grammarly на русском могу ошибаться, но ничего такого нет, все проверяльщики как минимум сленгом не владеют.
Думал для русского такое сделать как pet-project но пока всё упирается во время.

Answer 2 · 2018-12-15 23:06:50

Для решения этой проблемы есть фундаментальное препятствие.
Для разработки подобного софта нужен общедоступный корпус языка (набор размеченных текстовых данных), создание которого - задача для лингвистов. Далее, этот набор данных должен быть интегрирован в достаточно специфическое ПО. А еще он должен быть доступен для разработчиков.

В случае русского языка, случилось закономерное: государственные институты занялись этой проблемой, но программную часть стал делать Яндекс. Это их традиционная манера - подмять под себя данные, которые созданы на деньги налогоплательщиков, превратив это либо в закрытый, либо в коммерческий продукт. Например, так происходит с данными о пробках, которые собираются гос. организациями, с данными о местоположении общественного транспорта и т.п. Результат - национальный корпус русского языка - закрытый проект с чертами коммерческого.

Потому такая штука как открытый корпус русского языка делается параллельно на добровольной основе www.opencorpora.org
Этого набора данных пока недостаточно для разработки того, о чем вы мечтаете.

Существует ли на мировом рынке софт для быстрой, автоматической коррекции правописания текстовых файлов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт