Существует ли на мировом рынке софт для быстрой, автоматической коррекции правописания текстовых файлов?

Question

Вадим Соловьёв @VadimSoloviev

Человек из касты создателей

Существует ли на мировом рынке софт для быстрой, автоматической коррекции правописания текстовых файлов?

Ищу софт который позволит в считанные секунды выполнить коррекцию правописания спаршенного с форума текста на русском и английском языках.
Открыл текст, нажал 1 или 2 кнопочки для разных языков - получил готовый результат.
Ищу софт который действует по принципу не навреди и корректирует только те слова в опечатках которых он уверен с высокой долей вероятности и который не заставляет пользователя просматривать километровый текстовый файл предлагая ему вручную подтверждать коррекцию 1000 неверно написанных слов. В первую очередь он должен уметь автоматически корректировать орфографию и опечатки так как итоговый текст будет подвергнут речевому синтезу. И когда синтезатор речи читает текст с опечатками это прям очень критично. Волей неволей встаёт вопрос о том что бы уменьшить их количество настолько насколько это вообще возможно автоматическим способом.

Вопрос задан более трёх лет назад
231 просмотр

1 комментарий

Подписаться 1 Средний 1 комментарий

Решения вопроса 2

1 комментарий

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Windows

+4 ещё

Простой
Программно гасить монитор в Windows (11). Как?
- 1 подписчик
- 20 апр.
- 277 просмотров
1

ответ
Программное обеспечение и интернет-сервисы

Простой
Для чего такие сайты?
- 1 подписчик
- 20 апр.
- 2932 просмотра
6

ответов
Программное обеспечение и интернет-сервисы

Простой
Какую программу использовать для демонстрации материалов (изображений и иных) на втором экране?
- 1 подписчик
- 19 апр.
- 46 просмотров
0

ответов
Программное обеспечение и интернет-сервисы

+2 ещё

Простой
Как разговаривать с кошкой удалённо через веб-камеру и колонки?
- 1 подписчик
- 16 апр.
- 220 просмотров
3

ответа
Компьютерные сети

+1 ещё

Простой
Компьютерный клуб в селе? Реальность или Мечта?
- 1 подписчик
- 09 апр.
- 277 просмотров
6

ответов
Программное обеспечение и интернет-сервисы

+1 ещё

Простой
Как удалить отправленные письма на которые не пришел ответ?
- 1 подписчик
- 08 апр.
- 90 просмотров
1

ответ
Программное обеспечение и интернет-сервисы

Простой
Как запустить OPENAI API на NODE из РФ?
- 1 подписчик
- 04 апр.
- 199 просмотров
2

ответа
Программное обеспечение и интернет-сервисы

Простой
Как в Picso переключаться между страницами?
- 1 подписчик
- 04 апр.
- 32 просмотра
0

ответов
Python

+3 ещё

Средний
Какие существуют библиотеки Python для комплексной обработки текста, включая исправление ошибок и удаление лишних символов?
- 1 подписчик
- 01 апр.
- 85 просмотров
1

ответ
Python

+2 ещё

Простой
Как вывести текст без ошибок в файл с помощью SpellChecker?
- 1 подписчик
- 28 мар.
- 72 просмотра
1

ответ
Показать ещё Загружается…

Auto QA СберДруг

Сбер • Москва

от 200 000 ₽

Backend Developer (PHP)/Fullstack

Wiregate

от 1 800 до 2 500 $

Руководитель отдела тестирования/QA Lead

Uniscan Research • Новосибирск

от 175 000 до 210 000 ₽

Devops для видео сервиса

26 апр. 2024, в 06:46

1500 руб./в час

Найти ошибку flutter_map

26 апр. 2024, в 05:31

1000 руб./за проект

Разработать электронику для весов с Wi-Fi

26 апр. 2024, в 01:22

1000 руб./в час

Вадим Соловьёв дорогой пользователь, настоятельно рекомендуем еще раз обратить самое пристальное внимание на п. 3.1 регламента работы сервиса (и, в особенности, на его последний абзац).
В противном случае, ваши вопросы будут удаляться по причине тег-спама, а систематические нарушения приведут к блокировке учетной записи.

Answer 1 · 2018-12-15 22:01:36

На английском есть www.grammarly на русском могу ошибаться, но ничего такого нет, все проверяльщики как минимум сленгом не владеют.
Думал для русского такое сделать как pet-project но пока всё упирается во время.

Answer 2 · 2018-12-15 23:06:50

Для решения этой проблемы есть фундаментальное препятствие.
Для разработки подобного софта нужен общедоступный корпус языка (набор размеченных текстовых данных), создание которого - задача для лингвистов. Далее, этот набор данных должен быть интегрирован в достаточно специфическое ПО. А еще он должен быть доступен для разработчиков.

В случае русского языка, случилось закономерное: государственные институты занялись этой проблемой, но программную часть стал делать Яндекс. Это их традиционная манера - подмять под себя данные, которые созданы на деньги налогоплательщиков, превратив это либо в закрытый, либо в коммерческий продукт. Например, так происходит с данными о пробках, которые собираются гос. организациями, с данными о местоположении общественного транспорта и т.п. Результат - национальный корпус русского языка - закрытый проект с чертами коммерческого.

Потому такая штука как открытый корпус русского языка делается параллельно на добровольной основе www.opencorpora.org
Этого набора данных пока недостаточно для разработки того, о чем вы мечтаете.

Существует ли на мировом рынке софт для быстрой, автоматической коррекции правописания текстовых файлов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт