Как сгруппировать список английских слов по частям речи и сохранить в отдельные файлы?

Question

nv_vasilencov @nv_vasilencov

Как сгруппировать список английских слов по частям речи и сохранить в отдельные файлы?

Добрый день. До этого задача была отпарсить русский словарь. Я использовал pyMorphy2 такой скрипт:

Скрипт

infile = Path(r"C:\Temp\slovar.txt")
words = infile.read_text(encoding="utf-8").splitlines()
print(words)
#['каждый', 'охотник', 'желает', 'знать', 'где', 'сидит', 'фазан']
morph = MorphAnalyzer()
items = [(str(morph.parse(w)[0].tag.POS), w) for w in words]

print(items)
#[('ADJF', 'каждый'), ('NOUN', 'охотник'), ('VERB', 'желает'), ('INFN', 'знать'), ('ADVB', 'где'), ('VERB', 'сидит'), ('NOUN', 'фазан')]
for g, it in groupby(sorted(items), key=lambda x: x[0]):
    otufile = infile.parent / f"{g}.txt"
    otufile.write_text("\n".join([word for pos, word in it]),
                       encoding="utf-8")

Но вот незадача, вот из этого поста https://toster.ru/q/305279, я узнал что pyMorphy2 не поддерживает английский.
Не знаю как поступить, прошу помощи). Содержание словаря - это слова где каждое начинается с новой строки https://drive.google.com/file/d/1K9YGgGY1Nk86bhIGW...

Вопрос задан более трёх лет назад
133 просмотра

2 комментария

Подписаться 1 Сложный 2 комментария

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Простой
Как пройти авторизацию на youtube с помощью selenium(python)?
- 1 подписчик
- час назад
- 10 просмотров
1

ответ
Python

+2 ещё

Простой
Как установить 2 версии libssl в kubuntu 22.04?
- 2 подписчика
- 10 часов назад
- 98 просмотров
0

ответов
Python

Простой
Как в библиотеке Flet при нажатии на кнопку сделать, чтобы появилось всплывающее окно?
- 1 подписчик
- 11 часов назад
- 21 просмотр
0

ответов
Python

+1 ещё

Сложный
Интерпретация результатов модели lambdamart?
- 1 подписчик
- 12 часов назад
- 22 просмотра
0

ответов
Python

Простой
Как в конце каждой строки файла добавить тэг?
- 1 подписчик
- вчера
- 120 просмотров
1

ответ
Python

+1 ещё

Простой
Почему asyncio.current_task() не передается в функцию?
- 1 подписчик
- вчера
- 91 просмотр
1

ответ
Python

+2 ещё

Простой
Срабатывает антивирус на скомпилированный файл python, как исправить?
- 1 подписчик
- 22 апр.
- 202 просмотра
1

ответ
Python

Простой
Почему не срабатывает if? как это пофиксить?
- 1 подписчик
- 22 апр.
- 148 просмотров
2

ответа
Python

+2 ещё

Простой
Как транслировать аудио в микрофон, py, c#, c++?
- 1 подписчик
- 22 апр.
- 171 просмотр
3

ответа
Python

Средний
Почему Низкий FPS анализ изображения yolov8 YOLO?
- 2 подписчика
- 22 апр.
- 33 просмотра
0

ответов
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Создание и публикация короткого (reels) UGC-видео на YouTube-канале

25 апр. 2024, в 01:46

500 руб./за проект

Настроить перехват https-трафика для android-приложения

25 апр. 2024, в 01:02

10000 руб./за проект

Программа (скрипт) для автоматизации торговли Solana

25 апр. 2024, в 00:45

100 руб./в час

eaniconer,
Словари распространяются отдельными пакетами:

pymorphy2-dicts-ru для русского языка,
pymorphy2-dicts-uk для украинского языка (экспериментальный).

Где вы увидели поддержку английского?
nv_vasilencov, ага, ошибся-извиняюсь, подумал что uk - Unided Kindom, а оказалось Ukraine

Answer 1 · 2019-01-24 11:26:59

Евгений Акулинин @forkhammer

Fullstack-разработчик (Django, Angular)

Попробуй использовать библиотеку NLTK для анлийского языка www.nltk.org/index.html

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2019-01-24 20:39:00

Если у Вас задача "сделал-забыл", Вам нужен костыль и не нужна производительность, попробуйте через API яндекс-переводчика переводить слова, а затем определять часть речи при помощи pyMorphy2. Или использовать какой-либо словарь с возможностью определения части речи. Разумеется, времени потребуется больше, чем Вам, вероятно, хотелось бы.

Как сгруппировать список английских слов по частям речи и сохранить в отдельные файлы?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт