@Kornyshev
Newbie Java Student

Как спарсить HTML в Java с помощью HtmlUnit или JSOUP?

Здравствуйте. Возникла следующая проблема с парсингом сайтов: метод get в JSOUP и соответствующий механизм в HtmlUnit возвращают исходный код страницы. Но нужный текстовый контент, который я вижу в браузере, зашит в исходники, а как его оттуда извлечь я не знаю. Есть ли возможность средствами Java получить итоговую HTML страницу со всем текстовым контентом или всё это в читаемом виде? Заранее спасибо, надеюcь понятно написал.
  • Вопрос задан
  • 266 просмотров
Решения вопроса 1
erge
@erge
Примус починяю
Я думаю, что вам нужен "безголовый" хром, смотрите Introduction to Headless Chrome
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
Bell Integrator Ульяновск
До 400 000 ₽
Bell Integrator Хабаровск
До 400 000 ₽
Bell Integrator Ижевск
До 400 000 ₽
19 апр. 2024, в 14:12
30000 руб./за проект
19 апр. 2024, в 14:10
500 руб./за проект