@VuztreeCalan
Дилетант Широкого Профиля

Как на питоне пропарсить URL внутри script?

Пытаюсь вытащить картинки с этой странички, использую session.get, вижу следующее:
5d753bf60befb810573521.png
Вроде не беда, в коде есть ссылки на все хайрезы, но все кроме первой находятся внутри script, а сам скрипт выглядит так:
5d753c8445e56838320974.png
Нужные ссылки соответственно лежат далеко внутри этой строчки.
Теперь использую soup.find_all('script'), среди вывода нахожу и нужный мне скрипт, соответственно сейчас у меня два вопроса, как находить только один скрипт а не все сразу, и есть ли способы вытащить из огромной строки URL-ы кроме как используя страшные регулярки?
  • Вопрос задан
  • 398 просмотров
Решения вопроса 1
AWEme
@AWEme
Retard Soft Inc.
Помню я давал код в прошлом ответе.
https://www.artstation.com/projects/o1eqm.json
В этой ссылке всё есть.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@smsi
Не проще искать что-то типа "https://cdna.artstation.com/p/assets/images/images/" - начало, ".jpg" - конец.
Никаких страшных регулярок при этом не нужно
Все картинки по этим ссылкам и вытащите
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы