@TechNOIR

Powershell+Selenium. Как обойти каптчу?

Добрый день.
Написал скрипт парсинга информации, но на сайте скрипт натыкается вскоре на каптчу и валится.
Как распоздать картинку я уже нашел. Через стороннее API.
НО! Ссылка на картинку каптчи выглядит так:
http://www.site.ru/captcha.ashx?guid=d7s8f7sdf9sd798f

Как получить картинку данную? Есть идея конечно сделать скриншот, тогда в данном случае как сделать скриншот конкретного объекта (каптчи)? Напримет может выделить как-то обрать с помощью Selenium и снять скриншот с области.
Есть идеи,товарищи знатоки? Спасибо заранее
  • Вопрос задан
  • 328 просмотров
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
from selenium import webdriver
from PIL import Image

fox = webdriver.Firefox()
fox.get('http://toster.ru/')

# now that we have the preliminary stuff out of the way time to get that image :D
element = fox.find_element_by_id('hlogo') # find part of the page you want image of
location = element.location
size = element.size
fox.save_screenshot('screenshot.png') # saves screenshot of entire page
fox.quit()

im = Image.open('screenshot.png') # uses PIL library to open image in memory

left = location['x']
top = location['y']
right = location['x'] + size['width']
bottom = location['y'] + size['height']


im = im.crop((left, top, right, bottom)) # defines crop points
im.save('screenshot.png') # saves new cropped image


иногда нужно бывает промотать до конца страницы, тогда чуть сложнее
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы