@WebEditor

Как получить контент с Yandex без Яндекс.XML?

Добрый день.
Делали скрипт и наткнулись на проблему с яндексом:

Нам очень жаль, но запросы, поступившие с вашего IP-адреса, похожи на автоматические. По этой причине мы вынуждены временно заблокировать доступ к поиску.

Чтобы продолжить поиск, пожалуйста, введите символы с картинки в поле ввода и нажмите «Отправить».


В общем яндекс вместо контента вернул страницу с каптчей.

Используемый код:

echo file_get_contents("http://yandex.ru/yandsearch?text=мазда");


или
$url = "http://yandex.ru/yandsearch?text=мазда";
$ch = curl_init();
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
        curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 20);
        curl_setopt($ch, CURLOPT_ENCODING,'gzip,deflate');
        curl_setopt($ch, CURLOPT_URL, $url);
        curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows; U; Windows NT 6.1; ru; ru:1");
        $data = curl_exec($ch);
        curl_close($ch);
        echo $data;
  • Вопрос задан
  • 2626 просмотров
Пригласить эксперта
Ответы на вопрос 4
darkrain
@darkrain
Никак. Только если использовать кучу проксей
Ответ написан
Комментировать
Lomoson
@Lomoson
Даже если использовать кучу прокси яндекс понемногу начинает их банить.
Затусуйтесь на форумах сеошников и купите/попросите дополнительные идиницы webmaster для Яндекс.XML.
Ответ написан
Комментировать
opium
@opium
Просто люблю качественно работать
разбирайте капчу через антигейт
используйте много прокси и впнов
Ответ написан
Комментировать
bigton
@bigton
Web-программист
Распознавание одной капчи удаленным сервисом может занимать 30-60 сек. Когда Яндекс поймет, что вы точно робот, он будет выдавать капчу на каждый запрос.
Работайте через XML, лимиты можно приобрести тут xmlstock.com/.
Все таки, если вы зарабатываете на продвижении, можете понести небольшие издержки на снятие позиций.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы