Каким образом можно парсить email'ы/имена людей по всему интернету?

Недавно заинтересовался поиском и анализом данных при помощи поисковиков + наткнулся на пару интересных сервисов, которые завязаны, как раз на этом. Стало интересно, каким образом они работают, но сам ничего путного так и не нашёл. Надеюсь сила Тостера придёт на помощь.

Первый: https://emailhunter.co/
Суть сервиса примерно следующая: вы вводите адрес сайта, а вам в ответ выдаются все email'ы, которые находятся на этом адресе. Судя по форме выдачи, в частности по вкладке "sources", сайт, каким-то образом парсит слово, которое заканчивается на "@domain.com". Сначала думал, что используется какой-то гугловский API, но, как оказалось у гугла есть ограничение на 10k запросов в день. Учитывая, что даже средняя подписка EmailHunter'а предлагает 20k запросов, можно предположить, что это не гугловский API. И вот теперь даже не представляю, каким образом, они ищут эти email'ы.

Другим сервисом является https://charlieapp.com/.
Пример работы сервиса: https://charlieapp.com/briefings/deCPb-5SlRLXZDibB...
Он совсем про другое: парсит Google Календарь и даёт вам информацию о человеке с которым у вас встреча. Например, список его профилей в соц. сетях, блог, где работает и т.п. Интересно в нём то, что он может найти новости о человеке и статьи про компанию. Тут тоже не очень понятно, каким образом он ищет новости и статьи.
  • Вопрос задан
  • 7070 просмотров
Пригласить эксперта
Ответы на вопрос 2
IonDen
@IonDen
JavaScript developer. IonDen.com
Спамеры пусть сами ищут свои примочки.
Ответ написан
zvermafia
@zvermafia
WebDev
Может они собирают базу e-mail которые были взломаны/украдены или у них есть собственный бот который бродит по интернету и собирает мыли...
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы