Исследование веб-сайтов в рамках OSINT
DISCLAIMER: Данная статья написана в ознакомительных целях и не является руководством к неправомерным действиям или обучающим материалом для сокрытия правонарушений.
Исследование веб-сайтов в рамках OSINT может предназначаться для решения целого ряда задач:
– идентификации владельцев или администраторов
– мониторинга изменения цен
– анализ конкурента
– SEO или используемые ключевики и др.
Анализ любого веб-сайта начинается с получения регистрационных данных WHOIS.
WHOIS-сервисов очень много. Поэтому приведу лишь несколько популярных:
https://whois.domaintools.com/
https://whoer.net/ru/checkwhois
Как вы можете видеть, WHOIS содержит данные о сроках регистрации домена, его IP-адреса, владельце, регистраторе и их контактах.
Разумеется если, интернет-магазин обещает вам сказочно низкие цены и вообще «МЫ УЖЕ 10 ЛЕТ НА РЫНКЕ!», но его домен зарегистрирован 2-3 дня назад, то следует задуматься о том, а не лохотрон ли тут часом…
Однако, о грустном… После введения норм GDPR про открытую публикацию персональных данных владельцев доменных имен пришлось забыть. А для поиска по старым записям WHOIS, в которых персональные данные были сохранены, могу порекомендовать еще пару полезных ресурсов:
https://osint.sh/whoishistory/
https://drs.whoisxmlapi.com/whois-history
Продолжаем о грустном. Как известно, есть такая компания – Cloudflare, которая позволяет дополнительно при использовании ее услуг – скрывать данные о владельцах вебсайтов.
Так вот, ее анонимность иногда можно приоткрывать. Для этого я использую такой опенсорсный продукт, как CrimeFlare: https://github.com/zidansec/CloudPeler.
Он существует и в веб-интерфейсе по ссылке: https://crimeflare.herokuapp.com. CrimeFlare позволяет делать немногое, но важное – получать реальный IP-адрес сайта, скрытого за Cloudflare.
Еще пара ресурсов, на которых могут попадаться утёкшие пароли от различных онлайн-сервисов. В числе последних может оказаться и исследуемый вами сайт:
Как мы все знаем, сайт — это не только доменное имя. Сайт должен быть где-то физически расположен. Место его расположения — это хостинг.
Данные хостинга того или иного сайта также можно узнать в открытых источниках:
https://www.whoishostingthis.com/
https://hostadvice.com/tools/whois/
Перейдем к контенту, размещаемому на сайте, и обратимся к анализу различных метрик (рекламных идентификаторов).
Следующая подборка сервисов позволит вам понять, какие технологии рекламной слежки (и не только) присутствуют на сайте:
https://themarkup.org/blacklight
https://pagexray.fouanalytics.com/
Впрочем, вы можете открыть исходный код веб-страницы, а дальше поискать рекламные идентификаторы в ручном режиме по следующим ключевым словам:
AdSense: Pub- или ca-pub
Analytics: UA-
Amazon: &tag=
AddThis: #pubid / pubid
Metrika: mc.yandex / ym
Rambler: top100
Mail.ru: Top.Mail.Ru
Если мы нашли код одной из метрик, то мы можем открыть ее публичную статистику. Для этого введите ID метрики в одну из следующих гиперссылок:
https://metrika.yandex.ru/dashboard?id=ВВЕДИТЕ_ID
https://top100.rambler.ru/search?query=ВВЕДИТЕ_ID
https://top.mail.ru/visits?id=ВВЕДИТЕ_ID
Публичная метрика интересна тем, что первым посетителем сайта она засветит того администратора, который ставил ее на веб-ресурс. Это может быть владелец сайта. Тогда мы получим сведения о его поле, возрасте и городе проживания. Вы можете проверить это на следующей метрике Яндекса https://metrika.yandex.ru/dashboard?id=55694881.
Кроме этого, коды метрик или рекламных идентификаторов позволяет находить в сети дополнительные сайты, использующие ее в своем коде. Для этого можно воспользоваться следующими сервисами:
https://intelx.io/tools?tab=adsense
https://dnslytics.com/reverse-analytics
Реверсивный поиск дополнительных (аффилированных с проверяемым) веб-ресурсов возможен не только по рекламным идентификаторам.
Вы можете использовать реверсивный поиск по IP-адресу размещения вебсайта, при помощи ресурсов:
https://2ip.ru/domain-list-by-ip
https://www.cy-pr.com/tools/oneip
https://hackertarget.com/reverse-ip-lookup
https://mxtoolbox.com/reverselookup.aspx
Вы также можете осуществлять реверсивный поиск по совпадению связанных адресов электронной почты:
https://2ip.ru/domain-list-by-email
А еще реверсивному поиску можно подвергать SSL-сертификат сайта:
https://www.ssllabs.com/ssltest
Переходим к сбору контактов. Часть контактной информации владельца веб-ресурса выкладывают на сайте или при регистрации доменного имени. Попробуем найти максимальное число контактов (адресов электронной почты) при помощи таких сервисов, как:
https://2ip.ru/domain-list-by-email