+7 (812) 677-17-05

Как роботы собирают данные о пользователях

Спорных прецедентов с работой ботов по всему миру было зафиксировано уже немало. Так, в 2018 году компания Cambridge Analytica использовала приложение с ИИ-ботом This Is Your Digital Life для сбора информации из соцсетей. Эти данные помогли не только создать персонализированные рекламные кампании, но и манипулировать политическими предпочтениями избирателей в ходе президентской кампании в США.

В 2021 году в свободном доступе оказались данные 533 млн пользователей Facebook (принадлежит Meta, признанной в России экстремистской организацией и запрещенной), собранные ботами. В том числе утекли и данные почти 10 млн россиян: номера телефонов, имена, даты рождения и даже адреса электронной почты. В этом году с помощью бота Shodan хакерам удалось украсть секретные документы с телефона капитана BBC США об американских беспилотниках. Для кибершпионажа используются и боты, которые «профилируют» пользователей (создают их портрет) в рамках рекламной идентификации, добавил директор департамента расследований T.Hunter Игорь Бедеров.

Ботами разработчики называют программы, нужные для автоматизации каких-либо действий. Программисты предлагают разные классификации ботов. Например, ведущий эксперт по сетевым угрозам компании «Код безопасности» Константин Горбунов выделяет чат-боты, спам-боты и DDoS-боты, используемые для атак на сайты. Существуют также боты—cканеры уязвимостей, ищущие пробелы в системах сервисов.

Есть боты-парсеры для сбора информации. Среди них — копирующие на веб-страницах имена, номера телефонов и адреса людей веб-скрепинг-боты, например Scrapy и Beautiful Soup. Также есть боты—парсеры социальных медиа, заточенные на сбор данных из соцсетей, к примеру Twitterbot. Данные о конфигурации IoT-устройств может собирать бот ZoomEye. Распространены и боты, копирующие сайты целиком.

Технически большинство ботов работают по одному принципу — автоматически отправляют HTTP-запросы, как те, что делает человек через браузер. Сайты в ответ на запросы возвращают информацию, например ответы с карточками товаров онлайн-магазина. Далее бот достает из полученных HTTP-ответов нужные данные, структурирует их и складывает в базу. Многие боты незаметно интегрируются в трафик. Они используют зашифрованные каналы передачи данных и отправляют информацию на зарубежные серверы.

Получившиеся дата-сеты могут быть проданы, использованы для донастройки поисковых систем, конкурентного или иного анализа, обучения ИИ, говорят эксперты. Боты, собирающие информацию о пользователях, могут запускаться из любой точки планеты. Технически все выглядит так: программист, к примеру, физически находится на Кипре или в Нью-Йорке и пишет там программу для бота. Далее через интернет арендует мощности у одного или нескольких хостинг-провайдеров. Программа развертывается на мощностях дата-центров, которые также могут располагаться в любой точке мира.

Специалисты по кибербезопасности говорят, что для защиты от ботов как компаний, так и простых пользователей существует несколько стандартных методов. Ботов можно нейтрализовать специальными анти-бот-решениями, например Cloudflare (программа защиты от DdoS-атак), говорит Игорь Бедеров. Также можно просить у посетителей сайтов вводить CAPTCHA (тест для определения робота или человека) и ограничивать число запросов с одного IP-адреса.

Ранее специалисты по информационной безопасности рассказали, как ИБ-отрасль работает с дефицитом кадров в 2024-м году.

Читать статью в полной версии «Коммерсант»

02.12.2024 Мы в СМИ
Читайте все свежие новости первыми. Подписывайтесь на нас в Telegram
Спасибо

Спасибо, что заполнили форму! Мы свяжемся с вами в ближайшее время по указанным контактным данным!

Обратный звонок

Заполните форму и наш специалист свяжется с вами в ближайшее время.

    Принимаю соглашение об использовании персональных данных