На первых курсах мой сексапильный одногруппник Диса занимался пикапом новеньких девочек на потоке, находя их аккаунты Вконтакте и определяя все их интересы. Популярная практика уже в те времена, судя по моим опросам.
Весело и задорно: ВК было несколько лет отроду, о приватности в интернете мало кто думал вообще, а легко добытая личная информация позволяла натворить с человеком всякого. Или, к счастью, не натворить. Сегодня деанонимизирующих данных в интернет сливается еще больше, зачастую удивляя даже ученых мужей нашего времени. В сети можно найти даже людей, которые не пользуются ей — ваших родителей, например. Сегодня говорим о деанонимизации и вашем любимом «вычислении по айпи».
Социальные сети не просто знают о вас всё, они могут знать даже то, что вы не до конца понимаете. Как в истории с беременной школьницей. Попробуйте поковырять таргетинг рекламы на Facebook — вы удивитесь по каким неочевидным параметрам можно впаривать рекламу. Из моего опыта: показ баннера «двум близким людям, временно разлученных расстоянием» и поиск «людей которые много донатят в мобильных играх под iOS».
В социальных сетях можно закрыться или удалиться, но из государственных баз данных уже вряд ли. С одной стороны это удобно: уверенный пользователь ПК — Людмила Михайловна из ЖЭУ, теперь не просит вас приносить заплёванные квиточки из почтового ящика — у неё есть система «Город». Вы можете проверить свои налоги, штрафы и долги, зайдя на сайт соответствующей службы, а современные банки даже научились всё это делать за вас (по крайней мере в Москве).
С другой стороны «базы телефонов» на DVD — хит продаж на Горбушке начала нулевых. Фигня из прошлого, да, но представьте моё удивление, когда по одному из реальных мобильных номеров я смог особых трудностей пробить все данные своего автомобиля. По найденному VIN-номеру я смог узнать телефоны, имена и регионы обитания предыдущих владельцев. По именам — аккаунты в ВК, их предыдущие автомобили и… короче начинаем.
В этом посте поговорим про поиск «простых» людей. Разберем инструменты добычи максимума информации о человеке в открытых источниках сети, не хуже олдскульного «пробить по телефону». Для знаменитостей, политиков и популярных аккаунтов методы могут отличаться, но во многом пересекаться.
С примерами на этот раз сложнее. Несмотря на десяток успешных деанонов, я не могу сослаться ни на один из них, не нарушив приватность участников. Придется брать примеры из других источников или экспериментировать на себе.
Основные зацепки для поиска
Личные данные
Никнейм, имя-фамилия, дата рождения, телефон, адрес, образование, служба, ИНН (SSN), и.т.д. Чаще известно лишь что-то одно, но зачастую этого достаточно чтобы начать.
Идем в Google. Отправная точка большинства расследований. По нику Google выдаст аккаунты человека в играх или на форумах, которые часто раскрывают нам другие данные. Steam вот знает под какими еще никами человек играет, форумы отображают дату рождения. Учебные учреждения часто публикуют списки учащихся. Одно «но» — не бросайтесь сразу доверять найденному. Как часто вы вводите вместо даты рождения на форумах что-то типа 01-02-1983? Вот и я тоже.
Не забывайте про поисковые операторы. Поиск по «filetype:doc» (или xls, pdf) может помочь, если человек участвовал в каких-нибудь олимпиадах или соревнованиях. Учебные заведения часто публикуют их результаты на сайтах, не особо думая о приватности. Американских или евро-студентов можно найти по фильтру «site:.edu», который будет искать по сайтам в зоне университетов.
Социальный поиск и глубокая паутина. Крупные поисковики хоть и договорились с соцсетями индексировать их данные, но часто это лишь имя-фамилия и пара строк биографии. Социальные сети до сих пор остаются практически DeepWeb’ом для исследователей, на сайте расследований FirstDraftNews написана целая статья для иностранцев как зарегаться в ВК чтобы проще вести расследования.
Поиск Facebook, VK, Twitter — главные отправные точки. Их возможности огромны: поиск по нечеткому имени, возрасту, учебе и службе.
Объяснения тут излишни, формы поиска говорят сами за себя. Фильтровать по городу, возрасту и другим данным труда не составит. Но есть и некоторые неочевидные вещи. Из того, чем часто пользуюсь я: Facebook позволяет искать по номеру телефона, даже если пользователь у вас не в друзьях — новая «база телефонов» с Горбушки. твитер поможет найти не только пользователя, но и всех, кто отвечал ему в реплаях или упоминал в определенные даты. Если знаете еще подобные неочевидные фичи — пишите в комменты под этим абзацем.
Мета-поисковики и агрегаторы. В России самый популярный — people.yandex.ru, за рубежом есть PeekYou и аналоги, которые легко нагуглить по запросу «people search». Базы и возможности у них скудные, чаще всего джентльменский набор это имя и город. Но их плюсом является то, что они часто находят связанные аккаунты в других социальных сетях, о которых вы могли даже не догадываться.
Документы и открытые данные
Помимо личного следа в социальных сетях, некоторые данные появляются в сети и без нашего ведома. Базы данных всяких министерств, коммунальщиков, госуслуг, росреестр, реестры юридических лиц, судебных приставов — всё это открывает дополнительные возможности для поиска. Например вы знаете, что ваша цель водит автомобиль, занимается предпринимательством или покупала квартиру — скорее всего какая-то информация об этих операциях легко доступна в сети.
Эти данные недоступны для поисковых систем, так как требуют ввода поискового запроса. Но эти базы часто использует тот же ФБК Навального, многие свои расследования они ведут через реестр госзакупок, росреестр (последнее про Медведева тоже) и платный сервис СПАРК, недавно прославившийся в истории с Лигой Школ.
Единого мирового хранилища таких данных, очевидно, нет. Если нужно найти человека за пределами РФ — ищите соответствующую базу. Частенько доступность личных данных в других странах может удивлять. На опыте собственных поисков могу сказать, что в Швециии некоторых штатах США есть так называемые White Pages, где можно без особых усилий пробить такие махровые инсайды, что весь этот пост покажется ненужным. Вплоть до клички кота.
В США или Европе открытых данных очень много, в Азии и на Ближнем Востоке — поменьше. Вот еще несколько агрегаторов для примера.
Skipease — пока живая страничка с подборкой социальных поисковых систем по США. Там же на странице собран целый список альтернатив, они могут помочь в других странах.
Investigative Dashboard Search — поиск по документам и компаниям, аналог Спарка для интернациональных поисков. Хорошо работает и в России, особенно если человек входит в топы или занимается госзакупками. Вот так можно узнать, что Навальный в 2012 года входил в совет директоров Аэрофлота (но уже нет). Я вот не знал.
AVInfo — открытая база по автомобилям в России и их владельцам. Можно искать по госномеру, телефону владельца, VIN’у и получить много информации о предыдущих владельцах, проведенных ТО, страховках и техосмотрах. В базе больше 13 млн российских автомобилей, в основном правда московские и питерские.
На полную катушку используется автоподборщиками, так как кроме всего прочего агрегирует и сохраняет объявления с автору и дрома. Для них есть платный аккаунт с расширенными возможностями, но для большинства наших целей подойдет и бесплатный. Если кто-то еще не понял каких целей, то это даёт возможность по фотографии очередного «пацанчика рядом со своей четыркой» за один запрос узнать его мобильный телефон. А если на радостях он еще и выложил в Instagram фотографию техпаспорта или водительских прав у себя на лбу, как принято при получении, то здесь деанон может быть аж до домашнего адреса. Это наверное тема для отдельного поста.
Ну или более бытовой вопрос: узнать номер телефона предыдущего владельца машины, чтобы вежливо (!) спросить давно ли подвеску меняли. Если вы использовали какие-то еще подобные сервисы, делитесь опытом в комментариях ниже.
Фотографии
Вид из окна может выдать координаты, а реверсивный поиск по изображению может привести на аватарку или альбом с фотографиями пользователя. На лепре или двачах так всегда находят всяких шкур в ВК, это проще простого.
Особняком здесь стоит поиск людей по фотографии. Первым подобным сервисом был Face.com, он находил даже неточные совпадения черт лица, но его быстренько купил и закрыл Facebook. Не буду опять шутить про Лукавого Марка, нашутились уже в предыдущем посте. Для ВК в прошлом году появился FindFace от N-Tech.Lab, делающий примерно то же самое, но под оберткой маркетингового инструмента. На его основе особенно бомбанул проект Егора Цветкова из петербургской «Бумаги», когда он он фотографировал незнакомых людей в метро и потом находил их профили в ВК, узнавая про их жизни многое по одной грустной фотографии.
Местоположение
IP адрес. «Вычислю по айпи» хоть и стало мемом, но от этого метод не стал менее рабочим. Через базу GeoIP2 City хорошо определяется страна и город, где находится данный IP-адрес. Точность до города почти гарантирована, в своих проектах использую их базу уже года три. Сбои бывают только в редких случаях, когда какой-нибудь мобильные оператор решает перекинуть пул IP-адресов из одного региона в другой. Но это бывает раз пару лет и спокойно решается ежемесячным обновлением базы.
GeoIP выдаёт еще координаты, но предупреждает не использовать их как местоположение пользователя. Чаще всего это просто точка где-то в центре города или района провайдера. Но мы можем попытаться найти карту наносетей этого провайдера, по ней область поиска становится еще больше.
Но IP очень легко подделать, он никогда не является 100% доказательством. Прокси-серверы и тоннели типа VPN позволяют сделать это любому в один клик. Если человек хочет скрыть IP — это не составит труда. GeoIP выдаёт другую часть света — скорее всего он так и сделал, но всё же иногда это может быть зацепкой.
Другие фотографии пользователя. Получил права — налепи их на лоб и выложи, пусть все узнают серию и номер. Это уже было выше. Из менее очевидного — фотографии чеков из супермаркета, талонов электронной очереди или вида из окна. Определить адрес вплоть до этажа становится делом техники и желания, если это важно.
Здесь нет единого совета. Любая информация с фотографии может стать зацепкой, смотрите внимательно на окружение.
Гео-поиск. Во всех популярных социальных сетях есть геометки. Фейсбук предлагает оставить «чекин» в самых разных местах, твитер прописывает ваши координаты к каждому твиту, ВК добавляет геотег к фотографиям из мобильных приложений. Иногда пользователь этого не замечает, а чтобы их подделать — нужно уметь в программирование. Для твитера есть GeoSocialFootprint, который анализирует последние геометки пользователя. Можно попробовать найти подобные сервисы для других соцсетей или перебрать эти данные вручную.
Есть и обратная возможность: искать твиты рядом с определенными координатами. Так запрос самолет geocode:48.035569,38.755646,40km since:2014-07-17 until:2014-07-18 выдает первые фотографии с места крушения Боинга под Донецком.
Круг общения и коммуникации
В каждом поиске настаёт момент, когда он заходит в тупик. Мало данных, закрытые аккаунты и другие проблемы. Приходится погружаться в рутинный просмотр всей доступной информации в надежде интуитивно обнаружить хоть какую-то зацепку. При поиске мест приходится просматривать километры спутниковых снимков, а при поиске людей — всё публичное социальное взаимодействие. Входящее и исходящее.Неосторожный комментарий про «любимый универ» или «открывшийся около дома кинотеатр» может стать главной зацепкой.
Если человек спрятал свой аккаунт под замок, социальные сети стараются скрыть как можно больше данных. Но чаще всего не могут сделать это полностью. Тот же Twitter скрывает от чужих глаз ленту и подписчиков, но позволяет легко найти все публичные упоминания и реплаи пользователю.
Вконтакте тоже, причем ищет даже в ссылках и метаданных. Но если аккаунт человека известен, то по его ID можно найти куда больше информации о круге общения. Попробуйте вбить свой ID в URL, узнаете много интересного.
Facebook хоть и выпилил Graph Search, всё равно позволяет себе некоторые вольности. Есть сайт graph.tips, который знает куда фейсбук спрятал доступные поисковые запросы. Для меня с удовольствием расскажет всем места, которые я посещал или фотографии, которые комментировал.
Благодаря этому появляются агрегаторы типа SocialMention, которые могут делать это одновременно по нескольким социальным сетям. Но их возможности ограничены, а закрываются они так быстро, что уже через пол года эта ссылка может быть нерабочей.
Если персонаж молчит или даже закрыл аккаунт от посторонних — его друзья могут быть гораздо более общительны, выдавая его просто самим фактом своего присутствия. Так мы однажды нашли владельца закрытого аккаунта, когда пробежались по списку людей, с которыми он взаимодействовал в твитере. Найдя каждого их них в ВК оставалось только соотнести их списки друзей. Можно найти уже готовые решения анализа таких социальных пересечений. Лично мне известны для твитера и для ВК.
В качестве примера анализа социальных связей есть расследование от Bellingcat, где с помощью оставленного социального отпечатка раскрыли личность одного из представителей «золотой молодежи», оказавшегося сыном крупного чиновника. Парень неосторожно комментировал чужие фотографии в Instagram, чем выдал свою фамилию, университет и факультет, что позволило найти его в списках учащихся и понять все зависимости. После этого он закрыл аккаунт и больше не постил видео с пренебрежениями к правилам дорожного движения.
Интересы и группы
Помимо круга общения, яркими маркерами могут стать интересы. В личных аккаунтах мало кто думает об их фальсификации: если человек увлекается программированием или фотографией, то скорее всего в разных социальных сетях он будет подписан на группы по этим интересам. Если групп нет — подойдут лайки. Для ВК есть целая куча приложений, рекомендаций от меня тут не будет, их можно найти «смотреть лайки в вк». Есть сайты-шпионы, которые следят за активностью конкретных пользователей (сайт не проверен, может быть вредоносным).
Для других соцсетей дела обстоят сложнее. Facebook не показывает какие посты лайкнул пользователь, только группы. Поиск в Instagram тоже ничего не умеет, но есть сторонние сервисы типа One Million Likes, изначально созданные для продвижения и накрутки лайков, но полезные для нас. Для поиска комментариев Instagram хорошо индексируется гуглом, что позволяет найти всю публичную активность пользователя по фильтру «site:instagram.com».
В твитере есть Lists, куда ботописатели часто добавляют аккаунты по ключевым словам. Что еще удобнее, ведь выйти из листа нельзя. Написал твит про SEO — добро пожаловать в список сеошников навечно.
Дальнейшее использование списка групп и интересов ограничивается только вашим воображением. Если есть идеи — пишите ниже.
Заключение и ссылки
В этом посте я постарался совместить весь личный опыт с десятками прочитанных расследований и статей. Надеюсь вы узнали из поста хоть что-то новое про обыденные инструменты и методы их использования. Здесь нет никаких секретных архивов ФСБ или хитрых инструментов поиска. Хотя последние возможно будут появляться. Может даже я попробую что-нибудь такое запрограммировать.
Пока же для нас всех главным инструментом остаётся конечно же сайт передачи Жди Меня.
Ну и пара ссылок по теме:
- Расследование Bellingcat про «Rich Russian Kids», которое использовалось в качестве примера как человек может сам себя спалить.
- Красивое разоблачение авторов аккаунтов Fake_MIDRF в твитере (оригинал был утерян вместе с сайтом, это репост). Моя любимая часть — как вычисляли номер телефона. Оказывается разные сервисы скрывают звездочками разные цифры.
- Пост на схожую тематику на хабре. Нашел когда готовил материалы для статьи.