Заметки профайлера - Алексей Владимирович Филатов
Между тем – вот часть того, чем мы занимались на тренинге по анализу и профилированию пользователей по соцсетям. Несмотря на то, что это только 1/20 часть материала – уверен и это будет полезно.




Ваш смартфон и цифровой профайлинг
Наш смартфон знает о нас больше, чем кто-либо на этой планете. Это уже реальность также, как кстати, и то, что эту информацию оттуда можно довольно легко добыть.
Недавно Медуза опубликовала материал о том, как оператор городского WiFi в Москве следит за пользователями и таргетирует рекламу и продает полученные данные третьим сторонам. И это важно, потому что речь идет о миллионах москвичей.
Суть заключается в следующем: когда вы заходите в московское метро и другой транспорт с включенным на смартфоне блоком WiFi, оператор, – а это Максима Телеком, вполне легально узнает, что вы туда вошли и легко отслеживает ваш путь движения. Чтобы потом продавать вашу карту перемещения рекламодателям. Это происходит потому, что ваш смартфон по умолчанию старается «зацепиться» за бесплатную сеть WiFi. Ну, допустим, ладно, метро. Когда мы туда заходил, мы так или иначе принимаем правила их игры. Однажды попав в базу, профиль пользователя начинает обрастать информацией: в нем сохраняются все его перемещения, данные о поле, возрасте, уровне дохода, интересах (на основании анализа посещаемых через WiFi сайтов), технические характеристики смартфона.
Но все зашло гораздо дальше: Максима Телеком наводнила всю Москву своими базами WiFi – и теперь не только в транспорте и начинает дополнять профили пользователей их экономическими привычками. Например, если вы каждый день идя на работу проходите мимо одного и того же кафе, оно вполне может запустить в ваш Фейсбук рекламу именно на вас – тем более, что вы каждый день видите его вывеску.
Способы профилировать пользователей на основе приложений их смартфонов и паттернов их взаимодействия с ним – наиболее перспективное и активно развивающееся направление ибо смартфоны сейчас есть у каждого, да еще и с приложениями, которые постоянно отслеживают наши перемещения, покупки, встречи, контакты, и многое другое. Лично я не пользуюсь приложениями, которые получают фактический контроль над смартфоном, а таких много – мобильные приложения банков, особенно Сбер, который просто навязывает его своим клиентам, да и многие другие. Да и WiFi у меня тоже всегда выключен, хоть я и не параноик.
Машинная оценка людей для принятия кадровых решений
Тема, которую некоторые боятся, некоторые отрицают, другие скептически ухмыляются, еще кто-то с интересом ждет.
Но никто не не остается равнодушным. Сейчас многие известны и не очень компании пишут программы оценки людей по его лицу, мимической экспрессии, голосу, речи. И некоторые из них уже действительно стали эффективными и внедряются в реальную практику. В России над этой темой работает несколько команд. Одна из них – это Skillaz и VisionLab, InterVyo и другие. Я довольно близко знаком с их подходом в оценки и считаю этот подход весьма перспективным. Суть – в поиске корреляций между внешними признаками лица и невербального поведения человека с надежными психометриками с использованием больших данных, мощной математики и статистики.
В целом на этом рынке лет через 5 развернется нешуточная конкурентная борьба, в которой пока не понятно кто победит. В широком смысле этого слова.
Но эти технологии обязательно надо учитывать, поскольку, старшее поколение они только затронут, мы будем их создавать, а младшему поколению с этим жить. И лучше счастливо.
Цифровой профайлинг и американские IT-гиганты
Какие данные о нас собирают коммерческие компании и как они их используют?
Вчера в чате говорили по большие данные и то, как их используют коммерческие компании. Это заставило меня открыть залежавшийся с прошлого года 93х страничный доклад «Корпоративная слежка в повседневной жизни», опубликованный знаменитой Cracked Labs еще в 2017 г.
Полностью выкладывать этот доклад сюда не буду посмотрите в канале.
Дело в том, что некоторые компании классифицируют нас с вами – их потенциальных клиентов по более, чем 30.000 категорий и учитывается все, начиная от поисковых запросов и тех приложений, которыми мы пользуемся, состоянием здоровья, уровня доходов и геолокацией до сексуальной ориентации, хобби и психотипа. И это уже реальность.
Я всегда говорил – цените свои персональные данные и умейте ими правильно распоряжаться. Чаще всего люди не понимают, какие данные о них собираются и как они будут использоваться. Они подписываются под нечитанными пользовательскими соглашениями, которые составлены в интересах бизнеса и разрешают передачу данных третьей стороне.
И даже если мы будем читать все соглашения, это принципиально не изменит ситуацию. В прошлом году норвежские правозащитники прочитали правила пользования 33 самых популярных в стране приложений. Это заняло у них 30 часов. А недавно британский провайдер публичного Wi-Fi добавил в пользовательское соглашение право отправить юзера сети принудительно чистить общественные туалеты. За две недели эксперимента на такие условия не глядя подписались 22 тысячи человек.
Большие данные, наш цифровой след, который мы оставляем, а также способность их правильно проанализировать – это и есть нефть XXI века. Но мы пока не научились ее ценить и использовать.
Чтение по губам
Появились новости от LipNet – программы, умеющей читать по губам с правильностью более 93%.
В прошлом году эта нейросеть засветилась во всех новостных лентах, а потом новости о ней пропали. Впрочем, так часто бывает с перспективными разработками, поскольку они тут же покупаются IT-гигантами. Так, скорее всего, произошло и в этот раз.
О Lipnet я писал уже несколько раз и детали о ней можно узнать здесь: t.me/ProProfiling/306
Юрген Шмидхубер – руководитель команды создателей LipNet, и один из самых авторитетных европейцев в области машинного обучения и нейросетей, неделю тому назад на отвечая на вопрос: «Что сейчас происходит с LipNet?» сказал только одно слово «Cortana». А это – голосовой помощник от MicroSoft.
Вообще чтение по губам – очень полезный навык не только для профайлинга, но и вообще для жизни: иногда важно понимать то, что говорят при громко включенной музыке за соседним столиком.
Доказано, что если человек видит губы своего собеседника, то он понимает его гораздо лучше. Кстати, это особенно важно при изучении иностранных языков. Когда-то в начале 2000-х, когда был тренинговый бум, я даже посещал в Москве приличные курсы по чтению по губам ведущих российских сурдопедагогов. Но редкий профессионал по губам способен прочитать больше, чем 40% речи, если к этому добавить жестикуляцию и мимику, то процент чтения доходит до 60. Вообще это отдельная сурдопедагогическая тема, входящая в лечение нейросенсорной тугоухости, но сейчас она активно оцифровывается.
Искажение правды и фейковые новости
В конце декабря 2017-го я писал, что те фейки, которые в прошлом году нам казались сумасшедшими, в этом – покажутся цветочками. Похоже мы вступаем в эпоху, в которой действительно никому нельзя верить. И все трижды перепроверять. Новостной фон в последнее время это только подтверждает. Правды становится все меньше, а фэйк и фэйковых новостей – все больше.
После полуторагодового разбирательства Комитет конгресса США все-таки не нашел связи предвыборной кампании Трампа с Москвой. Но перед этим в том, что эта связь была с помощью СМИ убедили больше чем полмира. Даже некоторые мои друзья в Штатах уверены, что такая связь была. Напоминаю, что фейковые новости создаются с использованием так называемого эффекта «проминка». Принцип такой: «Каждый раз, когда к нам приезжает Иван Иванович, у нас пропадают золотые ложки. Да, ложки мы через год находим в своих же карманах, но осадчик от Иван Иванина, кем бы он ни был, остается».
Кстати, и это важно, Et Guardian недавно опубликовал большой материал о рекомендательном алгоритме YouTube, продвигающем