Статья с описанием метода, позволяющего извлекать персональные данные из лайков, опубликована в ночь на вторник в Proceedings of the National Academy of Sciences, сообщает «Газета.Ru». Ее авторы — математики из Кембриджского центра психометрии и Кембриджского исследовательского подразделения Microsoft.
Оказывается, точный портрет пользователя соцсетей можно сделать, анализируя лайки, которые он ставит, сообщают математики из Кембриджа. Такое «теневое портретирование» может быть использовано как в научных, так и в корыстных целях, а также для программирования общественного мнения и планирования информационных провокаций.
С помощью специально написанного предсказательного алгоритма математики проанализировали историю лайков более 58 тысяч пользователей Facebook, согласившихся участвовать в эксперименте и предоставивших авторам для проверки правильности предсказательной модели данные своих персональных профилей.
Результатом этого исследования стала статистическая модель, умеющая извлекать личные характеристики из истории лайков с очень высокой точностью. Так, модель научилась правильно угадывать сексуальную ориентацию пользователей Facebook в 88% случаев, правильно отличать чернокожих и белых американцев — в 95%, а республиканцев от демократов — в 85%.
Мусульмане и христиане были правильно классифицированы в 82% случаев, а семейный статус человека и случаи злоупотребления наркотиками и алкоголем — в 65% и 73% случаев соответственно.
Хотя менее 5% юзеров-геев лайкали материалы, посвященные гейским свадьбам и прочим событиям, однозначно связанным с гей-активностью, сексуальная ориентация подавляющего большинства геев была угадана правильно. Сделано это было за счет того, что модель научилась правильно определять семантический контекст лайка, обрабатывая большие объемы менее информативных, но более популярных лайков, адресованных ТВ-шоу, музыкальным исполнителям и прочим событиям, которые появлялись в лентах пользователей.
Высокая предсказательная точность статистической модели удивила самих авторов статьи. Но обнаружились и некоторые странности. Так, судя по числу проставленных лайков, пользователи с высоким IQ испытывают непонятную тягу к картошке фри, зажаренной фигурными спиралями, а фотографии пауков привлекают повышенное внимание некурящих граждан.
Как бы то ни было, информация, извлеченная из одних только лайков, поможет создать удивительно точные персональные досье на миллионы интернет-пользователей — уверены математики из Кембриджа.
Заметили ошибку? Выделите ее мышью и нажмите Ctrl+Enter