Группа американских и британских социологов заявила о возможности автоматически распознавать пол, возраст и личностные характеристики пользователей социальных сетей. Для этого они проанализировали 15,4 миллиона статусов на Facebook.
Социологи университетов Пенсильвании и Кембриджа в Великобритании изучали лексику, используемую в "статусах" на Facebook. Ученые собрали данные о 136 тысячах пользователей, которые в общей сложности обновили свой статус более 13 миллионов раз.
Для получения достоверной информации исследователи выбрали написавших за время эксперимента более одной тысячи слов. В итоге исследование включало 74941 человека, создавших 15,4 миллиона статусов из 309 миллионов слов. Анализ показал, что экстраверты чаще используют слова "вечеринка" и "девушки", в то время как интроверты предпочитают компьютеры и Интернет. Также социологи увидели характерные для определенного возраста выражения. Так "домашнее задание" и названия предметов свойственны подросткам, а "дочь" или "муж" характерны для тех, кому больше 30 лет.
Между тем ученые полагают, что данная работа позволит отделить стереотипы о той или иной категории пользователей от ее реальных характеристик. Они считают удачным решение не подсчитывать частотность того или иного слова из закрытого списка, а взять слова и сочетания символов, изначально присутствующие в выборке, передает PLoS One.
Отметим, что появление социальных сетей вывело социологию на новый уровень. Если ранее опрос даже тысячи человек требовал сложной полевой работы, то интернет-исследования позволяют оперативно собирать намного больше данных и анализировать их с использованием автоматических методов.