Профилирование пользователей SNS проводится в рамках методологии «обучение с учителем». Для этого используется созданный коллективом размеченный корпус реплик пользователей соцсетей (база данных «Речевые и неречевые параметры пользователей социальной сети», рег. в Роспатенте № 2 018 621 839 от 20.11.2018), прошедших психологический опрос BFI. Разметка включает более 150 языковых параметров, относящихся к семантике, грамматике, стилистике и др. На втором этапе с помощью генетического алгоритма был осуществлен отбор значимых языковых параметров для каждой психологической черты (экстраверсии, доброжелательности, открытости, добросовестности, нейротизма), а также пола. В результате каждой психологической/социальной черте был поставлен в соответствие свой набор из 25−35 языковых параметров. Это позволило соотнести психологические и социальные параметры с речевым поведением. На третьем этапе была создана программа BFI CNN Detector (рег. в Роспатенте № 2 019 661 827 от 09.09.2019), использующая методы глубинного обучения на основе сверточных нейронных сетей и размеченный корпус. Точность профилирования достигает 65−70% при небольшом для подобных исследований материале. Результаты сопоставлялись с известными моделями, использующими word2vec, а также разного рода словари (в частности, MRC и LIWC); было обоснованно преимущество предложенной модели.