УПРОЩЕНИЕ ПРОЦЕССА СОСТАВЛЕНИЯ АНКЕТ (ОТ УЧЕНЫХ МГУ)
Ученые факультета вычислительной математики и кибернетики МГУ предложили инновационную систему, которая эффективно подбирает контрольные вопросы для анкет с помощью обработки естественного языка. Созданная система дает возможность минимизировать количество ложной информации в исследованиях.
Для получения максимально корректных и правдивых ответов, правильных выводов и прогнозов в анкету добавляются контрольные вопросы, речь в которых идет об одном и том же, но с использованием различных формулировок. Если ответы на такие вопросы не совпадают, это может указывать на то, что респондент в целом был не очень искренним. Однако создание таких контрольных вопросов может быть сложным и требовать значительных усилий и временных затрат.
Для решения этой проблемы ученые разработали инновационную систему, предназначенную для облегчения процесса составления анкет и эффективного подбора контрольных вопросов с помощью методов обработки естественного языка для поиска похожих вопросов в анкетах и определения наиболее подходящих контрольных вопросов.
№ п/п | Методы, применяемые в системе | Основы метода | Преимущества метода |
1. |
TF-IDF (Term Frequency-Inverse Document Frequency) |
Основывается на анализе частоты встречаемости слов и обратной частоты документов, что позволяет определить наиболее значимые слова в тексте, использованные для описания его содержания | Облегчает поиск информации в больших коллекциях документов |
2. | Латентно-семантический анализ (LSA) | Использует математическую модель и статистические методы для определения семантических связей между словами в документе. Это позволяет выявить наиболее важные слова, связанные с тематическим направлением, и определить степень их схожести с другими вопросами | Помогает более точно подбирать контрольные вопросы и избегать повторений или путаницы |
3. | Тематическое моделирование | Основывается на алгоритмах машинного обучения. С помощью этих алгоритмов система автоматически выявляет наиболее вероятные комбинации тем и слов, обсуждаемых в документах | Система определяет распределение вероятностей для каждой темы в каждом документе, что облегчает поиск вопросов, содержащих схожие темы |
Использование данной системы значительно упрощает процесс составления анкет, а время и усилия, затрачиваемые экспертами на этот процесс, сокращаются. Эффективность системы уже была подтверждена при составлении анкет с вопросами из областей психологии и социологии. Результаты исследования были представлены на Всероссийской конференции «Ломоносовские чтения-2023».
Источник: МГУ имени М. В. Ломоносова.