В новаторском исследовании, недавно опубликованном в журнале Humanities and Social Sciences Communications, представлена новая модель выявления депрессии, использующая аудиовизуальные сигналы из видеоблогов на YouTube. Эта инновационная модель открывает многообещающие перспективы для раннегоdentсимптомов депрессии у пользователей социальных сетей, что потенциально способствует своевременному вмешательству и поддержке. Депрессия, серьезная глобальная проблема, связанная с суицидальными мыслями, затрагивает более 264 миллионов человек во всем мире, по данным Всемирной организации здравоохранения (ВОЗ). Несмотря на распространенность этой проблемы психического здоровья, раннее выявление остается серьезной проблемой, что обусловливает необходимость в более эффективных и доступных методах скрининга.
В эпоху обилия видеоконтента в социальных сетях исследовательская группа обнаружила неиспользованный потенциал использования аудиовизуальных данных для выявления и коррекции депрессивного поведения. Исследование, проведенное группой преданных своему делу исследователей, использовало API данных YouTube для доступа и анализа обширного массива данных видеоблогов (влогов), опубликованных в период с января 2010 года по январь 2021 года. Используя специальные ключевые слова, подобранные при участии специалистов в области психического здоровья, исследователи отфильтровали контент, чтобы отделить видеоблоги, посвященные депрессии, от обычных ежедневных видеоблогов.
Команда тщательноtracаудиохарактеристики, используя OpenSmile, в сочетании с визуальными сигналами, полученными с помощью библиотеки FER Python, уделяя особое внимание сегментам, где в кадре присутствует один человек. Этот комплексный подход позволил исследователям построить надёжную модель обнаружения депрессии с использованием высокоэффективного алгоритма XGBoost, который продемонстрировал превосходную производительность по сравнению с другими классификаторами машинного обучения, такими как случайный лес и логистическая регрессия, в начальных экспериментах.
Ключевые выводы, сделанные в результате тщательного анализа
Комплексный анализ собранных данных выявил несколько важных показателей, связанных с депрессивными видеоблогами. В частности, исследование показало, что у людей с депрессивными симптомами обычно наблюдается более низкая громкость и основная частота (F0) речи, что подтверждается статистическим анализом. Более того, наблюдалось снижение отношения гармоник к шуму (HNR) в вокальном сигнале у людей с депрессией, что свидетельствует о более высоком уровне шума в вокальном сигнале.
Кроме того, исследование выявило повышенный уровень джиттера, обычно связанный с тревожностью и повышенным риском тяжёлой депрессии, в видеоблогах, описывающих депрессивное поведение. Анализ также подчеркнул значимость частоты второй форманты (F2), которая, как известно, ниже в видеоблогах, посвящённых депрессии, что подтверждает её потенциал как дифференцирующего маркера депрессивных состояний. Кроме того, исследование выявило более высокий индекс Хаммарберга в видеоблогах, посвящённых депрессии, что указывает на заметное различие интенсивности в разных частотных диапазонах.
Что касается визуального аспекта, анализ показал, что у людей с депрессивными симптомами наблюдался более низкий уровень счастья и более высокие уровни грусти и тревоги в выражении лица, что соответствует типичному эмоциональному профилю депрессии. Однако значимых различий в выражении нейтральности, удивления или отвращения обнаружено не было.
Передовая методология и многообещающие результаты
Исследователи тщательно использовали стратифицированное разделение данных на обучающую и тестовую выборки и нормализованные признаки, гарантируя исключение любых перекрытий каналов YouTube в наборах. Они точно настроили гиперпараметры модели, используя поиск по сетке с перекрёстной проверкой, в конечном итоге оптимизировав модель для точной бинарной классификации. Сравнительный анализ производительности подтвердил превосходство предложенной модели над логистической регрессией и классификаторами случайного леса, продемонстрировав более высокую точность, достоверность, полноту и показатели F1.
Изучение влияния модальностей в ходе исследования показало, что, хотя звуковые признаки превосходят визуальные признаки при выявлении депрессии, интеграция как звуковых, так и визуальных сигналов значительно повышает эффективность модели, что указывает на эффективность комбинированного подхода в разработке надежной системы выявления депрессии.
Кроме того, гендерный анализ показал, что модели, адаптированные для женщин-блогеров, демонстрируют более высокую точность по сравнению с моделями, адаптированными для мужчин-блогеров, что подчёркивает потенциальное влияние пола на проявление симптомов депрессии в речи и мимике. Это открытие подчёркивает важность разработки гендерно-специфичных моделей для повышения точности диагностики депрессии.
Ключевые предикторы, выявленныеdentдля выявления депрессии
Проницательные результаты исследованияdent, что вариации громкости и выражение счастья являются значимыми предикторами дляdentдепрессивных видеоблогов. Эти результаты подчеркнули решающую роль колебаний интенсивности голоса и выражения счастья на лице для точного выявления симптомов депрессии в видеоблогах.
Разработанная исследователями инновационная модель, способная произвести революцию в области диагностики и лечения депрессии, представляет собой важнейший инструмент дляdentранних признаков депрессии среди пользователей социальных сетей. Использование аудиовизуальных материалов из видеоблогов YouTube не только повышает точность диагностики, но и обещает способствовать своевременной поддержке и вмешательству, что в конечном итоге способствует улучшению результатов лечения психического здоровья во всем мире.
Депрессия