研究人员利用YouTube视频博客开发出创新的抑郁症检测模型

经过

德里克·克林顿

阅读时长：3分钟 2023年11月8日

沮丧

一种新的模型利用 YouTube 视频博客中的语音和面部表情来检测抑郁症。.
它优于其他方法，凸显了视听分析的重要性。.
性别差异模式显示，vlog 中的声音强度和快乐程度是抑郁症的关键指标。.

近期发表于《人文与社会科学传播》期刊的一项突破性研究提出了一种新型抑郁症检测模型，该模型利用YouTube视频博客中的视听线索。这一创新模型有望早期dent社交媒体用户的抑郁症状，从而促进及时干预和支持。据世界卫生组织（世卫组织）报告，抑郁症是与自杀意念相关的全球性重大问题，影响着全球超过2.64亿人。尽管抑郁症如此普遍，但早期检测仍然是一项重大挑战，因此亟需更有效、更便捷的筛查方法。

在社交媒体平台视频内容泛滥的时代，研究团队意识到利用视听数据来检测和应对抑郁行为的巨大潜力。这项由专业研究团队开展的研究，利用 YouTube 数据 API 访问并分析了 2010 年 1 月至 2021 年 1 月期间发布的大量视频博客（vlog）数据集。研究人员在心理健康专家的协助下，使用特定的关键词筛选内容，从而区分出与抑郁相关的 vlog 和普通的日常 vlog。

研究团队利用 OpenSmile 精心trac音频特征，并结合通过 FER Python 库获取的视觉线索，尤其关注画面中仅包含单个个体的片段。这种综合方法使研究人员能够使用高效的 XGBoost 算法构建一个稳健的抑郁症检测模型。在初步实验中，该模型展现出优于其他机器学习分类器（例如随机森林和逻辑回归）的性能。

通过严谨的分析揭示的关键见解

对收集的数据进行全面分析后，揭示了与抑郁vlog相关的几个关键指标。值得注意的是，研究表明，表现出抑郁症状的人通常在语音中表现出较低的响度和基频（F0），统计分析也支持了这一结论。此外，研究还观察到抑郁症患者语音信号的谐波噪声比（HNR）降低，表明其语音信号噪声水平较高。

此外，该研究还发现，在描绘抑郁行为的视频博客中，抖动水平显著升高，而抖动通常与焦虑和重度抑郁风险增加相关。分析还强调了第二共振峰（F2）频率的重要性，已知该频率在抑郁相关的视频博客中较低，这凸显了其作为抑郁状态鉴别指标的潜力。此外，该研究还表明，抑郁相关的视频博客中哈马伯格指数较高，这表明不同频段的强度存在显著差异。

在视觉方面，分析显示，有抑郁症状的个体面部表情中幸福感较低，悲伤和焦虑感较高，这与抑郁症的典型情绪特征相符。然而，在表情中性、惊讶或厌恶方面，未发现显著差异。

先进的方法和有前景的研究成果

研究人员精心采用了分层训练集和测试集划分方法，并对特征进行了归一化处理，确保两组数据集之间不存在任何YouTube频道重叠。他们利用网格搜索和交叉验证对模型的超参数进行了微调，最终优化模型以实现准确的二元分类。性能对比分析证实，与逻辑回归和随机森林分类器相比，所提出的模型具有更优的性能，在准确率、精确率、召回率和F1分数等指标上均表现更佳。

该研究探索了各种模式的影响，结果表明，虽然音频特征在检测抑郁症方面优于视觉特征，但音频和视觉线索的结合显著提高了模型的性能，这表明组合方法在开发稳健的抑郁症检测系统方面是有效的。

此外，性别特异性分析表明，针对女性视频博主定制的模型比针对男性视频博主定制的模型具有更高的准确率，这凸显了性别对抑郁症状在言语和面部表情中的表现可能产生的影响。这一发现强调了开发性别特异性模型以提高抑郁症检测准确率的重要性。