基于变换器模型和辅助特征的社交媒体帖子抑郁检测
原文中文,约700字,阅读约需2分钟。发表于: 。本研究解决了社交媒体帖子抑郁检测中传统机器学习算法在捕捉复杂文本模式方面的不足。提出了一种结合变换器模型、元数据和语言特征的神经网络架构,利用DistilBERT生成丰富的文本表示,并采用数据增强技术来改善模型性能。最终,模型在抑郁检测任务中的加权F1分数显著提高,展现出显著的效果和潜在影响。
研究探讨了心理健康与社交媒体的关系,特别是在外向用户中检测抑郁症。使用多种模型对Reddit和X数据集进行分类,并创建了孟加拉社交媒体抑郁数据集(BSMDD)。结果显示,DepGPT在零样本和少样本学习中表现出色,准确度和F1分数接近完美。研究强调了大型语言模型在不同语言环境中的有效性,为抑郁症检测提供了重要信息。