MDD-5k:用于精神障碍的新型诊断对话数据集,通过神经符号大语言模型生成
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了在隐私和伦理限制下难以直接收集精神障碍诊断对话的问题。通过设计一个神经符号多代理框架,利用匿名患者案例生成多样化的诊断对话,从而创建了MDD-5k,这是一个包含5000个高质量对话的新型标签中文精神障碍诊断数据集。该数据集的开发有望促进AI精神健康护理领域的进展。
通过使用大型语言模型开发医学任务导向的对话系统,模拟医生与患者对话以推断诊断结果。研究使用外部规划器和大型语言模型改进了人工智能系统在信息收集和自然语言理解方面的局限性。通过模拟医生的疾病筛查和鉴别诊断的两阶段决策过程,设计了两个规划器来引导医疗对话。采用强化学习和大型语言模型进行主动学习,通过在MIMIC-IV数据集上评估,发现该系统能够胜过现有模型,是实现自动对话式疾病诊断并提高医学诊断精确性和可访问性的重要一步。