深圳市大数据研究院和香港中文大学(深圳)的研究人员引入“诊断链”(CoD)的概念,解决了大语言模型在医疗诊断领域中可解释性的问题。CoD将诊断过程转化为一个模仿医生思维流程的诊断链条,从而提供了一条清晰的推理路径。此外,CoD还能输出疾病确信度分布,确保决策过程的透明度。
- GitHub:https://github.com/FreedomIntelligence/Chain-of-Diagnosis
这种可解释性不仅使模型诊断变得可控,还通过确信度的熵减少,帮助识别关键症状以供进一步询问。借助CoD,研究人员开发了DiagnosisGPT,它能够诊断9,604种疾病。实验结果表明,DiagnosisGPT在诊断基准测试上的表现优于其他LLM模型。更重要的是,DiagnosisGPT在确保诊断严谨性的可控性的同时,提供了高度的可解释性,这为临床应用和模型信任度的提升奠定了基础。
例如,你告诉CoD你最近经常头痛。CoD会首先总结你的症状,然后从其疾病数据库中检索出可能与头痛相关的疾病,如偏头痛、紧张性头痛等。接着,它会分析这些疾病的典型症状,并与你的症状进行匹配。最后,CoD会输出一个信心分布,告诉你它认为你患有每种疾病的可能性有多大。如果它对某个疾病的诊断信心很高,它可能会直接给出诊断;如果信心不足,它可能会进一步询问你是否还有其他症状,如视觉模糊或恶心等,以便做出更准确的诊断。
主要功能
- 诊断疾病:CoD能够诊断9604种疾病,这是一个非常广泛的疾病覆盖范围。
- 透明度:它通过一个“诊断链”来模拟医生的思考过程,让你知道每一步是如何进行的。
- 信心分布:CoD会输出对每种可能疾病的诊断信心分布,这有助于决策者了解模型的确定性。
主要特点
- 可解释性:CoD的设计使得其诊断过程不再是一个黑箱操作,而是可以通过一系列步骤来解释的。
- 控制性:通过设置信心阈值,可以控制模型的诊断决策,使其更加严格或宽松。
- 数据隐私:CoD使用合成病例数据进行训练,避免了真实患者数据的隐私问题。
工作原理
CoD的工作原理可以分解为以下几个步骤:
- 症状抽象:首先,系统会总结患者描述的症状。
- 疾病召回与知识整合:基于症状,系统会识别出可能的疾病,并从疾病数据库中检索相关知识。
- 诊断推理:系统会分析每种疾病的典型症状,并与患者的症状进行匹配。
- 信心评估:根据推理过程,系统会生成对每种疾病的诊断信心分布。
- 决策制定:如果最高信心超过设定的阈值,系统会做出诊断;否则,系统会进一步询问症状。
具体应用场景
- 自动诊断:在没有医生的情况下,CoD可以自动进行初步诊断,提供可能的疾病建议。
- 辅助医生诊断:在医生的辅助下,CoD可以提供更详细的分析和建议,帮助医生做出更准确的诊断。
- 教育和培训:CoD的透明推理过程可以用于医学教育,帮助学生理解复杂的诊断逻辑。
- 远程医疗:在远程医疗环境中,CoD可以帮助医生在不与患者面对面的情况下进行诊断。
0条评论