数据集EHRCon:专门设计用来确保EHRs中的结构化表格和非结构化笔记之间的数据一致性

分类:大语言模型 | 热度:81 ℃

韩国科学技术院、 三星医疗中心、麻省理工学院和多伦多大学推出EHRCon,关于电子健康记录(Electronic Health Records,简称EHRs)的数据一致性问题。EHRs是医院用来存储患者医疗记录的数字系统,其中既包括结构化数据(比如药物信息、诊断结果)也包括非结构化的临床笔记(比如医生的笔记)。这两种数据形式相互补充,为医生提供全面的患者信息。但是,由于设计上的不直观以及人为错误,这些数据之间常常出现不一致,这对患者安全构成了严重风险。

  • 项目主页:https://ehrcon.github.io
  • GitHub:https://github.com/dustn1259/EHRCon

论文的主要功能是介绍了一个新的数据集EHRCon和任务,它们专门设计用来确保EHRs中的结构化表格和非结构化笔记之间的数据一致性。EHRCon数据集是与医疗专业人员合作制作的,使用了MIMIC-III EHR数据集,并手动标注了105份临床笔记中的3943个实体,以检查它们与数据库记录的一致性。

主要特点包括:

  1. 双重模式:数据集包含两种模式,一种使用原始的MIMIC-III架构,另一种使用OMOP CDM架构,以提高其适用性和泛化能力。
  2. 大型语言模型的应用:利用大型语言模型(LLMs)的能力,提出了一个新的框架CheckEHR,用于验证临床笔记和数据库表之间的一致性。

工作原理是CheckEHR通过一个八阶段的过程来工作,包括笔记分割、命名实体识别、时间过滤、表格识别、伪表格创建、自我修正、值重格式化和查询生成。这些阶段利用了大型语言模型的上下文学习能力,以提高处理复杂任务的准确性和效率。

具体的应用场景包括:

  • 临床记录审核:医生或系统可以使用CheckEHR来检查他们的临床笔记与EHRs数据库中的记录是否一致。
  • 数据清洗:在将临床笔记输入到EHRs之前,可以使用这个框架来确保数据的准确性。
  • 医疗质量改进:通过识别和纠正不一致的数据,可以提高医疗服务的质量和患者安全。
  • 研究和分析:研究人员可以使用这个数据集和框架来分析EHRs数据的一致性问题,进而改进EHRs系统的设计。

例如,一个医生在临床笔记中记录了患者使用了某种药物和剂量,但是EHRs的数据库中记录的剂量不同,CheckEHR框架就能够识别出这种不一致,并提示医生或系统进行核对和修正。这样就能减少因数据不一致导致的医疗错误,提高患者治疗的安全性。

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)! 点此爆料

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论