北欧国家健康数据收集的经验教训:完整性、一致性、问责制
首页 > 资讯 > 北欧国家健康数据收集的经验教训:完整性、一致性、问责制 出自识林
北欧国家健康数据收集的经验教训:完整性、一致性、问责制
笔记 2021-03-30 性能再好的汽车没有燃料/电就寸步难行。医疗卫生中的人工智能(AI)也是如此,即使拥有再出色的算法和技术,但没有燃料(数据)也寸步难行。而且不是任何燃料都可以,就像一些汽车在最高辛烷值汽油的情况下能够最好地运行一样,在干净和高质量的数据上 AI 也能最好地运行。 而访问此类数据可能充满挑战。目前无法生成高质量的健康数据成为困扰 AI 有效应用的问题之一。数据科学家需要花费近 80% 的时间来收集和清理数据,然后才能进行分析。这种障碍限制了医疗保健领域 AI 从个体化医疗和基于价值的医护到加速药物发现和开发的极具前景的创新。 近日诺华北欧地区真实世界证据负责人 Madlaina Costa-Scharplatz,诺华北欧地区首席创新官 Peter Hovstadius 以及诺华 Biome 全球负责人 Jacob LaPorte 通过发表在 STAT 上的一篇观点文章介绍了北欧的一些经验。 他们表示,半个多世纪以来,这些国家(丹麦、芬兰、冰岛、挪威和瑞典)一直在建立强大的数据基础,帮助解锁 AI 的前景并在全球范围内加速个体化医学的发展。在所有数据驱动的活动中,这些国家在三个方面比较突出:完整性(completeness)、一致性(consistency)和问责制(accountability)。前两者是与流行的数据质量框架相关的维度。而问责制则长期以来是在合规方面获得使用数据的监管和社会性许可的一种手段。 完整性 许多“组学”技术的进步提供了前所未有的能力来表征生物的生命构成要素和人类的遗传密码。但是,许多卫生系统无法充分利用基因组学洞察,因为他们缺乏随时间推移的人群健康结局数据。这些缺点使得难以(甚至不可能)进行复杂的遗传和分子变异与疾病风险、表现和治疗结局的关联或因果分析。 北欧国家早在二十世纪 40 年代就开始收集整个人群的健康数据集。从那时起,就建立了一个基础架构来收集每个人整个生命周期中的全面健康数据。这些数据位于庞大的国家质量登记注册网络(有 230 多个)中,包含与健康问题、干预措施和结局有关的详细信息。唯一的个人 ID 号码系统使研究人员可以将来自不同注册表的数据交叉连接到个人。 通过对可用数据的其它维度进行分层,这些国家进一步扩大了这些注册登记库的应用范围。例如,为在国家注册库中进行生物组学分析而对生物样本进行补充的重点工作包括冰岛的 deCODE 和芬兰的 FinnGen。社会经济数据也被运用于其中一些注册登记库,以更好地将环境影响与遗传影响区分开。随着数据变得越来越复杂和多维,北欧科学家们致力于通过甄筛和审查来确保数据的完整性。这样可以减少因低质量的洞察而浪费时间和资源梳理数据的风险。 北欧国家具有系统和文化上的机制可以实现此类数据存储。其中许多机制在其他国家目前阶段是比较缺乏的。例如,北欧的卫生系统几乎 100% 采用电子病历,并且正在通过诸如“北欧可互操作性项目(Nordic Interoperability Project)”努力实现完全的可互操作性,从而使得不同的病历系统可以轻松地与国家卫生数据注册登记库交换和利用信息。这些国家还拥有扎根于医学实践的社会契约:患者信任并同意出于研究目的共享其信息以改善所有人的公共卫生状况。 一致性 数据必须在不同的收集点之间保持一致的结构和汇总,以便进行分析。从基层医疗、专科诊所到药房,每名患者的旅程都包括多个场地。来自所有这些场地的输入数据应以单一格式和文件编制。为将其汇总到整个人群中,所有提供商都需要一致地记录患者数据,以便将其输入到一个准备就绪的分析数据集中。 这在理论上似乎很简单,但实践中却充满挑战。在像美国一样的分散式医疗系统中,不同的技术和数据标准在数据一致性方面造成裂隙,而且这种裂隙只会随着患者病程的发展而不断增大。 但在北欧并非所有平台都同步,也不是所有类型的数据都同步,例如临床文档或放射图像。但这些挑战已经通过诸如 Data Saves Lives 之类的计划来解决。Data Saves Lives 是一项开放源代码的项目,旨在创建通用知识图表。该计划如果成功,将建立一个通用的分类法和本体,将任何健康数据与其它健康数据连接起来,以进行更快、更完整的人群分析。 问责制 数据必须可用,但也必须受到保护。一些法律可以保护隐私,但重要的是寻找新机会来防止数据隐私受到侵犯。还必须考虑有关数据所有权的细微差别的辩论,包括个人拥有数据的权力与第三方可能出于自身利益或以对患者不透明的方式使用数据的权力。 北欧国家将对区块链等技术的投资置于优先地位。例如,瑞典的 CareChain 计划实施了用于健康数据的国家区块链,同时让患者能够控制自己的数据,以便他们可以给予和管理知情同意给第三方。 有了这样的模型,患者就可以拥有自己的数据,同时还可以将数据许可给国家性的机器学习生态系统用于分析。数据掌握在患者手中的同时,为复杂而强大的集合提供信息,两全其美。 作者:识林-Acorn |