首页
>
资讯
>
探讨在制药质量管理中运用 AI 工具
出自识林
2019-06-12
药品投诉通常属于滞后指标,一旦发生问题,就展开响应式调查。借助于人工智能工具,将来的场景或许变为以积极主动的方式查看所有数据和系统,能够主动预测并做出决策。对于习惯于事后开展响应式调查的业界人士来讲,这样的场景或许有些科幻和遥远,对于AI术语,刚接触时也会感到晦涩、难懂。回想1997年时风靡的中文版《数字化生存》(Being Digital)中所描述的愿景,很多在今天已经变成现实。或许正像伟大冰球手,被誉为“冰球大帝”的Wayne Gretzky所说的,“好的球员总是适时滑到冰球所在的位置,伟大的球员却是事先滑到冰球将至的位置。”
FDA官员与制药、医疗器械领域的领导者都认同,人工智能(AI)工具可以在这些行业中实现质量管理的阶跃性改变。可能受影响的领域,包括供应链管理、批放行、制造、合规运行、临床试验终点与药物发现等。
2017年8月,Xavier-Health人工智能计划(Xavier Health Artificial Intelligence Initiative)召集来自工业界、学术界和政府的核心成员和专家,探讨人工智能应用于质量管理的可能性和潜在障碍。2018年3月在俄亥俄州辛辛那提Xavier大学举办的FDA/Xavier PharmaLink会议上,作为该计划的一部分,两个工作组介绍了取得的进展。去年8月的Xavier AI年度峰会上,发布了更为深入的概括,以及AI在制药和医疗器械公司应用的更为详细的讨论。Xavier Health人工智能计划,致力于扩大制药和设备行业的人工智能使用范围。Xavier Health人工智能计划任务是确定在质量运营、法规事务、供应链运营和制造业务中实施AI的方法 — 通过AI增强人为决策,从而使决策更有根据。计划的愿景是利用人工智能,将行业从被动响应变为主动、具有预测性,最终具有规范性,从而做到第一次就做对。目的是通过确保产品质量的一致性来提高患者的安全性。该计划旨在推动从传统的制药技术(例如工厂审计和产品抽样)获得实时快照,转向对大量GMP和非GMP数据的持续监测,实现持续的产品质量保证。
存在危险信号?
机器学习过程中,为达成决策而采取的路径会发生变化,因此算法的程序员无法判断决策是如何实现的。这形成了一个“黑箱”,对于制药等受到高度监管的行业,由于需要用文件记录决策和所采取的措施,可能会出现问题。“大家来自一个需要验证工艺流程的行业 — 工艺验证往往是单向的。随着系统不断学习,算法不断演化发展,不再相同。如何在这样的新情况下实施管理?” Xavier Health总监Marla Phillips在去年3月的会议上这样评论。
此外,由于决策的逻辑并非显而易见,人工智能机器做出的决策可能会受到质疑。Xavier Health人工智能计划致力于通过更为稳健可靠的数据和信息来增强人为决策。数据源的可信度能够确保最终用户对结果有信心。
将输入与结果链接起来的过程称为“可解释性”,这是Xavier正在承担的另一项研究工作。广义上可解释性指在需要了解或解决一件事情的时候,可以获得所需要的充分的可以理解的信息。反之,如果在一些情境中无法得到相应的充分信息,那么对大家来讲,这些事情都被认为不可解释。AI算法通常被认为属于知识产权的范畴,但通过可解释性,终端用户可了解导致最终结果的输入。首先使用已知输入和已知结果对AI进行测试和训练,获得对算法的信心。这种监督学习是重要的第一步。大多数行业都在这个层面上工作。然而,下一步是通过深度神经网络(DNN)进行无监督学习。无论是有监督学习还是无监督学习,必须保持输入和输出之间链接的完整性,以便人们可以有信心通过AI加强他们的决策。
展望未来,必须考虑在采用AI时真正需要的组织文化。Phillips问道,“如果从[AI工具]那里获得信息,‘这个产品会失败的情况,不予放行’,而在过去20年间,遇到这样的情况,通常予以放行。大家会告诉管理层报废这批产品吗?大家如何知道这批产品失败?AI工具报告的情况可能是对的。这样的情况,使得大家所面临的决策形势和文化与一直以来的做法截然不同。”
警示故事
Xavier人工智能计划的核心成员Kumar Madurai,是Computer Task Group (CTG)的首席咨询师和解决方案经理,根据与客户打交道的经验,分享了一个经历过的人工智能生成决策背后的科学信任的警示故事。
“一家客户在开始时就希望有一个专门从事数据分析的小组。他们以大爆炸的方式轰轰烈烈开始,集成了来自于八个不同系统的数据。当时大家的想法很简单,认为一旦将这些数据全部集成并链接起来,他们就可以构建查询和分析。在这种情况下,他们开发了一些工具。但原来设想应该根据AI工具获知的信息采取行动的主题专家们,并不信任AI工具所告知的内容。”
想要有效和可信任地使用AI工具,专业知识、培训和文化必须就位。于是客户决定重新开始使用更简单的工具,这些工具具备更多可见性和更多数据探索功能。目标是帮助主题专家们运行、使用和更好地理解一个系统。
评估持续学习系统(CLS)
两个Xavier AI团队之一负责探索如何评估持续学习系统(CLS),随着算法的发展,CLS在不同测试时间的输出可能不同。这项工作的两个团队领导者之一是来自于FDA器械与放射健康中心(CDRH)的生物医学研究资深科学家Berkman Sahiner。行业和监管机构都需要信任人工智能背后的科学,共同扩展对人工智能的理解,因此FDA的参与,对于这项工作至关重要。一般而言,行业和监管机构已习惯于传统科学和经过验证的工艺流程。
该团队的目标是确定如何以最大程度降低产品质量风险和患者安全风险,以及最大程度地发挥人工智能在促进患者健康方面的优势,提供对CLS性能的合理信任水平。探究什么类型的检测或设计过程,可以为CLS的用户提供合理的保证,保证输出可靠、可应用。
作为实现这一目标的一部分,该团队正在研究一系列问题:
- 由于CLS是动态的,因此算法会随时间而变化。更新算法的标准是什么?完全自动化?还是有人为参与?
- 由于性能随时间而变化,是否可以监控现场性能,以更好地了解CLS的发展方向?
- 了解用户可能会随着算法的进化发展受到影响并做出不同响应,就变更做出沟通交流的有效方法是什么?
- 如何确保导致算法变化的新数据具有足够的数据质量?
该团队还在研究可解释性、安全性和隐私等 — 这些实际运用对于所有新的软件工具都很重要。CLS团队分为两个下属团队,分别专注于制药和医疗器械领域。CLS团队提交了一份《医疗保健领域人工智能及持续学习系统的展望与质量规范白皮书》,覆盖了CLS的最佳实践以及如何将其应用于医疗保健领域等内容。白皮书并非指南或标准,目标受众是医疗器械软件开发人员和CLS用户。
实现持续产品质量保证
另一个Xavier AI团队正在探讨持续产品质量保证(CPQA),分为研究运用于制药与医疗器械的两个下属团队。该团队的领导者之一是Shire制药公司全球质量技术运营高级副总裁Charlene Banard。
制药和医疗器械行业对“持续”(Continuous)这一术语并不陌生 — 例如,持续工艺核实(ICH Q8,FDA工艺验证指南),以及持续质量核实(ASTM E2537)。但是,该团队使用的持续产品质量保证(CPQA)术语的情况有很大不同。ICH、FDA和ASTM术语中的“持续”,指一系列使用文件记录并且透明的正在进行的活动。另一方面,CPQA将使用包括CLS在内的AI工具,如果不保持输入和输出之间的链接,CLS会演变成“黑箱”。尽管学习如何信任这些工具是CLS团队的权限范围,但这方面的工作对于确保CPQA工作的成功至关重要。
Banard在去年3月的会议上汇报了推动团队工作的动力。“尽管行业已经采取控制以确保产品质量,但失败与召回并不鲜见,”她指出。“产品质量保证受限于组织对所有相关数据(已知或未知的数据)的实时访问、评价、链接,还有实时管理风险、知情决策方面的限制,这些因素最终对实现行动措施的能力造成限制。团队非常相信AI是可以改变未来的工具之一。”
投诉模型
注意到AI可能会出现“模糊不清”的情况,Banard将团队的工作聚焦于与患者安全相关的客户投诉实操模型上。范围是所有类型(生物)制药、器械和生命科学产品(例如药品、医疗器械、组合产品)的安全性相关投诉。
Banard强调,选择投诉的原因在于,大家都关注患者安全和防止对患者造成伤害。如果能够确实预防与安全相关的投诉,可以产生重大影响。对医疗器械和制药行业来说,投诉过程可以触摸得到,并不生疏,可用于说明使用人工智能工具预测未来的故障,说明哪些数据可能具有价值。投诉属于滞后指标,一旦发生问题,就展开调查。但是,Banard表示,“如果能够像响应式那样,以积极主动的方式查看所有数据和系统,就能够主动预测并做出决策。”
CPQA团队的阶段性成果
CPQA团队公布了三个阶段性成果:流程图、数据元模型和相关术语定义(与CLS团队协作)。
针对制药和医疗器械应用,分别构建了初始系统图。这些系统图展示了GXP体系、非GXP体系和投诉系统之间的互联性和潜在的因果关系。团队建议这些系统图至少包括质量体系检查技术(QSIT)和合规计划要素,并应考虑现有体系和那些现在还不存在但具有价值的体系。Banard提供了投诉示例系统图(见下图)。蓝色框表示具有可能的目标数据的系统。灰色框是可能位于两个相互链接的蓝框中的数据元。
例如,在上图中,如果要对客户投诉展开调查,可以选择左边的路径,查看制造执行系统(MES)或实验室信息管理系统(LIMS)数据。其间的数据元有助于构建数据,因此可以加入这两个系统的所有信息。如果采用更具关联性的方法,可以有效地通过鱼骨图,添加从AI工具获取的信息。Banard指出,“如果能够在所有系统上放置一个AI工具(如图下半部所示),可以查看的相关数据量将非常大,这是我们的目标:找到可能提供信息的相关性,让大家能够做出预测性或主动性的决策。”
从数据湖中获取有价值信息
数据湖是存储企业的各种原始数据的大型仓库,其中的数据可供存取、处理、分析及传输。数据湖是所有相关数据的组合,包括原始数据和转换数据,用于各种任务,包括报告、可见性、分析与机器学习。可以包括来自关系数据库的结构化数据;半结构化数据,例如字符分隔值文件(CSV文件);非结构化数据,例如电子邮件、文档和PDF格式文件;甚至包括二进制数据。重要的是,AI允许在所有系统中持续汇总信息,包括来自于非GMP系统的信息。
Banard认为,可将这样的人工智能工具视为数据湖中的捕鱼者。由于LIMS和企业资源计划(ERP)系统中都存在“产品标签”(product ID),因此增强了AI工具抽取出有意义数据的能力。
可实现的数据元模型采用所有内部系统电子表格形式,其中包含投诉调查的相关信息。还包括通常不属于内部数据的信息,例如地缘政治背景(透明度等)、患者监控、社交媒体监控。电子表格显示了相同数据驻留在多个系统中的位置,增强了以有意义的方式提取数据的能力。旨在强调统一结构化数据的概念和价值。
公司为AI做好准备了吗?
去年3月的Xavier会议大数据分析分会上,Xavier CLS AI团队成员、Sight Machine公司产品和工程副总裁Ryan Smith探讨了公司如何确定是否已准备好在内部成功引入AI工具。
Smith认为,数字化就绪程度是Sight Machine在研究与客户的潜在合作关系时所关注的一件事。由技术就绪和组织准备就绪状态组成。Smith表示,组织准备就绪是“远远超过技术能力的项目成功预测因素。”在技术方面,需要有大量能够使得AI生效的“干净数据”构成的数据集。如果数据不干净(即不能够做到统一协调),公司可能花费更多时间来协调数据而不是投入使用。Sight Machine公司发布了一个免费使用的“数字化就绪指数”(digital readiness index,DRI),让潜在客户可以查看组织或组织中的设施,并根据技术准备情况对其进行评估是否拥有数据和系统情况如何,以及组织准备就绪程度,组织准备就绪程度主要体现在改变和使用一些工具的能力和文化方面。
希望成为潜在客户的公司,可以在其网站上使用交互式工具来衡量在制造数字化方面的准备就绪情况和说明性的DRI白皮书。DRI使用一款在线问卷。根据对问卷的回答情况,DRI使用加权评分系统将组织置于五个数字化准备就绪领域之一,这五个数字化准备就绪区域包括链接、可见性、效率、高级分析和转换。 Sight Machine公司针对每个区域提出快速成效项目与领域的建议,以投入开发更高级的功能。随着公司进入更高级的数字化准备就绪区域,将能够承担可以在运营、质量和盈利能力方面产生更大影响的项目。在准备就绪程度较低的情况下,在Github上公布的项目用例包括跨整个网络的实时生产的全局运营视图,并提供针对失控事件的警报的统计过程控件。
作者:识林-Kapok
识林®版权所有,未经许可不得转载。如需使用请联系 admin@shilinx.com 。
参考资料
[1] How AI Tools Will Transform Quality Management In The Life Sciences
|