• 知识
  • 视频
  • 社区
  •  首页
政策法规
  •  国内药监
  •  FDA
  •  EU
  •  PIC/S
  •  WHO
  •  ICH
  •  MHRA
  •  PMDA
  •  TGA
研发注册
  •  概览
  •  监管动态
  •  研究专题
生产质量
  •  概览
  •  监管动态
  •  各国GMP
  •  中国GMP
  •  中国GMP指南
  •  GMP对比
  •  检查缺陷
  •  研究专题
主题词库
  •  主题词库
帮助中心
  •  帮助中心
关于识林
  •  识林介绍
  •  识林FAQs
  •  功能介绍
  •  团队诊断
  •  联系我们
登录
  •  登录
  •  注册
替换
查找内容:
替换为:
全部替换
插入链接
链接网址:
链接显示标题:
请选择网址类型
点我插入链接
插入文件
文件名称:
文件显示标题:
请选择文件类型
点我插入文件
发现错误 发表观点

原文内容

反馈意见

提交 正在提交..... 反馈历史

复制下面的地址分享给好友

确定 正在提交.....
train

你好,

关闭
提交 重做 重新开始 关闭
跳转
  • 新建同级
  • 新建子级
  • 删除
  • 重命名
选择收藏夹
新建收藏夹
公开

取消 确定

1. 基本信息
姓名:
企业:
职位:
联系方式:
邮箱:
2. 请在此填写您的问题,我们将优先安排答疑
提交

报名成功!
课程观看链接如下:
请添加课程助理微信,获得更多信息:
确认
确定

  • 知识
  • 视频
  • 社区
  • 政策法规
    • 国内药监
    • FDA
    • EU
    • PIC/S
    • WHO
    • ICH
    • MHRA
    • PMDA
    • TGA
  • 研发注册
    • 概览
    • 监管动态
    • 研究专题
  • 生产质量
    • 概览
    • 监管动态
    • 各国GMP
    • 中国GMP
    • 中国GMP指南
    • GMP对比
    • 检查缺陷
    • 研究专题
  • 主题词库
  • 帮助中心
  • 关于识林
    • 识林介绍
    • 识林FAQs
    • 功能介绍
    • 团队诊断
    • 联系我们
  • 30天免登录

    忘记密码?

识林

丹麦药监局起草 GxP 人工智能和机器学习算法标准

首页 > 资讯 > 丹麦药监局起草 GxP 人工智能和机器学习算法标准

页面比对

出自识林

丹麦药监局起草 GxP 人工智能和机器学习算法标准
丹麦
页面比对
笔记

2021-03-16

跳转到: 导航, 搜索

丹麦药品管理局最近发布了一份问题清单公开征求意见,以定义适用于各种关键 GxP 监管领域(例如,生产、分销和临床试验)的人工智能(AI)/机器学习(ML)算法的标准。丹麦药监局表示,其拟议的标准不是“完整清单”,应被视为“成熟草案”的提案,邀请利益相关者在 4 月 30 日之前对此主题提供反馈。

标准适用于实现关键 GxP 相关功能并且可以使用监督学习进行训练的静态 AI/ML 算法。丹麦药监局的提案列出了与使用此类算法相关的标准和问题,主要分为三大方面:数据集、偏差和方差、混淆矩阵和度量指标以及对结果的解释。

另外,丹麦药监局解释指出,提出该拟议提案的原因是“目前的立法中没有任何直接解决 AI/ML 算法使用问题的法律。”虽然该提案是丹麦药监局的内部提议,但是在欧洲和国际背景下起草的,具有普遍参考意义。

关键 GxP AI/ML 应用程序的问题
基于静态 AI/ML 算法和监督学习

pdfFileicon-pdf.png

数据集

1. 算法的训练、验证(优化)和测试过程是什么?谁参与了不同阶段?与计划有哪些偏差(如果有)?

2. 用于训练、验证和测试算法的数据集有多大?如何识别(命名)每个组中的每个单独的数据元素,以及将数据集存储在何处?

3. 有什么证据表明,用于测试算法的数据集中的部分之前没有被用来训练或验证(优化)同一算法,或源自同一主题?

4. 用于测试算法的数据点何时与完整的数据点池分开?使用了哪些选择标准?

5. 测试数据应遵循哪种数据清洗、标准化、均质化、排除标准、数据合成或类似方法?为什么?

6. 如何确保测试数据集能够代表应用程序预期范围内的真实数据并包含足够的挑战性数据(例如,西伯利亚雪橇犬还是狼)?

7. 训练数据集中的哪些特征对算法的输出影响最大,如何影响选择?与测试数据集如何对应?

8. 如何确保测试数据集涵盖由于人员、过程和设备的差异而在实际数据中可能出现的任何技术差异(例如,格式)?

9. 如何对用于训练、验证和(特别是)测试算法的数据的正确分类进行确认,并由诸如第二人或实验室测试确认分类?

10. 测试数据已有多少年了,并且仍然相关吗?算法的 F1 分数是否可能会由于输入数据随时间的变化而变差(例如,由于 COVID-19 封锁期间健身中心关闭而导致健康数据发生变化),如果是,那么数据集的重新训练和校准计划是什么?

偏差和方差

11. 如何对算法进行优化以处理偏差(Bias)和方差(Variance)(偏差–方差权衡)?在测试中看到的优化结果是什么?偏差–方差权衡图的外观如何?

a. 偏差是来自学习算法错误假设的错误。高偏差可能导致算法错过特征与目标输出之间的相关关系(欠拟合)。

b. 方差是对训练集中小波动的灵敏度误差。高方差可能导致算法对训练数据中的随机噪声进行建模,而不是对预期的输出进行建模(过拟合)。

12. 如何在连续的训练、验证和测试周期中监控系统性能?例如,F1分数从70-80-90%可能表示由于过拟合导致算法过于自信。

混淆矩阵和度量指标

13. 混淆矩阵(TP/FP/FN/TN)和以下指标中的值是多少?

a. 灵敏度 [TP/(TP+FN)] 是总真阳性中正确识别为阳性的项目数。灵敏度也被称为召回率(Recall)、命中率(Hit Rate)或真阳性率(TPR)。

b. 特异度 [TP/(TP+FP)] 是总真阴性中正确识别为阴性的项目数。特异度也被称为选择性(Selectivity)或真阴性率(TNR)。

c. 精确度 [TP/(TP+FP)] 是总识别为阳性的项目数中正确识别为阳性的项目数。准确度也被称为阳性预测值(PPV)。

d. 假阳性率 [FP/(TN+FP)] 是总真阳性中被误识别为阳性的项目数。例如,一名男子被宣称怀孕。也称为 I 类错误。

e. 假阴性率 [FN/(TP+FN)] 是总真阳性中被误识别为阴性的项目数。例如,一名孕妇被宣称未怀孕。也称为 II 类错误。

f. 准确率 [(TP+TN)/(N+P)] 是正确分类的项目占总数的百分比。不应将其用于不平衡的类别集,因为一个类别的准确性会压倒另一类别。

g. F1分数[2*(精确度*灵敏度)/(精确度 + 灵敏度)] 是精确度和灵敏度的调和平均数。F1 评分优于准确率的优点是,对于不均匀的类别,可以提供更好的度量标准来计算模型性能。

结果解释

14. 对于应用程序的预期范围,混淆矩阵中的哪个象限和哪个指标更重要,并且如果看到较低的分数,为什么这些部分不那么重要?

15. 如何根据测试数据和测试结果(包括混淆矩阵和度量指标)来定义和限制应用程序的预期范围?

16. 如何定义最终结果的阈值,例如,“ 50.01%它是一只狗”的结果是否解释为结果“它是一只狗”?如果需要,结果何时需要人的参与?

作者:识林-蓝杉
识林®版权所有,未经许可不得转载。如需使用请联系 admin@shilinx.com 。

取自“https://lib.shilinx.com/wiki/index.php?title=%E4%B8%B9%E9%BA%A6%E8%8D%AF%E7%9B%91%E5%B1%80%E8%B5%B7%E8%8D%89_GxP_%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E5%92%8C%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E7%AE%97%E6%B3%95%E6%A0%87%E5%87%86”
上一页: PICS_2021_工作计划:完成中国入会谈判,修订大批指南
下一页: 山德士起诉_FDA_错误地授予赛诺菲_Aubagio_新化学实体专营权
相关内容
相关新闻
  • FDA 发布首份人工智能和机器...
  • FDA临床决策支持软件定稿指南...
  • FDA 发文讨论在药品研发中使...
  • 行业团体呼吁 FDA 采用基于...
  • FDA 收到的含人工智能和机器...
热点新闻
  • ICH 发布新 Q1 稳定性指南...
  • 【直播】25年4月全球法规月报...
  • 学习 “药典文献汇编” 迎接...
  • 国内无菌附录征求意见稿发布,...
  • 国内药政每周导读:工艺验证检...

 反馈意见

Copyright ©2011-2025 shilinx.com All Rights Reserved.
识林网站版权所有 京ICP备12018650号-2 (京)网药械信息备字(2022)第00078号
请登录APP查看
打开APP