您当前的位置:检测资讯 > 科研开发

人工智能医疗器械临床试验指南解读

嘉峪检测网        2025-07-22 08:41

摘要:人工智能(artificial intelligence,AI)已成为引领未来的战略性技术,也是中国未来发展的关键引擎。在医疗器械的创新研发中,AI已经在智能辅助诊断、智能辅助治疗、智能监护与生命支持等方面提供了关键支持,机器学习赋能设备软件功能(machine learning-enabled device software functions,ML-DSFs)已成为许多医疗器械的重要组成部分。近期,美国食品药品监督管理局(Food and Drug Administration,FDA)发布了《针对人工智能/机器学习赋能设备软件功能的预设变更控制计划上市提交建议的指南草案》,希望提供一个前瞻性方法来促进机器学习医疗器械的发展,在保证设备的持续安全性和有效性前提下,支持ML-DSF通过修改来迭代更新。该指南代表了最新的监管方向,特别有助于提升AI产品临床试验质量与效率,因此撰写本文加以详细介绍和解读,以利于借鉴国际先进监管理念和经验,促进产业健康发展和国际影响力提升。

关键词:人工智能;医疗器械;机器学习赋能设备

 

1、前言

人工智能(artificial intelligence,AI)已成为引 领未来的战略性技术。在《中国制造2025》[1]一文中,AI占据了重要地位,该文对AI的发展进行了明确的规划布局;2017 年国家出台《新一代人工智能发展规划》[2],计划到2030年中国成为该领域的全球领导者。因此,AI是立足国家发展战略规划,引领未来发展的技术革命。作为一门延伸和扩展人类智能的新技术科学,AI已在医疗健康、金融、教育安防等多个垂直领域得到应用。

在医疗领域,AI与医疗器械的创新结合主要体现在智能辅助诊断、智能辅助治疗、智能监护与生 命支持等方面。在未来几十年,大数据、AI将成为医疗技术发展的引擎,利用这些技术可以深刻挖掘医疗数据的价值与潜力,更早地预测患者的疾病风险 ,更综合性地为医生提供精准的诊疗方案[3-4]。 2020年以来,随着“冠脉血流储备分数计算软件产品”获得第一张AI三类医疗器械注册证,已经有多个产品接连上市,各科研院所和医疗机构开展的相关研究不胜枚举。近两年,随着监管路径逐渐清晰以及产业发展逐步成熟,AI医疗器械取得注册证的步伐不断加快。截至2022年12月22日,已完成国内注册的AI医疗器械产品覆盖了心血管、脑部、眼部、肺部、骨科、肿瘤等疾病领域,预期用途包括辅助分诊与评估、定量计算、病灶检测、靶区勾画等[5]。

临床试验作为AI医疗器械产品获批上市的重要环节,不仅对服务力提升和规范化提供支撑,也对打造可持续发展的、具备国际竞争AI医疗器械创新生态系统至关重要。目前我国AI整体发展水平虽然势头良好,但与美国相比仍存在差距,AI医疗器械的发展起步晚、临床试验数量和经验不足,亟待建立高质量的AI临床试验中心,保证AI医疗器械临床试验高效地实施。2022年工信部推动了“人工智能医疗器械揭榜挂帅”项目,其中的人工智能医疗器械临床试验中心有望加速促进这一进程。

近年来,国家药监局陆续发布了《深度学习辅助决策医疗器械软件审评要点》[6]、《人工智能 医用软件产品分类界定指导原则》[7]、《人工智能医疗器械注册审查指导原则》[8]等系列文件 ,规范AI医疗器械的审评注册标准。我国对于AI医疗器械监管的框架、原则和要求,在上市前评价、变更控制、信息透明、生存周期质控、真实世界监测、新技术评价等方面与国际监管先进水平基本相当,在重点产品评价方面处于领先水平,具有自身特色。但 AI 医疗器械在临床试验审批过程中仍存在产品迭代周期快于临床验证周期、数据安全和共享存在缺陷等等突出矛盾,阻碍了AI医疗器械产品的快速开发和市场化[9]。因此,我们需进一步参考借鉴国际先进监管理念和经验,进一步加强监管科学研究,提高监管能力和水平,促进产业健康发展,提升国际影响力[9]。

2023年11月,国家药品监督管理局医疗器械技术审评中心发布了《人工智能辅助检测医疗器械(软件)临床评价注册指导原则》[10],将AI医疗器械根据预期用途分为辅助决策类和非辅助决策类,目前国内辅助决策类AI医疗器械注册类别按照三类进行管理,非辅助决策类按照产品原有分类结果提交注册。该指导原则详细阐述了AI医疗器械临床试验设计过程中的关键点,从研究对象的筛选、评价指标的制定、临床参考标准构建、样本量的估算几个方面给出了监管层面的要求,并以肺结节CT影像辅助检测产品为例介绍了多阅片者多数据样本(multiple reader multiple case,MRMC)的临床试验设计方法,针对AI医疗器械的核心指标灵敏度、特异度、受试者工作特征(ROC)曲线等提供了计算样例。该指导原则的提出规范了AI医疗器械临床设计流程,给相关企业开展临床试验提供了具体的方案指导,进一步推动了AI技术在医疗领域的临床应用。

 

2、指南解读

随着技术在医疗保健各个方面的不断进步,结合AI,尤其是机器学习(machine learning,ML) 的医疗软件,又被称为机器学习赋能设备软件功 能(machine learning-enabled device software func-tions,ML-DSFs),已经成为许多医疗器械的重要组成部分。长期以来,美国食品药品监督管理局(Food and Drug Administration,FDA)一直运用创新方法监管医疗器械软件和其他数字化健康技术来确保其安全性和有效性。针对AI产品迭代周期快于临床验证周期,导致临床验证效率低的问题,2023年4月,FDA发布了《针对人工智能/机器学习赋能设备软件功能的预设变更控制计划上市提交建议的指南草案》[11]。这一草案指南的目的在于,提供一个前瞻性方法来促进ML 医疗器械(安全有效且使用ML算法进行训练的医疗器械)的发展,以一种负担最小的方式,在保证设备的持续安全性和有效性前提下,支持ML-DSF通过修改来迭代更新。该指南代表了最新的监管方向,特别有助于提升AI产品临床试验质量与效率,因此在本文中加以详细介绍和解读。

软件开发是一个不断迭代过程,FDA鼓励软件功能设备制造商不断对设备进行优化升级。对ML-DSFs的修改可能会严重影响器械的安全性和有效性,需要上市前审批,只有包含在预先变更控制计划(predetermined changed control plan, PCCP)中的修改可以例外。FDA认定PCCP为器械技术特性的一部分。通过在营销申请中增加PC-CP,制造商可以主动预先指定并争取对ML-DSFs计划修改及实行方式的上市前审批,其中PCCP所列出和实施的修改无需额外的上市申请。

一份PCCP必须包含“修改说明”、“修改方案”和“影响评估”三个部分,用于为FDA提供审查修改所需要的信息。“修改说明”需要明确ML-DSFs 后续所需修改,“修改方案”需要描述支持这些修改的验证及验证方式(包括预定的验收标准),“影响评估”用来帮助连接“修改说明”和“修改方案”,因其确认了计划的修改带来的收益和风险,以及修改方案中的验证和验证方式将如何保证设备的安全性和有效性。

 

2.1 修改说明 适合写入PCCP中的修改应以能够维持或提高设备安全性或有效性为目的。修改说明中提出的修改,均应能够使用设备现有的质量体系进行验证。修改说明中应写明ML-DSFs每一项计划修改及修改带来的设备特征和性能上的变化,修改不宜过多,且均应可验证。对ML-DSFs的修改应该详细说明,以保证能够被正确理解。每项修改都应在“修改方案”中有对应的具体性能评估方法。“修改说明”中应明确说明 ,计划的修改是软件自动实施还是需要手动实施(即是否需要人工输入、操作、审查或决策)。修改说明还应清晰说明是以统一的方式对市场上所有器械更新,还是根据不同的情况对不同器械使用不同方式更新。对于本地调整,应写明需要具备哪些本地因素或条件。

PCCP中可接受的修改类型包括:

(1)与ML-DSFs性能规范的量化措施相关的修改,包括通过使用新数据重新训练ML模型,从而改进分析和临床性能,其中新数据来自预期人群中相同类型和范围的输入数据; 

(2)与ML-DAFs输入相关的修改,包括涉及为兼容相同类型的新数据源(如不同品牌、型号或版本)所做的算法扩展或与新类型输入相关的有限修改;

(3)与设备使用和性能相关的有限修改,包括为特定群体子集使用更大数据集重新训练的设备进行授权。

 

2.2 修改方案 修改方案中应包含在开发、验证 以及实施修改说明的过程中,各项修改需遵循的方法和具体步骤,以及修改的证明和验证方法(包括预定的验收标准),且必须符合质量体系法规。

修改方案包括四个基本组成部分: 

(1)数据管理方法

通常来说,应包含以下信息:如何收集数据,包括带有纳入剔除准则的临床研究方案;数据处 理、存储和维护的相关信息;确定参考标准的流 程;数据相关的质量保障流程;在数据收集期间,将数据分为训练集和测试集的数据隔离策略;以及防止在训练和调试过程中访问性能测试数据的协议。FDA通过这些信息了解开发商对每项ML-DSFs修改使用的数据管理方法,包括制造商 计划如何获得和使用能够完整代表预期使用人 群的训练及测试数据;是否能够充分代表可识别 的亚群,包括交叉群体,并分为训练集和测试集,以尽量减少ML模型偏差;如何隔离训练和测试数据以避免过度拟合和错误引用测试性能;如何使用新数据补充或替代旧数据,以保证性能能够代表当前患者群体和护理标准;参考标准是否代表了确定实际情况的最佳流程;数据管理方法如何减少产生歧视性结果的可能。

 

(2)重新训练方式

应写明每项修改中可能产生变化的处理步骤,以及制造商实施ML-DSFs修改的具体方法。此外,如果重新训练涉及ML模型的结构修改,则重新训练方法中应写明其基本原理和具体每项结构修改的理由。FDA通过重新训练方法中的信息理解如何通过重新训练实现拟定的修改,确定修改是否按照适当、明确的方式进行,以及确定性能评估和更新步骤是否能够支持修改。

 

(3)性能评估方案

应包含在进行ML-DSFs修改后对整个设备的验证计划中,包括将新修改设备与原始设备和最近一次修改设备版本进行比较的ML模型测试协议等。性能评估方案应提供有关每项计划修改的研究设计、性能指标、预定验收标准及统计测试相关的详细信息;描述何种情况下需要进行性能评估;如何对能够代表临床人群和预期用途的测试数据进行隔离;需要计算哪些性能指标;以及对每次修改性能目标相关假设进行测试的统计分析方案。

 

(4)更新流程

应描述制造商如何更新其设备以实施修改,向用户提供适当的透明度,并且在适当的情况下,更新修改相关部分用户培训并进行实际监控。PCCP应描述实施修改导致的所有标签变更,包含详细的使用说明和特定位置修改的相关信息。因此,设备商应确保设备修改前后版本的验证方案一致,或明确两个方案之间的具体差异;提供软件更新实施的具体描述;提供软件更新对原有用户带来的具体影响;描述如何告知用户所做的修改,包括性能差异、性能测试方法差异、和/或更新中解决的已知问题。

更新流程部分的信息,让FDA理解如何通过更新流程降低实施修改带来的风险;如何向用户提供有关设备更新的信息(以便用户能够正确解读设备输出结果中的更新);如何保持更新后的设备能够可靠运行;如何让相关人员及时了解设备功能和性能的最新信息。

需要注意的是,PCCP应清晰指出修改说明中的每项修改,对应修改方案中的哪些部分。对于具有多项修改的PCCP,可以通过溯源表来实现。

 

2.3 影响评估 在PCCP中,影响评估是用来评估 ML-DSFs实施PCCP带来的收益风险(包括如何降低这些风险)的文件。制造商应用已有的质量体系作为框架,来指导和管理针对PCCP中修改的影响评估。影响评估文件应将每次修改的设备版本与初始设备版本进行比较,讨论每一项修改的风险和收益,讨论修改方案中的内容如何合理保持设备的安全性和有效性,讨论一项修改将如何影响另一项修改,以及全部修改的整体影响。

根据FDA的上述要求准备PCCP,可以在保障ML-DSFs安全性和有效性的前提下,大幅降低迭代更新所需的审批时长和要求,从而促进ML-DSFs更快的迭代,以更好地支持ML-DSFs的应用及患者获益。

 

3、展望

PCCP对于我国制定关于AI医疗器械算法更新控制措施具有重要参考意义。AI医疗器械具有快速迭代更新的特性,AI算法更新主要涉及两个层面:一是算法结构层面的更新,包括更换全部训练集,即算法驱动型更新;二是指新增训练集数据量,即数据驱动型更新。目前,针对算法驱动型更新,我国法规明确要求需要进行医疗器械的变更注册。而针对数据驱动型更新,是否需要进行变更注册需要根据算法性能评估结果来决定,只有结果发生显著性改变才需要做变更注册。而对于“显著性”如何判定,目前缺乏统一结论,而对于AI医疗器械,随着上市后收集的数据越来越多,必然会扩充训练集提升算法性能,如何确定变更注册的节点对于企业而言就相当重要。参考PCCP使用新增数据重新训练ML模型方面的内 容,我们可以考虑从以下几方面确定变更节点:①在AI医疗器械提交注册时企业就需要明确后续扩充训练集的数据类型及数据质量控制方法;②企业需要根据产品现有算法性能指标制定算法性能显著提升的指标节点,并在注册时一同提交算法性能更新计划,说明相关指标提升与产品更新的对应关系;③明确扩充训练集后的算法性能评估方案。

通过以上措施制定安全有效的算法性能更新节点,一是可以避免部分企业频繁变更注册,增加企业运营负担且浪费审评资源;二是可以避免部分企业自由“扩张”,逃避监管,一定程度上填补了我国AI医疗器械上市后监管空白。

但与此同时AI医疗器械临床试验也面临很多挑战,AI医疗器械临床试验目前主要分为前瞻性研究和回顾性研究,前瞻性研究是通过提前的试验设计,并随时间的推移跟踪治疗结果;回顾性研究是对已有真实世界临床数据的分析。回顾性研究的成本较低,企业更愿意采用该方式开展临床试验研究,目前辅助分诊与评估、辅助检测、辅助诊断类AI医疗器械都有相关产品通过回顾性研究取得医疗器械注册证,但回顾性研究过程中可能出现的数据偏移、数据完整性缺失等问题需要研究者仔细考量。除此之外,AI医疗器械的真实世界研究也面临同样的问题,真实世界数据在大多数情况下缺乏其记录、采集、存储等流程的严格质量控制,会造成数据缺失、记录不准确等问题。而我国各级医院都存有大量既往数据,如何将这些数据利用起来,无论是用于AI医疗器械的训练测试,还是作为临床试验回顾性研究、真实世界研究数据都是当前AI+医疗领域发展的重点之一。2023年10月25日,国家数据局挂牌成立,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用等,医疗数据的交易与流通有望变为现实。此外,《人工智能辅助检测医疗器械(软件)临床评价注册指导原则》进一步明确了AI辅助检测类医疗器械临床评价的要求和适用情形[10]。本指导原则是供注册申请人和技术审评人员使用的指导性文件,对AI辅助检测类医疗器械临床试验的指标设定、同品种比对路径等问题提供了有价值的参考意见。

综上,人工智能技术在医疗器械领域的应用,可以显著提高医疗器械开发效率、降低开发成本,对于医疗器械行业的长足发展具有革命性的意义。监管领域相关政策的及时完善,对于指导开发方向,严控器械质量至关重要,有助于推动 AI+医疗器械领域的产品最终落地和应用。

 

参考文献

[1] 中国国务院. 中国制造2025[EB/OL]. (2015-05-19). https://www. gov.cn/zhuanti/2016/MadeinChina2025-plan/mobile.htm#

[2] 中国国务院.新一代人工智能发展规划[EB/OL].(2017-07- 20). https://www.gov.cn/zhengce/content/2017-07/20/con- tent_5211996.htm.

[3] 滕依杉, 李曼, 赵阳光, 等 . 人工智能医疗器械产业发展现 状分析[J]. 保健医学研究与实践, 2023, 20(5): 151-156.

[4] 浙江大学, 中国食品药品检定研究院, 海军军医大学第二 附属医院 . 人工智能医疗器械性能评价通用方法专家共识 (2023)[J]. 协和医学杂志, 2023, 14(3): 494-503.

[5] 张乔, 黄思芮, 张楠, 等 . 国内人工智能医疗器械发展现状 分析[J]. 医疗卫生装备, 2023, 44(5): 64-68.

[6] 中国国家药品监督管理局.深度学习辅助决策医疗器械软 件审评要点[EB/OL]. (2019-07-03). https://www.cmde.org.cn//xwdt/shpgzgg/gztg/20190703141714991.html.

[7] 中国国家药品监督管理局.人工智能医用软件产品分类界定指导原则[EB/OL]. (2021-07-08). https://www.cmde.org.cn//flfg/zdyz/zdyzwbk/20210708153450851.html.

[8] 中国国家药品监督管理局.人工智能医疗器械注册审查指 导原则[EB/OL]. (2022-03-07). https://www.cmde.org.cn//flfg/zdyz/zdyzwbk/20220309091014461.html.

[9] 彭亮, 刘枭寅, 张宇晶, 等 . 人工智能医疗器械国际监管比较研究[J]. 中国数字医学, 2023, 18(5): 1-7.

[10] 中国国家药品监督管理局 . 人工智能辅助检测医疗器械 (软件)临床评价注册指导原则[EB/OL]. (2023-11-07). https://www. cmde. org. cn//flfg / zdyz / zdyzwbk /20231116154535183.html.

[11] US Food and Drug Administration. Marketing Submission Rec-ommendations for a Predetermined Change Control Plan for Artificial Intelligence/Machine Learning (AI/ML)-Enabled De- vice Software Functions (Draft)[EB/OL]. (2023-04-03). https: //www. fda. gov / regulatory-information / search-fda-guidance- documents / marketing-submission-recommendations-prede- termined-change-control-plan-artificial-intelligence.

 

分享到:

来源:梁浩/王顺等

医疗器械 医药