医疗器械领域人工智能技术的发展_检测资讯

医疗器械领域人工智能技术的发展

嘉峪检测网 2021-04-13 15:37

2020年1月初，世界卫生组织（WHO）发布了有关新冠肺炎的病例通报。然而早在2019年12月初，一家专门通过人工智能监测传染病传播的加拿大公司就警告过它们的客户会有相关疫情的风险。这一警告来自网络上对动植物传染病的新闻报道和文章的AI分析。同时，对全球机票数据的分析可以让AI准确预测病毒数日后的传播情况。

01 缺乏监管框架

案例揭示了AI和机器学习（ML）的能力。这两者都越来越多地通过集成电路的形式被运用于医疗器械领域。尽管使用AI同样有风险，但常用标准和规范尚未包含对这些创新技术的具体要求。比如欧盟的医疗器械法规（MDR）仅提出了一般性软件要求。根据规定，必须按照当前技术水平、为目标用途开发和生产软件。

这也适用于AI，必须确保功能的可预见性和可重复性，这反过来又需要经过验证和确认的AI模型。软件标准IEC 62304和IEC 82304-1就提出了验证和确认要求。但是传统软件和搭配机器学习的人工智能仍然有根本上的区别。机器学习基于使用数据训练模型，而不是对流程进行明确的编程。随着训练的进行，模型会通过改变“超参数”不断改善和优化。

02 测试AI训练数据和定义范围

数据质量的好坏是AI进行预测的关键。常见问题包括监督机器学习模型中的偏差、模型过度或低度拟合以及标签错误。测试揭示了这些问题，并显示偏差和标签错误常常是缺乏多样性的训练数据无意识导致的。以一个被训练用于识别苹果的AI模型为例。如果用于训练模型的数据主要是不同形状和大小的青苹果，模型可能会将绿色的梨子认成苹果却无法识别红苹果。在特定环境下，某些方面无意识的共同特性可能被AI视为重要特性，尽管它们毫不相关。数据的统计分布必须做出合理调整，以符合真实环境。比如，AI在识别人类时，两条腿不应被视为关键因素。

标签错误也可能是主观性（“疾病严重程度”）或标识符不适合模型用途导致的。为大量数据贴上标签并选择合适的标识符是一个需要大量时间和成本的流程。有时只有很少一部分数据会进行人工处理，用于训练AI，然后指示AI标签剩余数据。这个过程并不能保证没有错误，也就是说错误会重复出现。

成功的重要因素就是数据质量和使用的数据量。目前，根据经验估计一个算法所需的数据量少之又少。虽然基本上只要数据的质量和数量足够高，即便是简单的算法也能发挥良好的作用，但大多数情况下能力受限于（标签）数据的可用性和计算能力。所需数据的最小范围取决于问题和AI算法的复杂度，非线性算法所需的数据要多于线性算法。

通常70-80%的可用数据用于训练模型，其他数据用于验证预测。用于AI训练的数据应涵盖特性的最大带宽。

示例：识别膝盖骨关节炎

黑盒AI显示，以下图片所属的两位患者中的一人将在未来三年发展成膝盖骨关节炎。

这是人眼看不到的，在当前的诊断无法确认的情况下，患者还会选择手术吗？（以下图片来自Spectrum IEEE.org在2018年8月发表的“Making Medical AI Trustworthy”（让医疗AI更加可信），最初来自Osteoarthritis Initiative。这篇文章反映的是作者的观点，不一定代表NIH或将初始数据提交到Osteoarthritis Initiative的研究人员的观点或看法。）

医疗器械领域人工智能技术的发展