中国医药报
往期回顾
返回目录

深度学习,AI医疗器械“学然后知不足”

    □ 彭亮     

    机器学习(ML)是人工智能的核心领域,专门研究计算机模拟人类学习行为的方法。深度学习(DL)于2006年正式提出,作为新一代人工智能技术的代表引领了本次人工智能热潮,几乎成为人工智能的代称。深度学习实为人工神经网络算法,特征提取无须人为干预自动完成,是基于海量数据和高算力的黑盒算法。

    人工智能医疗器械,是使用人工智能技术的医疗器械,包括人工智能独立软件和人工智能软件组件。人工智能技术在医疗器械的应用主要包括前处理(如成像速度提升)、流程优化(如一键操作)、常规后处理(如图像分割)、辅助决策(如辅助筛查、辅助识别、辅助诊断、辅助治疗)等方面,能够提高诊治的准确性和效率,降低医生误诊漏诊率和工作强度,具有良好的临床价值和应用前景。

    在我国,使用传统人工智能技术的医疗器械已有多款产品注册上市,如乳腺癌、肺结节、结肠息肉等辅助识别软件和心电分析软件。而使用深度学习等新一代人工智能技术的医疗器械典型产品有眼底照片糖网辅助筛查软件、CT图像肺结节辅助识别软件、病理图像辅助识别软件,目前仍主要处于研发、检测、临床试验阶段。

    深度学习虽然在商业领域已取得成功,但在医学领域应用还存在诸多问题。由于医学是经验科学,本身存在着不确定性和开放性,决策路径复杂,简单将商业成功经验移植到医学场景并不能达到预期效果。

    首先,深度学习是个“黑盒”,可解释性差。医生知其然但不知其所以然,影响后续医疗活动的开展,特别是长期使用产生依赖性之后较难发现产品出错。

    其次,深度学习以数据为基础,但医疗数据不能完全代表临床决策要素,同时其反映的是数据之间的相关性而非因果性,需要权衡对于医生临床决策的影响及其受益与风险。

    第三,深度学习需要大量高质量数据进行训练,满足相应条件的医疗数据相对较少。一是医疗数据较为复杂,具有多维度特征,增加数据标注和算法训练确有难度;二是医疗数据相对封闭,数据产权关系不清,数据获取较为困难;三是医疗数据需要人工标注形成标签以供训练,人为因素影响严重。

    最后,训练数据缺乏多样性,数据量不足,缺乏鲁棒性设计,导致算法泛化能力弱,重复性和再现性差,临床难以落地和推广。

    因此,只有在数据质量控制、算法泛化能力以及临床使用风险等方面扎实做好工作,才能保证深度学习医疗器械的安全性和有效性。此外,需要数据驱动与知识驱动相结合,以提升深度学习的可解释性。

    (作者单位:医疗器械技术审评中心审评一部)