团队研究深度学习模型在诊断溺水方面的医学有效性

发布时间:2024-03-05 16:48:16 栏目:精选百科

    导读 东北大学医学研究生院的一个研究小组对使用尸检成像诊断溺水的深度学习模型的医学有效性进行了详细检查。结果显示深度学习模型的结果与医学...

    东北大学医学研究生院的一个研究小组对使用尸检成像诊断溺水的深度学习模型的医学有效性进行了详细检查。结果显示深度学习模型的结果与医学专业人士的观察结果不一致。

    他们的回顾性研究于 2024 年 2 月 9 日发表在《医学影像信息学杂志》上。

    在尸检过程中,医疗专业人员很难做出溺水的诊断。没有单一的体征或测试可用于诊断溺水。尸检成像,例如尸检计算机断层扫描,可以帮助溺水诊断。在早期的研究中,表现良好的深度学习模型已被用于溺水诊断。一些人认为深度学习技术的表现与医疗专业人员一样好。然而,这些深度学习模型的医学有效性尚未经过充分测试,以确定其在现实临床环境中的准确性。例如,尚未进行任何研究来确保深度学习模型中的图像与医学发现相符。这种差距增加了人工智能诊断和医生评估之间存在差异的可能性。

    因此,东北大学团队开展了一项研究,评估深度学习模型的医学有效性,该模型在溺水诊断方面取得了较高的分类性能。他们的研究包括 2012 年至 2021 年间接受死后计算机断层扫描的 8 至 91 岁人群的尸检病例。其中,153 例是溺水病例,160 例是非溺水病例。他们从之前的工作中训练了三个深度学习模型并生成了显着性图。显着图突出显示了人们的眼睛首先聚焦的突出区域。研究人员将这些领域称为模型的重点领域。

    该团队将模型的焦点区域与放射科医生注释的“医学发现”图像区域进行了比较。他们的比较显示,在某些情况下,模型的重点区域中只有 30% 到 80% 与放射科医生指出的关键区域一致。团队在研究中发现的差异揭示了采用不同验证方法的重要性,并展示了评估人工智能系统性能的挑战。日本东北大学医学研究生院放射成像和信息学系的 Yuwen Zeng 表示:“研究结果强调需要新的训练方法,使人工智能模型内部结构与基于人类专业知识的复杂决策过程相一致。”

    大多数用于医疗诊断的人工智能系统都是基于分类模型的。这些模型已经实现了很高的分类精度,并且可以对其预测提供直观的解释。但对于这种视觉解释对于医学诊断是否有效还没有定量评估。

    “这项研究报告了深度学习模型的决策基础与医学专业知识之间的不一致,引起了对评估深度学习模型以确保其在现实世界医疗场景中的可靠性的关注。这种认识至关重要,因为它可能会影响开发和部署人工智能技术在医疗保健领域的应用,”曾说。

    该团队面临着与评估深度学习模型的可视化结果相关的独特挑战,特别是在医学图像的背景下。“目前,这些结果的定量评估还没有既定的金标准,视觉评估仍然是主要方法。现有的评估方法主要是针对自然图像设计的,因为自然图像很容易定义物体,”曾说。

    对于医学图像,由于目标边缘和特征固有的模糊性,这一挑战进一步放大。该团队的研究表明,考虑到数据的复杂性,需要改进专门为医学图像设计的评估方法。

    该团队指出,由于分类模型的分层和自上而下的架构,使用单个类别标签作为唯一的监督信息可能会阻止深度学习模型学习有助于最终诊断结果的所有因素。“我们这个项目的下一步是在模型中引入额外的人类专业知识,以限制模型参数的分布,这可以缓解模型和人类专业知识之间的这种不一致。这种方法旨在弥合模型决策过程与模型决策过程之间的差距。人类专业知识的复杂性,”曾说。

免责声明:本文由用户上传,如有侵权请联系删除!