人工智能(AI)具有提高医疗诊断速度和准确性的真正潜力。但是在临床医生可以利用AI的力量来识别X射线等图像中的状况之前,他们必须“教”算法寻找什么。由于缺乏可用于在有监督学习环境中训练AI系统的图像,因此识别医学图像中的罕见病理对研究人员提出了持续的挑战。
Shahrokh Valaee教授及其团队设计了一种新方法:使用机器学习来创建计算机生成的X射线,以增强AI训练集。
“从某种意义上讲,我们正在使用机器学习来进行机器学习,”多伦多大学电子与计算机工程系(ECE)的爱德华S.罗杰斯高级教授Valaee说。“我们正在创建能够反映某些罕见条件的模拟X射线,以便我们可以将它们与真实X射线结合起来,以拥有足够大的数据库来训练神经网络以识别其他X射线中的这些条件。”
Valaee是医学机器智能实验室(MIMLab)的成员,该实验室由医生,科学家和工程研究人员组成,他们将在图像处理,人工智能和医学领域的专业知识相结合,以解决医学难题。Valaee说:“人工智能有潜力在医学领域以多种方式提供帮助。” “但是要做到这一点,我们需要大量数据-在某些罕见情况下,使这些系统正常工作所需的成千上万张带有标签的图像就不存在了。”
为了制作这些人造X射线,研究小组使用了一种称为深度卷积生成对抗网络(DCGAN)的AI技术来生成并不断改善模拟图像。GAN是由两种网络组成的一种算法:一种生成图像,另一种试图从实际图像中区分合成图像。对这两个网络进行了训练,以使鉴别器无法将真实图像与合成图像区分开。一旦创建了足够数量的人造X射线,它们就会与真实X射线结合起来以训练一个深度卷积神经网络,然后将其分类为正常图像或确定多种条件。
Valaee说:“我们已经能够证明深度卷积GAN生成的人工数据可用于增强真实数据集。” “这为培训提供了大量数据,并提高了这些系统在识别罕见情况时的性能。
MIMLab通过其AI系统将扩充后的数据集与原始数据集的准确性进行了比较,发现对于常见条件,分类准确性提高了20%。在某些罕见情况下,准确性提高了约40%,并且由于合成的X射线不是来自真实的个人,因此数据集可以在医院场所外供研究人员随时使用,而不会违反隐私问题。
Valaee说:“这令人兴奋,因为我们能够证明这些增强的数据集有助于提高分类准确性,从而克服了将人工智能应用于医学的障碍。” “只有在训练数据量足够大的情况下,深度学习才能起作用,这是确保我们拥有可以对图像进行高精度分类的神经网络的一种方式。