基于人工智能模型的新冠肺炎诊断-洪岳博士

2023-08-15

摘要:科学家表明,早期诊断新冠肺炎和自我隔离有助于遏制病毒的传播。因此,有必要开发早期快速诊断该疾病的方法。本研究的重点是开发和使用基于人工智能的模型,该模型将帮助医学专业人员轻松快速地检测新冠肺炎,这些疾病可以在X射线图像、CT扫描图像和患者症状中找到。然后,该模型将被部署到网络上,以便于访问。为了提高模型决策的可信度,部署了不同的数据增强技术来创建数据集的方差,从而提高模型的准确性和有效性。该项目建议使用卷积神经网络对阳性和阴性肺炎患者的肺部X射线图像进行分类。对阳性和阴性新冠肺炎患者的CT扫描图像进行进一步处理。这消除了模型的偏见。最后,将疾病的症状作为条件陈述卷积神经网络模型添加到模型中。该模型对肺炎X射线图像的总体准确率达到95%,对未观察数据的CT扫描图像的总体准确性达到89.65%。


1简介

      2019年12月,新冠肺炎在中国武汉爆发后,该病毒已广泛传播至日本、韩国等邻国,并在意大利、西班牙等欧洲国家受到打击,最终在中东和美国登陆,全球有超过1000万人受该病毒影响。据记录,全世界已有数千人死亡。据世界卫生组织(WHO)统计,预计将有更多的人受到影响。

      冠状病毒是人畜共患的,这意味着病毒可以从动物传染给人类。该病毒与由蝙蝠和骆驼传播的严重急性呼吸系统综合征冠状病毒和MERS冠状病毒相似。然而,该病毒伴有不同的症状,如发烧、干咳、疲劳、痰液、呼吸急促、嗅觉丧失、肌肉疼痛、喉咙痛、发冷和鼻塞。

       最近的研究表明,病毒不能通过阴道或肛门性交传播,而是通过感染者鼻子和嘴巴的飞沫传播,尤其是通过亲吻、咳嗽和打喷嚏传播。血浆疗法等不同的临床试验被用作管理病毒的手段。目前,世界卫生组织已接受羟基氯喹用于治疗新冠肺炎的人体试验。

       肺炎是新冠肺炎的明显症状之一,是一种致命的呼吸道感染和炎症,通常由吸入的细菌和病毒引起,两者具有肺炎链球菌的相同特性。这种疾病通常伴有高热、剧烈胸痛、呼吸急促和咳嗽痰稠。了解对儿童、婴儿和老年群体的临床影响对于遏制病毒传播至关重要。从肺部的X射线扫描和CT扫描中进行的放射学分析在疾病的早期诊断和治疗中发挥了至关重要的作用。基于人类智慧的决策容易出错。

       世界各地的研究人员已经找到了将人工智能用于医学诊断和更快决策的方法,这反过来又有助于支持医学专业人员已经做出的预测。

       由于病毒的偶然性很高,很难获得可用的数据,导致采用其他预测手段。从感染者身上采集液体样本是不可取的,因为病毒已经显示出在表面存活一段时间的能力。这就是为什么分子测试方法被世界各地的科学家所接受,并且正在非常谨慎地进行。

       大多数研究表明存在偏见,因为大多数模型仅基于肺炎患者的X射线数据,而忽略了其他因素。需要注意的是,肺炎可能由流感等不同因素引起,这意味着仅凭X光数据进行诊断是不完全可接受的。

       因此,本文研究了X射线图像、CT扫描图像以及新冠肺炎的其他症状的使用,以开发一种AI模型,使该疾病能够快速、简单和早期诊断。


2技术路线

       数据增强(DA)被称为通过创建具有少量方差的图像的修改版本来人为地增加训练数据集的大小的过程。数据扩充通常是为了提高数据集的训练精度,以便模型从添加到图像的不同方差中更好地泛化。添加到图像的方差是宽度偏移范围、剪切范围、高度偏移范围、缩放范围、水平和垂直翻转。所有这些技术通常在图像数据集上执行,为训练数据集创建更多变量。

       这是诊断系统的第一步。收集的数据有5种类型,即:肺部X射线图像、肺部CT扫描、体温(发烧)、疲劳(声音问题)和干咳问题。获得的X射线图像数据约为5000多张。X射线图像分为三类,即:健康肺部图像、肺炎细菌图像和肺炎病毒图像,每类图像等分。此外,从github.com获得了373例病毒阳性病例和373例病毒阴性病例的横向CT扫描图像,共746张图像。

       图像处理是一种图像操作,旨在提高图像质量,提取有助于进一步研究图像的特定特征。这一过程是针对X射线和CT扫描图像进行的。

       收集的X射线和CT扫描图像是灰度形式的,这反过来有助于模型毫无问题地读取图像。RGB图像的大小是灰度图像的3倍,这意味着RGB比灰度图像具有更高的强度。

       直方图均衡是用于调整图像强度以增强对比度的技术。它给出了图像的直方图表示。

       卷积神经网络的工作原理基本上类似于人眼,它是一类用于分析视觉图像的深度学习。神经网络中的卷积层将图像转换为像素数,以便于阅读。卷积层的输出体积是通过沿深轴堆叠所有滤波器的激活图来获得的。尽管每个滤波器的宽度和高度都小于激活图的输入,但只有输入体积的有限局部区域与每个神经元相关。

        建立模型需要大量了解光学是如何工作的,以了解模式,从而确定它看到的是哪种图像。基本上有三层用于构建卷积神经网络层。即卷积、最大池化和完全连接的层。但该模型需要大量经验,公式为y=Xw+b。

       预训练模型的基本概念是使用已经存在的模型并调整模型以修复特定任务,如微调。Tensor flow Keras API采用不同的文档制作,用于计算机视觉和自然语言编程。一些预先训练的计算机视觉模型有XCEPTION、VGG16、VGG19、RESNET、INCEPTIONV3和MOBILENET。本研究使用了MOBILENET预训练学习,因为它使用起来更轻,并且可以很容易地与其他应用程序(如移动android应用程序等)接口。

       移动网络是由世界各地的研究人员开发的一种卷积神经网络,它对图像网络数据库中的100多万张图像进行训练,并为其分配了1000多个输出或标签。移动网络由28层组成,这是一个隐藏层,包含以下布局:全连接输入、最大池化、卷积等。

       X射线肺炎数据集的训练分为训练、验证和测试。训练数据集包含5000张图像中的70%,其余30%在验证和测试集之间平均共享。在训练数据集上总共完成了100个时期。对746个图像的CT扫描新冠肺炎数据集重复相同的过程。将数据拆分为验证集,以防止模型过度拟合,因为缺乏方差,模型会出现偏差。当模型在没有足够数据和参数来检查训练准确性的情况下过度训练时,就会发生过度拟合。

       数据的训练是在神经网络模型中完成的,这使模型能够更好地理解图像模式。具有一些不同的超参数,如学习率、历元、批量大小和交叉验证。


3. 结果分析

       统计分类的这个主题是在机器学习的这个领域。它通常被称为误差矩阵,因为它显示了允许算法输出可视化的各种布局,这在大多数管理学习中是典型的。

       肺炎数据的混淆矩阵有4种不同的布局,表示不同的情况。917张图像被留作模型测试,247张TP(真阳性)、5张FP(假阳性)、635张TN(真阴性)和30张FN(假阴性)。这表明模型性能尚可。

       对新冠肺炎数据的CT扫描图像进行了相同的处理,结果如下。结果如下:TP=12,TN=3,FP=14,FN=0。

       分类问题的性能使用AUC(曲线下面积)和ROC(受试者操作特征)曲线。它在评估用于检查模型性能的指标时很重要。

       如果需要对多类别分组问题进行测试或可视化,则我们使用AUC曲线和ROC(受试者操作特征)曲线。

       AUC曲线为0.950,这意味着该模型有95.0%的机会能够区分NORMAL类和PNEUMONIA类。

       AUC曲线为0.900,这意味着该模型有90.0%的机会能够区分非新冠肺炎和新冠肺炎。


4.讨论

       新冠肺炎的早期诊断表明增加了感染者的生存机会。基于人工智能的模型也被证明有助于更快地做出决策。根据肺炎患者胸部X光胸片正面图像和新冠肺炎阳性和阴性患者的CT扫描,建立模型以正确诊断新型冠状腺炎。 

       开发模型时使用的算法首先将图像大小调整为150x150(Height by Width)的标准尺寸。对图像进行数据增强以增加图像的数量并增加图像的方差。这样有助于防止过度拟合和整体数据泛化。对图像进行图像预处理,以增强胸部图像的某些特征,然后将处理后的图像传递给卷积神经网络,卷积神经网络训练并帮助识别图像。在模型中添加了其他功能,以减少模型的偏差,例如:发烧、咳嗽和疲倦。

       面临的为数不多的限制之一是用于该项目的系统的计算能力英特尔®核心™ i3-310M CPU@2.40GHz 8.00GB RAM。因此,对于繁重的计算任务或启用GPU的系统,使用colab等云计算平台是非常可取的。深度学习方法旨在帮助医疗专业人员在做出最终决定时防止错误。它可以说是一个通过交叉检查神经网络模型和医学专业人员的神经网络模型的双向确认系统。由此可以推断,神经网络旨在帮助医疗专业人员做出准确快速的决策。


5.结论

       该模型通过了准确性和验证测试,X射线图像和CT扫描图像的总体测试准确性分别为96.18%和89.65%。AUC曲线显示,该模型能够区分正常类别和肺炎类别的概率为95.0%。此外,该模型有90.0%的概率能够区分非新冠肺炎和新冠肺炎。该模型在预测疾病诊断方面表现出色。因此,鼓励基于人工智能的模型更好、更容易、更准确地诊断新冠肺炎。