基于SAM木材板缺陷分割方法-滕达博士

2023-08-29

一、引言

1.1背景和意义

      我国是制造大国,在经济全球化的驱动下,为了提高我国制造业生产加工企业在国际市场中的竞争力,必须加强制造业在生产中的质量检测。习近平总书记在参加十四届全国人大一次会议江苏代表团审议时强调,要坚持把发展经济的着力点放在实体经济上,深入推进新型工业化,强化产业基础再造和重大技术装备攻关,推动制造业高端化、智能化、绿色化发展,“任何时候中国都不能缺少制造业”。制造业是立国之本,强国之基。党的十八大以来,以习近平同志为核心的党中央把大力发展制造业和实体经济摆在更加突出的位置,作出建设制造强国的战略部署。全国工业战线深入贯彻落实党中央的决策部署,踔厉奋发、勇毅前行,中国制造业核心竞争力不断增强,产业科技创新水平和能力迈上新台阶,引领我国制造业实现历史性跨越。

       目前,生产桌面的企业仍然依靠拥有丰富经验的员工进行人工检测。人工检测过程中,某些缺陷会让人产生视觉疲劳,导致很多误判。容易收到外界干扰,检测效率难以得到保证; 每个人对于瑕疵的判断都尽不相同,主要依据肉眼检测,难以形成可以量化的质量标准;这种方法效率低下,而且容易出现漏检和错检的情况。对员工的培训和雇佣也会增加企业的预算成本,不利于国际市场的竞争。一些单一机理识别技术和传统的机器视觉识别方法由于成本较高、鲁棒性不强、适用面窄等原因不适合工业应用。随着科技的不断进步,基于深度学习技术的产品表面缺陷检测方法应运而生。

      经过一系列算法处理最终在电脑端可以显示出产品的缺陷信息以及产品的缺陷位置。相比较于人工缺陷 检测 的算法,基于计算机视觉的技术具有很多优点:

    (1)基于计算机视觉的缺陷检 测有一套固定的检测标准,检测结果稳定。

     (2)计算机可以保持全天 24 小时高强度 的工作 ,并且工作效率保持不变,可以省去大量的人力资源,减少产品的成本。

     (3)基于计算机视觉的表面缺陷检测技术拥有比人工更快的检测速度和更高的精度,并且在检测的过程中还能准确定位缺陷的位置。

     (4)随着新一代信息技术与制造业的深入融合,引发制造业产生巨大变革,逐步从数量扩增向质量提升转变。通过提升产品质量,减少人工成本,来生产高利润的产品,可以实现产品竞争力的跃升


1.2研究目的和重要性

      本文检测的缺陷主要指制造上的缺陷,是产品在加工、制作、装配等制造过程,不符合设计规范,或者不符合加工工艺要求,没有完善的控制和检验手段,致使产品存在不安全的因素,包括影响使用,存在安全隐患和不影响使用仅影响产品外观的缺陷。影响使用的例如:齿轮的缺牙,瓦片的裂痕等,不影响使用的例如:布料的污渍等。

      桌面缺陷分割在计算机视觉领域具有重要性。首先,桌面缺陷分割可以应用于质量控制和产品检测领域。通过准确地分割出桌面上的缺陷区域,可以帮助企业实时监测和检测产品的缺陷,提高产品的质量和可靠性。利用桌面缺陷分割技术,可以实现对生产过程的自动化监控和控制。通过自动识别和分割缺陷,可以实时调整生产流程,降低人工干预的成本和时间,提高生产效率。其次,桌面缺陷分割可以帮助企业在生产过程中更精确地定位和分割出缺陷区域,从而减少废品产生和资源浪费。通过及时发现和处理缺陷,可以降低生产成本并提高资源利用率。最后,桌面缺陷分割是计算机视觉领域的一个重要研究方向。相关的科学研究和技术创新将推动计算机视觉领域的发展,为其他领域的自动化和智能化提供技术支持。


二、相关工作

2.1国内外研究现状

       国内文献中关于缺陷检测的算法主要包括使用基于迁移学习技术的多尺度检测网络检测表面缺陷,并采用特征图可视化的技术直观的分析模型各个层学习到的缺陷特征,极大的提高了准确率和检测速度。还有使用基于ResNet50 分类算法对光滑反光工件表面缺陷进行识别,但是此算法只能识别单一缺陷,不能识别同一张图的多种缺陷,存在局限性。也有使用胶囊网络,针对训练的参数量、网络结构、收敛速度进行改进,实现缺陷检测。

国外缺陷检测主要有有人工识别、涡流检测法、漏磁检测、红外检测法和机器视觉识别等方法。传统的人工检测方法检测率低,实时性差,操作繁琐,环境适应性差,不适用于工业实时检测要求。涡流检测法不能检测出缺陷的形状和大小,并且很难检测出一些很深的缺陷。而漏磁检测法只适合于磁铁材料。


2.2主要研究方法和过程

   (1)查阅缺陷检测相关文献,并实地考察,确定可执行的方案。

   (2)对图像采集硬件系统和外观缺陷检测算法进行研究。外观缺陷检测算法研究主要是研究缺陷检测算法,选择合适的缺陷检测算法,针对外观进行算法优化。

   (3)利用计算机辅助设计分析,制定初步方案,包括硬件选型与搭建,外观缺陷数据集准备,软件设计草图绘制等。

   (4)进行系统设计与试验,其中缺陷检测模型建立,软件原型设计。

   (5)优化参数与调试,其中包括硬件模型优化,检测模型优化,软件设计优化。

   (6)总结,其中包括硬件设计、检测算法改进、软件设计的成果总结


三、算法设计

3.1算法原理

       我们所采用的所采用的计算机视觉方法和技术是基于Segmentation Anything Model模型进行桌面缺陷分割。该模型旨在解决CV领域中的分割任务,并引入了类似NLP中prompt的范式,为CV基础模型提供更广泛的支持和深度研究。

      SAM模型的出现统一了分割任务的下游应用,将CV领域的大模型的可能性展现出来。它的出现将对CV研究带来重大的变革,为各种任务提供统一的处理方式。可以预见,类似SAM这样的范式在学术界将迎来一次爆发,对CV的研究将产生巨大的影响。不久的将来,检测、分割和追踪等任务可能会实现更全面的一体化解决方案。

SAM模型具有新数据集和超强的零样本泛化能力,这将为CV领域带来新的挑战和机遇。通过这种新的范式和方法,研究人员可以更好地探索和应用CV技术,提高分割任务的准确性和效率。SAM模型的出现标志着CV研究进入了一个新的阶段,将为CV领域的发展开辟新的道路。

图片1.png

                                                          图3.1 桌面缺陷展示

       SAM模型的优势在于其能够高度精确地分割桌面缺陷,无论缺陷的形状和大小如何。它能够捕捉到图像中细微的细节和语义信息,提供准确的缺陷边界和分割结果。这种方法在桌面缺陷分割任务中具有较高的性能和适用性。


3.2算法流程

     1.数据准备:首先,需要收集和准备带有标注的桌面缺陷图像数据集。这些图像应包括缺陷和非缺陷的示例,并使用像素级标注来指示每个像素的类别(缺陷或非缺陷)。

     2.模型训练:使用准备好的数据集,将SAM模型进行训练,以学习图像中缺陷的特征表示和语义信息。通过大规模的训练迭代,模型能够学习到对缺陷进行准确分割的能力。

     3.模型推理:训练完成后,将训练好的模型应用于新的桌面缺陷图像。通过将图像输入模型,模型将输出一个分割掩码,指示图像中缺陷的像素位置。

     4.后处理和可视化:为了得到更准确的缺陷分割结果,可以应用一些后处理技术,如形态学操作、连通区域分析等。这有助于去除噪声、填充空洞和连接分离的缺陷区域。最后,将分割结果可视化,可以通过着色或边界绘制来突出显示缺陷区域。


四、实验和结果

4.1 实施细节

图片2.png

                                                      图4.1 检测结果展示


4.2 性能比较

      相较于传统的分割方法,SAM在桌面缺陷分割中展现出了明显的优势。传统神经网络在分割任务中通常需要大量的标注数据和训练时间,而SAM则能够利用其强大的预训练能力进行零样本迁移,即使在新领域的图像上也能够快速地进行分割。SAM模型的出现统一了分割任务的下游应用,模型采用了先进的计算机视觉技术和深度学习方法,使其在分割任务中能够更好地理解图像的语义和结构。与传统神经网络相比,SAM在分割精度、鲁棒性和泛化能力方面都取得了显著的提升。它能够自动分割图像中的各个物体,无论是在训练中见过的还是没有见过的。

      传统神经网络在分割任务中可能受限于标注数据的数量和质量,对于新领域的图像往往需要重新训练或微调才能取得较好的效果。而SAM模型的零样本迁移能力使其具备了更广泛的适用性,可以快速应用于不同领域的图像分割任务,无需大量的额外训练。它以其强大的预训练能力和通用性,为分割任务提供了更高效、准确且灵活的解决方案,使得图像分割的应用变得更加便捷和可行。


五、讨论和结论

      在桌面缺陷分割应用中,采用Segment Anything Model (SAM)的方法取得了显著的成果。SAM模型的通用性和零样本迁移能力使其成为处理桌面缺陷分割的理想选择。通过SAM,我们可以实现对桌面上各种缺陷的准确分割,包括裂痕、划痕、污渍等。此外,SAM还具备交互式提示的能力,使用户能够更加精细地指导模型进行分割,进一步提高了分割结果的准确性。它还能生成多个有效掩码,为不明确的提示提供了多种选择,增强了模型的灵活性和应用范围。

       基于SAM的桌面缺陷分割应用在准确性、灵活性和用户体验方面取得了显著的改进。SAM模型的引入为桌面缺陷分割领域带来了新的可能性,为进一步提升桌面缺陷分割的效果和应用场景提供了强大的基础。随着SAM技术的不断发展和完善,我们有理由相信它将在未来为桌面缺陷分割领域带来更多创新和突破。SAM模型的出现为视觉分割任务带来了重要的突破。它的通用性和零样本迁移能力使其成为处理各种分割场景的有力工具。未来,SAM有望对计算机视觉的发展产生深远影响,并为广泛的视觉任务提供基础能力。