NVIDIA DGX-1 助力中原工学院纺织图像智能检测与分析研究

案例简介

中原工学院图像分析与机器视觉实验室围绕学校纺织特色，结合自身学科优势，对基于深度学习的纺织图像表面缺陷开展相关研究。为解决大规模织物疵点图像集训练时间较长问题，实验室购置NVIDIA DGX-1超级计算设备，利用DGX自带的NGC快速搭建深度学习软件平台，大大缩减课题研究的平台搭建时间，加速提升科研课题进程。

Case Introduction

• Zhongyuan Institute of Technology image analysis and machine vision laboratory based on the school’s textile characteristics, combined with their own discipline advantages, based on deep learning of textile image surface defects to carry out related research. In order to solve the problem of long training time of large-scale fabric defect image set, the laboratory purchased NVIDIA DGX-1 supercomputing equipment, and used The NGC brought by DGX to quickly build a deep learning software platform, greatly reducing the construction time of the research platform and accelerating the process of scientific research.

背景

中原工学院（原郑州纺织工学院）图像分析与机器视觉河南省工程实验室长期从事基于机器视觉的纺织表面缺陷检测研究工作，实验室具有比较完善的基于机器视觉的纺织图像检测软硬件开发和仿真环境。

纺织工业是我国传统支柱产业、重要民生产业和创造国际化新优势的产业。在当前的纺织工业生产中，数字图像分析技术得到了广泛的应用。织物图像分析的核心内容对象主要是织物（面料），对它的纹理、颜色等属性的智能化分析技术愈显重要，已经引起纺织领域专家学者的广泛关注，也是纺织服装智能制造的关键内容。

挑战

现有基于机器视觉的织物疵点检测与分析系统主要在纹理相对简单的工业用布上取得了初步应用，由于精度有限，只能作为辅助粗筛工具，仍需验布工对检测结果进行二次核查。而面向纹理复杂的色织布、图案布的疵点检测与分析系统目前未见成功应用案例报道，国内外仍处于研发阶段。在织物疵点自动检测与分析方法研究方面，目前的研究成果大多采用传统的图像处理或模式识别方法，通常需要对一定规模的样本进行统计分析以构建疵点模型。由于传统处理方法难以对复杂纹理背景下种类繁多的疵点进行准确表征，且对织物纹理与疵点类型的改变和增加不具自适应性，导致检测与分析的准确率低；因此，需要结合最新人工智能技术，研究有效的机器视觉系统，实现疵点的智能检测与识别。

深度学习在语音识别、图像分类及目标检测等多个方面成效明显，以卷积神经网络(CNN, Convolutional Neural Network)为代表的深度学习模型通过对大数据样本的学习完成对抽象概念的理解，显著提升了传统检测及识别问题的正确率，使构建大规模织物图像驱动的深层次、复杂纹理疵点模型成为可能。

与浅层网络模型相比，深度学习模型能够充分发掘大数据蕴藏的内部丰富信息。相应地，模型也更复杂，学习参数也更多，因此有效模型的训练必须有大数据样本的支撑。另一方面，目前采用标记样本的深度学习处于主流地位，而在实际应用中存在着不断增长的海量无标记样本，为这些样本打上标签是一项耗时耗力的任务。因此，针对无标记数据的深度学习，以及随着数据量增加能够持续学习的在线深度学习方法是一个需要重点研究的方向。再一方面，高层的卷积层特征损失了很多细节信息（pooling 操作），所以定位精度不高，需要采用如多种特征融合、上下文信息等措施进一步提高检测性能。

针对产量大、疵点率较高的低端用布，疵点样本的采集相对容易，因此能够满足深度学习对大样本的需求。在满足具有足够多样本的前提下，深度网络模型能够学习并提取大样本更抽象的特征，并对多形变、多尺度问题具有很好的鲁棒性，为大数据样本条件下的疵点检测识别提供了有效的手段。织物图像纹理丰富，低层的纹理特征对于检测识别更为重要。因此利用深度网络的多层特征融合进行目标检测，在利用高层特征信息前提下，考虑低层特征的细节纹理信息，也是课题的重点研究方向。

由于每张织物疵点图片要处理大量的目标候选框，测试时间长，需要消耗大量的计算资源；而且算法对图片的分辨率精度也有一定要求，需将图形全部输入到网络中，使得处理每一张图片所使用的空间大，导致花费时间非常多。而NVIDIA DGX-1超级计算机独有的NVLink架构可以降低GPU在训练图片识别过程中的通信延迟，增大GPU之间的传输带宽，共享GPU显存的模式就可使单次训练输入更多的图片数据，大大降低了测试以及训练的消耗时间。

方案

为快速搭建深度学习训练平台，加快纺织图像表面缺陷科研课题研究进度，中原工学院引进了NVIDIA DGX-1AI超级计算机，用于推动图像分析与机器视觉实验室在机器视觉领域的研究布局。实验室研究员利用NVIDIA最新的NGC软件平台和Tesla V100 Tensor Core，基于SSD、YOLO算法开展织物缺陷的识别与定位。通过构建一个深度神经网络，将图像和标注位置作为样本输入，然后经过CNN网络，再通过一个分类头（Classification head）的全连接层识别是什么物体，通过一个回归头（Regression head）的全连接层回归计算位置，从而在图片中将里面的物体识别出来，并标出物体的位置。

1. 利用NVIDIA DGX-1最新的基于Volta架构的Tesla V100，在场景目标识别训练过程中，可以大幅度提升深度学习训练的计算性能，特别是结合专为深度学习设计的全新 Tensor Core，单张V100每秒平均训练的图片是双路CPU服务器的30倍以上；同时，DGX-1独有的NVLink互联架构，可以大大加快超大训练集的训练速度，极大地提升了科研进度。

2. 结合DGX最新的NGC软件系统，实验室研究员和学生可快速搭建深度学习训练平台，不管是TensorFlow、PyTorch或者MxNet，只需要一键下载部署深度学习镜像，便可以快速进入所需要的框架平台。同时，最新的NGC平台，也加入了预先训练的AI模型、模型训练脚本，可以方便实验室学生借助这些工具快速融入人工智能的学习环境。

影响

凭借DGX-1超强的计算能力，极大地提升了实验室在研究场景目标识别和定位科研课题的研究进度，进一步提升了实验室学生搭建深度学习平台的速度，降低了人工智能研究的门槛，为进一步提升实验室在机器视觉综合实力奠定了非常好的硬件计算基础。

中原工学院研究员表示：“在纺织图像缺陷识别与定位领域，中原工学院正依托图像分析与机器视觉省工程实验室，结合最新的DGX-1以及当前的科研课题，为后期开展新的人工智能新专业奠定良好的基础。而对于最新更新的NGC平台，实验室不仅利用深度优化的深度学习框架容器开展科研课题研究，最关键的在于利用NGC平台可以快速搭建现场人工智能教学平台，并结合预先训练的AI模型、模型训练脚本和行业专用软件堆栈，可使学生更快地迈入人工智能门槛，掌握基础而通用的人工智能模型。需要的人工智能应用程序或者模型都有共同的需求，不管是场景目标识别、对象检测、语言翻译、推荐引擎以及情感分析等，在开发以及研究这些课题过程中，如果根据一个预先训练的模型进行调整，要比从头开始快得多。