- 文献综述(或调研报告):
在当今社会,图像识别技术被广泛应用,并且在各个领域发挥着极其重要的作用。好的识别技术是关键所在,怎么样提高识别率和识别的速度意义重大,直接关系到图像识别的实用性和安全性。深度网络的多层结构相比浅层网络,能用更简洁的方式表达复杂函数,能学习得到深层的特征表示[1]。
图像分析的首要步骤在于对他的准确分割,所谓的图像分割是将图像按照色彩信息、灰度信息、纹理信息、几何外形等不同条件划分成多个不重叠的子块,使显示出一致性特征的元素处在同一子块内,而表现出不同特性的元素分处在不同子块[3]。传统的图像分割算法大体可以分为:基于边缘的检测算法,基于阈值分割法,区域的的生长和分裂合并法等。其中阈值分割法是当前最常用的直接检测区域的分割方法,实现简单,计量小,当前景和背景处在不同的灰度级时适宜选取这种方法,通过划分不同的阈值,将图片中的像素进行分类,从而达到分割的目的[3]。
在机器学习总体研究中,深度学习只是属于研究中的一个新的方向,其主要目的是通过构建一系列多层的学习模型,对其大量数据进行训练,提取相对学习有更用的特征信息,这样可以对一些信息进行有效预测,提高准确度[2]。它的基本特点是试图模仿大脑的神经元之间传递,处理信息的模式。最显著的应用是计算机视觉和自然语言处理(NLP)领域。显然,“深度学习”是与机器学习中的“神经网络”是强相关,“神经网络”也是其主要的算法和手段;或者我们可以将“深度学习”称之为“改良版的神经网络”算法。深度学习可以将一些内部基本特征于数据联系进行分类,通过不断训练将其运用到无监督学习中,其可作为预训练部分。相比传统方法,该深度学习模型具有一些优势,如,较好的分类能力。在深度学习中,其模型可以分为卷积神经网络(convolutional neural networks,CNN)、堆栈自编码网络(stacked auto-encoder network)、深度信念网络(deep belief network,DBN)等[2]。
卷积神经网络(CNN)在图像分割、分类、识别领域取得了优异的实际应用效果。CNN具有多层的网络结构,能够自下而上地从图像中提取特征。浅层的网络能感知较小的区域,提取的特征相对是具体的、抽象的,而深层的网络能够感知更大的区域,他提取的特征模糊了细节信息,能反映整体的空间架构。由下而上不同程度的特征提取,使CNN能够很好地概括物体的本质特征,有利于提高分类的精度。尽管CNN具有吸引人的品质,并且其本地架构相对有效,但将它大规模应用于高分辨率图像成本仍然非常昂贵。 幸运的是,当前的GPU与2D卷积的高度优化实现相结合,功能强大到足以帮助训练有趣的大型CNN[4]。
与分类不同的是,语义分割需要判断图像每个像素点的类别,进行精确分割。图像语义分割是像素级别的。但是由于CNN在进行convolution和pooling过程中丢失了图像细节,即feature map size逐渐变小,所以不能很好地指出物体的具体轮廓、指出每个像素具体属于哪个物体,无法做到精确的分割[6]。
针对这个问题,Jonathan Long等人提出了Fully Convolutional Networks(FCN),针对语义分割训练一个端到端,点对点的网络[6]。与经典的CNN在卷积层之后使用全连接层得到固定长度的特征向量进行分类(全联接层+softmax输出)不同,FCN可以接受任意尺寸的输入图像,采用反卷积层对最后一个卷积层的feature map进行上采样, 使它恢复到输入图像相同的尺寸,从而可以对每个像素都产生了一个预测, 同时保留了原始输入图像中的空间信息, 最后在上采样的特征图上进行逐像素分类。与之前的模型相比,FCN显得更加优雅[7]。简单的来说,FCN与CNN的区别在于把CNN最后的全连接层换成卷积层,输出的是一张已经Label好的图片[6]。卷积化,上采样,跳跃结构是FCN所用到的三种技术。FCN的出现很大程度上改善了对象检测和语义分割结果[5]。
而在2019年,谷歌又提出一个网络,称为EfficientNets,它的精度和效率比之前所有的卷积网络都好。为了获得更好的精度,放大卷积神经网络是一种广泛的方法。然而,放大CNN的过程从来没有很好的理解过,目前通用的几种方法是放大CNN的深度、宽度和分辨率,在之前都是单独放大这三个维度中的一个,尽管任意放大两个或者三个维度也是可能的,但是任意缩放需要繁琐的人工调参同时可能产生的是一个次优的精度和效率。实验研究表明了平衡深度、宽度和分辨率这三个维度是至关重要的,这样的平衡可以通过简单的使用一组常量比率来缩放每一个维度,使用一组固定的缩放系数统一缩放网络深度、宽度和分辨率[8]。
火焰图像识别目前多用于火灾检测,传统的火灾检测方法依靠传感器对火灾发生时产生的亮光、热量和烟雾浓度等的检测,间接判断火灾是否发生[9]。随着数字图像处理技术的发展,通过视频火焰检测来实现火灾预警的方法日益受到人们的广泛关注。在深度学习技术流行之前,火焰主要通过从视频图像中提取特征进而通过设定阈值来检测或通过 SVM、随机森林等分类器进行分类识别[9]。深度学习技术的兴起,使火焰特征提取实现自动化,通过设计卷积神经网络可以实现对于火焰特征的自动提取和分类识别。王光耀采用适合图像处理的卷积神经网络来进行火灾检测工作,并在 CNN 的输出分类层分别使用逻辑回归 LR 和支持向量机 SVM 对图像进行分类,从而完成识别工作。通过实验表明,基于深度学习的火灾检测算法的准确率已超过一般传统算法。使用传统图像处理技术对火灾进行识别工作,由于受特征选取是否合理的影响,会使得其识别准确率有所限制;而许多学者在火灾识别领域应用了深度学习技术,大多都是直接将数据送入网络进行训练,如此会造成特征学习的冗余以及训练时长的损耗[10]。所以将传统图像处理技术与深度学习技术结合来研究图像识别方法或许能有更好的成效。
参考文献:
- 丰晓霞. 基于深度学习的图像识别算法研究[D].太原理工大学,2015.
- 苏雪霞.基于深度学习的CT图像识别方法的研究[J].信息通信,2019(10):12-13.
- 翁健. 基于全卷积神经网络的全向场景分割研究与算法实现[D].山东大学,2017.
- Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks[C]//Advances in neural information processing systems. 2012: 1097-1105.
- He K, Gkioxari G, Dollaacute;r P, et al. Mask r-cnn[C]//Proceedings of the IEEE international conference on computer vision. 2017: 2961-2969.
- Long J, Shelhamer E, Darrell T. Fully convolutional networks for semantic segmentation[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2015: 3431-3440.
- Ronneberger O, Fischer P, Brox T. U-net: Convolutional networks for biomedical image segmentation[C]//International Conference on Medical image computing and computer-assisted intervention. Springer, Cham, 2015: 234-241.
- Tan, Mingxing, and Quoc V. Le. 'Efficientnet: Rethinking model scaling for convolutional neural networks.' arXiv preprint arXiv:1905.11946 (2019).
- 薛港城. 基于深度学习的火焰检测算法研究[D].西安电子科技大学,2019.
- 任杰英. 基于卷积神经网络的图像型火灾识别方法研究[D].西安科技大学,2019.
以上是文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。