基于深度学习的吸烟行为检测方法研究及其应用文献综述

 2023-08-15 17:23:59

文献综述(或调研报告):

关于吸烟行为识别,之前研究者门大部分是基于视频检测技术提出吸烟检测算法,主要是使用传统模式识别方法对吸烟产生的火与烟的运动特征以及手势特征进行识别。

在黄训平等人的基于交通监控的出租车司机吸烟行为自动检测研究[1]中,先利用匹配算法实现对出租车车窗区域的识别,接着设计一组具有代表性的特征识别吸烟厌恶和抖烟动作,包括烟雾质心运动轨迹、面积增长率、抖烟频次时间间隔等;最后用支持向量机进行特征分类。相似的,在张日东出租车司机吸烟行为评价标准及自动检测算法研究[2]中,设计了一套对出租车司机吸烟行为的自动检测算法。利用吸烟行为具有明显的烟雾伴随性,针对吸烟过程产生的烟雾进行分析和检测。从烟雾的颜色特征和运动特征两方面展开研究,用svm分类器通过判定疑似烟雾区域局部时间内面积变化速率的特征和质心角度变化特征实现对烟雾的检测和吸烟行为的判定。以上基于烟雾的特征进行吸烟行为检测很适用于出租车环境,司机吸烟产生的烟雾是交通摄像头能够捕捉到的比较明显的吸烟标志,但是在其他开阔环境中,烟雾散的快,颜色淡,同时人的吸烟习惯不一,产生的烟雾更加复杂,利用烟雾检测难度大,精度会降低。

而在燕山大学王超针对吸烟行为的手势识别算法研究[3]中,基于视觉信息的分析方法,将视频监控中吸烟者的手势作为判据进行识别,分为手势区域图像分割和特征提取两个关键步骤。在手势区域图像分割的环节,通过对常用手势识别方法的分析,发现吸烟行为与其它动作行为的最大区别在于手部与脸部的不定性周期接触以及手势的方位及整体现状,提出了基于视频序列中的运动信息与两次肤色检测相结合的分割方法,提取出了准确的手势区域。在识别阶段,根据吸烟这一特定行为特点,提出了采用Hu不变矩和边缘方向直方图两种方法相结合的识别算法,利用支持向量分类器实现分类识别,达到一定准确率。这种基于传统特征提取方法识别吸烟动作的方法对手势的研究能与其它干扰动作区分开,但是模型拟合能力弱一些,准确度相较于深度学习模型低一些。

传统基于图像处理的目标识别主要包含以下部分:图像预处理。通过几何规范、图像滤波、边缘检测,来减少图像捕捉是混入的外部复杂环境干扰以及成像所致噪声干扰。图像分割。将目标与背景看成各自相似连通区域的集合,实现目标背景划分,为目标特征提取做铺垫。常用有RGB法、HIS法、固定阈值法、自动阈值法、纹理分析法、边缘检测等。目标特征提取。传统人工特征提取根据某种区域选择算法选取目标上待提取特征的区域,然后人为设计有利分类识别的目标特征进行提取,需要在目标边缘检测和图像分割基础上进行。常用特征有视觉特征、统计特征、代数特征等。目标分类。进行分类器设计,通常作用于以及建立起的特征样本训练集基础上。常用的分类器有k-距离分类器、朴素贝叶斯网络分类器、SVM分类器、支持向量机等。

传统目标检测算法适应于有明显特征,背景简单的情形。而在实际应用中,背景复杂多变,而且待检测的目标复杂多变,很难通过一般的抽象特征完成对目标的检测。近年来,随着计算机计算能力和需要处理的数据量不断提升,以及技术进步、工业生产需求提高,深度学习模型逐渐取代传统机器视觉方法而成为目标检测领域的主流算法。利用庞大丰富的数据,通过深度学习完成模型的训练,可以使得算法的健壮性更高,泛化能力更强,复杂问题上的精确度跟高,更容易应用于实际场景。与传统目标检测算法相比,卷积神经网络对特征集庞大复杂的目标实现鉴别划分,并且可对多目标并行处理。但网络模型复杂,收敛速度较慢,还容易出现过拟合问题。

基于深度学习的目标检测算法主要分为两类:RCNN系列基于区域的目标检测算法,这类算法检测精度较高,但是速度较慢;以YOLO为代表的将检测转换为回归问题求解,检测速度较快,但精度较低,对小目标检测效果不理想,目标位置过于粗糙。两阶段模型因其对图片的两阶段处理得名,也称为基于区域(Region-based)的方法, R-CNN系列工作是这一类型的代表。R-CNN将检测抽象为两个过程,一是基于图片提出若干可能包含物体的区域(即图片的局部裁剪,被称为Region Proposal),使用Selective Search算法;二是在提出的这些区域上运行当时表现最好的分类网络(AlexNet),得到每个区域内物体的类别。Fast R-CNN是检测任务主流2-stage方法所采用的元结构的雏形。它将Proposal, Feature Extractor, Object Classification和Localization统一在一个整体的结构中,并通过共享卷积计算提高特征利用效率。Faster R-CNN是2-stage方法的奠基性工作,提出的RPN网络取代Selective Search算法使得检测任务可以由神经网络端到端地完成。粗略的讲,Faster R-CNN = RPN Fast R-CNN,跟RCNN共享卷积计算的特性使得RPN引入的计算量很小,使得Faster R-CNN可以在单个GPU上以5fps的速度运行,而在精度方面达到State of the Art(SOTA)。

基于直接利用深度学习图像识别的方法进行吸烟行为检测的实例很少,我参考了其他基于Faster RCNN的目标检测算法实例,从而对我使用、训练模型以及优化改进有一定参考和启发。

在秦丽娟等基于Faster RCNN的车牌检测算法[4]中,针对传统识别车牌方法易受环境影响产生误差、不易检测较小尺度目标等问题,根据车牌特点提出改进的Faster RCNN车牌检测法,优化了候选框建议网络RPN中的候选框尺寸 ,改进了算法的分类回归方式,使用全局性的池化层替代了原有的全连接层。anchor尺度比例优化中,原Faster RCNN算法用3种尺度和3种长宽比例共9中anchor进行扫描。基于牌照尺度较小、偏长方形等特点,采用3:2,2:1,1:1,尺寸设置成64与128两种,精度不变的情况下有效提升速度。在分类回归优化中,采用全局性的池化方法代替原算法的Roihead全连接层来特征提纯,在其任务中有较好的效果。

而在徐守坤等基于改进Faster RCNN的安全帽佩戴检测研究[5]中,针对现有安全帽算法对部分遮挡、尺寸不一和小目标存在检测难度大,准确率低的问题,提出基于改进的Faster RCNN和多部件结合的安全帽佩戴检测方法,运用多尺度训练和增加锚点数量增强网络检测不同尺寸目标的鲁棒性,引入防止正负样本不均衡的在线困难样本挖掘策略,然后对检测出安全帽工人和安全帽等采用多部件结合方法剔除误检目标。在多尺度训练中,图片送入网络之前,在保证原比例的前提下,将图片随机调整为短边取3种尺寸之一。锚点数量中RPN部分采用12个锚点,能检测更多小目标。在线困难样本挖掘策略:Faster RCNN在进行模型训练时,RPN网络会随机产生大量候选区域,由于目标在图片中所占比例较小,导致负样本空间过大,正样本和负样本存在巨大失衡。引入Shrivastava等人提出的在线困难样本挖掘机制。将原始的1个ROI网络扩展成2个共享网络参数的ROI网络。其中一个只读,选出loss值较大的候选区域作为困难样本。另一个以困难样本作为输入,进行标准ROI网络训练。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。