基于注意力机制和FasterRCNN深度学习的海洋目标识别模型.docx
《基于注意力机制和FasterRCNN深度学习的海洋目标识别模型.docx》由会员分享,可在线阅读,更多相关《基于注意力机制和FasterRCNN深度学习的海洋目标识别模型.docx(15页珍藏版)》请在第一文库网上搜索。
1、摘要:为进一步提升对复杂海洋目标的检测能力,引入自适应尺度的注意力机制,提出一种适应多尺度复杂海洋目标的改进FaSterRYNN模型,该模型通过将卷积网络与SKNet网络相结合,增强模型的特征提取能力与特征有效性,并针对船舶、蛇排、红树林、海岸线4类典型海洋目标,利用91卫图助手与无人机高清影像建立了12OOO张样本库,分别基于改进的FaSterRYNN模型与原模型进行对比测试试验。结果表明:改进的模型虽然略微增加了计算量,但其特征提取能力与目标检测能力明显强于原模型,整体识别准确率为87.1%;在4类典型海洋目标中,船舶的识别准确率最高,可达94.4幅而红树林由于其特征比较复杂,边界不明显,
2、其整体识别准确率为75.1%。研究表明,引入SKNet网络的FaSterRVNN网络模型,不仅增强了模型对多尺度复杂目标的特征提取能力,更适用于对复杂海洋目标的检测与识别。关键词:注意力机制;SENet模型;SKNet模型;区域候选网络;FasterRYNN模型;目标检测;深度学习随着中国经济社会的高速发展,沿海地区对于海洋资源的开发力度持续加大,中国海洋管理面临着越来越严峻的挑战,受开发理念(重开发轻治理)、开发方式(粗放式开发为主)、监管困难及利益驱动等多方面的影响,中国沿海违规开发(偷填、超填、闲置)、随意围垦、盗采海砂,以及非法挖矿采石、破坏红树林等生态环境、偷排与倾倒垃圾等行为频发,
3、使中国的海洋资源与生态环境遭到严重破坏。目前,常用的海洋监管与执法方式主要依赖于执法船巡逻、群众举报、雷达监测,前两者成本高、效率低,且具有严重的滞后性和较高的漏检率;后者则建设、维护成本巨大,且只能监测近岸半径约20公里区域。虽然近年来卫星遥感与无人机的广泛使用促进了监管手段的升级,但是对海量的影像数据进行人工审核仍然是一项十分艰巨的工作。因此,采用目标检测方法实现从海量影像数据中自动提取海洋目标信息,对于建立大范围、智能、快速的海洋监管机制具有十分重要的意义。目前,基于人工智能技术的目标检测技术已在多个领域得到了较好的应用。然而,将人工智能技术用于海上目标检测方面的研究和应用还相对较少。主
4、要原因包括:D样本集建立困难,目前尚无公开可用的海上目标检测数据集;2)传统的目标检测方法大多需要人为设定目标的特征,工作量大且难以选取出最优特征;3)海洋目标图像场景复杂,具有多尺度、多样性、形状多变等特点,目前常用的图像特征提取方法,如HOG(histogramoforientedgradient)+SVM(supportvectormachine)DPM(deformab1epartsmode1)等,对光照、形态变化、遮挡等鲁棒性不强,难以满足复杂多变的海洋目标检测需求。近年来,深度学习技术在目标检测领域取得了较大成功,这为实现多尺度的复杂海洋目标检测提供了一种新的解决方案。因此,国内外
5、学者开始研究基于深度学习模型的海洋目标检测方法,如袁明新等提出一种基于深度学习的海上舰船目标检测方法,该方法利用卷积神经网络、区域建议网络及FaStR-CNN检测框架构建了舰船检测系统,相比于传统机器学习目标检测模型,该舰船检测系统在检测精度及速率上均有大幅提高。但是,该方法只尝试了针对舰船这种特别明显的目标识别,并未对多尺度多类型的其他海上目标(蛀排、红树林、海岸线、养殖池塘等)进行识别,也未对识别后的目标进行行为活动分析。本研究中,依托自有的无人机高清影像及91卫图助手影像等基础数据,以FaSterRYNN模型为技术框架,引入视觉注意力机制,改进模型结构,使模型具有更强的复杂特征提取能力与
6、鲁棒性,实现对复杂海洋目标的检测与识别,并建立智能识别模型,以期用于海上目标的智能识别、非法用海占海与破坏生态环境行为的自动判断与预警。1相关网络模型为了增强卷积网络的特征提取能力,越来越多的研究人员将神经学的视觉注意力机制引入到深度学习模型中。一般通过三大注意力域来研究软注意力机制的网络模型结构,即空间域、通道域和混合域。通道域是相当于在每个channe1的信号上增加一个权重,用来代表此channe1与关键信息的相关度,权重越大则相关性越高。SENet(squeeze-and-excitationnetworks)是2017年ImageNet分类比赛的冠军模型,也是通道域的代表网络模型。SK
7、Net(Se1eCtiVekerne1networks)出自2019CVPR的一篇论文,是SENet的加强版。SENet与SKNet在注意力机制中处于同等地位,均可方便地融入FasterR-CNN模型中,对分类问题中的特征提取能力有一定提升。11SKNet模型将原图经过一系列的Conv、poo1ing操作,得到一个CHW(C表:示channe1,表示height,/表示Width)大小的featuremapoSENet模型是对featuremap的通道注意力机制的实现,而SKNet模型则是针对卷积核的注意力机制的实现。不同大小的目标会对不同大小的卷积核敏感程度不同o因此,SKNet试图针对不同
8、的图像找到最合适尺度的卷积核,即对不同的图像动态生成卷积核。其本质就是在网络中使用多尺寸的卷积核,与InCePtiOn网络中的多尺度不同,SKNet是让网络自己选择合适的尺度。SKNet结构如图1所示,其主要包括3部分操作:图1SKNet模型结构Fig.1StructureofSKNetmode1I)SP1it处理。对输入的featuremap使用两个大小不一样的卷积核进行groupconvo1ution(efficientgrouped、depthwiseconvo1utionsbatchnormaIizationRe1Ufunction)等操作,以提升精度。2)FUSe处理。通过SPIit
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 注意力 机制 FasterRCNN 深度 学习 海洋 目标 识别 模型