针对城市道路的图像语义分割.docx
《针对城市道路的图像语义分割.docx》由会员分享,可在线阅读,更多相关《针对城市道路的图像语义分割.docx(10页珍藏版)》请在第一文库网上搜索。
1、针对城市道路的图像语义分割樊天宇张瑞菊(北京建筑大学,北京102627)摘要城市道路图像的语义分割具有很多的应用场景,如自动驾驶、图片或视频中广告的插入等。这些应用场景都要求分割算法具有较高的精确度,城市道路图像中具有很多尺度大小不一的目标,不同尺度的目标特别是小尺度的目标,会给精细化分割带来更多困难。针对以上问题,提出了一种基于编码器一解码器结构的语义分割网络。使用该模型以改进不同尺度目标边缘的分割精确性。针对城市道路场景的Cityscapes数据集设计相关的对比实验,实验结果证明了所提方法的有效性。关键词图像语义分割;城市道路;深度学习中图分类号U463.6;TP391.41文献标识码A文
2、章编号2096-8949 (2022) 06-0011-03引言图像语义分割一直是计算机视觉领域非常重要的研究方向,伴随着深度学习在计算机视觉中目标识别领域率破纪录,大放光彩,深度学习也在计算机视觉其他子领域应用开来,如目标跟踪、图像去噪、场景重建、图像风格转换。图像语义分割是将像素按照图像中表达语义含义的不同进行分组(Grouping)和分割(Segmentation),在2022年之前,传统方法从“阈值法”逐步发展到基于像素聚类的分割方法,2022年后,基于深度学习的图像语义分割方法开始逐渐应用自动驾驶领域。自动驾驶通过环境感知、自主决策和运动控制等一系列关键技术,实现道路交通部分甚至完全
3、自动化运行,是对传统运输模式和出行方式的一次深刻的变革。现如今,主要发达国家纷纷将其列为下一阶段重要的发展领域。据不完全统计,截至2022年末,我国汽车保有量约为28 087万辆(包括三轮汽车和低速货车748万辆),比上年末增加1 937万辆,是名副其实的汽车大国。然而我国的自动驾驶技术专利虽然申请活跃,但总体的质量偏低,产业核心竞争力也有待提升。在“十三五”国家战略性新兴产业发展规划中指出,要加速电动汽车智能化技术应用创新,发展自动驾驶。自动驾驶系统作为智能驾驶汽车的“心脏”,其主要包括智能交通系统(IntelligentTraffic System, ITS)、先进驾驶辅助系统(Advan
4、ced DriverAssistance System, ADAS)o城市道路图像的语义分割是智能交通系统以及先进辅助驾驶系统中的重要一环,是实现辅助驾驶甚至完全自动化驾驶必不可少的关键技术。目前交通事故主要是人为失误造成的,其主要包括注意力不集中、行为不端等。道路感知和道路图像的语义分割作为先进驾驶辅助系统的基础,在帮助驾驶员避免错误方面起着至关重要的作用。一些成功的自动驾驶辅助系统或汽车企业,如Mobileye,宝马、特斯拉等,都开发了自己的产品,在研究和现实应用方面都取得了显著的成就。目前成熟的自动驾驶方案几乎都采用了基于视觉的技术,例如工业高清摄像头、双目相机等。它相比于激光雷达具有更
5、低的获取成本以及更接近于人眼的感知效果。这是因为在车辆行驶过程中,摄像头采集到的图像数据具有极大的信息量。图像语义分割将图像中每一个像素按照标签进行分类,从而可以从图像中提取出丰富的驾驶环境信息,辅助决策。例如在摄像头采集到的数据中,区分出道路与绿化带,行人与车辆,判定出可行驶区域,区分出道路路面与地面交通标示,判定出道路边缘与车道线。图像语义分割是自动驾驶中的重要环节,通过对摄像头传感器采集到的信息进行特征提取分类,才能获得有利于决策模块进行决策的信息1。在现阶段的自动驾驶技术中,处理好图像中道路路面的关键性信息,将有助于提高车辆行驶决策的准确度。1全卷积神经网络道路图像是自动驾驶中视觉传感
6、器收集到的重要信息,是汽车行驶环境的重要建模依据。在传感器收集到的大量图像信息中,自动驾驶感知模块依据语义信息将图像中不同分类的目标分割开来,帮助决策模块理解场景。随着深度学习在计算机视觉领域大规模应用,卷积神经网络也自然而然地成功应用到语义分割中。目前基于深度学习语义分割模型种类很多,全卷积神经网络是目前最成功的分割模型之一,传统深度神经网络模型中,在分类器前常接一个全连接层,全连接层因为要接受固定大小的输入维度,故当卷积层输出更大维度的特征图时,无法使用全连接层进行处理,对目标尺度变化大的特征难以学习加州大学伯克利分校的Jonathan Long等人提出了全卷积神经网络模型,该模型使用卷积
7、层取代了全连接层,接受任意尺寸的图像信息作为输入,经过多层卷积与池化进行特征抽取和降维操作后,引入反卷积对最后一层卷积层上输出的特征图执行上采样操作,使特征图恢复到与输入图像相同的尺寸,从而对输入图像中每个位置的像素产生一个预测,预测像素属于哪个类别1。全卷积神经网络模型的结构由于池化对每次卷积结果的降维操作,造成图像分辨率降低,当执行到P0015时,图像的分辨率较之输入时已经变得非常低,若从该层执行上采样操作,得到的分割结果也非常粗糙。从该层执行上采样操作后,获得与输入图像一样大小的输出模型,须放大32倍,故称为FCN-32so这样的模型由于缺少大量细节信息,分割效果很差。如果将该层池化后的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 针对 城市道路 图像 语义 分割
