卷积神经网络综述.docx
《卷积神经网络综述.docx》由会员分享,可在线阅读,更多相关《卷积神经网络综述.docx(7页珍藏版)》请在第一文库网上搜索。
1、卷积神经网络综述作者:刘健袁谦吴广喻晓来源:计算机时代2018年第11期摘要:卷积神经网络作为深度学习的一种经典而广泛应用的结构,克服了过去人工智能中被认为难以解决的一些问题。卷积神经网络的局部连接、权值共享及下采样操作等特性使之可以有效地降低网络的复杂度,减少训练参数的数目,使模型对平移、扭曲、缩放具有一定程度的不变性,并具有强鲁棒性和容错能力,也易于训练和优化。文章介绍了卷积神经网络的训练方法,开源工具.及在图像分类领域中的一些应用,给出了卷积神经待解决的问题及展望。关键词:深度学习;卷积神经网络;网络结构;训练方法中图分类号:TP183文献标志码:A文章编号:1006-8228(2018
2、)11-19-04Abstract:Asac1assica1kindofwide1yusednetworkstructureindeep1earning,convo1utiona1neura1networkshassuccessfu11yso1vedsomeprob1emswhichwereconsidereddifficu1ttoso1veinartificia1inte11igenceinthepast.Thecharacteristicssuchas1oca1connections,sharedweights,under-samp1ingetc.canreducethecomp1exit
3、yofnetworksandthenumberoftrainingparameters,andcana1somakethemode1creatinginvariancetotrans1ation,distortionandzoomandhavingstrongrobustnessandfau1tto1erance.Soitiseasytotrainandoptimizeitsnetworkstructure.Thispaperintroducesthetrainingmethods,opensourcetoo1sofconvo1utiona1neura1networksanditsapp1ic
4、ationsinthefie1dofimagec1assification,theprob1emsandprospectsoftheconvo1utiona1neura1networktobeso1vedaregivena1so.Keywords:deep1earning;convo1utiona1neura1networks;networkstructure;trainingmethod0引言人工神经网络(Artificia1Neura1Network,ANN)是对生物神经网络的一种近似模拟,是由大量神经元通过相互连接而构成的自适应非线性动态网络系统。1943年,心理学家MCCU1k)Ch和
5、数理逻辑学家PittS提出了第一个神经元数学模型,称为MP模型。他们通过MP模型提出了神经元的形式化数学描述和网络结构方法,证明了单个神经元能执行逻辑功能,从而开创了人工神经网络研究的时代。60年代,RoSenbIa1t在MP模型基础上提出了单层感知器模型,但是单层感知器网络模型不能够处理线性不可分问题。直到1986年,RUmeIhart3等人提出了BP算法解决了单层感知器不能解决的问题,掀起了神经网络在机器学习中的研究热潮C神经网络中的大量参数,容易发生局部最优、过拟合、训练时间长的缺陷。2006年,HintOn4等在Science上提出了深度学习,这篇文章的两个主要观点是:多隐层的人工神经
6、网络具有优异的特征学习能力,学习到的数据更能反映数据的本质特征,有利于可视化或分类;深度神经网络在训练上的难度,可以通过逐层无监督训练有效克服。Beng沁系统地介绍了深度学习所包含的网络结构和学习方法。目前,常用的深度学习模型有深度置信网络(DeepBe1iefNetwork,DBN)5-6s层叠自动去噪编码机(StackedDenoisingAutoencoders1SDA)7-8x卷积神经网络(Convo1utiona1neura1network,CNN)9-10等O1 CNN概述神经网络包括输入层、隐藏层和输出层,如图1所示。卷积神经网络是一种带有卷积结构的深度神经网络,卷积结构可以减少
7、深层网络占用的内存量,也可以减少网络的参数个数,缓解模型的过拟合问题。卷积神经网络中隐藏层是重要组成部分。经典的CNN由输入层、卷积层、下采样层(也称池化层)、全连接层及输出层组成。典型的1eNet-59是经典的CNN结构,如图2所示。卷积层和下采样层一般会取若干个,采用卷积层和下采样层交替设置,即一个卷积层连接一个下采样层,下采样层后再连接一个卷积层,依此类推。由于卷积层中输出特征面的每个神经元与其输入进行局部连接,并通过对应的连接权值与局部输入进行加权求和再加上偏置值,得到该神经元输入值,该过程等同于卷积过程,CNN也由此而得名9。1卷积层卷积核是卷积层的重要组成部分。特征提取器是卷积核的
8、本质,其主要作用是自动提取输入信号的深层信息。卷积层由多个特征面组成,每个特征面由多个神经元组成,它的每一个神经元通过卷积核与上一层特征面的局部区域相连。上一层的特征图被一个可学习的卷积核进行卷积,然后通过一个激活函数,就可以得到输出特征图。每个输出特征图可以组合卷积多个特征图的值11:其中,Wj称为卷积层1的第j个通道的净激活,它通过对前一层输出特征图Xi1-I进行卷积求和与偏置后得到,X1j是卷积层1的第j个通道的输出。f()称为激活函数,通常可使用SigmOid和tanh等函数。Mj表示用于计算UIj的输入特征图子集,kjij是卷积核矩阵,Mj是对卷积后特征图的偏置C对于一个输出特征图x
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卷积 神经网络 综述