基于机器学习算法的数字识别app开发.docx
《基于机器学习算法的数字识别app开发.docx》由会员分享,可在线阅读,更多相关《基于机器学习算法的数字识别app开发.docx(31页珍藏版)》请在第一文库网上搜索。
1、1绪论111研究背景与意义11.2 国内外研究现状11.3 本文结构安排32手写数字识别技术分析32.1 手写数字识别过程32.1.1 图片预处理42.1.2 特征提取42.1.3 分类器42.2 激活函数52.2.1 什么是激活函数52.2.2 Sigmoid函数52.2.3 Re1u函数62.3 输出层的设计62.3.1 softmax函数62.3.2 输出层神经元个数72.4 损失函数72.4.1 损失函数的作用72.4.2 均方误差损失函数72.4.3 交叉端误差损失函数73卷积神经网络的结构和模型设计83.1 卷积神经网络概述83.2 卷积层83.2.1 卷积运算83.2.2 填充和
2、步幅93.3 池化层103.3.1 最大池化113.3.2 平均池化113.4 误差反向传播算法113.5 本文所采用的网络模型结构144卷积神经网络的训练与优化144.1 全连接神经网络和卷积神经网络对比144.2 卷积神经网络的训练过程154.3 本文对卷积神经网络的优化164.3.1 使用Adam方法更新参数164.3.2 应用Dropout抑制过拟合174.3.3 对超参数进行优化185手写数字识别实验结果与分析185.1 基于卷积神经网络的数字识别实验结果185.2 项目打包与运行效果展示206总结与展望236.1 工作总结236.2 展望23基于机器学习算法的数字识别APP开发摘要
3、:手写字符识别技术作为OCR的一个重要分支,其综合了数学图像处理和机器学习等多方面的知识,已经逐渐成为计算机智能化的重要技术。由于PythOn在对机器学习处理有着先天优势,所以市面上大多是用Python实现的。本文将使用JaVaSCriPt语言,采用卷积神经网络算法,从其原理和结构开始一步步实现对手写数字的识别。通过MNIST数据集对模型进行训练,经过对待训练(识别)的图片预处理,特征提取,分类等操作,实现对手写数字测试集的识别并有着95%以上的识别准确率。最终打包成APK,作为APP在手机上运行。关键词:机器学习;卷积神经网络;手写数字1绪论1.1 研究背景与意义在如今快速发展的数字时代,目
4、前市面上大多是针对印刷字符识别的软件和应用,目前还没有一种商业上的应用或软件可以用于手写字符识别。该方面处理信息主要有两种,一种是文字类,这里指的是人类社会做使用的文字及由其所构成的文本信息,通常是印刷体,如英文字母组成的文本信息等,现阶段印刷体识别技术发展较为完善,相关理论及技术快速迭代,已经出现多种商业识别软件,且识别效果都较好。一种是数据类,其构成主要是阿拉伯数字及其他多种不同形态及用途的特殊符号所构成的数字和统计数据,对手写数字的识别就是处理这些信息的核心。手写数字识别研究的难点在于:第一,数字字形区分度不高,使得部分数字难以快速而简单区分;第二,书写风格差异性非常突出,导致相同数字形
5、态排布存在较大差异。在实际使用过程中,由于各种因素的影响,手写输入的识别准确率往往会低于印刷体字符。因此,手写数字识别及相关研究问题具有很大实用价值,一旦研发成功创造较大效益。1.2 国内外研究现状由于神经网络在图片分类上具有较大优势,国内研究者对于手写体识别问题的讨论多集中关注在神经网络方向。刘辰雨(2018)在对卷积神经网络1eNet-5模型的研究之上,提出了添加DrOPOUt层来抑制过拟合,同时也能够一定程度强化泛化性。另外也进行了模型激活函数的探讨,并启用原有的Tanh函数,而探索性利用Re1u函数,最终使得优化后的模型识别率从93.61%提高到了97.30%,误识率从0.96%下降到
6、T0.75%。陈鸿宇(2023)基于对K最邻近法(KNN)的研究过后,在对图像进行预处理后,通过KNN算法实现对手写数字的识别,对946个数据展开分析与测试,并获得相关相应结果,最终偏差率显示为1.05%,获得满意效果。杨栩(2023)在其论著中也针对手写数字图形进行识别研究,并在过程中主要利用卷积神经算法,也就是一定规模卷积层获得相应的特征向量,之后经过函数处理,在实现向量将为,最终实现结果输出,其中利用到的训练数据数量超过了八千个,同时进行迭代计算也超过了八次,最终获取达到预期的识别结果,超过96%能被识别。汪愿(2023)基于BP神经网络,采用动量因子和自适应学习的手写数字图片模式识别,
7、并利用MAT1AB仿真软件对大量手写数字识别进行测试后发现该方法对手写数字识别具有精度高、误差小、识别速度快、可靠性高的特点久当前,国内对手写数字的研究主要使用BP神经网络,KNN算法(K-NeareStNeighOrA1gorithm),CNN卷积神经网络(COnVo1UtionaINeura1Networks)O对于手写体数字识别技术,国外专家学者们也做出了大量的努力与探索。HongmeiWang(2023)等人针对卷积深度信任网络(COnVoIUtiOna1DeepBe1iefNetwork,CDBN)中卷积核的同质性,提出了一种适用于卷积受限玻尔兹曼机(Convo1u1iona1Res
8、trictedBo1tzmannMachine,CRBM)模型的基于交叉煽的稀疏惩罚机制,在此基础上,采用参数学习算法对梯度进行补偿,实现了监督学习和无监督学习的交替,最终使模拟数据集识别率达到97.45%。SaVitaAhIaWat(2023)等人研究基于cnn的手写数字识别的各种设计选项,以评估各种SGD优化算法在提高手写数字识别的性能,他们提出了一种CNN体系结构,以达到比集成体系结构更好的精度,同时降低操作复杂性和成本。此外,在设计CNN时,他们还提出了一个适当的学习参数组合,使得在分类MN1ST手写数字时获得一个新的绝对记录。最终经过大量的实验,在MN1ST数据集上实现了99.87%
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 机器 学习 算法 数字 识别 app 开发