基于舞弊三角理论的GA-BP舞弊智能识别与大数据应用研究.docx
《基于舞弊三角理论的GA-BP舞弊智能识别与大数据应用研究.docx》由会员分享,可在线阅读,更多相关《基于舞弊三角理论的GA-BP舞弊智能识别与大数据应用研究.docx(8页珍藏版)》请在第一文库网上搜索。
1、arrnnmii蝴 ga-bp与大煽应用研究近年来国内财务舞弊案件迭出,如2019年的康美药业、康得新以及2020年的瑞幸等,不仅损害了投资者利益和市场可信度,影响证券市场资源配置功能的发挥,还对中国上市公司的声誉造成严重影响。舞弊动因更加复杂多样,舞弊方式不断新式化,国家对上市公司的监管也日益加强,识别公司财务舞弊的方法成为社会焦点。本文以舞弊三角理论为基础,结合前人已有研究,构建了基于财务信息与非财务信息的指标体系,共计64个指标,作为智能算法识别舞弊的基础。根据412个公司样本拟合,并用70个样本进行测试,得到了一个精准有效的GA-BP舞弊识别模型。同时将模型进行扩展,为构建一个以数据处
2、理为核心组织,基于大数据技术进行自动分析与识别的审计框架提供了初步方案。1文献综述1.1 舞弊动因理论孙丽亚(2010)从“三元素”理论出发,分析三元素的内在关系,创建了与舞弊特征相关的识别卡。洪宏等(2012)利用“GONE”理论探究得出影响五项舞弊发生的重大因素。此外,管杨威等(2014)选择“CRIME”舞弊动机五因素论为研究依据,对60个上市公司舞弊与非舞弊样本进行对比检验获得较好应用能力的识别模型。1.2 舞弊指标彭子坤等(2013)立足非财务指标从舞弊行为的根本原因出发认识该行为,以公司治理信息和外部环境信息来对非财务信息进行分类,分析现在舞弊识别中的缺陷与滞后性。而熊方军(201
3、5)立足财务指标,通过对几十家舞弊和非舞弊公司的16个财务指标构建以Logistic模型为基石的舞弊识别方法,对数据进行剖析后认为:公司财务指标的数据样本容量大小影响着预测正确率,容量越小正确率越高。1.3 舞弊识别模型夏明等(2015)选取神经网络组合模型,以BP、RPF神经网络的实验结果为基础,提出RPF-BP组合模型,效法于生物体内神经网络,具有较好的自适应及容错性和应用性,为有效识别会计舞弊提供了新的思路和方法。与之不同的是杨贵军等(2019)使用基于Benford律的Logistic模型,创造性地提出创建一个Benford因子并将其带入到Logistic模型。另外,潘梦雪(2019)
4、基于有较高准确率的预测算法随机森林,结合20142017年400多家有舞弊行为的公司进行建模验证,得到具有实用价值的风险识别模型。由上述的文献可以得知,在舞弊识别模型、指标、舞弊动因理论的选择上,学术界针对不同方向都得到了较为丰富的成果。本文旨在前人研究的基磁上进行创新性优化,以期获得具有更高可信度和实用价值的舞弊识别模型。2 GA-BP模型构建2.1 神经网络选取人工神经网络中的BP (Back Propagation)神经网络应用最为广泛,其常见结构有三层,分别是输入、隐含与输出层,不同层之间的神经元之间可以利用通道进行信息传输。神经元与通道构成了一个非线性有向图,具有很强的学习能力与处理
5、能力,可以根据输入数据修改每条通道的权重,从而映射出未知结构的数据关系。该模型的重点在于权矩阵的确定。选取个学习样本,每个样本有个指标值和1个输出值,所以期望输出值构成了目标向量,输出值构成了向量,把与之间的误差逐层逆向传递给上一层,通过不断修正神经元间信号通道的权重来减少误差,当误差减小到预先设定的标准,则学习状态结束。2.2 遗传算法优化虽然BP神经网络的学习能力较强,但收敛速度较慢,易困于局部最优解,为克服这一缺点选用遗传算法(Genetic Algorithm , GA)进行优化。遗传算法借鉴自然界遗传机制与适者生存思想,模拟生物遗传进化过程,通过选择、交叉、变异等操作循环繁殖来挖掘最
6、优个体,缩小最优解范围,用于优化BP神经网络模型的权值阈值。2.3 GA-BP模型构建GA-BP模型算法的主要步骤如下。2.3.1 网络初始化首先需要确定神经网络的拓扑结构,包括网络层数和权值阈值个数,并赋予初始值,确定网络的学习规则,这里引入动量项,使得学习因子可以根据需要变化。其中为学习因子,影响网络收敛速度;为动量因子,影响误差修正力度,一般取0.9o2.3.2 种群初始化确定染色体的长度并进行编码,产生一个初始种群,每一个都代表网络中一个对应的权重。2.3.3 适应度函数将网络预测误差绝对值和的倒数作为遗传算法中的适应度函数。2.3.4 遗传操作(1)选择操作根据适应度函数计算个体适应
7、值作为筛选依据,采用轮盘赌注法确定父代染色体,适应度值越大被选中的概率越高,体现了适者生存思想。第个染色体被选中的概率为:(2)交叉操作根据数值交叉法,以交叉概率对染色体、的第个基因进行交叉操作,产生新个体和,其余部分直接进行复制。(3)变异操作以突变概率对染色体的第个基因进行突变操作产生新个体。2.3.5 寻找最优个体根据每次计算的适应度值进行判断,若达到设定的精度要求,或循环次数达到所设的最大迭代次数,则循环终止得到最优个体,解码便可获取最优权值、阈值。2.3.6 训练BP神经网络将最优权值、阈值赋给BP神经网络进行训练,计算输出向量与目标向量的总误差,若未达到预定标准则反向更新权值、阈值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 舞弊 三角 理论 GA BP 智能 识别 数据 应用 研究