《厦门大学本科生毕业论文标准模板示范2017年.docx》由会员分享,可在线阅读,更多相关《厦门大学本科生毕业论文标准模板示范2017年.docx(21页珍藏版)》请在第一文库网上搜索。
1、厦PS大挚(小二号宋体)本科毕业论文(主修/辅修专业)、(二号黑体)、M(三号宋体)面向非结构化企业指标信息的智能处理和可视分析IndicatorsoftheUnstructuredEnterpriseInformationforInte11igenceProcessingandVisua1ization/姓名:(1TimesNewRoman加粗)学号学院:系:专业:年级:校内指导教师:(姓名)(职称)校外指导教师:(姓名)(职称)小三号未体二OXX年六月四号宋体)厦门大学本科学位论文诚信承诺书本人呈交的学位论文是在导师指导下独立完成的研究成果。本人在论文写作中参考其他个人或集体已经发表的研究
2、成果,均在文中以适当方式明确标明,并符合相关法律规范及厦门大学本科毕业论文(设计)规范。该学位论文为()课题(组)的研究成果,获得()课题(组)经费或实验室的资助,在()实验室完成(请在以上括号内填写课题或课题组负责人或实验室名称,未有此项声明内容的,可以不作特别声明另外,本人承诺辅修专业毕业论文(设计)(如有)的内容与主修专业不存在相同与相近情况。学生声明(签名):年月日封面之后、正文之前的页码用罗马数字表示.值此论文完成之际,谨向所有关心和支持我的人们致以诚挚的谢意!(小四号宋体1首先,我要衷心地感谢我的导师XXX教授。从论文选题、内容和整体结构的确定,到直至最后定稿,XXX老师都以极其负
3、责的态度给予悉心指导,为我提出了许多宝贵的意见和建议,使我获益良多。他渊博的学识、严谨的治学态度以及朴实的学术作风时刻激励我不断努力完善自己,对我的悉心关怀和教诲也将鼓舞我在今后的学习和工作上不断努力向上。在此,谨向XXX老师致以最诚挚的感谢!其次,还要感谢与我一起完成这个项目的所有团队成员。没有他们的帮助和共同努力,就没有项目的圆满成功,也就不会有本文的形成。在此,向他们表示衷心的感谢!(小四号宋体)随着信息的发展,出现了越来越多的非结构化信息。并且非结构化信息在政府和企业等的决策中扮演着重要的角色。如何将非结构化数据有效的管理起来,能够进行数据和知识挖掘,提取当中的隐含信息,提供一种形象的
4、可视分析,为政府和企业决策提供支持成为当今亟待解决的主要问题。I本文以北京市科委的指数统计文档为研究对象,主要任务是针对以北京市科委的指数统计文档为代表的非结构化信息的抽取和企业指标信息的可视分析。主要工作包括三个方面:第一,设计了一套以北京市科委的指数统计文档编写规范为标准的确实可行的信息抽取算法;第二,针对抽取出来的指标信息,借助于DUndaS可视化工具进行可视分析:第三,完成了一个满足客户需求的企业信息摩管理系统。论文从项目背景出发,介绍了系统开发的背景和研究价值。然后,详细介绍了企业指标信息智能处理的可行性和算法设计,以及企业指标信息可视分析的原理及其实现。再次,论文详细阐述了系统的需
5、求,具体介绍了企业信息库管理系统的设计及其实现,最后论文针对企业信息库管理系统进行了分析和评价,并指明了下一步的改进计划。(小四号黑体)(小四号宋体)关键词:非结构化信息;信息可视化;可视分析(小:TimesNewRoman加粗)AbstractWiththedeve1opmentofinformation,therehasbeenanincreasingnumberofunstructuredinformation.Anditp1aysanimportantro1eindecisionofgovernmentandenterprise,etc.Howtomanagetheunstructur
6、edinformationefficient1y,minethedataandknow1edge,extracttheimp1icitinformation,provideavisua1imageana1ysis,andthensupportthegovernmentandenterprisesdecisionhavebecomethemain(小四;TimeSNeWROman)issuestobesett1edurgent1y.Inthisquestionfordiscussion,wemain1yhavearesearchinindicatorofenterprisedocumentsfr
7、omtheBeijingScienceandTechno1ogyCommissionandtrytoobtaintheindicatorsoftheunstructuredinformation,andthenprovideavisua1imageana1ysis.Itinc1udesthreeaspects:First,todesignasetofpractica1informationextractiona1gorithm;second,throughtheuseof(heDundasChartt1box,providingvisua1ana1ysis;third,comp1etedEnt
8、erpriseInformationManagementSystemwhichmeetcustomersrequirement.Thebeginningofthedissertationintr(1ucedthebackgroundoftheproject,introducedthebackgroundofthesystemandresearchva1ue.Second,detai1inginformationextractiona1gorithmsandprincip1esofInformationVisua1ization.Third,thedissertatione1aboratedth
9、esystemsrequirement,specifica11yintroducedthesystemdesignandimp1ementation.Fina11y,somepossib1eimprovementsandfutureworkswerepresented.,(小四号TimCSNewRoman)/(小四号Tin*esNewRoman加粗)Keywords:UnstructuredInformation;InformationVisua1ization;Visua1Ana1ysis(四号黑体)致A谢IIiAbstractVIIContentIX1绪论11.1问题及其意义11.3论文组
10、织结构22文献综述52.1 非结构化信息处理52.1.1 非结构化信息管理概述52.4本章小结86结论116.1 论文总结116.2 工作展望12参考文献13附录15AbstractVIIIXContent.1绪论11.1问题及其意义11.3论文组巡构22文献综述52.1 非结构化信息处理52.1.1 非结构化信息管理概述52.4 本章小结86结论116.1 论文总结116.2 工作展里12参考文献13附录15(正文从男右页开始:奇数页页眉为当前章名,小五号宋休.)(四号黑体)1绪论(小四号宋体,1.5倍行间距,两端对齐)批注IJ2):顺序编码制参考文献的标注方式:数字加方括号在右上角,置于句
11、号之前。1.1 问题及其意义随着计算机技术的发展,使海量信息得以存在并迅猛发展。尤其是信息技术的日益普及其应用以后,随着各个行业的信息系统的规模的日益扩大,信息系统在长年累月的运转过程中,积累了庞大的数据资源。然而决策者却很难利用这些数据资源,为企业和政府的决策提供确实有效的帮助。这是因为一方而,在这庞大的数据资源中,非结构化信息占据了主要部分。GartnCr的一项调查显示,在今天的社会中,有80%以上的商业行为依赖于非结构化信息;我们所存储的数据中,85%以上是非结构化信息.;每过三个月,我们周围的非结构化信息就会增加一倍。这些数据充分说明,我们周困信息的形态是以非结构化信息为绝对主体的,也
12、可以说我们接触到的信息中绝大部分是非结构化信息。因此对非结构化信息进行管理,能够进行数据和知识挖掘,提取当中的隐含信息,对决策进行支持成为当今亟待解决的主要问题。另一方面,随着信息技术的发展,信息结构越来越复杂,信息更新越来越快,信息规模越来越大,给人们获取信息、理解信息、掌握信息带来了沉重的负担,常常导致“认知过我”、“视而不见”bMd北京市科学技术委员会在企业指标信息统计分析工作上就存在这两方面的问题,文献介绍了这方面的工作。每年北京市科委都要对北京市企业进行企业指标信息的调查,在长年累月的积累过程中,北京市科委积累了大量的企业指标调查表、项目立项、执行、验收等文档。这些调查表以Word形
13、式保存起来,并且调查指标的方式也呈现多样化,存在选择、填空、表格、问答以及这些题目的复合等形式。而且企业指标的调查涵盖范围也很广泛,从企业性质及登记情况到企业财务及信息化投入状况,再到人力状况及信息化支撑状况,到企业信息化基础设施建设状况、企业信息化应用情况,甚至涉及到企业对信息化工程的满意程度的调查。面对海量的非结构化企业指标信息,北京市科委每年都要投入大量的人力、物力、精力,将企业指标信息从WOrd文档中手工提取出来,形成计算机可以识别的结构化的表格信息,再对企业指标信息进行统计分析。即使是这样,仍然存在许多问题:第一,手工抽取企业信息调查表耗时较长,工作强度大。第二,手工抽取数据信息容易
14、出现错误,准确性不能得到有效保证,而且旦出错,就(正文之后的页码用阿拉伯数字连续编码,小五号TimesNewRoman9有可能导致整个统计分析结果的错误,进行核对非常困难。第三,即使是将企业指标信息全部准确转成计算机可以识别的表格数据以后,由于数据的多样性,缺少形象的对企业指标信息的统计分析工具。针对北京市科委的企业指标信息统计分析问题,我的毕业设计结合北京市科委的业务需求,开发了企业信息库管理系统。这个项目来源于国家科技支撑计划项目课题“面向服务的智能化制造技术及示范应用”(课题编号2006BAFOIA17)。该项目主要是为了解决北京市科委的指标信息统计分析过程中,存在指数统计困难和文档管理
15、困难两个问题,以业务为主线,主要包括科委文档的管理、企业指标信息的智能处理、企业指标信息的可视分析三个方面的内容。通过为科委中存在的大量信息文档实体构建基础信息模型,来方便用户的F1常管理和提高文档的利用率。通过构建应用数据模型,将企业指标信息文档中的非结构化信息智能抽取出来,并存储于数据库当中,将非结构化信息结构化,用成熟的结构化数据管理理论来管理非结构化数据。通过对指标信息的查询,构建信息可视分析模型,使用户可以对知识进行挖掘,提供形象的可视分析,提高北京市科委的企业指标信息的统计分析效率。本项目完成后将会在北京市科委投入使用。1.2 研究内容和方法1.3 论文组织结构本论文共分为六章,论文首先分析了政府和企业在信息化过程中遇到的两个问题:非结构化信息管理和“认知过载”。并结合北京市科委的企业指标统计分析问题,介绍了毕业设计项目的背景和研究价值,引出了论文所做的主要工作内容。紧接着论文简单概述了毕业设计项目中所用到的各项技术,并针对北京市科委的业务要求提出了信息抽取和基于DundasChart信息可视化的解决方案。然后论文就项目中的两个技术难点非结构化信息处理和信息可视分析,详细阐述了信息抽取技术的算法设计和信息可视分析技术的模型设计。在系