省委网信办数据融合交换平台迭代(网信大脑建设)软件部分项目采购需求.docx
《省委网信办数据融合交换平台迭代(网信大脑建设)软件部分项目采购需求.docx》由会员分享,可在线阅读,更多相关《省委网信办数据融合交换平台迭代(网信大脑建设)软件部分项目采购需求.docx(9页珍藏版)》请在第一文库网上搜索。
1、省委网信办数据融合交换平台迭代(网信大脑建设)软件部分项目采购需求1项目背景20XX年底,我办完成了数据融合交换平台的建设,在省级层面对网信业务数据进行归集、编目、治理和共享,形成办内数据基座。随着我办业务深化发展,通过着力提升智能化支撑能力,以“集中化、智能化、共享化”的思路迭代数据融合交换平台,践行以算力换人力,以智能增效能的管理理念,充分利用网信数据融合一期项目数据和成果,针对我办实际需求进行深化建设,实现通用主题知识库积累能力、基础算法模型构建能力、AI智能研发能力的全面提升,打造数据全域融合、要素敏捷配置、业务智能协同、安全平稳可靠的数据治理新范式。2建设目标在数融平台一期基础上,开
2、展数据融合交换平台迭代,继续完善通用知识库的建设和积累,提升面向文字、图像处理能力,开展网信底层能力的研发,从而提升网信数字化应用的作战能力、作战效率,提供网信融合服务。3软件功能需求3.1 知识库建设本次项目新建6个知识库,分别是国内外媒体知识库、突发事件知识库、敏感词校对知识库、垃圾信息过滤知识库、指令库、情感分析知识库。3.1.1 国内外媒体知识库本库以数据融合一期项目归集的数据为依托,构建国内新闻网站、账号、新闻客户端、报纸、微博、微信、自媒体平台订阅号等以及海外媒体渠道主体各维度属性数据体系,用于分析重要账号与这些媒体相关账号的社交媒体互动,通过挖掘和分析大数据,发现热点话题和趋势,
3、实现为新闻宣传、内容生产等业务提供支持,从而在进行舆情应对、对外宣传时能够做到“有理可讲、有料可发”。3.1.2 突发事件知识库本库以数据融合一期项目归集的数据为依托,以舆情事件数据、网络安全事件等数据为支撑,通过收集、整理和共享各种突发事件相关的信息和知识,对各个类型突发事件的知识规则定义,辅助突发事件模型,形成各种类型的应急预案,从而在发生突发事件时可通过知识库进行快速识别并预警,更快、更准确地做出反应,并提高应对紧急情况的效率。3.1. 3敏感词校对知识库本库以数据融合一期项目归集的舆情数据为依托,对数千个敏感词条及知识进行处理、标引、打标、分类等,形成敏感词校对知识库,用来对数据进行敏
4、感信息识别及校对,强化稿件质量,实现高效率、高质量完成稿件创作和校对。3.1.4垃圾信息过滤知识库本库以数据融合一期项目归集的舆情数据为依托,存储垃圾信息特征及垃圾信息识别的知识规则,形成上千条句法模式的专业垃圾词库,可通过关键词过滤来定位和阻止垃圾信息,同时可以通过反馈机制来不断完善和更新其数据库。当用户报告垃圾信息时,系统可以将此信息添加到数据库中以提高识别率,本库用来对新闻信息正文中的相关新闻、来源、广告等数据进行垃圾信息清洗。3.1.5指令库本库存储办内各个处室的系统(应急、网管、传播、网安等)指令相关数据,用于保证指令数据的完整性,保持办内指令的统一性、规范性,同时接入指令系统,对指
5、令进行二次应用。1.1 .6情感分析知识库本库存储情感分析分类体系及每个类别对应的知识规则,用于对文本中的情感进行分类和分析,了解用户在评论、社交媒体、客户服务等场景下表达的情感偏向。比如用户对新闻或通知的看法、评论或观点等。1.2 模型整合和扩展3. 2.1整合已有基础模型为避免重复建设,提升资源复用率,本平台将对我办已建成的A1基础能力进行整合,如:文字特征提取能力、摘要提取能力、相似性识别能力、关系抽取能力等。对上述A1能力的整合将不影响现有业务系统的正常运行,并使其可以开放给更多办内业务平台使用,把分散在各个信息化系统中分散的模型,通过统一的平台进行整合管理,最终提供一致的对外模型服务
6、,形成服务合力,同时也避免后续的重复建设。4. 2.2扩展图像处理模型本次项目通过扩展图像信息提取、图像质量评估、图像特征提取、票证识别、人脸识别、人物特征识别、特定物体识别、特定场景识别等图像处理模型,在业务层面填补图像处理技术空白,为我办信息化系统提供统一的图像处理能力服务。5. 2.3扩展突发事件发现模型本次项目通过扩展突发事件发现模型,实现对突发事件进行快速识别和预警,进而通过研判分析制定应对策略,可最大程度的提高应对突发事件的效率和准确性,减少人力消耗,帮助我办更好地应对突发事件的挑战。3.3建设A1能力平台建设A1智能计算平台,支持数据处理、模型训练、模型发布、模型应用等AI开发全
7、生命周期管理,同时提供全流程配套的可视化操作界面,可快速完成算法模型训练及使用,在业务语料的支撑下,快速构建业务场景模型,为各类业务应用提供智能处理能力,盘活网信数据资产,形成良性业务闭环,同时也能够更好地应对外部因素变化和内部业务需求。3.3.1数据标注以界面可视化的方式,提供业务数据的机器预标注能力,把实际业务过程中产生的数据进行预标注,生成机器可识别、可训练的数据格式。支持多种格式数据标注;提供基于词典、算法规则、小样本学习等多种数据预标注算法,实现快速的机器预标注,提升工作效率。3.3.2数据管理对未标注数据、已标注数据、数据格式、数据集和预训练模型进行统一管理。支持对业务系统产生的原
8、始未标注数据和通过机器标注的已标注数据进行管理,统一数据格式并根据实际业务数据类型关联数据集,并且支持特定算法与预训练模型关联,进行预训练。3.3.3任务管理支持模型训练任务的可视化配置,可同时对多批次多类型的模型训练进行管理,支持对模型的训练情况、验证和评估结果进行实时查看,及时了解任务状态情况。3.3.4算法管理内置多种已经训练调优完毕的数据模型,包括统计机器学习算法库、深度学习算法库、自然语言处理组件库等,为模型训练提供高效的支撑能力。3.3.5模型管理提供模型生命周期可视化管理,可进行模型训练任务定制,灵活配置语料、学习框架,支持模型查看、模型评估、模型下载、模型发布,与任务关联查看和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 省委 网信办 数据 融合 交换 平台 大脑 建设 软件 部分 项目 采购 需求