XX学院全球信息采集与大数据分析科研平台采购需求.docx
《XX学院全球信息采集与大数据分析科研平台采购需求.docx》由会员分享,可在线阅读,更多相关《XX学院全球信息采集与大数据分析科研平台采购需求.docx(12页珍藏版)》请在第一文库网上搜索。
1、XX学院全球信息采集与大数据分析科研平台采购需求一、采购清单采购标的名称数量具体内容数量单位全球信息采集与大数据分析科研平台1套多语种文献资料库8个外文网站的数据抓取、清洗和文本分析端口,全网搜索1项翻译机4台计算机辅助翻译软件系统1项二、采购内容(一)多语种文献资料库1英语、德语、法语、阿拉伯语、西班牙语、俄语、日语、韩语8个语种文献资料库,包括数据汇入、数据共享、数据查询、小语种翻译、账号权限管理等主要模块,各模块功能如下:2 .数据汇入:采集数据汇入、用户资料编辑、上传;3 .数据共享:数据展示、查看、取用;4 .数据查询:搜索功能、主题分类;5 .账号权限管理:账号管理、角色权限、用户
2、分组管理、登录控制、账号注册。(-)外文网站的数据抓取、清洗和文本分析端口,全网搜索共1项,服务期2年。1 .采集内容使用爬虫技术,采集范围包括800个外文网站(外文网站目录由采购人提供),采集内容包括文章标题、时间、作者、正文、链接,采集频率为每天采集一次,数据每24小时更新,数据存储在本地,数据接入资料库。中标方须根据数据采集要求,在定向800个网站进行数据收集,使用语言包括英语、德语、法语、阿拉伯语、西班牙语、俄语、日语、韩语,并将所采集数据进行数字化转化,同时确保数据的真实性、完整性和合法性。2 .词语分析根据抓取的数据进行每周关键词、热词分析提示。3 .海外内容搜索接入全网搜索入口、
3、800个外文网站全部内容搜索入口,提供线路供搜索海外内容,外文网站域名由后台限定。4 .数据抓取要求(1)反爬机制要求为确保网络爬虫系统能够高效稳定地采集所需信息,需要满足以下反爬机制:1)使用代理IP网络爬虫应具备代理IP功能,代理IP应用于规避目标网站的IP封锁等限制,确保顺利进行数据采集。2)模拟登录网络爬虫系统应支持模拟登录功能,实现自动化登录操作,并保证账号和密码的安全传输和存储。3)分析网页源码实现网页源码分析功能,通过使用浏览器自带的开发者工具等技术,提取难以采集的页面中的所需信息。4)使用AP1接口在可能的情况下,应优先使用目标网站提供的API接口来获取所需信息。(2)数据去重
4、和增量更新要求为保证数据的准确性和避免不必要的资源浪费,网络爬虫系统需要实现数据去重和增量更新功能。将爬取过程中产生的UR1进行存储,并确保UR1的唯一性,免重复请求。网络爬虫系统应对爬取到的每条数据进行唯一标识的制定,确保爬取的数据在持久化存储前进行去重,避免重复存储相同的数据。(3)分布式等问题要求网络爬虫系统需要支持分布式部署,以提高爬虫的效率、速度和可靠性。采用分布式爬虫技术,将爬虫任务划分成多个子任务,提高爬虫的效率和稳定性。(三)性能先进的翻译机共4台。拥有离线翻译、拍照翻译、语音速记、扬声器等功能,支持英语、德语、法语、阿拉伯语、西班牙语、俄语、口语、韩语8个语种,网络支持WiF
5、i、蜂窝数据等方式。(四)计算机辅助翻译软件系统共1项。1 .支持语言数量在线翻译定向外文网站搜集到的内容,支持英语、德语、法语、阿拉伯语、西班牙语、俄语、日语、韩语等70种语言。2 .文件格式支持pdfdocdocxx1sx1sxtxtpptpptx共8种文件格式。3 .文档翻译支持文本、文档翻译,自动识别源语言语种,支持OFFICE系列/PDF等多种文档格式翻译,翻译结果原格式、原译导出,支持30M以上文档大小。4 .翻译历史用户翻译历史记录留存、自主管理,支持通过语言方向、文档名称等条件检索。5 .用户管理授权用户登录后才可以使用翻译功能,翻译调用情况可以实时查看。6 .翻译页数20万页
6、(无时间周期限制,直至20万页用完为止)。7 .账号数量1个主账号+100个子帐号+3条vip专属通道+5条普通通道。(五)培训和售后服务提供相关用户培训文档,培训形式、时间等根据招标人要求确定。提供自终验合格之日起2年的质保,人员5*12小时响应。三、安全服务要求系统安全防护建设要按照国家关于信息系统安全管理有关要求及国家有关安全策略、法规、标准和管理要求进行,以风险评估和需求分析为基础,坚持适度安全、技术与管理并重、分级与多层保护和动态发展等原则,保证网络与信息安全和政府监管与服务的有效性。安全系统建设内容包括信息安全管理规章制度、资源安全、应用安全、系统安全、网络安全等方面。(-)安全合
7、规要求投标人设计开发系统的安全功能需满足国家法律要求、需要满足招标人的安全监管要求及网信系统安全标准,相关要求包括不限于以下:中华人民共和国网络安全法。投标人承诺交付的系统在通过以上合规要求时提供技术支持;如果遇到因功能缺失导致无法满足合规要求时,应立即响应并对安全功能改进。(二)安全管理要求投标人应采取必要的措施和机制保证设计开发业务系统的安全性。措施应包括不限于以下部分:(1)设置安全专员;(2)定期安全培训;(3)定期安全自查与改进。投标人承诺在项目实施过程中应遵循招标人制定的相关开发安全管理规范。(三)漏洞规避要求投标人应确保交付的成果不存在中高危漏洞和安全缺陷。(1)不得存在高危漏洞
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XX 学院 全球 信息 采集 数据 分析 科研 平台 采购 需求