智慧图书馆环境下图书馆报纸专题库建设探讨.docx
《智慧图书馆环境下图书馆报纸专题库建设探讨.docx》由会员分享,可在线阅读,更多相关《智慧图书馆环境下图书馆报纸专题库建设探讨.docx(9页珍藏版)》请在第一文库网上搜索。
1、智慧图书馆环境下图书馆报纸专题库建设探讨关键词:智慧图书馆;报纸专题库;国家图书馆;数字化项目摘要:报纸资源是图书馆馆藏资源的重要组成部分,具有较高的史料价值和学术价值。文章以国家图书馆在建报纸数字化项目为例,对不同类型报纸的数据库建设要点进行了对比分析,旨在为其他图书馆报纸专题库建设提供参考。中图分类号:G250.7文献标识码:A文章编号:1003-1588 (2022)05-0096-05图书馆馆藏资源数字化是图书馆信息资源建设的重要内容,可提高馆藏资源利用率,满足用户多元化的信息需求。在智慧图书馆背景下,图书馆可通过数据资源挖掘实现知识增值和服务创新。报纸专题数据一部分年代久远的报纸已经
2、丧失阅览功能,束之高阁无人问津。报纸资源较高的文献价值和较低的利用率这对矛盾,使开展馆藏报纸资源的保护和深度开发工作迫在眉睫,报纸专题数据库建设应运而生。笔者在国家图书馆从事文献数字化工作多年,参与了多个报纸专题库建设,在此对不同类型报纸的数据库建设要点进行对比分析,希望能为其他图书馆报纸资源专题库建设提供参考。1报纸专题库建设的意义1.1 报纸专题库建设是智慧图书馆资源建设和保护的重要途径一方面,开展报纸专题数据库建设可以保护馆藏纸质报纸资源,特别是民国时期破旧老报纸资源,延长报纸资源的使用寿命;另一方面,专题库建设是实现报纸资源增值服务的重要途径3。报纸资源的载体多为实体资源和缩微胶片,亟
3、待保护的年代久远的纸质报纸资源已经逐渐丧失了阅览功能,而缩微胶片对读者的阅读设备、使用技巧要集合体。例如,国家图书馆“中国历史文献总库近代报纸数据库”(即民国报纸数据库)就是将所有馆藏民国报纸缩微胶片数字化并进行报纸标题内容OCR (OpticalCharacterRecognition,光学字符识别)文字识别,数据库设置了任意词、区域、拼音等检索入口,实现了馆藏民国报纸一站式导航服务,读者也摆脱了必须到馆查资料的困难,人机交互随时随地5。2国家图书馆报纸专题库建设现状截止到2022年12月,国家图书馆馆藏中文报纸实体资源196, 764(合订)册,外文报纸资源102, 238册;馆藏数字化报
4、纸资源3, 430种。门户网站中,已建成并免费对读者开放的大型报纸专题数据库有中国历史文献总库红色文献数据库、近代报纸数据库、申报、NewspaperSource (EBSCO)等18个。在众多报纸专题数据库中,笔者曾参与了民国报纸缩微胶片数字化项目和中华人民共和国大事记馆藏报纸展项目。在数据库建设形式方面,以上项目基本包括了现阶段我国图书馆报纸资源数字化工作的两个方向:基于全文ORC识别的小型专题数据库以及基于标题识别、标引的大而全数据库。笔者将从专题库建设涉及的主题内容遴选、标准规范制定和其他相关特殊事项等方面分析不同类型专题库的不同特点。3报纸专题库建设要点对比分析3. 1专题内容遴选数
5、据资源是数据库的核心。不同类型数据库的数据采集策略不同,无论是大型专题数据库如民国报纸数据库,还是小型展览型特色主题数据库,资源的采访原则都应精而全,要选择完整的、具有馆藏特色的报纸资源。3.1.1 综合性数据库。国家图书馆民国报纸缩微数字化项目是国家图书馆和出版社、外包公司合作完成的民国报纸专题数据库,该项目以1919-1949年间的民国报纸为对象,尽可能收录民国期间出版发行的所有报纸资源。馆藏报纸缩微胶片资源是其加工对象,大而全是其特点,不仅有新华日报大刚报这样的大报,还有读者广泛、内容休闲又具趣味性的小报,如电影报北平小报新儿童报文艺新闻等。由于报纸版面数量巨大,经费有限,且民国报纸破损
6、严重,本着最大限度抢救报纸资源的原则,项目组最后将该项目的流程确定为:在每版扫描图像的基础上对版面篇目标题(包括引题、标题、副题)进行OCR文字识别,并对篇目的位置范围进行置标,最终实现了基于篇目标题检索的民国报纸库阅览服务6。3.1.2 特色主题数据库。国家图书馆另一报纸资源库中华人民共和国大事记线上展览项目是为庆祝中华人民共和国成立七十周年建设的,该数据库通过对1949-2022年国内外发生的重大历史事件及相关报道的揭示,客观真实地反映了我国近70年来发生的巨大变化,献礼共和国成立七十周年。与此同时,项目组将建成的专题数据库对外开放,为专家学者提供知识服务7。该项目围绕中华人民共和国成立七
7、十周年这一主题,以19492022年人民日报为加工对象,以共和国70年来重大历史事件报道为脉络,遴选相关度较高的报道并辅以图书、讲座等其他馆藏资源,形成关联数据以丰富事件内容。较之覆盖面较广的综合性民国报纸数据库,大事记报纸资源展虽然信息源遴选单一、专指性强,但丰富的关联数据资源使该报纸展览资源库更加立体。下页表1对以上两类自建库的特点进行了对比分析,图书馆可根据需求和馆藏资源特点决定建库类型。3.2 项目标准规范3 . 2.1元数据标准。民国报纸数字化加工项目是在图像扫描的基础上进行文章标题内容的文字识别,由专业的外包公司完成数字化加工,国家图书馆负责数据验收。民国报纸元数据的内容由两部分组
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智慧 图书馆 环境 报纸 专题 建设 探讨
