《信息存储与检索复习.docx》由会员分享,可在线阅读,更多相关《信息存储与检索复习.docx(11页珍藏版)》请在第一文库网上搜索。
1、名词解释1、同句检索是要求参加检索运算的两个词必须在同一自然句中出现,其先后顺序不受限制。2、查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度,可用下面的公式表示:查全率=(检出相关文献量/系统中相关文献总量)*100%3、查准率:是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度,可用以下公式表示:查准率=(检出相关文献量/检出文献总量)*100%4、漏检率:是指漏检相关文献量与在检索系统中相关文献总量的比率,是衡量信息检索系统漏检文献的尺度,可用下面的公式表示:漏检率=(漏检相关文献量/系统中相关文献总量)*100%
2、5、跨库检索:可同时检索多个平台上的多种资源,输入一个检索式,便可以看到多个数据库的查询结果。6、单库检索:在选定的单一数据库中进行检索。7、经典论文优先:被引用数比较多,或者文章发表在档次比较高的杂志上等经典的、有价值的文献优先排在前面。8、相关度优先:和查询的条件内容最相关的文献优先排在前面。9、最新论文优先:发表时间比较新的文献优先排在前面。10、精确匹配:检索结果中包含与检索词完全相同的词语11、模糊匹配:检索结果包含检索词或检索词中的词素12、顺查法是根据有关课题的起始年代利用选定的检索工具由远及近的进行逐年查找。13、倒查法从最新时间查找起,直到满足检索要求为止。14、抽查法是针对
3、有关学科的发展特点,抽查某些特定时期的文献信息。15、二次检索是指在前一次检索结果的范围内,继续进行检索。16、定题检索SDI(se1ectivedisseminationofinformation)查找有关特定主题最新信息的检索。17、回溯检索RS(retrospectiveSearCh)查找一段时期内有关特定主题信息的检索。数据库的基本复习:数据收录文献范围,有哪些数据库?.以下哪个数据库提供同名作者检索功能:(D)A.著作权B.发明权C.发现权D.专利权5、WWW信息资源基于(C)协议传输。A、FTPB、TE1NETC、HTTPD、P2P6、下列哪个属性不是百科全书的特点(D)oA、内容
4、具有权威性B、检索系统的完备性C、修订制度的完善性D、内容更新的时效性7 .下列选项中,不属于信息能力的有(B)A.鉴别B.传递C.评价D.有效利用8 .Goog1e搜索引擎的首页面上有一个“手气不错”的按钮,这个按钮的作用是什么?(D)A.测试你当天的手气B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的链接D.直接跳转到系统认为是最相关的页面9、(C)被认为是当今世界上最知名也是最权威的百科全书。A、美国百科全书B、哥伦比亚百科全书C、不列颠百科全书D、中国大百科全书10.文献信息检索的全过程包括文献信息的两个过程(C)A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引第
5、一章绪论1、什么是信息(Information)?在西方英文中information一词有情报、资料、消息、报道之意,我国大陆曾译为情报或信息,后经国家有关部门核准,统一译成“信息”。在我国台湾、香港地区,该词被译为“资讯”。教材定义:信息是被反映物的属性再现,信息的属性在于表现它物。也就是说,信息不是事物的本身,而是由事物发出的消息、情报、指令、数据、信号中所包含的内容,是对客观世界中各种事物发出的特征、变化及其相互联系的最新反映。一切事物包括自然界和人类社会都会产生信息。一个完整的信息过程,包括信息的传递、接收、贮存、加工和利用。2、信息具有以下特征:(1)普遍性:信息是物质的普遍属性,只
6、要有物质存在,就有信息,物质不灭,信息也永恒存在。(2)时效性:信息在一定的时间内是有效的信息,在此时间之外就是无效信息。而且任何信息从信源传播到信宿都需要经过一定的时间,都有其时滞性。(3)传递性:物质是运动的,信息也随之运动,而信息的运动过程就是信息的传递与反馈过程。(4)可转换性:信息是可以由一种形态转换成另一种形态。信息一般有4种形态:数据、文本、声音、图像。这4种形态可以相互转化,例如,照片被传送到计算机,就把图像转化成了数字。(5)可再生性:信息不同于一次性消耗资源,它可以被反复利用而失去其价值,相反,对它的开发利用越深入,它不仅不会枯竭,还会更加丰富和充实。(6)共享性:同一信源
7、可以供给多个信宿,因此信息是可以共享的,且不因共享而减少。(7)可识别性:信息是可以识别的,识别又可分为直接认别和间接识别,直接认别是指通过感官的识别,间接识别是指通过各种测试手段的识别.不同的信息源有不同的识别方法。(8)可存储性:信息是可以通过各种方法存储的。3、信息检索定义:广义:将信息按一定的方式组织和存储起来,并根据用户需要找出相关文献的过程。其中包括存与取两个环节,存即信息存储,是对信息进行收集、标引、描述、及组织,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程。取即信息查找,是通过某种杳询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程。狭义:仅
8、仅指信息查找的过程。即取的环节。4、信息资源的分类:(1)信息源可分为自然信息源和社会信息源。(2)按信息资源所依附的载体划分:体裁信息资源:以人体为载体并能为他人识别的信息资源。按其表述方式又可分为口语信息源和体语信息源。口语信息源是人类以口头方式表述但未被记录下来的口语信息,如:谈话、讲课、讲演、讨论、唱歌等。体语信息源是以人的体态为载体表述出来的信息资源,如:表情、手势、姿态等方式表述的体语信息。实物信息资源:以实物为载体的信息资源。又分为自然实物信息源与人工实物信息源。如:化石、产品、样品等。文献信息资源:以文字、图形、符号、声频、视频等发生记录在各种载体上的知识和信息资源。网络信息资
9、源:以网络为纽带连接起来的信息资源和以网络为主要交流、传递、存储的手段与形式的信息资源。(3)按信息资源传递的范围划分:公开信息资源:又称共享信息资源或白色信息资源半公开信息资源:又称灰色信息资源非公开信息资源:又称黑色信息资源5、文献信息资源:信息资源的加工深度和结构等级划分:(1)零次文献:指未经过任何加工的原始文献。如:实验记录、手稿、日记、原始录音、原始录像、谈话记录。(2)一次文献:未经加工或粗略加工的原始信息资源,以本人的研究成果为基本素材而创作的文献,具体、详尽和系统化。如期刊论文、专利文献、科技报告、会议录、学位论文等等。(3)二次文献:它是将大量分散、零乱、无序的一次文献进行
10、进行加工、整理、标引、著录、浓缩,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。如:目录、题录、索引、文摘。具有报道和检索功能。(4)三次文献:通过二次信息资源提供的线索,对某一范围内的一次信息资源进行分析、研究、加工而成的信息资源,它包括综述、述评、专题情报研究报告、百科全书、年鉴、指南、手册、词典等。一次文献是二次文献和三次文献的基础,是文献检索的主要对象;二次文献具有浓缩性,是一次文献的简略及有序化,是文献检索的工具;三次文献具有综合性,既是检索对象,又可提供一定的检索途径与检索手段。总之,文献经过加工、压缩,从零次信息到三次信息,使科技信息由分散到集中,由无序
11、到有序,由无组织到系统化,由博而精的对知识信息进行不同层次的加工的过程。信息的不同出版类型划分:(1)图3(2)蚯1(3)科技报告(附:美国四大科技报告(AD报告,PB报告,NASA报告,DOE报告)(4)会议文献(会议文献的特点:论题集中、新颖、丰富、专深、学术性强。是了解各国科技发展水平和动向的重要文献来源)(5)专利文献(6)技术标准和规范(7)政府出版物(8)学位论文(9)产品资料(10)技术档案(11)随6、信息检索的类型:按检索对象的内容区分:(1)文献检索(文献检索是以文献作为检索对象,查找含有用户所需信息内容的文献,文献是一种相关性检索而非确定性检索,系统不宜接解答用户所提出的
12、问题本身,只提供与之相关文献或文献的属性信息与来源指示供用户参考和取舍。所以其检索对象是包含特定信息的各种文献)(2)数据检索(数据检索是将经过选择、整理、鉴定的数值存入数据库中,根据需要查出可回答某一问题的数据的检索。数据检索是一种确定性的检索,即直接提供用户所需要的确切数据。而且检索结果一般也是确定性的,要么是有,要么是没有;要么是对,要么是错。有些数据检索系统不仅能查出数据,还提供一定的运算、推导能力)(3)事实检索(事实检索是检索关于某些客体(如机构、人物等)的指示性描述,或关于某一事件发生的时间、地点、经过等信息并将其查找出来的检索。如:名词术语、概念、定义、理论、方法、公式、事件等
13、。事实检索属于数据,因为事实也是一种数据,即非数值性数据)按检索要求区分:(1)强相关检索(强调检索的准确性,也称作特性检索)(2)弱相关检索(强调检索的全面性,向用户提供系统完整的信息的检索。也称族性检索)第二章信息检索的理论与基本方法1、定义:信息检索语言又称为情报语言、情报存储和检索语言、信息组织语言,是用来描述文献特征,表达主题提问的一种专门的人工语言,是由给定领域中的一切可用来描述信息内容和信息需求的词汇或符号,及其使用规则构成的供标引和检索的工具。是沟通信息存储与检索两个过程,标引人员与检索人员的桥梁。信息检索语言是检索系统的语言基础,主要作用是:表达描述信息内容和信息需求;用于信
14、息的组织和整序;用于对检索系统中索引标识或提问标识的规范和控制。2、分类:根据结构原理划分:(1)分类语言(2)主题语言(3)分类主题一体化语言(4)代码语言(5)引文语言分类语言主要可分为:等级体系型分类语言和分面组配型分类语言目前我国广泛采用中国图书馆分类法(简称中图法)进行分类,该分类法由5大部类、22个大类组成主图语言分为:标题语言关键词语言元词语言叙词语言3、检索途径及其选择:(1)内容特征检索途径:内容特征是指表征文献实质意义的特征,如主题词、关键词、分类号、内容摘要等。分类途径主题途径分类主题途径(2)外部特征检索途径:外部特征是指文献上显而易见的,一般情况下不反映文献实质意义的
15、那些特征,如书名(题名、篇名)、人名、各种符号标识(专利号、标准号、报告号等)、机构名、文献出处等责任者途径题名途径序号途径引文途径4、西文词典一般都是按本国文字的字母顺序排列,查询时按字顺查找;日文字典大多按五十音顺排列,查找时按音顺查找;中文字典排列方法较多,有部首法、笔画笔顺法、汉语拼音法、四角号码法等。5、百科全书按收录范围分为:综合性百科全书(如:中国百科全书、专业性百科全书(如I:化工百科全书;还可按编辑规模分为:大百科全书(20卷以上)、小百科全书(10卷以下)、百科词典(单卷)。编排方式有三种:按字顺编排、按分类编排和分类与字顺相结合编排。目前,按字顺编排条目已成为百科全书编排方式的主流,也有采用分类与字顺相结合的形式编排的。百科全书其中最主要的是主题索引6、世界ABC三大百科全书:美国百科全书EA、不列颠百科全书EB(又称大英百科全书)、科利尔百科全书EC7、年鉴大体可分为,综合性年鉴和专业性年鉴两大类,前者如百科年鉴、统计年鉴等;后者如经济年鉴、历史年鉴、文艺年鉴、出版年鉴等。其主要作用是向人们提供一年内全面、真实、系统的事实资料。8、名录可分为:人名录、地名录和机构名录9、文献检索工具简介:文献检索工具是用于报道、存贮和查找文献线索的工具,它通过对文献特征的