检索绪论

如题所述

第1个回答  2010-10-26
信息:信息是物质存在的一种方式、形态或运动状态,是事物的一种普遍属性,一般指数据、消息中包含的意义,可以使消息中所描述事件的不定性减少。

知识:人们在改造世界的实践中所获得的认识和经验的总和,是人的大脑通过思维重新组合的系统化的信息集合。

情报:为解决一个特定的问题所需要的激活了的、活化了的特殊知识或信息。
(情报的基本属性:知识性、传递性、效用性)

文献:记录有知识的一切载体。 (GB3792.1-83《文献著录总则》)
文献的四个基本要素:
①记录知识的具体内容;
②记录知识的手段,如文字、图像、符号、声频、视频等;
③记录知识的物质载体,如纸张、光盘、录像带等;
④记录知识的表现形态,如图书、期刊、专利说明等。
一、文献的类型(按载体类型分):
印刷型:传统的图书、期刊等
视听型:唱片、录音带、录像带等
缩微型:缩微胶卷、缩微胶片等
数字型(或电子型):电子图书、电子期刊、数据库等

*零次文献:未经信息加工,直接记录在载体上的原始信息,如实验数据、试验记录、调查材料、设计草图、私人笔记、口头交流的信息等。

一次文献:即原始文献,指著者以其本人的研究成果(如实验、观察、调查研究等的结果)为基本素材写成的原始创作。
例如:专著、期刊论文、研究报告、会议文献、专利文献、学位论文、会议论文、译文、电子期刊、电子图书等。

二次文献:将大量无序、分散的一次文献收集、整理、加工、著录,并按一定的顺序加以编排,形成可供检索一次文献线索的新的文献形式。因其检索功能而称之为检索工具或检索系统。
例如:题录、目录、索引、文摘等。
题录:以期刊论文为例,加下划线部分为文献出处。
题名/著者//期刊名.年,卷(期).–页码

三次文献:围绕某一专题,利用二次文献的检索,在吸取一次文献内容的基础上形成的文献。如综述、述评、进展等期刊文献和百科全书、年鉴、指南、手册等参考工具书。
综述(Survey, Review)是指综合分析和描述一定时间范围内某一学科或专业科研发展和现状,并预测未来的一类文献。

检索的概念:
检索(Retrieval):利用检索工具查询问题答案的全过程。
文献检索(Literature retrieval):指以获取文献为目的,科学地借助各种检索工具,查询相关文献资料的过程。
信息检索(Information retrieval):指从任何信息集合中查出所需信息的活动、过程和方法,有广义和狭义两种理解。广义的信息检索还包括信息存储,合称信息存储与检索。狭义的信息检索仅指信息的查找过程。

检索语言是信息存储与检索过程中描述信息特征和表达用户信息提问的一种人工语言。
它是根据文献的外表特征或者内容特征,把某些具有检索意义的语言或符号加工编制成为文献信息检索服务的特殊语言。
检索语言的主要作用是对文献的外表特征和内容特征进行多层次描述,提供多种检索途径,以方便用户从不同角度进行检索查找。

分类语言:
中国图书馆图书分类法(中图法)
国际十进分类法(Universal Decimal Classification, UDC)
美国国会图书馆图书分类法(Library of Congress Classification, LC)

中图法基本大类:
A 马克思主义、列宁主义、毛泽东思想
B 哲学
C 社会科学总论
D 政治、法律
E 军事
F 经 济
G 文化、科学、教育、体育
H 语言、文学
I 文学
J 艺术
K 历史、地理
N 自然科学总论
O 数理科学和化学
P 天文学、地球科学
Q 生物科学
R 医药、卫生
S 农业科学
T 工业技术
U 交通运输
V 航空、航天
X 环境科学、劳动保护科学(安全科学)
Z 综合性图书

关键词:指出现在文献的标题、文摘或全文中,能表达文献实质内容的,或者能被人们作为检索入口的关键性专业名词术语。是一种没有规范化的自然语言,又称为自由词。

主题词:是一种反映文献内容主题、经过严格规范化了的人工语言。即是将反映文献主题的各种同义词进行书写形式的统一化后定下的检索语言。

数据库及其结构:
数据库(Database)是能满足某种特定目的或某一特定数据处理系统需要的一种数据集合,它可以由一个或多个文档组成。
文档(File)是数据库中一部分记录的集合。
记录(Record)是数据库中的基本文献单元,一条记录往往记录着一篇文献的相关信息。
字段(Field)是组成记录的基本信息单元。每一个字段都描述文献的某一方面的特征,包括外表特征和内容特征,如题名、作者、刊名、出版年、主题词等等。各个描述文献一部分特征的字段组合就成了记录。

布尔逻辑检索是检索系统中应用最为广泛的检索技术,是最简单、最基本的匹配模式,其理论基础是集合论与布尔逻辑。
布尔逻辑检索采用布尔逻辑表达式来表达用户的检索要求。布尔逻辑表达式是指通过布尔逻辑运算符来连接检索词,以及表示运算优先级的括号组成的一种表达检索要求的算式。
例: (肺癌 or 肺肿瘤)and 手术

位置检索(又称相邻度检索、邻近检索):检索时通过位置算符(又称邻近算符)规定检索词之间在原始文献中的相邻位置关系。
位置算符都隐含了逻辑算符AND的含义,即由它们连结的两个检索词(式)都必须出现,但位置算符还对连结的两个检索词的位置关系作了进一步的限定。

位置检索大致包括三种级别的检索:
字段级检索:限定检索词在同一字段范围内,如with(Medline光盘数据库);
子字段或自然句级检索:限制检索词在同一子字段或自然句中,如near(Medline光盘数据库);
词位置检索:限定检索词的相互位置满足某些条件,如彼此相隔多少个词(或字),是否以一定的先后顺序出现,一个词的出现是否不允许另一个词(或字)同时出现等,如nW、pre(ScienceDirect)。

截词检索是在检索时针对检索词附加一个截断符号,指明该检索词在与文献数据库的词比较时,采取完整匹配还是部分匹配。
截词符分为无限截断和有限截断。
无限截断:一个截词符代表多个字符,常用截词符 “*”。有前截断、中截断、后截断之分。
有限截断:一个截词符只能代表一个字符,常用截词符 “?”(又称通配符)。

指定字段检索是指为了达到某种检索目的,把检索的范围限制在某个或某几个字段内进行的检索方法。

知识是人的大脑经过思维加工而形成的有序化信息的集合,是一种信息产品,是信息的一部分;文献则是记录有人类知识的一切载体,是知识的一部分;情报是人们为解决特定问题而被活化了的知识,是知识的一部分,情报也蕴含在文献之中,但不是所有文献都是情报,因而信息、知识、文献、情报之间是一种包含与被包含的关系。