首页 > 广东 > 阳江市 > 信息检索的方法,常用文献信息的检索方法

信息检索的方法,常用文献信息的检索方法

来源:整理 时间:2023-01-05 07:08:15 编辑:好学习 手机版

1,常用文献信息的检索方法

中文的话:中知网、维普、万方。。。。外文:ncbi 。。。。。。
给你说一个软件 文库宝, 我的资料都从上面找,可以下载很好用

常用文献信息的检索方法

2,怎样进行信息检索

就是一探手到海里就捞到了针.
首先对文本进行清洗(预处理),然后进行分词,接着建立索引,最后实施检索……基本过程应该差不多是这样子的,但是具体实施步骤与具体方法还看你是要检索什么样的数据、要达到什么目的额。

怎样进行信息检索

3,信息检索有什么秘诀吗

工作及生活都发生了变化、索引和文摘信息检索大概可分为四个阶段:初级阶段的检索工具书。在筛选过程中,限定性词语越多,限定性越小,搜集的信息越准确,同时也越少。第三是计算机检索阶段,随着科学技术的发展,信息检索也在发生变革,使人们真正进入了信息社会。 在网络检索时代,人们大量使用网络筛选信息,不久就被用来进行信息的存储和检索。第四阶段是网络检索时代,网络的出现,使我们的学习。1946年第一台电子计算机诞生以后,主要是以图书目录为主。第二是手工检索阶段,信息检索的真正发展是在18世纪以后。逐渐形成了完整的手工检索工具——目录
准确地说,不应称为秘诀,而是技术和方法信息检索技术和方法的确是可以分类的详细阐述的
..0.0
你好!准确地说,不应称为秘诀,而是技术和方法信息检索技术和方法的确是可以分类的详细阐述的希望对你有所帮助,望采纳。

信息检索有什么秘诀吗

4,网络信息检索方式

网络信息检索方式指网络信息检索系统或数据库在检索首页界面或网页的各个不同检索区上设置的检索人口的总称。检索方式有:简单检索、复合检索、高级检索、分类(浏览)检索、导航检索、专家检索等。 1.简单检索(simple search) 也有称初级检索、自由词检索、基本检索。指在数据库首页的检索词输入框(或称查询提问框)内输入一个单词或词组,提交检索工具查询的一种检索方式。这是最基本的检索方式。 2.复合检索(combine search) 也称布尔逻辑组配检索(bo01ean search),或简称组配检索。复合检索指在任意字段情况下在检索式输入框内输入复合逻辑检索式提交检索工具查询的一种检索方式。 3.高级检索(advanced search) 高级检索指在已设定的高级检索窗口中输入多个检索词,运用逻辑组配关系,查找同时满足多个检索条件的数据,在高级检索界面上一次性实现本应多次检索的结果的一种检索方式。 4. 目录检索(category search)(或称分类检索) 有些检索工具,如雅虎、万方,提供分类目录检索。目录检索是指目录按类名分类,每类又分若干子类目,层层逐级展开,最后点击末级类名,显示网页名链接和简短内容摘要,点击链接,显示相关网页内容(如雅虎),或显示该类的文献记录(如万方、维普)。 5.导航检索(navigation search)或称浏览检索(browse search) 导航检索与目录检索相似,指在系统设置的导航区内按检索树格式逐级展开和进行浏览选择的检索方式。导航检索有学科分类导航检索和刊名导航检索。分类导航检索在选择到分类未级时会显示该类的全部文献记录。刊名导航则在按刊名分类或字顺查到所需刊名时会显示该刊年份和期号,在选定期号后即会显示该期的目录,以供选择某文的题录、文摘或全文,如维普。 6.专家检索(expen search) 指系统在检索页面上设置一个较大的提问框供用户输入检另策略。用户可根据检索课题的需要,调用相应的检索技术编制比较细致复杂的检索提问式,以一次达到比较满意的检索结果。这种检索方式适用于有丰富检索经验的用户。

5,网络信息检索的方法有哪些分析这些方法的差异性及其各自的优势

网络信息检索方法主要有以下四种:1、漫游法2、直接查找法3、搜索引擎法4、网络资源指南法1.漫游法 (1)偶然发现。这是在因特网上发现、检索信息的原始方法。即在日常的网络阅读、漫游过程中,意外发现一些有用信息。这种方式的目的性不是很强,具不可预见性和偶然性。 (2)顺“链”而行。指用户在阅读超文本文档时,利用文档中的链接从一网页转向另一相关网页。此方法类似于传统手工检索中的“追溯检索”,即根据文献后所附的参考文献追溯查找相关的文献,从而不断扩大检索范围。这种方法可能在较短的时间内检出大量相关信息,也可能偏离检索目标而一无所获。 2.直接查找法 直接查找法是已经知道要查找的信息可能存在的地址,而直接在浏览器的地址栏中输入其网址进行浏览查找的方法。此方法适合于经常上网漫游的用户。其优点是节省时间、目的性强、节省费用,缺点是信息量少。 3.搜索引穆检索法 此方法是最为常规、普遍的网络信息检索方法。搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具。用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果提供给用户。它一般支持布尔检索、词组检索、截词检索、字段检索等功能。利用搜索引擎进行检索的优点是:省时省力,简单方便,检索速度快、范围广,能及时获取新增信息。其缺点是:由于采用计算机软件自动进行信息的加工、处理,且检索软件的智能性不很高,造成检索的准确性不是很理想,与人们的检索需求及对检索效率的期望有一定差距。 4.网络资源指南检索法 此方法是利用网络资源指南进行查找相关信息的方法。 网络资源指南类似于传统的文献检索工具————书目之书目(bibliography of bibliographies),或专题书目,国外有人称之为web of webs,webliographies,其目的是可实现对网络信息资源的智能性查找。它们通常由专业人员在对网络信息资源进行鉴别、选择、评价、组织的基础上编制而成,对于有目的的网络信息检索具有重要的指导作用。其局限性在于:由于其管理、维护跟不上网络信息的增长速度,使得其收录范围不够全面,新颖性、及时性不够强,且用户还要受标引者分类思想的限制。参考资料:过仕明主编. 信息检索概论. 黑龙江科学技术出版社, 2005.10

6,网络信息检索的策略与技巧

网络信息检索策略设计应遵循快、准、全及低成本的原则,以实现检索策略最优化。1、明确检索目标,确定检索项分析主题、使用布尔逻辑算符等构造检索式2、选择合适的检索系统根据检索主题和检索系统的特点选择检索系统3、正确对待检索结果对漏检、错检、溢检、无检索结果的处理方式。4、选择最佳上网时间选择网速较快的时间段。 多数情况下,有一个好的搜索策略,能正确地应用布尔逻辑符,并熟悉每个搜索引擎的特性,就可得到一个好的检索结果。除此之外,在某些情况下还可用其他的一些技巧来改善检索结果。1、扩大检索范围、提高查全率2、缩小检索范围、提高查准率3、Ctrl十F 用搜索引擎检索到所需文档并连接到相关网页后,有时会发现所要的文件并没有出现在当前视野中,这可能是因为文件存放在当前网页的底部。一个快捷的方法就是按“Ctrl十F”在当前页查找文件。4、给检索结果作标签避免再重复出现。
所谓信息检索策略就是为实现检索没目标而制定的全盘计划和方案,是对整个检索过程的谋划和指导。 ?编辑本段制定一个良好的检索策略。 如何制定一个良好的检索策略,往往涉及到以下各方面的知识和技能。?l 明确检索的内容和目的 在检索之前,须弄清检索主题,对所给出的检索课题进行分析,根据它的主题结构、类型、专业范围、性质等加以分析,使之形成若干能代表信息需求而且有检索意义的主题概念,包括所需信息的主题概念有几个.概念的专指度是否合适,哪些是主要的,哪些是次要的,力求分析的主题概念能准确反映检索的需要,明确所需文献信息的文献数量、语种、年代范围、类型及其他外表特征,明确检索内容涉及的主要学科范围等。明确检索的内容和目的是选择检索工具、选择数据库以及其它检索行为的第一步。 ?2 尽可能使用专题检索工具及专业数据库,并收集一些专题信息网址 ?专题检索工具是专为查询某一学科或某一主题的信息而产生的查询工具。相对于综合性的检索工具来说,专题检索工具对解决实际查询问题十分有效,它具有更高的查准率和查全率。而选择数据库的原则是以专业数据库为主,综合数据库为辅。 3 了解何种信息由哪些机构提供服务,并注意收集一些机构的url 了解何种检索工具,何种参考工具能回答何种问题是信息查询的关键。有时从信息提供机构搜索信息源能取得意想不到的效果,即了解从网上可以获取哪些信息、何种信息主要由哪些机构提供服务仍是十分重要的。这就需要我们平时多注意一些机构地址的收集.以便检索时能“随手拈来”做到快速查询信息的目的。 4 了解常用的搜索引擎以及检索系统的特性与功能 搜索引擎在查询范围、检索功能等方面各具特色,不同的检索应选用不同的搜索引擎。了解常用搜索引擎的性质、功能、检索方法等,有利于更好地使用搜索引擎。 5 掌握实用的检索技巧 掌握一些实用的检索技巧能让你操作自如,得心应手,从而做到快速、准确、全面地查找信息。 1) 提高查全率的方法:降低检索词的专指度,用上位词或相关词补充到检索式中;尽可能多地罗列同义词;使用多个检索途径;取消某些过严的限制,尽可能在所有检索的字段中检索;使用截词检索方法:使用"or" 进行检索:使用多元搜索引擎。 2)提高查准率的方法:提高检索式的专指度,增加或换用下位词和专指度较高的词;增加概念进行限制;限制检索词出现的可检字段;利用not 限制一些不相关的概念;使用"and"检索;利用进阶检索功能(即利用前一次检索的结果作为后一次检索的范围,逐步缩小检索范围)。 3)加快检索速度的技巧有:利用检索站点的特色服务快速检索;掌握不同引擎的搜索策略,充分利用不同引擎的优点,可以获得最佳最快的检索结果。 4 )一般的搜索技术有:逻辑操作符的使用,包括and, not, or; +、-和通配符的使用;不要滥用空格,在输入汉字作关键词时,不要在汉字后追加不必要的空格;注意大小写的敏感性:避免使用一个词查询,输入的主题词尽可能多而且是精确词或词组.有利于缩小检索范围"最专指面优先" 6 .机检和手检有机结合起来,节约检索费用 机检即计算机检索,包括光盘检索、联机检索、网络检索。手检即手工检索,主要是利用工具书和期刊查找资料。计算机检索的出现为情报检索的发展开创了崭新的局面,它改变传统手工检索的方式,能迅速为检索者查找信息资料。不过,即使机检有再多的优点,有时也需要手检与之配合,以达到更好的效果。 7 注意检索策略信息动向,培养信息检索能力
策略:1、明确检索目标,确定检索项分析主题、使用布尔逻辑算符等构造检索式。2、选择合适的检索系统根据检索主题和检索系统的特点选择检索系统。3、正确对待检索结果对漏检、错检、溢检、无检索结果的处理方式。4、选择最佳上网时间选择网速较快的时间段。 多数情况下,有一个好的搜索策略,能正确地应用布尔逻辑符,并熟悉每个搜索引擎的特性,就可得到一个好的检索结果。除此之外,在某些情况下还可用其他的一些技巧来改善检索结果。技巧:1、扩大检索范围、提高查全率。2、缩小检索范围、提高查准率。3、Ctrl十F用搜索引擎检索到所需文档并连接到相关网页后,有时会发现所要的文件并没有出现在当前视野中,这可能是因为文件存放在当前网页的底部。一个快捷的方法就是按“Ctrl十F”在当前页查找文件。4、给检索结果作标签避免再重复出现。

7,如何进行计算机信息检索

1 计算机信息检索的基本方法 4.3.1明确检索要求和检索目标计算机检索的第一步准备工作是明确检索要求和检索目标。明确检索要求就是要搞清楚本课题属于什么学科,所需文献的类型及语种,查找文献的年代,所需文献的最佳篇数,允许支配的检索费用。这些要求对选择数据库、构造检索策略都是十分重要的。 确定检索目标也是进行计算机信息检索前应搞清楚的准备工作。例如:如果属于开题调研,则应尽可能地检索出与之相关的全部文献,即要求较高的查全率;以便充分地做好开题的准备工作;如果属于探索性、开创性的课题,则只需要查出一些启发性的文献,对查准率和查全率要求都不一定有很高的要求。 4.3.2课题分析1. 课题概念的分析方法分析课题就是分析出课题所涉及的主要概念,并找出能代表这些概念的若干个词或词组,进而分析概念之间的上、下、左、右关系。对于新学科、交叉学科和边缘学科的课题,则要搞清楚这些概念之间的关系。概念分析的结果应以概念组为单元的词或词组的形式列出,以便下一步制订检索策略时使用。 2. 隐含概念的分析方法有些课题的实质性内容往往很难从课题的名称上反映出来,课题所隐含的概念和相关的内容需要从课题所属的专业角度作深入分析,才能提炼出能够确切反映课题内容的检索概念。例如:"社会保障"包含"养老保险"、"失业保险"、"医疗保险"和"社会救济"等概念,如果要检索社会保障方面的文献,应该析出上述概念,才能保证文献的查全率。 3. 核心概念的选取有些检索词中已经含有的某些概念,在概念分析中应予以排除。例如:课题"公司劳动奖励、职工培训和养老保险制度管理的理论和实践",如果把"劳动奖励","职工培训","养老保险","公司","制度","管理"六个概念全部组配起来,则会造成大量文献漏检。实际上,劳动力资源管理已经包含了劳动奖励、职工培训和养老保险三个方面,而且,劳动力管理必然是针对该三个方面而言的。因此,本课题只须采用"劳动力资源"和"管理"这两个本质概念即可。 为了提高文献的检准率,应该从相应的规范词表中选择所需的检索词。并且在确定检索词时,除了要考虑反映主题概念的同义词、近义词等相关的检索词外,还要注意选择被选用检索词的缩写词和不同拼法的词,以避免漏检有关的文献。 4.3.3检索词的扩展、选择和处理目前的计算机信息检索系统,还不具备智能思考的能力,还不会对所输入的检索词以及涉及的所有词进行自动、全面的检索,因此,必须在概念分析的基础上列出与概念有关的词,从中做出选择,并利用截词等方法对检索词予以归并。 1.相同概念的检索词的扩展 扩展相同概念的检索词的方法一般有同义词方法、主题词表方法和截词方法(1) 同义词方法。在同一概念的范畴内,从语言角度,选择不同的名称、不同的拼写方法和单复数形式。不同的名称包括学名和俗名、简称和全称,商品名和物质或产品名,事物的代码和事物的学名。不同的拼写方法,以英语为例,包括英式英语和美式英语的区别。 (2)截词方法。当某些检索词词干相同、词义相近,但词尾或词中间有变化时(多数英语单词的单复数变化和英美不同拼写形式),可以采用截词方法扩展检索词。这种方法要求在词干后使用截词符。截词符一般包括"?"和"*"两种。具体采用什么形式,各个系统都有明确的规定。例如:在DIALOG系统中,截词符号有无限截词算符 ("?") 和有限截词 ("??"和"?? ?")等多种,"?"有时还用做字符屏蔽符。(3)主题词表方法  许多数据库都编有自己的主题词表。在数据库编有主题词表的情况下,应该尽量从词表中选择检索词。使用主题词表,不仅可以使检索词更加规范,提高检索结果的准确性,而且可以从同族词中选取更多的上位词、下位词、相关词,使获得的检索结果更为理想。 2.检索词的选择和处理 运用上述方法得到的词,首先应加以选择,即注意选用本专业通用的术语(应避免使用冷僻词和根据中文术语自译生造的词),然后以概念为单位,构成组面(facets)。例如:课题"东西方社会保障制度比较研究"的概念组面和检索词为:--------------------------------------------------------------------------------2 计算机信息检索的基本方法  概念组面1:"社会保障"social security 概念组面2:"制度研究"system? Research4.3.4数据库的选择不同数据库的学科范围不同,检索指令不同,收费的标准也不同。所以,在检索之前应该阅读有关数据库的使用介绍,以便选择数据库时做到心中有数。 选择数据库,我们一般应该遵循以下几条原则1.按照课题的检索要求和目的,选择收录文献种类多、专业覆盖面宽、年代跨度对口的数据库; 2.当需要查找最新文献信息时,选择数据更新周期短的数据库;3.当还需要获取原文时,选取原文获取较容易的数据库; 4.在同时有多个数据库可供选择的情况下,应首先选择比较熟悉的数据库。 5.当几个数据库的内容交叉重复率比较高时,应选择检索费用比较低的数据库。 4.3.5检索策略构成和调整方法在实际检索过程中,仅需一个检索词就能满足检索要求的情况并不很多。通常我们需要使用多个检索词构成检索策略,以满足由多概念组配而成的较为复杂课题的要求。 检索策略,又称提问逻辑,就是对多个检索词之间的相互关系和检索顺序作出的某种安排。构成检索策略就是运用计算机情报检索系统可以接受的方法,包括布尔逻辑算符、位置逻辑算符等方法,表达课题检索要求的过程。 1.布尔逻辑算符  规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑"或(OR)"、"与(AND)"和"非(NOT)"。 (1) 或(OR)运算符。也可用"+"代替,是用来组配具有同义或同族概念的词,如同义词、相关词等。其含义是,检出的记录中,至少含有两个检索词中的一个。OR算符的基本作用是扩大检索范围,增加命中文献量,提高检索结果的查全率,OR运算符还有一个去重的功能。在实际检索中,同一组面中含义相同的词,相互之间都使用OR运算符。另外,在使用截词方法检索具有相同词干的检索词时,这些词之间也自动地隐含了逻辑"或"的关系。 (2) 与(AND)运算符。也可用"*"代替,用来组配不同检索概念。其含义是检出的记录必须同时含有所有的检索词。AND算符的基本作用是缩小检索范围,减少命中文献量,提高检索结果的查准率。在实际检索中,不同概念组面之间以及同一组面内的不同含义的词之间通常使用AND算符。 (3) 非(NOT)运算符。也可用"-"代替,但在检索时建议使用NOT,以避免与词间的分隔符"-"混淆,NOT算符是排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能同时含有其后的词。NOT算符的基本作用是缩小检索范围,提高检索结果的查准率. 2. 位置算符  位置算符又称邻接算符(adjacent operators),适用于两个检索词以指定间隔距离或者指定的顺序出现的场合,比如,以词组形式表达的概念;彼此相邻的两个或两个以上的词;被禁用词或特殊符号分隔的词等。位置算符是调整检索策略的一种重要手段。按照两个检索词出现的顺序和距离,可以有多种位置算符,而且对同一种位置算符,检索系统不同,规定的位置算符也不同。例如,Compendex光盘数据库使用的位置算符"(N)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序可以颠倒)、"(F)"(表示其两侧的检索词必须在同一字段(例如同在题目字段或文摘字段)中出现,两词的词序可以颠倒)、"(S)"(表示其两侧的检索词必须在同一句子中出现,两词的词序可以颠倒)和"(W)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序不可以颠倒)四种。 3.字段限制字段限制也是调整检索策略的一种重要的手段。它是限定检索词必须在数据库记录中规定的字段范围内出现的文献,方为命中文献的一种检索方法。如果想指定在题名等字段中查找所希望的检索词,就需要使用字段限制。字段限制适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索结果的查准率的场合。由于字段限制采用前缀和后缀的形式,因此又称为前缀限制和后缀限制。例如Compendex光盘数据库基本字段限制的用法是在需要指定字段的检索词后加上后缀运算符"/"和段码。这个数据库辅助字段限制的用法是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符"="。 --------------------------------------------------------------------------------3 计算机信息检索的基本方法 4. 检索策略的调整检索策略输入检索系统后,系统响应的检索结果有时不一定能满足课题检索的要求,例如:或者检出的篇数过多,而且不相关文献所占比例很大,或者检出的文献数量太少,有时甚至为零,这时就需要调整检索策略。 调整检索策略之前,首先要分析造成检索结果不理想的原因。对于输出篇数过多的情况,应分析是否是由下述原因造成的:①选用了多义性的检索词;②截词截得过短;③输入的检索词太少;④应该使用"与(AND)"的使用了"或(OR)";⑤优先运算符"()"使用错误。对于输出篇数过少的情况,应分析是否是由下述原因造成的:①检索词拼写错误;②遗漏重要的同义词或隐含概念;③检索词过于冷僻具体;④没有使用截词算符;⑤位置算符和字段算符使用的过多;⑥使用过多的"与(AND)"算符。 针对上述原因,如果是属于需要扩大检索范围,提高文献查全率,调整检索策略的方法有:①减少"与(AND)"算符,增加同义词或同族相关词使用逻辑或(OR)将它们连接起来;②在词干相同的单词后使用截词符(?);③去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。 如果是属于缩小检索范围,提高文献查准率的,调整检索策略的方法有:①减少同义词或同族相关词;②增加限制概念,用逻辑与(AND)将它们连接起来;③使用字段限制,或者限定检索词在指定的基本字段,或者指定的辅助字段出现,限制检索结果的文献类型、语种、出版国家;④使用适当的位置算符;⑤使用"非(NOT)"算符,排除无关概念。 4.3.6输出格式和方式的选择所谓输出格式的选择是对记录字段的选择。所谓输出方式的选择是指对屏幕显示、打印和存盘的选择。一般情况下,如果输出的是中间结果,属于基本字段的题目(TI)、文摘(AB)、叙词(DE)和识别词(ID)字段是必须的,这些字段有利于观察结果,对检索策略做进一步调整。如果是最终结果,可以根据时间、经费条件选择其中适用的格式。 输出方式的选择,要注意的问题是,数据库是否只允许打印、存盘选中的记录;在选定打印、存盘后,是否还须进一步选择"当前记录""全部记录""选中记录";另外如果是存盘,是否还有文件扩展名的限制。
1 计算机信息检索的基本方法 4.3.1明确检索要求和检索目标计算机检索的第一步准备工作是明确检索要求和检索目标。明确检索要求就是要搞清楚本课题属于什么学科,所需文献的类型及语种,查找文献的年代,所需文献的最佳篇数,允许支配的检索费用。这些要求对选择数据库、构造检索策略都是十分重要的。 确定检索目标也是进行计算机信息检索前应搞清楚的准备工作。例如:如果属于开题调研,则应尽可能地检索出与之相关的全部文献,即要求较高的查全率;以便充分地做好开题的准备工作;如果属于探索性、开创性的课题,则只需要查出一些启发性的文献,对查准率和查全率要求都不一定有很高的要求。 4.3.2课题分析1. 课题概念的分析方法分析课题就是分析出课题所涉及的主要概念,并找出能代表这些概念的若干个词或词组,进而分析概念之间的上、下、左、右关系。对于新学科、交叉学科和边缘学科的课题,则要搞清楚这些概念之间的关系。概念分析的结果应以概念组为单元的词或词组的形式列出,以便下一步制订检索策略时使用。 2. 隐含概念的分析方法有些课题的实质性内容往往很难从课题的名称上反映出来,课题所隐含的概念和相关的内容需要从课题所属的专业角度作深入分析,才能提炼出能够确切反映课题内容的检索概念。例如:"社会保障"包含"养老保险"、"失业保险"、"医疗保险"和"社会救济"等概念,如果要检索社会保障方面的文献,应该析出上述概念,才能保证文献的查全率。 3. 核心概念的选取有些检索词中已经含有的某些概念,在概念分析中应予以排除。例如:课题"公司劳动奖励、职工培训和养老保险制度管理的理论和实践",如果把"劳动奖励","职工培训","养老保险","公司","制度","管理"六个概念全部组配起来,则会造成大量文献漏检。实际上,劳动力资源管理已经包含了劳动奖励、职工培训和养老保险三个方面,而且,劳动力管理必然是针对该三个方面而言的。因此,本课题只须采用"劳动力资源"和"管理"这两个本质概念即可。 为了提高文献的检准率,应该从相应的规范词表中选择所需的检索词。并且在确定检索词时,除了要考虑反映主题概念的同义词、近义词等相关的检索词外,还要注意选择被选用检索词的缩写词和不同拼法的词,以避免漏检有关的文献。 4.3.3检索词的扩展、选择和处理目前的计算机信息检索系统,还不具备智能思考的能力,还不会对所输入的检索词以及涉及的所有词进行自动、全面的检索,因此,必须在概念分析的基础上列出与概念有关的词,从中做出选择,并利用截词等方法对检索词予以归并。 1.相同概念的检索词的扩展 扩展相同概念的检索词的方法一般有同义词方法、主题词表方法和截词方法(1) 同义词方法。在同一概念的范畴内,从语言角度,选择不同的名称、不同的拼写方法和单复数形式。不同的名称包括学名和俗名、简称和全称,商品名和物质或产品名,事物的代码和事物的学名。不同的拼写方法,以英语为例,包括英式英语和美式英语的区别。 (2)截词方法。当某些检索词词干相同、词义相近,但词尾或词中间有变化时(多数英语单词的单复数变化和英美不同拼写形式),可以采用截词方法扩展检索词。这种方法要求在词干后使用截词符。截词符一般包括"?"和"*"两种。具体采用什么形式,各个系统都有明确的规定。例如:在DIALOG系统中,截词符号有无限截词算符 ("?") 和有限截词 ("??"和"?? ?")等多种,"?"有时还用做字符屏蔽符。(3)主题词表方法  许多数据库都编有自己的主题词表。在数据库编有主题词表的情况下,应该尽量从词表中选择检索词。使用主题词表,不仅可以使检索词更加规范,提高检索结果的准确性,而且可以从同族词中选取更多的上位词、下位词、相关词,使获得的检索结果更为理想。 2.检索词的选择和处理 运用上述方法得到的词,首先应加以选择,即注意选用本专业通用的术语(应避免使用冷僻词和根据中文术语自译生造的词),然后以概念为单位,构成组面(facets)。例如:课题"东西方社会保障制度比较研究"的概念组面和检索词为:--------------------------------------------------------------------------------2 计算机信息检索的基本方法  概念组面1:"社会保障"social security 概念组面2:"制度研究"system? Research4.3.4数据库的选择不同数据库的学科范围不同,检索指令不同,收费的标准也不同。所以,在检索之前应该阅读有关数据库的使用介绍,以便选择数据库时做到心中有数。 选择数据库,我们一般应该遵循以下几条原则1.按照课题的检索要求和目的,选择收录文献种类多、专业覆盖面宽、年代跨度对口的数据库; 2.当需要查找最新文献信息时,选择数据更新周期短的数据库;3.当还需要获取原文时,选取原文获取较容易的数据库; 4.在同时有多个数据库可供选择的情况下,应首先选择比较熟悉的数据库。 5.当几个数据库的内容交叉重复率比较高时,应选择检索费用比较低的数据库。 4.3.5检索策略构成和调整方法在实际检索过程中,仅需一个检索词就能满足检索要求的情况并不很多。通常我们需要使用多个检索词构成检索策略,以满足由多概念组配而成的较为复杂课题的要求。 检索策略,又称提问逻辑,就是对多个检索词之间的相互关系和检索顺序作出的某种安排。构成检索策略就是运用计算机情报检索系统可以接受的方法,包括布尔逻辑算符、位置逻辑算符等方法,表达课题检索要求的过程。 1.布尔逻辑算符  规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑"或(OR)"、"与(AND)"和"非(NOT)"。 (1) 或(OR)运算符。也可用"+"代替,是用来组配具有同义或同族概念的词,如同义词、相关词等。其含义是,检出的记录中,至少含有两个检索词中的一个。OR算符的基本作用是扩大检索范围,增加命中文献量,提高检索结果的查全率,OR运算符还有一个去重的功能。在实际检索中,同一组面中含义相同的词,相互之间都使用OR运算符。另外,在使用截词方法检索具有相同词干的检索词时,这些词之间也自动地隐含了逻辑"或"的关系。 (2) 与(AND)运算符。也可用"*"代替,用来组配不同检索概念。其含义是检出的记录必须同时含有所有的检索词。AND算符的基本作用是缩小检索范围,减少命中文献量,提高检索结果的查准率。在实际检索中,不同概念组面之间以及同一组面内的不同含义的词之间通常使用AND算符。 (3) 非(NOT)运算符。也可用"-"代替,但在检索时建议使用NOT,以避免与词间的分隔符"-"混淆,NOT算符是排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能同时含有其后的词。NOT算符的基本作用是缩小检索范围,提高检索结果的查准率. 2. 位置算符  位置算符又称邻接算符(adjacent operators),适用于两个检索词以指定间隔距离或者指定的顺序出现的场合,比如,以词组形式表达的概念;彼此相邻的两个或两个以上的词;被禁用词或特殊符号分隔的词等。位置算符是调整检索策略的一种重要手段。按照两个检索词出现的顺序和距离,可以有多种位置算符,而且对同一种位置算符,检索系统不同,规定的位置算符也不同。例如,Compendex光盘数据库使用的位置算符"(N)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序可以颠倒)、"(F)"(表示其两侧的检索词必须在同一字段(例如同在题目字段或文摘字段)中出现,两词的词序可以颠倒)、"(S)"(表示其两侧的检索词必须在同一句子中出现,两词的词序可以颠倒)和"(W)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序不可以颠倒)四种。 3.字段限制字段限制也是调整检索策略的一种重要的手段。它是限定检索词必须在数据库记录中规定的字段范围内出现的文献,方为命中文献的一种检索方法。如果想指定在题名等字段中查找所希望的检索词,就需要使用字段限制。字段限制适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索结果的查准率的场合。由于字段限制采用前缀和后缀的形式,因此又称为前缀限制和后缀限制。例如Compendex光盘数据库基本字段限制的用法是在需要指定字段的检索词后加上后缀运算符"/"和段码。这个数据库辅助字段限制的用法是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符"="。 --------------------------------------------------------------------------------3 计算机信息检索的基本方法 4. 检索策略的调整检索策略输入检索系统后,系统响应的检索结果有时不一定能满足课题检索的要求,例如:或者检出的篇数过多,而且不相关文献所占比例很大,或者检出的文献数量太少,有时甚至为零,这时就需要调整检索策略。 调整检索策略之前,首先要分析造成检索结果不理想的原因。对于输出篇数过多的情况,应分析是否是由下述原因造成的:①选用了多义性的检索词;②截词截得过短;③输入的检索词太少;④应该使用"与(AND)"的使用了"或(OR)";⑤优先运算符"()"使用错误。对于输出篇数过少的情况,应分析是否是由下述原因造成的:①检索词拼写错误;②遗漏重要的同义词或隐含概念;③检索词过于冷僻具体;④没有使用截词算符;⑤位置算符和字段算符使用的过多;⑥使用过多的"与(AND)"算符。 针对上述原因,如果是属于需要扩大检索范围,提高文献查全率,调整检索策略的方法有:①减少"与(AND)"算符,增加同义词或同族相关词使用逻辑或(OR)将它们连接起来;②在词干相同的单词后使用截词符(?);③去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。 如果是属于缩小检索范围,提高文献查准率的,调整检索策略的方法有:①减少同义词或同族相关词;②增加限制概念,用逻辑与(AND)将它们连接起来;③使用字段限制,或者限定检索词在指定的基本字段,或者指定的辅助字段出现,限制检索结果的文献类型、语种、出版国家;④使用适当的位置算符;⑤使用"非(NOT)"算符,排除无关概念。 4.3.6输出格式和方式的选择所谓输出格式的选择是对记录字段的选择。所谓输出方式的选择是指对屏幕显示、打印和存盘的选择。一般情况下,如果输出的是中间结果,属于基本字段的题目(TI)、文摘(AB)、叙词(DE)和识别词(ID)字段是必须的,这些字段有利于观察结果,对检索策略做进一步调整。如果是最终结果,可以根据时间、经费条件选择其中适用的格式。 输出方式的选择,要注意的问题是,数据库是否只允许打印、存盘选中的记录;在选定打印、存盘后,是否还须进一步选择"当前记录""全部记录""选中记录";另外如果是存盘,是否还有文件扩展名的限制。
文章TAG:信息检索的方法信息信息检索检索

最近更新

  • 早晨图片,谁有早晨太阳刚刚升起的图片

    谁有早晨太阳刚刚升起的图片2,早晨最美是什么1,谁有早晨太阳刚刚升起的图片http://image.baidu.com/i?tn=baiduimagect=201326592lm= ......

    阳江市 日期:2023-05-06

  • 得了月子病怎么办,得了月子病怎么办急急

    得了月子病怎么办急急2,得了月子病咋办1,得了月子病怎么办急急病情分析:产后风又叫月子病,病症类似于风湿、类风湿疾病,全身关节疼痛难忍,遇冷、遇风后,疼痛的症状会加重。月子病月子治 ......

    阳江市 日期:2023-05-06

  • 期初建账,数据周期表:期初余额以上期期末余额核算

    期初余额以上期期末余额为基础,反映上期交易结果和上期采用的会计政策,扩展的数据期初balance指的是期初的现有账户余额,通常期初的余额是上一个账户结转到当前账户的余额,等于对应账 ......

    阳江市 日期:2023-05-06

  • 我心依然,我心依然什么意思

    我心依然什么意思意思是没有变化2,我心依然800字作文我对某某女孩子心依然坚定这题目很坑爹有歧义不过你老师应该叫你写你想学音乐但是失败了很多次我心依然美丽是流星的划过,是烟花的绽放 ......

    阳江市 日期:2023-05-06

  • 亲情伴我成长,作文 亲情伴我成长

    作文亲情伴我成长亲情伴我成长感悟亲情,就在生活的点点滴滴之中。自从,我在马老师补习班学习写作的过程当中,我就感悟到了浓浓的亲情。每次,我去马老师补习班时李老师是那么的认真,仔细讲解 ......

    阳江市 日期:2023-05-06

  • 唐筛准确率,唐筛检查的准确率有多高

    唐筛检查的准确率有多高2,唐氏筛查准确率有多高3,唐式筛查准确率高吗4,唐氏筛查正确率有多少1,唐筛检查的准确率有多高关键字唐氏筛查准确率需要明确的是,唐筛检查只能帮助判断胎儿患有 ......

    阳江市 日期:2023-05-06

  • 作文四年级,跪求四年级的作文日记一则

    跪求四年级的作文日记一则日记一则今天,我们早早地吃了晚饭,趁着外面凉快,我和妈妈一起去外面shopping.“叮铃铃”当我们来到十字路口一边的几家小店旁,正要进“圣百合”面包店的时 ......

    阳江市 日期:2023-05-06

  • 繁华落幕,繁华落幕:爱而无悔

    落幕:一般表示阶段结束或某事即将结束,也就是说,这个城市曾经繁华,现在却找不到过去的感觉,不再繁华,繁华是繁华的时候,落幕意味着结束,美好的时光已经过去,什么叫爱而无悔,当然,繁华 ......

    阳江市 日期:2023-05-06