我想写一篇与胡姬花花生油油有关的论文,大家帮想下怎么检索文献资料,也就是检索词,与胡姬花花生油油有关就行

您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
基于强化学习模型的科技用户学习机制研究:以检索方法认知为例论文.pdf99页
本文档一共被下载:
次 ,您可免费全文在线阅读后下载本文档
文档加载中...广告还剩秒
需要金币:200 &&
你可能关注的文档:
··········
··········
南京理工大学
硕士学位论文
基于强化学习模型的科技用户学习机制研究:以检索方法认知
姓名:贺娟
申请学位级别:硕士
专业:情报学
指导教师:甘利人
座机电话号码
基于强化学习模型的科技用户学习机制研究:以枪索方法认知为例
本论文为国家自然科学基金项目“数据库网站用户信息搜索中的学习行为研究" 编
号:座机电话号码 的一个子课题,核心任务在于通过强化学习模型的拟合实验研究来挖掘
科技文献数据库用户学习行为的内在机制。
本论文首先对科技文献数据库检索方法功能进行剖析,并提出检索方法的分类体系
框架;在此基础上,基于符号理论对科技文献数据库检索方法符号表征体系进行分析。
然后,运用认知心理学理论,对检索方法符号体系的认知机制以及认知改变的学习
机制进行分析,并提出检索方法符号选择行为改变的影响因素体系框架;同时,基于博
弈学习理论,对本文要研究的科技用户对于检索方法的选择学习行为的机制与博弈学习
行为的机制进行了比较。
接下来,对两个重要的强化学习模型――BM模型、RE基本模型及其修正模型进入
深入的理论分析,对模型的产生背景、理论假设、基本原理、验证方法、实验拟合情况、
修正点、适用性等进行全面考察。
最后,在模型分析的基础上,选择了其中的六个模型,对应科技用户检索方法选择
正在加载中,请稍后...第3章如何收集和利用文献资料第3章如
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
第3章如何收集和利用文献资料
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口大理学院成人高等教育护本《文献检索》课程学习指导(2012级起使用) - 大理学院成教在线
当前位置: >>
大理学院成人高等教育护本《文献检索》课程学习指导(2012级起使用)
来自:继续教育学院
时间:日22:59:00
大理学院成人高等教育
&&& 《文献检索》课程学习指导(2012级起使用)
(护理学专业本科)
文献检索专业(专升本)的一门选修课,36学时,2学分。该课程采用平时自学和期末面授相结合的教学方式。
文献检索文献检索
&[内容要点]
第一节&& 文献检索课的发展
一、文献(信息)检索的出现
信息、能源和材料,并称为现代社会的三大支柱。20世纪以来,人类创造的信息量高速增长,浩如烟海。信息检索,就是从浩如烟海的信息海洋中查找出所需信息的过程。为实现这个过程是需要适当理论和方法的,信息检索课应运而生。
作为一门学科,信息检索(Information Retrieval)历史可追溯到19世纪下半叶。但在20世纪中期以前,信息存储和传播主要以纸质为载体,因此,信息检索研究关注的是如何检索利用纸质文献中记载的信息。现代意义的信息检索作为一个独立的领域,是1946年计算机出现后在国际上逐步得以确立的。
二、我国的信息检索教育
教育部(当时是国家教委)1984年发出的“高教一字004号”文件要求在高等教育院校开设“文献检索与利用”课程。
近30年来,文献检索教育尤其是手工检索教育方面已取得了很大的成绩。然而随着计算机、多媒体等信息技术的发展,以多种载体多种记录方式的非纸信息急剧的增加,靠“手翻、眼看、大脑判断”的手工检索模式已经难以适应信息社会的发展要求,计算机信息检索应运而生;以Internet为代表的全球性计算机网络迅速发展和普及,更进一步的推动了信息检索的发展,使得网络化信息检索逐渐成为信息检索的主流。
第二节&& 信息素质
文献检索课的最终目的就是提高学生的信息素质。
一、信息素质的概念
信息素质这一概念是1974年,由美国信息工业协会的会长Paul Zurkowski首次提出的。当时他对信息素质下的定义是:利用大量的信息工具及主要信息源使问题得到解答的技术和技能。发展到今天,对它最广泛性的解释是,作为具有信息素质的人,必须具有一种能够充分认识到何时需要信息,并有能力有效的发现,检索,评价和利用所需要的信息,解决当前存在的问题的能力。
信息素质(information literacy)是一个综合性的概念,包含信息意识,信息技能,信息道德,是人们在工作中运用信息、学习信息技术、利用信息解决问题的能力。它是信息社会中人们必须具备的素质,也是当今素质教育一个重要方面。
1、信息意识
是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。
同样重要的信息,有的人善于抓住,有的人却漠然视之。这是由于各人的信息意识强弱不同。信息技能的掌握在很大程度上取决于信息意识的提高。强烈的信息意识――对信息敏感。一项有关 Medline 检索类型的研究提示平均每20分钟的检索可产生有用的信息,而这些信息有助于导致新的或改变临床的决定。
信息意识的强烈与否对能否挖掘出有价值的信息、对文献获取能力的提高起着关键的作用。日本人在这方面做得非常好,例如:大庆油田事件。
2、信息能力(信息技能)
寻求和创造新知识的能力。信息的搜集获取能力主要包括信息接受力;信息捕捉力;信息吸收力;信息检索力等。其中信息检索力指熟悉各种信息源,掌握信息检索的基础理论和基本技术,熟练地利用各种手工检索工具和计算机检索系统查找所需信息的能力。
&具体表现为以下6种技能:
明确任务(Task Definition):了解问题的症结,确定所需信息和目的,分清任务的轻重缓急;
信息查询策略(Information Seeking Strategies):了解各种信息源,能够作出评价并确定优先查找的次序;
查找和检索(Location and Access):确定信息藏址,从信息源中找出信息;
信息利用(Use of Information):能够读懂(或听懂、理解)查出的信息,了解信息在满足需求中的特定价值;
信息综合(Synthesis):能够组织信息,提供信息产品(论文、报告等);
信息评价(Evaluation):评价查找结果和解决问题的过程(效率)。
3、信息道德
指人们在信息活动中应遵循的道德规范。
信息犯罪是运用信息技术故意实施的严重危害社会并应负刑事责任的行为。
二、信息素质的分类和评价标准
1、信息素质可分为
工具素质:能用印刷和电子信息资源的有关工具,如计算机、软件等;
资源素质:了解信息资源的种类、形式和查找、检索方法;
社会结构素质:掌握信息的社会地位、作用、影响;
研究素质:掌握利用信息进行有关学科研究的技能;
出版和传播信息素质:能利用文本或多媒体报告研究结果。
2、信息素质的评价标准
1999年1月,美国大学与图书馆协会通过了“美国高等教育中学生信息素质能力标准”,共5条,每条附有具体的操作说明,为教师或图书馆对学生、用户、读者的信息素质评价提供了依据。这5条主要内容如下:
第一,能确定信息资源的特点和范围;
第二,能有效地获取所需信息;
第三,能评价信息及其来源,利用其知识基础和价值系统选择适当的信息;
第四,能有效利用所获得的信息实现特定的目标;
评价要点包括①能运用新的和以前的信息开发新产品或项目;②能调整开发产品或项目的过程;③能与别人就产品或项目情况进行有效的沟通
第五,了解信息使用的经济、法律和社会问题,在信息获取和利用时自觉遵守道德规范和有关的法律。(即在产品或项目开发中能正确使用有关信息资源,如合理使用或引用等)
终身学习是现代信息数字化时代的生存的基本技能,具备良好的信息发现、吸收、创新能力的较高信息素质则成为数字化时代个人发展的核心。这要求我们必须有能力从数量巨大的信息中鉴别、获取、利用信息,这种能力来自信息素质教育,个人知识的增长得益于信息素质的提高。
第三节&& 学习文检课的重要意义和作用
一、信息检索的意义
在信息爆炸的时代,纷繁芜杂的信息扑面而来。据估计,现在全世界每年出版图书在50万件以上,期刊10万种以上,专利约50万件,科技报告约90万件,会议文献10多万篇,产品样本50多万件,每年发表的科技论文近500万篇,以光盘,网络为载体的现代数字化、电子化文献急增,势不可挡,社会信息总量每年都呈指数式增长,这种现象被称为“信息爆炸”或“信息过剩”。
大量的信息往往使人无所适从,从浩如烟海的信息海洋中迅速而准确地获取自己最需要的信息,变的非常困难。在海量、无序的信息中准确地鉴别和摒弃有害的和无用的信息,迅速地找到、获得并利用对自己真正有用的信息,这是信息社会对个人信息素质的核心要求。在教育部1998年颁发的《普通高等学校本科专业目录和专业介绍》所包括的249中专业中就有218中专业在其业务培养要求中明确规定“掌握文献检索,资料查询的基本方法”或“掌握文献检索及运用现代信息技术获取相关信息的基本方法。”信息检索与信息利用能力已成为信息社会衡量人的信息素质的一个重要指标。
信息检索方法是人们打开知识信息宝库的金钥匙。一个人,不管他多么有学识,多么具有学习、研究和创造能力,他都必须在充分共享别人的信息资源、大量地吸收、借鉴前人的研究成果的基础上,才能有所发明、有所创造。
12积累、继承和借鉴前人的研究成果是科技发展的重要前提,在研究工作中,任何一个项目从选题、实验研究或设计,到成果鉴定,每一步都离不开信息。只有充分掌握了有关信息,才能避免重复,少走弯路,保证研究工作在尽可能高的层次上起步,并缩短研究周期。3更新自身知识积累,适应社会发展需要;掌握信息检索的方法与技能,是形成合理知识和更新知识的重要手段,是做到无师自通、不断进取的主要途径。
19667464830
196682036019711200
[内容要点]
一、信息(information)
图书情报学的定义:信息是事物存在方式、运动状态及其特征的反映,是事物发出的信号、消息。宇宙中事物存在和运动形态千变万化,信息也就千差万别。按信息内容可分为自然信息、生物信息、社会信息和机电信息四大类。
从自然界角度看,表征物质的属性:地球昼夜的变化是一种信息,它反映出地球绕太阳自转的运动特性和状态;山的高度是一种信息,它反映出山的空间特性;树干的年轮是一种住处它反映了树木成长的时间特性――树龄;闪电是一种信息,它反映了云层中所含能量的不知所云性;花的香味也是一种信息,它反映了花分子结构的化学特性等等。
据不完全统计,信息的定义有100多种,至今仍无法统一,为各界普遍认同。这种情况主要是由于信息本身的因素,以及认识层次上的差别造成的。
不同的学科,从不同的角度对信息这个概念有不同的解释。经济学、心理学、新闻学和哲学的定义不同于图书情报学对信息的定义。控制论专家N•看看维纳(N. Norbert Wiener)从信息自身具有的内容属性给信息下定义被许多研究所引用。信息论的创始人申农(C.E.Shannon)1948年在《通信的数学原理》一文中将信息定义为“两次不定性之差”。
国内在这方面也有许多争论。
信息的定义之所以呈现多样化,主要原因有三:第一,信息本身的复杂性,它是一个多元化,多层次、多功能的综合物;第二,信息科学是一门新兴学科,它的许多分支学科仍在随着社会、经济和科学技术的发展而发展,其内涵和外延不很确切;第三,人们出于不同的研究和使用目的,从不同的角度或层次出发,对信息概念就会作出不同的解释。
因此,许多学者建议将信息的要领分为不同的层次来解释。在诸多层次中,最重要的是两个层次:一是没有任何约束条件的本体论层次,即信息是一种客观存在的现象,是事物的运动状态及其变化方式的表征,不受主体意志的影响。不停运动着的事物不断产生本体论意义上的信息;二是受主体约束的认识论层次,即信息就是主体所感知或所表述的事物运动状态及其变化方式,是反映出来的客观事物的属性。
二、知识(knowledge)
知识是是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的结果。
知识来源于信息,是对信息处理后获得的认识。知识按其内容可分为自然科学知识、社会科学知识、思维科学知识和哲学知识四大类。医学知识属于自然科学范畴,是人们长期与疾病作斗争的经验总结。另外,知识还可以分为:
(1)根据国际经济合作与发展组织(OCED)出版的《以知识为基础的经济》报告将知识分为四种类型,分别为:know-what 、know-why 、know-how 、know-who。
第一类“知是(Know-what )” ,即知道是什么的知识,指关于事实与现象的知识,是一切知识的基础,包括自然科学知识和社会科学知识,它可以通过学习获得。
第二类“知因(Know-why )” ,即知道为什么的知识,指那些自然、人的思维和社会运动的法则和规律的科学知识,包括自然原理和规律方面的科学理论;
第三类“知如(Know-how )”,即知道如何做的知识,即指技艺和能力知识,包括技术诀窍或专有技能。
第四类“知谁(Know-who )”,它包括关于谁知道什么,以及谁知道如何做什么的信息。
(2)把知识分为显性知识(Explicit Knowledge)和隐性知识(Tacit Knowledge)。
所谓显性知识是指经过人的整理和组织后,可以编码化和度量,并以文字、公式、计算机程序等形式表现出来,还可以通过正式的、系统化的方式(如出版物、计算机网络等)加以传播,便于其他人掌握的知识。典型的显性知识主要是指以专利、科学发明和特殊技术等形式存在的知识,它是有载体的、可以表达的,OECD的分类中“知事(Know-what)”和“知因(Know-why)”;
隐性知识是与人结合在一起的经验性知识,很难编码化,并将其文字化或者公式化,它们本质上以人为载体,因此难以通过常规的方法收集到它,也难以通过常规的信息工具进行传播。隐性知识往往是个人或组织经过长期积累而拥有的知识,通常不易用语言表达,也不可能传播给别人或传播起来非常困难。例如:技术高超的厨师或艺术家可能达到世界水平,却很难将自己的技术或技巧表达出来从而将其传播给别人或与别人共享。隐性知识对应的是OECD中的关于Know-how和Know-who的知识,其特点是不易被认识到、不易衡量其价值、不易被其他人所理解和掌握。
(3)从知识的来源分
第一类是人脑之中,以主观意识存在,只有当以一定的形式,通过一定的载体表达时,才能为其他人所感知;
第二类是存在于实物之中,如古文物、样品、样机、物品等。人们可以通过研究实物而获得某种知识;
第三类是用文字、图形、代码、符号、声频、视频等技术手段记录在一定的载体之上,例如刻在甲骨上、印在纸张上等,这就是文献。
三、情报(information)
情报是关于某种情况的消息和报告,或者说情报是运用一定的形式,传递给特定用户,并产生效用的知识或信息。情报具有三个基本属性:知识性、传递性、效用性。
四、文献(literature)
文献:是记录有知识的一切载体。凡是用文字、图形、符号、音频、影像等手段记录下来的知识统称为文献。
其他的定义:一是《文献情报术语国际标准(草案)》(ISO/DIS5127)的定义,“为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录到唱片上,或存贮在磁盘上。这种附着在各种载体上的记录统称为文献。” 另一个是中国的国家标准。是各种媒介和形式的信息集合,包括文字、声像印刷品、电子信息、数据库等。
文献的构成要素:知识是文献的实质内容,核心要素;载体(纸张、感光或磁性材料)是文献的物质形态、存在方式;记录或媒介(文字、图像、声音)是文献的表现形式。
(1)知识是文献的内容
(2)符号系统是信息的携带者
(文字不是表达思想的唯一手段,图形、声频、视频等同样成为表达思想、传递感情的重要手段。总的说来,文献中的符号系统指图画、文字、公式、图表、编码、声像和电磁信息等。)
(3)载体是符号赖以依附的“寄主”
随着生产力的发展,存贮和表达人们思想的物质载体不同了,从金石、竹简、羊皮、丝帛、纸张发展到用感光介质和磁性介质。从非人工材质的泥版、岩石、石板、兽骨、木板、竹片、兽皮、树叶、桦树皮等到各种人工材质,如无机材质(陶、砖瓦、瓷,玻璃等)、金属材质(青铜、铁、铝、金银等)、高分子材质(帛、纸、胶片、醋酸纤维等)、复合材质(磁带、光盘等)。纸质文献已经多得不便于快速传输信息、高效查阅和高密度存贮了,于是其他介质的文献应运而生,这些文献主要包括:纸质文献具有价格低廉、质地柔软、易于书写、携带和收藏等其它一些载体所无法比拟的性能而成为文献家族的主干。
(4)记录方式是将文献的符号进入载体的方法和过程
按记录方法分可有手工记录、机械记录、光记录、电记录、声记录和磁记录。其中最常见的是印刷。随着科技的发展,文字记录可以转变为数据记录,并用电子方法存贮到磁介质上去。此外,还有光学字符识别(Optical Character Recognition,简称OCR)技术就代表了这种崭新的技术,它通过光学方法对字符、标记表示的书面数据进行自动识别,转换成机器可以处理的信息,这样就实现了纸质文献信息向电子信息的转换,而且可以通过不同接口装置向不同设备输入数据,这些设备进而与通信网络相连,实现远距离数据传送。
五、信息、知识、情报、文献之间的关系
&文献与信息、知识、情报之间既有区别又有联系,信息广泛存在于自然界和人类社会,其涵盖面最大、最广,许多信息具有未经加工的自然属性;知识是人们工作生活中的经验总结,来源于信息,是经过精心研究、领会后的有用信息,是人类对信息加工处理后的产物,所以知识是被人们所认识(提炼加工)的一部分信息;情报来源于知识,是经过传递并对特定用户产生效用的一部分知识。信息、知识、情报都比较抽象,必须通过符号、文字、音频、影像等形式才能表现出来,并利用一定载体加以物化,才能被人们所认识和传播,文献就是这种物化了的信息、知识和情报。
文献的类型和级别
&&& 期刊的相关知识
&&& 影响因子:某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。
核心期刊(Core Journal)的概念:少数刊载某一学科大量高质量专业论文的期刊称为核心期刊,其主要特点为:1)刊载专业文献密度高,信息含量高;2)水平较高,代表本学科的最新发展水平;3)出版相对稳定,所载文献寿命较长;4)利用率和被引率较高。
不分国家级、省、地级;中华牌、中国牌,以国际通行的载文量(被收录进索引刊物)、引文分析、专家意见、综合筛选等综合确定。
&&&& 世界著名期刊:The Lancet&&& (1823-) 英刊
&&&&&&&&&&&&&&&&& New Engl J Med (1821-)英刊
&&&&&&&&&&&&&&&&& Bri Med J& (1840-)英刊
&&&&&&&&&&&&&&&&& JAMA&&&&& (1883-)美刊
&&&&&&&&&&&&&&&&& Nature&&&&&&& (1869-)& 美刊
&&&&&&&&&&&&&&&&& Science&&&&&& (1880-)& 美刊
二、按文献的加工深度划分文献为一次、二次、三次和零次文献,也成为文献的级别。
1、一次文献
一次文献(primary document)是以作者本人的生产实践与科学研究成果为基本素材而撰写的文献,无论创作时作者是否参考或引用了他人的著作,也无论其以何种载体形式出现,均称为一次文献。包括专著、期刊论文、科技报告、会议文献、专利文献、技术标准和学位论文等。
2、二次文献
二次文献(secondary document)是指将分散无序的一次文献按一定方法进行浓缩、整理、简化,组织成为系统的便于查找的工具性文献,如各种目录、题录、文摘、索引、书目指南等,网上检索引擎也是二次文献。这些文献也称为检索工具。
3、三次文献
三次文献(tertiary document)在合理利用二次文献的基础上,选用一次文献的内容,根据一定的需要和目的进行综合、分析、选择、浓缩而编写出来的文献,如字辞典、百科全书、综述、述评、年鉴、手册、名录指南和教科书等。
4、零次文献。
指未经正式发表或未形成正规载体的一种文献形式。如私人笔记、底稿、手稿、个人通讯、新闻稿、会议记录,工程图样、实验记录、调查稿、原始统计资料、技术档案等。如:书信,手稿,笔记等。特点:客观性,零散性,不成熟性。一般是通过口头交谈、参观展览、参加报告会等途径获取,不仅在内容上有一定的价值,而且能弥补一般公开文献从信息的客观形成到公开传播之间费时甚多的弊病。
信息检索的基本原理
一、文献(信息)检索的概念
信息检索(Information Retrieval)是在1949年国际数学会议上由Galvin W. Mooers 在《把信息检索看作是时间性的通讯》一文中首次提出的。指从文献信息集合中查找所需文献或文献中包含的信息内容的过程。广义的文献检索包括存贮和检索两者的过程和技术;而狭义的文献检索是从用户的角度来理解,仅指从已经存贮的具有检索功能的文献信息集合中查询出所需文献的过程。
(1)狭义的检索是指依据一定的方法,从已经组织好的大量有关信息集合中,查找并获取特定的相关信息的过程。
(2)广义的检索包括信息的存储和检索两个过程(Storage and Retrieval)。信息存储是将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的数据库或检索系统,供人们检索和利用。而检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。
二、信息检索的基本原理
通过对大量分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。其中存储是为了检索,而检索又必须先进行存储。
一句话概括信息检索的基本原理:信息检索是对信息集合与需求集合的匹配和选择。
需求集合:人们为了满足某种需求时,感到需要补充知识,因此产生了对信息的需求。
信息集合:是有关某一领域的文献或数据的集合体,它是一种公共知识结构,可能弥补用户的知识结构缺陷。
匹配和选择:是一种机制,负责把需求集合和信息集合进行比较,然后根据一定的标准选出需求的信息。
三、文献检索的类型
四、信息检索发展的趋势
1、深度:传统检索向全文本、多媒体、多载体、多原理等新型信息检索的发展,在深度上提高管理和组织信息的能力,如探索自动抽词、自动索引、自动检索、自动文摘、自动分类、自动翻译等;
2、广度:信息资源的网络化和分布化,面向Internet中浩瀚无垠的资源,在广度上提高管理和组织信息的能力。
检索语言和《中国图书馆分类法》
R47R47R47R47
cancertumorcarcinoma
cancer, tumor, carcinoma&
Neoplasms.
carcinoma, tumor, cancer
(Medical Subject HeadingsMeSh)Index MedicusMEDLINEMeSh18,000
副主题词(Subheadings)又称限定词(Qualifiers),与主题词进行组配,对某一主题词的概念进行限定或复分,使主题词具有更高的专指性。如诊断(Diagnosis,DI)、药物治疗(Drug Theray,DT)、血液供给(Blood Supply,BS)等。
(Chinese Library ClassificationCLC)522O QRZ
R542.41&&&
R542.42&&&
R542.43&&&
R542.51&&&
R542.52&&&
R542.53&&&
R542.54&&&
索书号:由分类号和书次号构成,大理学院图书馆藏书的分类号是依据《中图法》得来;书次号是同类书的区分号,是依据著者姓名的四角号码得来)
[内容要点]
文献检索的主要技术
文献检索的主要技术主要是指计算机检索技术。
一、布尔检索
&1、布尔检索定义
用布尔逻辑算符来表达检索词间的逻辑组配关系,是最基本、最最常用的检索技术。
2、常用的布尔逻辑算符有:
(1)逻辑或(+,OR):表达检索词间的并列关系。可扩大检索范围,提高查全率。
如:A+B,表明结果中含有A或B都为检索命中。
(2)逻辑与(*,AND):表达检索词间的交叉关系。可缩小检索范围,提高查准率。如:A*B,表明结果必须同时含有A和B才为命中。
(3)逻辑非(―,NOT):表达检索词间的排除关系。可缩小检索范围,提高查准率,但要慎用。如:A―B,表明结果是A中不包含B的那部分。
二、截词检索
又称词干检索、模糊检索。检索时,只需用词干加截词符号,凡是含有与该词干相同的文献均能被检出。该方法能很好解决中西文单词的派生形式,避免漏检现象的出现。检索系统不同,截词符也不同,常用的有:#,?,*等。
根据截词符出现的位置不同,可分为:
1、右截词(后截词)检索,前方一致检索。是最常用的截词方式。主要用在词的单复数、年代、作者、查同根词等情况。如:王伟?(可查出所有名字中含“王伟”的作者的文献,如王伟民等)Social* (可代替social, socialist, socialistic, sociality, socialization等);“brows*”,检索出browse、 browser、 browsers 、browsing等。
2、左截词(前截词)检索,后方一致检索。多见于复合词较多的文献检索,也可进行一个学科的不同应用领域的检索。但有此功能的系统不多。
例:* magnetic 可以检索出magnetic、 electromagnetic、 theromagnetic等。
3、中间截词检索,屏蔽检索。将截词符置于检索词中间,词的前后方一致。又称“通用字符法”或“内嵌字符截断”,该方式能解决英美拼法不同单词的书写或有些词在某个元音位置上出现的单复数的不同拼写。如:wom?n(可代替woman, women)社会科学?发展(可代替社会科学的发展,社会科学研究的发展等)
(4)前后截词:
三、限制检索:限制检索是缩小或约束检索结果的方法,主要是指限定字段检索,即是指定检索词在记录中出现的字段。位置算符只能限定词与词间的相对位置,但不能确定检索词在文献记录中的位置。限制检索的方法很多,如利用前、后缀符进行的字段检索;利用系统规定的限制符、限制检索命令进行的限制检索等。
(1)字段检索:是限定检索词在数据库记录中出现的字段范围的一种检索方法。在检索系统中,数据库设置、提供的可供检索的字段,如题名、主题词、文摘、语种、出处、年份等。
(2)常用的限定符有:in、=、&=、 &= 、& 、&等。
&如:PY&=2001,表示要检索2001年后的文献
数据库中的字段包括
TI(题名),AB(摘要),DE(主题词),ID(标识词),SU(主题词),KW(关键词)
AU(著者),BN(国际标准书号),SN(国际标准刊号),CC(分类类目),CS(机构),DT(文献类型)或PT(出版物类型),JN(刊名)或JA(刊号),LA(语种),PY(出版年),SO(来源出版物)
注意:不同的数据库其字段代码可能不同。
位置检索也叫临近检索。文献记录中词语的相对次序或位置不同,所表达的意思可能不同,而同样一个检索表达式中词语的相对次序不同,其表达的检索意图也不一样。布尔逻辑运算符有时难以表达某些检索课题确切的提问要求。字段限制检索虽能使检索结果在一定程度上进一步满足提问要求,但无法对检索词之间的相对位置进行限制。位置算符检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的临近关系,并且可以不依赖主题词表而直接使用自由词进行检索的技术方法。位置算符又称邻接算符,适用于两个检索词以指定间隔距离或者指定的顺序出现的场合。位置算符是提高检索查准率的一种重要手段。
(1)(W)算符与(nW)算符
(W)算符要求在此算符两侧的检索词必须按输入时的前后顺序排列,而且所连接的词之间除可以有一个空格、或标点或连接号外不得夹有任何其他单词或字母。(nW)算符则允许在连接的两个词之间最多夹入n个其他单元词。
(2)(N)算符与(nN)算符
(N)表示,在此算符两侧的检索词必须紧密相连,所连接的词间不允许插入任何其他单词或字母,但词序可以颠倒。(nN)算符则表示在两个检索词之间最多可以插入n个单词,且这两个检索词的词序任意。
五、短语检索
固定词组的检索,方法是在检索词上加上双引号,也称为强制检索。这一方法在查找名言警句或专有名词时显得格外有用。如“mother in law”、“信息素养标准”。
第二节& 印刷型信息检索工具
分、正文部分、辅助索引部分(主题词索引、关键词索引、著者索引、分子式索引、生物分类索引、专利号索引)、附录部分。
手工检索工具),
& 三、目录式检索工具:统称目录
&&& 按职能划分,有国家书目、出版社与书店的出版发行目录、专题文献目录、资料来源目录等;
&&& 按收录文献类型划分,有图书目录、期刊目录、声像资料目录、数据库目录、电子出版物目录、标准目录、档案资料目录等;
&&& 按文献收藏范围划分,有馆藏目录和联合目录。
&&& 其中馆藏目录揭示了一个图书馆的馆藏书刊及电子出版物等文献资源,主要包括馆藏图书目录和馆藏期刊目录。OPACOnline Public Access Catalogue, “”
&&& 联合目录目的是提供读者了解多个图书馆的文献收藏情况,通过图书馆所提供的馆际互借方式向其他图书馆索取文献信息资源。
&&& 四、题录式检索工具:又称索引。题录由著录项目构成,一般包括文献题名、著者、刊名、发表年、卷、期、起止页码等。系统地累积多篇论文题录的检索工具――题录式检索工具。按出版形式分,题录式检索工具可分为期刊式、图书式、附录式三种。例如,《中文科技资料目录》、《全国报刊索引》、美国《医学索引》都是国内外著名的题录式检索工具期刊;《中国科技期刊中医药文献索引》是题录式检索工具书。
&&& 五、文摘式检索工具:又称文摘。文摘是提供文献内容梗概,简明描述文献重要内容的短文。根据详略,分指示性文摘和报道性文摘两种。汇集大量文摘,配以相应的题录,按一定方法组织编排,系统积累、报道和揭示文献信息的工具――文摘式检索工具。是检索工具的核心。
&&& 例如:美国《化学文摘》,即CA;《生物学文摘》,即BA
&&& 目录-题录-文摘式检索工具的比较
&&& 在揭示文献方面,题录比目录更具体深入;而文摘式检索工具揭示报道的文献比目录、题录式检索工具更详细,且方便阅读,节省时间,同时还可减少语言障碍(多数附有英文摘要),但它编辑出版的时间相对较长。(信息时差问题)
&&& 六、世界著名手工检索工具书介绍:
&& 1、《BA》生物学文摘
&& 《Biological Abstracts》简称BA,是世界范围内生命科学文摘的重要检索期刊。它收录了来自世界各国尤其是欧美各国有关生物学、医学、农业方面的文献,摘用了100个国家和地区约6000种期刊。从BA中可查到实验医学研究,包括临床和理论方面的文献。
&&& BA的检索特色体现在它独有的生物生物体索引、生物分类索引和属类索引上。
&&& 生物体索引,可用来检索具体生物体文献(包括细胞株、病毒);
&&& 生物分类索引,用来检索涉及到具体生物体,如病毒、细菌、寄生虫、实验动物、人类等的文献;
&&& 生物属类索引按照文摘中涉及到的生物体的属种名称字顺排列,比查生物分类索引更直接。生物分类索引中,生物分类最多只列到“科”,未再列属种。例如,霍乱弧菌的临床研究就可以运用BA中的属类索引查找。
&& 2、《CA》化学文摘
&& 《Chemical Abstract》简称CA,由美国化学学会化学文摘服务处(CAS)编辑。CA收录的医学文献侧重在人或动物疾病或外部因素导致体内发生的各种变化,如疾病过程中对各种成分的测定,药物对疾病的治疗机理及不良反应,放射性物质或有毒的化学物质对各种器官、组织的损伤及疾病的诊断和治疗方法。查药物,CA是必查的检索工具。
&&& CA的检索特色体现在它的化学物质索引、专利索引、分子式索引等方面。
&&& 化学物质索引――凡内容涉及专门化学物质的文献均可在该索引中查到。这些化学物质指:组成原子和原子数已知、价键清楚、立体化学结构明确的元素,化合物,抗菌素、酶、激素,多醣类及某些用字母、数字、商品名表示的物质等。
&&& 专利索引的主要功能是:根据已知专利号,查找某件专利在CA上的摘要,并可查找它的等同专利和相关专利。在CA的80个大类中,与医药卫生有关的近30个大类。这些大类中都有专利文献的分布,但最集中的类目是5,9,16,17,62,63类。包括的内容有诊断、外科和人体鉴别用的仪器,如产科接种疫苗器械;眼科治疗仪,如白内障治疗仪;磁疗、放射治疗装置;假肢体的材料及其制造;病毒的制备、纯化;繁殖、维持或保藏微生物的方法;DNA、RNA、载体和质粒的分离、制备或纯化;酶或微生物的测定试验等。
&&& 分子式索引――提供了一条直接从分子式查找到具体化学物质的途径。
&& 3、《SCI》
&&& 即《科学引文索引》(Science Citation Index)是由美国科学情报所(ISI)编辑出版的一种国际性的多学科索引。SCI不仅是一种大型的文献检索工具,而且是引文分析的极为重要的工具之一。
&&& SCI的应用价值:
&&& 如果科研人员想知道其在我国核心期刊或国外刊物发表的文章是否被引用,如果被引用,那么是在什么文章中引用,该文章哪年写的,发表在什么期刊上;某单位科研部门想了解近10年中每年该单位公开发表的论文数量,或比较若干个同类医院、科研机构或院校1年或几年中公开发表的论文数量等,所有这些都可以在SCI上查找。
&&& 在SCI的年度索引中有一个期刊引用(证)报告(Journal Citation Reports,JCR), 它详细报道了期刊引用与被引用的有关信息,如某期刊被引用的总次数、影响因子、当年指数、某期刊某年发表的论文总数等。根据这些数据,可以确定某种期刊在科学杂志群中以及在整个科学交流系统中的作用和地位,从而帮助科研人员选择投稿方向,有助于提高本学科的知名度。
&&& 实际上,各种印刷型检索工具如美国《医学索引》(Index Medcia,IM)、《生物学文摘》(Biological Abstracts,BA)、《化学文摘》(Chemical Abstracts,CA)、荷兰《医学文摘》(Excerpta Medica)、中国《中文科技资料目录:医药卫生》等都已经实现了计算机数据库检索。(手检――机检)
第三节&& 信息检索的主要途径
检索途径:依据文献的外部特征(题名、责任者、标识、出版者、出版时间等)和内部特征(分
3/&&&&&&&&&&&&&&&&&&&&&&&
第四节&& 信息检索的基本步骤和策略
信息检索的基本步骤(流程)
1、 分析信息检索的请求。
信息需求分为潜在的需求、认识到的需求和表达出的需求集中状态。分析检索请求包括a明确检索的目的(如为了写文章、申请专利、了解某一学科领域的最新进展等)、b检索请求的内容特征分析涉及到的主要概念及其相互关系的分析,以及相关名词术语的选择等,需要专业知识)、c检索请求的形式特征分析(所要求的文献语种、年代、类型--期刊论文、学位论文等,相对内容特征分析,形式特征分析要简单和明确一些。
2、制定检索策略。
检索策略是指为实现检索目标而制定的全盘计划和方案,是对整个检索过程的谋划和指导(广义);狭义上,是指我们在检索时确定提问逻辑和检索词之间的组配方式。
检索策略的调整:扩大检索范围和缩小检索范围。
检索策略是为实现检索目的而制定的具体检索方案。对于一个具体的检索过程而言,编制出一个好的检索策略,使其能够确切地反映检索需求,就有可能使检索者以最短的时间和最低的成本获取最满意的检索结果。
常用的计算机检索策略有:
a积木型(build-block)。把检索请求剖析成若干个不同的概念面,先分别对这几个概念面进行检索,并在每个概念面中尽可能全面、详尽列举相关词、同义词、近义词,并用布尔算符“OR”连接成子检索式,然后再用合适的布尔算符把所有子检索式,构成一个总检索式,类似把各个积木块拼成图案。
b “引文珠形增长”(citation pearl growth)。从已知的少数几个检索词开始检索,获得一篇或极少数相关结果,从中选出一些新的相关检索词,用这些词进行检索,出现新的相关结果,又会发现一些新的相关检索词,重复上述过程。这种方法可以如滚雪球般获得更多更适用的信息。
c逐次分馏(successive fractions):一次一次提高检索专指度,一步一步缩小命中结果集合。层层剥笋,逐步逼近核心部分。漏检较少。数据库中的二次检索(结果中的检索)。
3、 选择检索系统(搜索引擎、数据库),拟订并执行具体检索步骤。
具体检索步骤主要有:a选择并输入检索词。B选择检索词的组配连接符号(布尔算符等)c选择检索途径,实施检索。d初步浏览检索结果。e使用合适的反馈调整方法,对检索结果进行优化。
4、 获取并整理检索结果
在线浏览、打印、存盘
5、 分析评价检索操作与检索结果
主要涉及:检索结果分析、检索系统功能的评价与认识,检索操作中存在的主要问题等。
评价和衡量检索效果的两个重要和常用指标:查全率和查准率。
第五节& 优化检索结果的方法
一、检索效果评价指标
根据F. W. Lancaster 的阐述,判定一个检索系统的优劣,主要从质量、费用和时间三个方面来衡量,因此,对信息检索效果的评价也应该从这三个方面来评价。
质量标准:主要通过查全率和查准率进行评价。(主要标准)
费用标准:用户为检索课题所投入的费用。
时间标准:花费的时间,包括检索的准备时间、检索过程时间、获取文献时间等。
对检索效果的评价,首先必须考虑的对检索结果的评价:(1)用户是否得到了所需要的信息;(2)得到的信息是否全面而准确。
以一个检索提问去检索任何一个数据库都会出现4 个相关量检出的相关信息量、未被检出的相关信息量、检出的非相关信息量、未检出的非相关信息量。
1、查全率(Recall Ratio)
当用户要全面检索某一信息库时,检出的成功度可用检出的所有相关信息在信息库所有相关信息中所占的比例来表示。这种对信息库检索全面性的测量指标即为查全率,可定义为:
查全率=检出的相关信息数 / 信息库中相关信息总数 × 100%
2、查准率 (Precision Ratio)
当用户要对检索到的结果进行分析时,检出的相关信息数在所有检出信息中所占的比例往往成了较重要的评判指标。这种对检索结果中的相关信息的测量指标即为查准率。也称为信号噪音比(Signal-to-noise Ratio)。查准率与检索的相关信息数有关。可定义为:
查准率:检出的相关信息数 / 检出的信息总数× 100%
查全率和查准率必须结合使用,单独使用不能全面说明检索效果的好坏
(1)若检出1篇相关文献,必能达到100%的查准率,但查全率肯定很低;
(2)若检出的信息数等于库中信息总量,必能获得100%的查全率,但是查准率肯定很低。
3、误检率(Noise Ratio)
误检率=检出的非相关信息数 / 检出的信息总数× 100%
4、漏检率(Omission Ratio)
查全率=未检出的相关信息数 / 信息库中相关信息总数 × 100%
查全率和漏检率是互补的,查全率+漏检率=1;
查准率和误检率也是互补的,查准率+误检率=1
5、其他的评价指标:均衡查全(Proportional Recall)、相对查准率(Relative Recall)、覆盖度(Coverage Ration)、新颖度(Novelty Ratio)、错检率(Fallout Ratio)
检索效益评价
检索效益的评价要考虑社会效益和经济效益,具体体现为:(1)信息和知识的传播速度和广度;(2)信息资源的有效利用率;(3)避免重复;(4)提高工作效率。
二、优化检索结果的方法
主要是针对各种影响查全和查准的因素,提出的一些提高查全率和查准率的方法。
[内容要点]
网络信息资源和搜索引擎概述
InternetWEBInternetWEB
(search engine)
KeywordsYahoo
META Search EngineInfoSpaceDogpileVivisimoDogpileVivisimo
spiderSpider
著名搜索引擎简介
1Google .hk/
1998GooglePageRank20064GoogleGoogle 20103Googlehk
20001InfoseekBaidu 20011022Baidu
19944Stanford UniversityJerry YangDavid FiloYahoo Yahoo! YSTYahoo! Search Technology120123810,00050%
5Bing()& .cn/
200961Bing()
1. Medical Matrixhttp://www.medmatrix.org/index.asp
Medical Matrix
2. Medscape/
MEDLINEMerriam-WebstersID
1Clinical content, Medline, Drug Info, AIDSL, Whole Web, News, Medical Images, Dictionary
2more specialty pages
Transplantation
3. CliniWeb Internationalhttp://www.ohsu.edu/cliniweb/
4. Health Webhttp://www.healthweb.org/
5. Medishttp://www.docnet.org.uk/medisn/searchs.html
6. Medical World Search/
7. Health A to Z/atoz/
8. The Alternative Medicine (http://www.pitt.edu~cbw/internet.html)
9. BioMedNet (/)
10 (http://www.oculist.net)
(http://www.
12 http://compass.:8010
百度和Google搜索引擎的检索特色
亿的中文网页。下面是百度首页,默认是“网页”检索。单击右下“更多”按钮进入其产品和服务页面。
地区搜索和个性设置
在百度上都存有一个纯文本的备份,称为“百度快照”。百度速度较慢,您可以通过“快照”快速浏览页面内容。
或者打开速度特别慢, “百度快照”能帮您解决问题。
”来自于数学名词“Googol”, Googol表示一个 1 后面跟着 100 个零。这一术语体现了公司整合网上海量信息的远大目标。
每天处理的搜索请求已达2亿次,而且这一数字还在不断增长。Google数据库存有超过100亿个Web文件,属于全文(Full Text)搜索引擎的代表,也是当今互联网上最流行的搜索引擎。
核心软件称为 PageRank。
链接到网页 B 时,Google 就认为“网页 A 投了网页 B一票”。Google 根据网页的得票数评定其重要性。除了考虑网页得票数(即链接)的纯数量之外,Google还要分析投票的网页,“重要”的网页所投出的票就会有更高的权重。
只显示相关的网页,其正文指向的链接包含您所输入的所有关键词,而无须再受其它无关结果的烦扰。
首页,同样是单击“更多”进入产品、服务页面。
文件,只需搜索“关键词 filetype:swf”。
种非HTML文件的搜索。除了PDF文档,Google现在还可以搜索Microsoft Office (doc, ppt, xls, rtf) ,Shockwave Flash (swf),PostScript(ps)和其它类型文档。
查询到的第一个网页。您将完全看不到其它的搜索结果。使用“手气不错”进行搜索表示用于搜索网页的时间较少而用于检查网页的时间较多。
大学的主页,只需在搜索字段中输入“Stanford”,然后单击“手气不错”按钮。Google 将直接带您进入Stanford 大学的官方主页 www.stanford.edu
检查有没有错别字。如果发现用其他字词搜索可能会有更好的结果,它能提供相应提示来帮助纠正可能有的错别字。
查询手机电话号码归属地,您只需直接输入要查的号码即可(不需要任何关键词)。Google能自动识别以13开头的11位数字为手机号码而返回相关的网站链接,让您即刻便知道答案。
网络搜索引擎检索技巧
寻找特征词
检索词明确具体
一句话检索
去掉作用很小的词
中西结合检索法
检索词表述准确
一、寻找特征词
选特征词。如对于小说而言,“小说”、“目录”,“第一章”、“第一卷”是其特征关键词。因为这些词一般都在小说页面中出现,而其它页面较少有这些词。例子,用【七剑下天山第一回】找小说,比直接搜【七剑下天山】好得多。
寻找特征词检索举例1
比如入党申请书。申请书有一定的格式,因此只要找到相应的特征词,问题也就迎刃而解。比如入党申请书的最明显的特征词就是“我志愿加入中国共产党”。
例:我志愿加入中国共产党 入党申请书&
寻找特征词检索举例2
找工作总结范文 还是那个关键问题,工作总结会有什么样的特征词?将心比心的设想一下,就会发现,工作总结,总会写的象八股文一样,“一、二、三”,“第一,第二,第三”,“首先,其次,最后”。而且工作总结的标题中,通常会出现“工作总结”四个字,于是,问题就很好解决了:
例:第一 第二 第三 intitle:工作总结&
寻找特征词检索举例3
找市场调查报告范文 市场调查报告的网页,有几个特点。第一是网页标题中通常会有“xxxx调查报告”的字样;第二是在正文中,通常会有几个特征词,如“市场”、“需求”、“消费”等。于是,利用intitle语法,就可以快速找到类似范文。
&例:市场 消费 需求 intitle:调查报告&
二、检索词明确具体
多数朋友主要用网页搜索。网页是互联网最主要的构成单元,网页上有文字、音频、视频,构成了互联网的主要信息。不过,包容一切,难免泥沙俱下。尤其是想找某一选定类型的信息时,网页搜索却什么东西都有,要花费不少功夫去辨别筛选。如有人搜【小虎队】,是想找小虎队的歌曲,网页搜索结果不仅有歌曲,还有小虎队的介绍、图片等。对这位朋友来说,结果就称不上完美。&
检索词明确具体举例1
就像买衣服,你到服装店里跟导购说“我要买衣服”,这就是废话,服装店难不成还卖电脑。但如果你说“我想看新款冬装”,导购马上就会带你看到你想看的。在这里“新款”“冬装”就是关键词。所以,使用搜索引擎要避免大而空的关键词,它不知道你要找啥,就可能返回很多莫名其妙结果。
检索词明确具体举例2
某一小学生想找小学4年级数学课本,他使用的检索词是“小学4年级数学”,出现的却不是他想要的具体课本内容,而是大量杂乱的网页。只要在检索词上加上课本,为“小学4年级数学课本”,马上在返还结果首页出现他想找的电子课本。
检索词明确具体举例3
找一个东西,尽量明确具体地描述它,不要用含义宽泛模糊的词。想搜“诺基亚5230”的信息,那么直接用【诺基亚5230】来搜,不要用【诺基亚】作为关键词。希望找“清华大学附中”,不要搜【清华大学】再翻页,直接搜【清华大学附中】。&
三、用一句话作为检索词
好不容易找到一篇符合要求的科学发展观心得体会范文,但只有第一段,要想看全文,请注册。怎么办,一定非得注册么。当然不用。选取第一段中的一句话,放到搜索框中查找。由于互联网的开放分享,独一无二、只有一个网站才有的情况是极少的;一般情况下都能找到其它网站提供的全文。
用一句话作为检索词
看到一个好结果,但打不开页面,快照也用不了。此时,可以选取摘要中的一句话,或者标题,作为关键词来搜索。
四、去掉作用很小的词
常见的是疑问词、叹词、助词。
“我的浏览器主页被修改了,谁能帮帮我呀”。这是典型的自然语言,但网上和这样的话完全匹配的网页,几乎就是不存在的。因此这样的搜索常常得不到想要的结果。
&&& “浏览器主页被修改”
某三年级小学生,想查一些关于时间的名人名言,他的查询词是“小学三年级关于时间的名人名言”。
绝大多数名人名言,并不规定是针对几年级的,因此,“小学三年级”事实上和主题无关,会使得搜索引擎丢掉大量不含“小学三年级”,但非常有价值的信息;“关于”也是一个与名人名言本身没有关系的词,多一个这样的词,又会减少很多有价值信息;“时间的名人名言”,其中的“的”也不是一个必要的词,会对搜索结果产生干扰;“名人名言”,名言通常就是名人留下来的,在名言前加上名人,是一种不必要的重复。
因此,最好的查询词,应该是“时间名言”。
五、学会用空格
很多时候,想找的内容一个词无法表述妥当。此时借助空格,使用多个关键词来搜索,能提高搜索效率、检准率。如找佳能ip1180打印机的驱动,多个关键词组合来搜,用【佳能ip1180 打印机 驱动】,效果会更好。找小说《天龙八部》,用【天龙八部 小说】比直接搜【天龙八部】要好得多。
用空格区分多个关键词,是最常用的明确寻找信息的方法。
六、中西结合检索法
在使用搜索网站时,灵活地结合中文和英文可以很好地完成某些搜索任务。您除了可以将要翻译成中文的英文词汇用作关键字,并指定搜索网站只返回中文网页的结果,尝试将搜索网站当成翻译机器来使用;还可以将中文词汇的一部分翻译成英文,例如您正想将“土豆烧牛肉”翻译成英文,只要您知道土豆的英文,您就可以输入关键字 “土豆烧牛肉 potato”,从互联网上找到含有土豆烧牛肉的英文翻译。
如果只输入英文词汇,那返还的结果一般都为纯英文网页,利用起来不方便,有语言障碍,而将其中的一个单词的中文意思作为检索词输入,用空格连接,出现的就是用中文解释的网页。
七、查询词表述准确
关键词是指输入到搜索框中,需要查询的内容。搜索引擎的结果,我们无法控制;当结果不好时,我们只能增加、减少、调整关键词。搜索技巧中,最重要的是选好关键词。好的关键词,事半功倍,能帮你快速找到所求,满意而去。查询词表述准确是获得良好搜索结果的必要前提。
检索举例。例如,要查找2004年国内十大新闻,查询词可以是“2004年国内十大新闻”;但如果把查询词换成“2004年国内十大事件”,搜索结果就没有能满足需求的了。&
第六节 优化搜索引擎检索结果的方法
不论是手工检索还是计算机检索,或是利用计算机通过因特网进行检索,尽管检索各具特点,但从对检索的目的要求来说都是相同的――查全、查准。以下是优化搜索引擎(百度、Google)检索结果、提高其检全率和检准率的方法和检索技术归纳。
一、提高检准率的策略
1、运用AND和NOT 运算
使用AND运算符号。对搜索引擎来说,空格即是执行“AND”运算,因此,用空格连接多个检索词即可提高专指度和检准率。
NOT 运算。NOT 运算符号则用短横“-”表示,可去除无关搜索结果,提高搜索结果相关性。比如,你要找“青岛”的城市信息,输入“青岛”却找搜到一堆“青岛啤酒”新闻,在发现这些新闻的共同特征是“啤酒”后,输入“青岛 C啤酒”来搜索,就不会再有啤酒烦你了。
2、强制检索(“”),也叫短语检索
例如:键入“莎士比亚喜剧”,会找出包含完整莎士比亚喜剧词组的页面。这种查询方法要求用一对半角的双引号来把关键字包括起来。又如:“mother in law”,可避免出现检索词分散的无关结果。
3、限定文件格式(filetype:)
具体操作为检索词后键入“filetype:”,冒号后键入文档格式,如PDF、DOC等。如:“ 电子商务 filetype:pdf”
可用于查找写论文的资料。如论文研究方向是“互联网对人类心理带来的变革” ,可列检索式“互联网 心理 filetype:doc”,意思是限制搜索结果为Word格式的文件,能查到不少写作论文的素材。
限制文件格式检索文本信息。用搜索引擎的网页进行文件格式的限制可过滤大量无关信息,能检索出不少实质性的文本信息,作为写作论文的资料。
用搜索引擎的网页检索文本信息
找论文的范文。眼看要进行毕业答辩了,可论文还没有开工呢。小刘准备的论文研究方向是“互联网对人类心理带来的变革”,他想看看有没有相关的论文范例,用来参考参考。
很简单,请出百度。搜索关键词“互联网 心理 filetype:doc”,意思就是限制搜索结果为doc格式的文件,结果有不少文档可以作为论文的一些素材。
4、用“intitle”缩小包围圈
“intitle”的标准搜索语法是“关键字 intitle:关键字”。
比如要写一篇关于《“超级女声”商业运作的成功之道》论文找资料,列检索式为“商业 intitle:超级女声”(冒号请在英文状态下输入),那么百度就只会在所有标题中包含“超级女声”这个词的网页中寻找出现了“商业”这个关键词的结果。
5、限定搜索网域(site)
&“site”表示搜索结果局限于某个具体网站,如“<SPAN lang=EN-.cn”,或者是某个域名,如“<SPAN lang=EN-等。
如:搜索中国教育科研网站(<SPAN lang=EN-)所有包含“红楼梦”的页面,检索式:“红楼梦 ”
“商业 超级女生 .cn”
6、其他方法和注意事项
句子检索法。想找一段话,只记得其中的几个词,用google的网页检索,在搜索框输入词如下:“足球 失望一支股 绝望 原话?”google结果不理想,换用百度,同样的检索词,在结果头几页的网页快照中出现“要体会失望就看一看球,要体会绝望就买一买股”,但前面还应有两句,整个点开之后,文件内容太多,根本就找不到完整的这句话,这时把“要体会失望就看一看球,要体会绝望就买一买股”整个复制粘贴到检索框里,马上找到完整的这句话:“要体会涨价就尝一尝肉,要体会通胀就加一加油,要体会失望就看一看球,要体会绝望就买一买股”。
明确具体的检索词。如要找电影《手机》的相关信息,就键入“电影《手机》”,而不是“手机”。
告别错别字。细节决定成败,这老话也适用在搜索上。输入的关键词有错别字,自然得不到需要的结果。
二、提高检全率的方法
1、运用布尔逻辑符 “OR”连接几个关键词。尽可能全面、详尽地列举相关词、同义词、近义词。
2、截词检索
3、在较少的结果中多提炼几个关键词,再用这些词进行检索,可以如滚雪球般获得更多更适用的信息。情报学上称此种检索方法为“引文珠形增长”(citation pearl growth)。
4、作者途径检索。 从高相关度的论文作者名入手,可检索到更多切合需求的文献。
5、在打不开网页、遇到死链时,截掉网址的后半部分,只保留前面一段,通常能进入所需网页的网站主页,运气好的话在此能找到要查询的内容。
信心、决心和耐心
有时可能你有这样的感觉,你已尽全力搜索,但依然没有找到需要的答案。这时千万不要放弃,仔细回顾你的搜索过程,也许只要修正一个小差错,一个看上去毫无希望的搜索,很有可能在改变搜索策略后获得成功。决心、耐心和信心,你肯定可以!
实践的重要
搜索到了最后,比拼的是搜索者的知识面。问题出来了,需要解决。如果对问题有足够的了解,并能适当的运用网络检索的一些技巧,那么一般都会快速准确的获得预想的结果。
检索技能的提高需要慢慢积累经验,有问题就搜索,常搜索。一切都可以搜索,并不意味着每次都能满意而归。但只要去搜索,总是一个尝试,有可能获得答案;并且搜索得越频繁,积累的经验越多,查找的效率就越高。
三、信息评价的指标
影响信息价值的因素是多方面的,比如信息源、信息发布者的权威程度,信息本身的系统性、逻辑性等。评估主要从可信度、准确度、合理性及相关支持等方面来进行。
一般资料 Google,百度,雅虎
古汉语(诗词)类资料 百度(个案显示这方面百度有独到之处)
产品或服务 搜狐、新浪(质量较高)/网易(较全)
聚合、分类 比比猫
检索操作题
1、查找哈佛图书馆墙上的名言。要求:写出用什么搜索引擎?检索词是什么?一共有多少条?摘录其中自己感受最深的1、2条。
2、查找“985”高校和“211”高校分别有多少所?二者的概念?
3、找尼采说过的一句话:谁终将……
CNKIEBSCO(ASP)PubMed
&& [内容要点]
数据库概述
&如果说利用搜索引擎更多是帮助解决我们日常生活中遇到的问题,那么解决学术问题(写论文、报课题需要的文献资料)则首选各类数据库,尤其是期刊全文数据库是目前查找学术资源最便捷的途径。以下介绍的这些数据库有部分可以在网络上免费查询,但是很多都需要付费使用,一般是由高校(单位)图书馆购买,在校园网IP地址范围内免费使用,比如大理学院图书馆网站()提供的数字资源有:CNKI、VIP维普、万方等中文期刊全文数据库;外文期刊全文数据库有Gale、ProQuest和EBSCO(ASP)。还有超星电子图书、爱迪科森网上报告厅、和超星名师讲坛、银符考试题库等多种类型的数字资源。
一、什么是数据库
&&& 数据库定义:计算机信息检索系统中的数据库是指一定专业范围内的信息记录及其索引的集合体,是计算机信息检索系统的重要组成部分,是信息资源,是检索对象。
&&& 二、数据库的类型:
&&& 1、书目数据库:存储的是二次文献,包括文献的外部特征、题录、文摘和主题词等,检索结果是所需文献的线索而非原文。许多书目数据库是印刷型文献检索工具(索引、文摘)的机读版本,如MEDLINE、CBMDISC等。
&&& 2、全文数据库:存储的是原始资料的全文。全文检索可以直接获取原始资料,而不是书目检索时的线索,提高了用户的检索效率。DIALOG系统中有48种医药期刊全文数据库,我国开发了《中国学术期刊》全文数据库(CAJ)。
&&& 3、数值数据库:主要包含的是数字数据,如各种统计数据、科学实验数据、测量数据等。检索结果可供直接参考。美国国立医学图书馆编制的化学物质毒性数据库RTECS(Registry of Toxic Effects of Chemical Substances),包含了10万多种化学物质的急、慢性毒理实验数据。
&&& 4、事实数据库:存储的是用来描述人物、机构、事物等信息的情况、过程、现象的事实数据。如名人录、机构指南、大事记等。用户可通过人名、机构名、事物名称查到他们的介绍和相关信息。美国MEDLARS系统中的医生咨询数据库(PDQ数据库),能为医生提供有关癌症治疗和临床实验的相关病因、诊断标准、治疗方案以及最新研究进展等信息。
&&& 三、数据库的结构:一般由记录、字段、文档组成。着重讲记录、字段。
&& (1)记录:是构成数据库的一个完整的信息单元,每条记录描述了一原始信息的外部特征和内部特征。例如,书目数据库中的一条记录通常代表一篇文献,其他类型数据库中的记录可能是一种治疗方案、一组理化指数。
&& (2)字段:比记录更小的单位是字段,是组成记录的数据项目。例如,在MEDLINE中一条记录代表一篇书目文献,在这条记录中有题名、著者、来源、文摘、主题词等字段。
每个字段有自己的名称和缩写,例如,
题名字段Title(TI)用表示;
著者字段Author(AU)用表示;
文摘字段Abstract(AB)用表示;
来源字段用Source(SO)表示。
&&& 计算机信息检索的最基本原理就是通过所知道的字段信息查找完整的文献记录。当今世界权威的大型数据库,都具备了最大的信息容量,最强的检索功能,最友好的界面,最快的检索速度以及最理想的查全率和查准率等特点。
&&& 四、我国常见的若干生物医学及其相关数据库介绍
1、英文数据库
(1) MEDLINE数据库:世界公认的最具代表性和权威性的生物医学数据库,美国
国立医学图书馆建立。
(2)荷兰《医学文摘》数据库(EM):按学科单独出版,药学及药理学内容较MEDLINE
(3)《生物学文摘》数据库(BA):是生命科学主要的文摘和索引数据库,由美国
生物科学信息服务中心(BIOSIS)编辑出版。
(4)《化学文摘》数据库由美国化学学会(ACS)下属部门――美国化学文摘社(CAS)
编辑出版。
(5)《科学引文索引》数据库(SCI):由美国科学情报所(ISI)建立,其最大的
特点是提供引文检索,用于查找文献被引用的情况,包括被引著者和被引文献。
2、中文数据库
(1)中国生物医学文献数据库(CBMDISC):是中国医学科学院医学信息研究所研
制开发的综合性医学文献数据库。
(2)中文生物医学期刊数据库(CMCC):由解放军医学图书馆开发,与CBMDISC配
(3)中国学术期刊数据库:是我国第一个连续出版的大规模集成化、多功能学术
期刊全文型数据库,由清华大学主办,共有理工(A、B、C三辑)农、医、经济法律与政治、文史哲、教育与社科综合、电子技术与信息科学等10个专辑。
(4)万方数据库:包括《中国企业、公司及产品数据库》、《中国科学技术成果数
据库》、《中国科技文献数据库》、《中国学术会议论文数据库》、《中国科技论文与引文数据库》、《中国科技信息机构数据库》等。
(5)中国中医药文献数据库:是中国中医研究院中医药信息研究所研制,由中国
中医药文献数据库和针灸针麻文献数据库两者合并而成。
中文全文数据库检索
CNKI91003252
ABC16836009100
8000(1539)8001007
600020020&
B1287300 2
外文全文数据库检索
http://www.ncbi.nlm.nih.gov/PubMed
MedlineNLMMEDLARS3019667043001100
97626NLMWebMedline PubMedMEDLINE
1PreMedlineMeSHPubMedPubMedPubMedNLMPreMedline[PubMed--in Process]MEDLINEPreMedline
2MEDLINEPubMed[PubMed--as supplied by publisher]PubMed
3GenBankhttp://www.ncbi.nlm.nih.gov/Genbank/index.htmNIHNLMNCBI1982DNADDBJEMBL
EBSCO(ASP)
ASPAcademic Search Premier, 8,2304,280 (1975)(peer-reviewed)3,5181,600ISIWeb of Science
循证医学及其信息源
&&& (Evidence Based MedicineEBM)
Embase(Embase Database)
NRRNational Health Service NHS
(Chinese Biomedical Literature DatabaseCBM)
/Cochrane(Chinese Evidence-Based Medicine/Cochrane
Center DatabaseCEBM/CCD)/Cochrane2
Cochrane(Cochrane Library)
BMJBest Practice
National Institutes of Health
Consensus Statements and Technology Assessment StatementsNIHCS & TASNIH(Office of Medical Applications of Research,OMAR)
&&& Practice GuidlineNational Guideline Clearinghouse NGCGuidelines
&&& Consensus Development Conference,
&& 1(Evidence Based MedicineEBM)
BMJ(American College of PhysiciansACP)http://www.acponline.org/journals/ebmmenu.htm
&& 2(ACP Journal Club )
&&& ACP(American Society of Internal MedicineACP-ASB)http://www.acpjc.org
&& 3(Evidence Based Nursing)
/template.cfm?name=bmjhomeBMJ
Bandolier NHS
&& 4 (Evidence Based Health Care)
&&& http://www./journals
&&& (5)Chinese Journal of Evidence-Based
&&& 200162004
&& 6Evidence-Based Medicine
&&&&&& Cochrane library users grouphttp://www.york.ac.uk/inst/crd/clug.htm
&&&&&& NIHhttp://clinicaltrials.gov/
&&&&&& http://www.chinacochrane.org/
&&&&&& Cochranehttp://www.cochrane.org/index0.htm
&&&&&& Cochranermedhealthonline.org/item.aspx
&&&&&& EBM online/
&&&&&& Cochrane(/cochrane)
&&&&&& Sumsearch(sumsearch.uthscsa.edu/searchform4.htm)
&&&&&& TRIP Database
&&&&&& Doctors Desk () http://drsdesk.sghms.ac.uk
&&&&&& CRD Database ()
&&& 1Cochrane LibraryCochraneUpdate Softwarehttp://www./cochraneCochrane2PubMedHttp:/www.ncbi.nlm.nih.gov/PubMed
EBSCO(ASP)PubMed
复制、下载、存贮)
个人知识管理
Personal Knowledge Management
Paul Dorsey
Office MS Outlook Lotus NotesICQMSNweb-blog wikiPDA
,&&&&&&&&&&&&&&&&&&&&&
文献综述写作
②评述性:是指比较专门地、全面地、深入地、系统地论述某一方面的问题,对所综述的内容进行综合、分析、评价。
③先进性:综述不是写学科发展的历史,而是要搜集最新资料,获取最新内容,将最新的信息和科研动向及时传递给读者。
五、综述的写作步骤
题目不要过大,过大的题目需要有诸多的内容来充实,必然要查找大量的文献,增加阅读、整理过程的困难&
学术论文参考文献的标准著录格式
Bibliographic ReferencesGB/T 77142005
[].GB3469-83
1 .[M].2007
2 .[J].()199333(4):62-67.
3 Mookerjee D. Monitoring via-a-vis investigation in enforcement of law[J]. The American Economic Review199283(3):503~511
4 .[D].2008
5 .[EB/OL].[<st1:chsdate w:st="on" IsROCDate="False" IsLunarDate="False" Day="6" Month="10" Year="-10-06].http://www.cyol.net /<st1:chsdate w:st="on" IsROCDate="False" IsLunarDate="False" Day="14" Month="9" Year="-09-14
[]. [N].()
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&20128附件下载:
(编辑:董莉)
建议使用IE4.0以上版本 分辨率800×600 较小字体浏览本站
版权所有 & 大理学院继续教育学院/电大大理分校电大教学科 制作维护

我要回帖

更多关于 花生油 的文章

 

随机推荐