欢迎来到天天文库
浏览记录
ID:44960134
大小:501.50 KB
页数:33页
时间:2019-11-06
《第5章-1-计算机信息检索策略与技巧》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第一节计算机信息检索策略与技巧第五章检索综述检索策略和技巧学习的目的1.为什么检索?如何检索?它山之石可以攻玉。但并不是每块石头都可以攻玉的。用何方法寻找最好石头。2.利用信息解决问题。提高自我科学研究过程中对事物现有的认知能力并弥补认知缺陷3.从信息中发现问题。有助于自我认知区域局限的跨域从必然认知世界走向自由认知世界一、计算机信息检索的基本构成(一)课题分析(二)检索词的确定(三)检索策略(四)编制检索式二、其他误检或漏检原因三、检索策略实例计算机信息检索策略与技巧一、计算机信息检索的基本构成接受课题选择数据库数据库组档方式课题概念分
2、析抽取检索词决定检索策略编制检索式重建检索式补充新的策略不满意用户满意程度满意输出可供检索的字段基本索引辅助索引截词算符布尔算符位置算符匹配数据库整理检索结果(一)课题分析●检索目的定位例如:课题:“论企业生产线的优化”课题:“论企业生产线的优化”企业*生产线*优化工厂公司流水线计算机控制在线控制智能控制企业工厂公司++生产线流水线+优化计算机控制在线控制智能控制+++()()()**●自由语言与数据库标引语言要对等例如:海绵的制造工艺检索式:海绵*(制造+工艺)实际是:海洋中的多孔类动物对“海绵”的理解,世人已经共认为:“海绵”与“泡沫
3、塑料”、“泡沫橡胶”类物质等同。●多主题概念的课题应以“简”为主1、课题有A、B、C、D、E、F等主题概念进行组配,其中“C”词建库人员未从原始文献中挑选出来作为标引词时,该“C”主题词则表现为零,则整个检索式等于零。2、课题“利用基因工程的手段提高植物中淀粉含量”基因工程*淀粉基因*淀粉天然植物茶叶中提取茶多酚作为食品防腐剂天然*植物*茶叶*提取*茶多酚*食品*防腐剂茶叶*提取*茶多酚*食品*防腐剂茶叶*茶多酚*食品*防腐剂茶多酚*食品*防腐剂茶多酚*(食品+防腐)●少用或不用对课题检索意义不大的词1、词义泛指度过大的词,如:“展望”—
4、—趋势、现状、近况、动态等“应用”——作用、利用、用途、用法等还有如“开发”、“研究”、“方法”、“影响”、“效率”等等。2、词义延伸过多的词,如:“制造”——制备、生产、加工、工艺等“提炼”——精炼、提取、萃取、回收、利用等3.少用无法定性定量的词冷、温复合挤压连续成形技术(冷挤压or温挤压)and连续and成型(冷or温)and挤压and连续and成型冷=常温以下温=45`C~600`Cor800`C处理结果:取消:冷、温二词深化处理:增加:挤压对象的词。如塑料、金属等词或其他如有助于限制范围的有效实词如:挤压时用的润滑材料:石墨。。
5、。。●运用主题概念所表达的上位或下位概念课题(1)“加氢裂化防污垢的开发与应用研究”,将“加氢裂化”与“防污垢”组配,结果不理想。概念向上位“石油加工与石油炼制”的概念扩大,再与“防垢剂”组配,完成了课题的要求。课题(2)碳4、碳5馏份工艺情况(C4orC5)anddistillat*上位:Petroleumandproduct*anddistillat*下位:(Buteneor1-3butadiene…)anddistillat*一氧化碳氢化1、氢化热2、氢化催化剂3、氢化动力学4、甲烷化5、甲烷化热6、甲烷化动力学7、甲烷化催化剂8、
6、燃料气体制造课题(3)“一氧化碳的氢化”很明显这一课题所包括的范围过于广泛:(二)注意检索词的词义变化1、汉词与英语等西方语言的词汇相比较:◆汉词的字与词界线比较模糊,一个字也许就是一个词,英语基本上没有这种现象。◆汉词无固定的词头、词尾和性、数的变化。而英语构词时这种情况很多。◆汉语的构词一般与语义有关,一个词后加上一个字就派生出另一个新的词,而英语的情况与此有很大的不同。2、关键词与主题词◆关键词即是“自由词”,是信息的提供者各自采用的不经过一定规范化限定的词。检索操作方便,但其专指度差,常需用较高的逻辑匹配、截词符等技能。◆主题词即
7、指以自然语言中优选出的,经过规范化处理后的名词术语。检索操作需将习惯使用的自然语言与各数据库自编的主题词表对照后方能使用,但专指度较高。(三)检索策略查全率是指系统检索时能检出相关文献的能力。(1)查全率=被检出的相关文献量系统数据库中相关文献总量*100%(2)查准率=被检出与课题相关的文献量被检出的文献总量*100%查准率是指系统检索时拒绝不相关文献的能力。条件、目标?查准率查全率1.二者相背2.目标优先3.现有条件(四)编制检索式一个好的检索式是最终实现检索策略是否达到预想结果的具体表现形式。1、影响查全率的种种因素如:检索词是否已
8、扩大到穷尽;是否合理应用逻辑“或”来优化检索;是否对课题检索策略作了必要的扩大。2、影响查准率的因素如:是否尽量选用了专指度较高的检索词;是否尽量采用了逻辑“与”逻辑“非”和位置算符进行优化检
此文档下载收益归作者所有