欢迎来到天天文库
浏览记录
ID:55963312
大小:1.37 MB
页数:39页
时间:2020-06-18
《信息检索技术现状、发展和未来.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、信息检索与内容安全专业委员会集体讨论稿信息检索技术的发展——过去、现在和未来信息检索•信息检索:–从数据中找到与用户需求相匹配的内容•信息检索的发展–紧随着用户需求的发展与变化–随着信息技术的爆炸式发展而产生质的飞跃–在不同的发展阶段遵循不同的商业模式FigureCopyrightbyTREC发展阶段1——数字图书馆时代•需求对文档全文内容的快速检索1945:VannevarBush’sarticle“Aswemaythink”目标:未来人们能够实现对海量图书资源(1M)进行快速的访问“Alibraryofa
2、millionvolumescouldbecompressedintooneendofadesk……Itmaybeconsultedwithexceedingspeedandflexibility.”发展阶段1——数字图书馆时代•技术:草创时期–数据库查询自由文本的全文检索–倒排索引技术–词频与权重(termsignificance)Frequency/Informativity•Luhn1957frequencyinformativity•后来发展出TFIDF权重计算方法LUHN,H.P.,'Astati
3、sticalapproachtomechanisedencodingandsearchingoflibraryinformation',IBMJournalofResearchandDevelopment,1,309-317(1957).123…RankUsedbyLuhnfortermsignificance发展阶段1——数字图书馆时代•技术:检索模型–集合论模型•Booleanmodels(e.g.Lancasteretal.,1973)–代数模型•VectorSpacemodels(e.g.Salton
4、etal.,1983)–概率模型•RSJmodel(Robertson&SparckJones,1976)•BM25(Robertsonetal.,1994)发展阶段1——数字图书馆时代•评价–Cranfield评价体系(Cleverdon,1950’s)–关注“relevance”(F.W.Lancaster,1979)"Relevanceisthecorrespondenceincontextbetweenaninformationrequirementstatement...andanarticle(a
5、document),thatis,theextenttowhichthearticlecoversthematerialthatisappropriatetotherequirementstatement."F.W.Lancaster,1979–第一届TREC(TextREtrievalConference)标准评测会议举办(1992)•新闻报纸语料,部分政府文档,图书资料;压缩后2G发展阶段1——数字图书馆时代•里程碑(国际):Salton奖的颁发情况1983Salton现代信息检索的奠基人,20世纪60年
6、代开发出信息检索系统SMART。1975年提出了著名的向量空间模型以及词项权重模型TF-IDF1988KarenSpärck概率检索模型的提出者之一。20世纪70-80年代与Robertson一起Jones建立了信息检索的RSJ概率框架。首次提出了“IDF”的概念(1972)。和Robertson一起给出了二值独立模型(BIM)的主要基础理论(1976)。1991CyrilCleverdon在20世纪60年代完成了著名的Cranfield项目,对信息检索的评价方法以及自动索引构建的方式做出了卓越的贡献。199
7、4WilliamCooper信息检索中引入概率的先驱。1997TefkoSaracevic是情报学社会传播派的主要代表人之一,对信息检索系统的测试和评估,尤其是信息检索中的人机交互等方面做出了突出的贡献。发展阶段1——数字图书馆时代•里程碑(国内):748工程–1985年,开始开展新闻资料检索的研究–1989年,研制出第一套基于关键词标引的新闻资料检索系统–1992年,研制出基于我国第一套中文全文检索系统–1993年,开发商业化全文检索系统TRS–1997年,获得国家科技进步二等奖发展阶段1——数字图书馆时代
8、•应用形态–封闭数据集合–单机模式或专网内的主机-终端模式•商业模式–软件/解决方案提供–专网内的查询服务提供信息检索发展•信息检索:从数据中找到与用户需求匹配的内容•信息检索的发展,紧随着用户需求的发展与变化–发展阶段1:数字图书馆时代——对文档全文内容的快速检索–发展阶段2:早期互联网时代——?信息检索•信息检索:从数据中找到与用户需求匹配的内容•信息检索的发展,紧随着用户需求的发展与变化–发展
此文档下载收益归作者所有