数据相关性与知识化服务研究

数据相关性与知识化服务研究

ID:41853136

大小:291.56 KB

页数:20页

时间:2019-09-03

数据相关性与知识化服务研究_第1页
数据相关性与知识化服务研究_第2页
数据相关性与知识化服务研究_第3页
数据相关性与知识化服务研究_第4页
数据相关性与知识化服务研究_第5页
资源描述:

《数据相关性与知识化服务研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、相关性和知识化服务提纲引子关于相关性研究图书馆的数据组织引文关系和链接关系内容相关用户行为相关结束语问题的提出获取文献信息的困惑选择什么网络数据库,图书馆员的困惑用户的困惑面对大量文献信息的困惑如何取舍判断权威和重要的信息的标准谁是权威,谁有影响力内容可靠吗关于相关性的研究系统相关性-Taube检索出的文献就是与查询相关的文献,主题相关关注噪音、索引、词汇的语义语法描述用户相关-Vickery用户检索相关信息的愿意程度Gradra和katter研究用户兴趣领域与主题以及文献之间的关系,系统输出和用

2、户需求之间的关系Rees和Schultz研究显示个体差异对相关性判断影响很大Maron和Kuhns用概率论的方法判断实现相关性排序关于相关性的研究Goffman基于集合论探讨查询表达式和文献信息间的相关关系Goffman和Newill提出流行病学理论,相关性作为接触有效性的度量Cooper的逻辑相关性理论Wilson的情境相关理论Harter的心理相关理论Schember、Barry等人基于用户的相关性实证研究,对相关性涉及到方面深入论述,认为相关性可以归结为论题的、面向用户的、多维的、认知的和动

3、态的Saracevic提出信息检索的分层交互模型小结关于相关性从系统为中心到用户为中心,user-central用户的认知用户的差异用户的需求从单维向多维,包括信息、环境、系统、用户从静态到动态的变化从单向输出到交互图书馆的数据组织图书馆书目系统元数据的累积单一的用户检索系统分类和主题相关性判断缺乏支持力度缺少用户的参与SirsiDynix代表在IFLA会上表示随着数字全文内容的逐渐普及和网络化数字挖掘能力和关联能力的日益提高,真正有意义的将不再是元数据本身,而是关于用户行为(user-taggi

4、ng,collabarativefiltering)、用户过程(用户教育研究管理的环境流程等)内容关联的组织机制(引用、链接、逻辑语义)引文关系和链接关系引用关系和链接关系是广泛用来建立相关关系的方法引用和被应用链接和被链接同引和同被引同链接和同被链接引用强度,耦合强度是计量关系强度的值引用关系和链接关系修正:即时引用情况,最新链接情况引用和链接权重,有影响力的引用和有影响力的链接应比影响力小的引用更具代表性自引的影响vs恶意的链接引用和链接关系的深化研究前沿和热点研究路径探索同时该论文的作者或合

5、作者还有什么文献与该论文相同主题的文献有哪些WebofScience、ScienceChina等基于引文的系统发现一篇论文引用了哪些文献,该论文被哪些文献引用了,强度如何;该论文和哪些论文共同引用相同参考文献,耦合度是多少Google,百度等的PR(pagerank)基于链接关系的强度和修正,让我们在一个搜索中可在首页发现重要的信息基于引用和链接关系的系统参考文献n引证文献相关关系引文统计单篇文献:题名作者文摘出处关键词年190019301960199020002002200420062007相关

6、文献:作者相关关键词相关参考文献相关拆分、规范、归一化处理内容概念相关引用关系和链接关系体现的相关关系从某种程度上说是从形式上发现和计量相关关系,从文献信息内容看共词:关键词和主题词Tag,用户的标识词概念抽取,算法和模型聚类,cluster用户行为相关说的和做得那个更可靠?Yahoo统计到的用户行为证明用户做的和说的表现得非常不一致数字图书馆的用户呢?从counter统计看,用户的使用和当初的强烈需求有一段不小的差距在网络上更信任陌生人的推荐和意见权威受到了挑战关心看了这篇文章的人还看了什么文章

7、关于这篇文章有什么样的评论,好评和差评是多少我要标记这篇文章的tag,谁的tag和我的一样用户日志分析出的关系更为重要用户行为的一些统计数字用户查询行为查询的长度主要指的是用户提交的查询中包含几个词语或字(用空格隔开的)搜索引擎的分析结果表明,长度不超过3个词的查询占了总查询数的93.15%,平均长度为1.85个词,这说明用户输入的查询通常都比较短一个session指的是同一个用户在某一小段时间内的连续查询对每个session中所含的查询个数进行了分析,得出的结果中在同一个session内查询的平

8、均个数为1.75,有66.46%的session只含有一个查询,即在那小段时间内,大部分用户只提交了一个查询且没有对该查询进行修改用户行为的一些统计数字用户对待查询结果的行为实验数据显示约85%的用户只翻看搜索引擎返回结果的前10个结果,即返回结果页面的第一页,所以传统的基于整个结果集合查准率和查全率的评价方式用户信息检索的评价,需要着重强调在评价指标中有关最靠前结果文档与用户查询需求的相关度最高的的部分搜索结果的金三角现象,搜索引擎营销公司Enquiro、Did-it以及专门研究

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。