欢迎来到天天文库
浏览记录
ID:57121766
大小:2.67 MB
页数:52页
时间:2020-08-01
《基于领域知识库的信息推荐系统 智能文本篇章分析课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、2013届毕业论文答辩数学科学学院基于领域知识库的文本信息推荐系统演讲者:谷林指导老师:林荣德--智能文本篇章分析一二三四五六概述一网络高度发达的今天,网络信息的量也正以几何级数的方式增长。有些时候,您是否发现对信息的选择有些困难呢?概述一该如何选择我感兴趣的信息呢?概述一这个时候信息推荐系统来了!信息推荐系统InformationRecommedationSystem概述一推荐系统是一种为解决Internet上成千上万的信息过载而设计的智能的代理系统。它能从Internet上大量的信息中向特定用户自动推
2、荐符合其个人兴趣偏好或需求的信息,从而实现个性化的推荐服务。信息推荐系统概述一基于领域知识库的文本信息推荐就是根据知识点之间的相关性和用户的兴趣来推荐用户感兴趣的文章信息。项目简介推荐信息分类:个人热点推荐公共热点推荐概述一本项目需要解决的三个问题建立用户兴趣模型并进行动态更新;抓取网页文本,并对文本篇章进行智能分析;依据用户个人的兴趣知识库产生推荐文本信息。系统框架二数据库后台分析程序Web推荐系统读取用户个人信息以及推荐信息反馈用户的浏览记录读取所有用户的浏览记录和每个用户的所有关键词存储推荐信息以及
3、动态更新的用户兴趣返回搜索结果搜索用户关键词访问推荐的网页Internet2.1信息推荐系统的框架图系统框架二2.2后台分析程序数据处理流程后台分析程序处理过程分为两个功能模块:从用户浏览记录中挖掘用户兴趣搜索用户关键词产生推荐信息用户兴趣模型三兴趣模型的定义:用户兴趣模型是将用户感兴趣的事物抽象出其概念,并且用特定的表达形式表示出用户兴趣的一种方案。用户兴趣模型三3.1用户兴趣模型的表示方法向量空间模型是将用户兴趣模型表示成一个n维特征向量,每一维向量表示如下:主概念子概念相似或包含关系值fatherc
4、hildp用户兴趣模型三3.2用户行为的数据收集用户行为的数据收集是一个获取与用户特征、偏好或活动相关的信息的过程。一般有两种方式:显性隐性领域智能文本篇章分析和信息推荐四4.1领域知识库智能文本篇章分析和信息推荐四4.1.1公共知识库实例以体育领域为例,树形结构图:智能文本篇章分析和信息推荐四4.1.2个人知识库实例个人知识库看作公共知识库树的一棵子树,简单的用户知识库实例如图:NBA专题体育网球足球国际足球英超梅西个人知识库树形结构图:智能文本篇章分析和信息推荐四4.5计算子概念对某关键词贡献度主概念
5、子概念贡献度wID2(主概念)wID1(子概念)P(关联值)uID(用户编号)体育足球0.70921121010足球国际足球0.50921121010以体育领域为例,树形结构图:体育假想兴趣树遍历访问的顺序为:123451514131211109876NBA专题体育网球足球国际足球英超梅西NBA专题对体育的贡献度为:0.8*0.5=0.4梅西对国际足球的贡献度为:0.5*0.5*0.6=0.15智能文本篇章分析和信息推荐四智能文本篇章分析和信息推荐四4.6文章评分和信息推荐按如下公式对文章进行评分:智能文
6、本篇章分析和信息推荐四4.7推荐信息的动态更新推荐的信息超过3天后,默认为此文章已经失去时效性,故予以删除,从而达到减少数据冗余。智能文本篇章分析和信息推荐四4.8用户个人知识点兴趣度变化的勒夏特列原理“知识点兴趣度的时间修正:快开始,慢减少”的思想,效果如图:系统测试结果五5.1.1百度搜索“体育”的结果本次仅以关键词“体育”为例,来测试后台分析程序的运行结果。系统测试结果五5.1.2搜索结果的网页源代码本次仅列举第一条信息的网页源代码,如下图:系统测试结果五5.1.3分析提取有意义网页地址的结果测试网
7、页地址系统测试结果五5.1.6文章最终评分结果以及产生的推荐信息系统测试结果五5.2用户兴趣的挖掘和个人知识库的动态生成系统测试结果五5.2.1读取用户浏览记录点击信息表中的一条记录如下体育足球梅西5.2.3动态生成用户个人兴趣关键词之间的包含关系结论与展望六本项目基本实现了:建立用户兴趣模型并进行动态更新;智能文本篇章分析;依据用户个人的兴趣知识库产生推荐信息。结论:结论与展望六将来有如下几个方面值得个性化推荐系统及用户兴趣模型相关研究者关注:面向用户多兴趣的模型研究;面向用户群体的建模研究;用户长期和
8、短期兴趣的集成研究;用户建模过程可视化技术的研究和实现。展望:TheendThankyou!从用户浏览记录中挖掘用户兴趣的数据处理流程图搜索用户关键词产生推荐信息的数据处理流程图智能文本篇章分析和信息推荐四4.2自动搜索关键词,提取有效网页地址智能文本篇章分析和信息推荐四4.2自动搜索关键词,提取有效网页地址关键技术:正则匹配智能文本篇章分析和信息推荐四4.3网页文本提取思路及算法
此文档下载收益归作者所有