基于领域知识库的信息推荐系统-智能文本篇章分析

基于领域知识库的信息推荐系统-智能文本篇章分析

ID:4428740

大小:1.11 MB

页数:33页

时间:2017-12-01

基于领域知识库的信息推荐系统-智能文本篇章分析_第1页
基于领域知识库的信息推荐系统-智能文本篇章分析_第2页
基于领域知识库的信息推荐系统-智能文本篇章分析_第3页
基于领域知识库的信息推荐系统-智能文本篇章分析_第4页
基于领域知识库的信息推荐系统-智能文本篇章分析_第5页
资源描述:

《基于领域知识库的信息推荐系统-智能文本篇章分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、2013届毕业论文----智能文本篇章分析题目:基于领域知识库的文本信息推荐系统姓名:谷林学号:0921121010学院:数学科学学院专业:信息与计算科学级别:2009级本科指导老师:林荣德时间:2013年5月33摘要推荐系统是为解决Internet上成千上万的信息过载而设计的一种智能的代理系统,它能从Internet上大量的信息中向特定用户自动推荐符合其个人兴趣偏好或需求的信息,从而实现个性化的推荐服务。基于领域知识库的信息推荐即是根据知识点之间的相关性和用户的兴趣来向其推荐用户感兴趣的信息,推

2、荐信息包括个人热点推荐和公共热点推荐。本项目需要解决的主要问题有如下三个方面:第一、建立用户兴趣模型并进行动态更新。建立用户兴趣模型,首先,要收集用户的行为数据,其方式主要有显式和隐式两种;其次,用基于向量空间模型(VSM)来表示用户的个人兴趣;最后,处理用户浏览记录挖掘用户感兴趣的知识点的关键词,通过回溯用户所有关键词的生成算法动态建立用户兴趣知识库。第二、对文本篇章进行智能分析。首先,需要建立领域的知识库,并且人为设定每两个个知识点之间的相似包含关系;其次,从网页HTML源文件中提取文章的标题

3、和正文,用正则表达式匹配的方法获取标题,用分块提取汉字的思路分析提取出文章正文,剔除图片、贴吧、广告等;最后,将提取出的文章进行分词和评分。第三、依据用户个人的兴趣知识库产生推荐信息。产生推荐信息,首先,系统通过搜索引擎自动搜索用户关键词,从搜索结果中提取有效的网页地址;其次,二次访问获得的有效网页,进行文本篇章智能分析,通过评分情况判断是否推荐。测试结果表明,本项目已经能够很好地依据用户的个人兴趣实现个性化的文章信息的推荐,并且通过处理用户浏览过推荐网页来挖掘用户潜在的兴趣,从而实现用户兴趣知识

4、库的动态更新。至此,推荐系统核心功能的框架已经基本搭建完成,为以后扩展至更多的领域的研究打下了坚实的基础。关键词:推荐系统用户兴趣模型智能文本篇章分析推荐信息33AbstractRecommendationsystemisanintelligentagentsystemsolvingthousandsofoverloadinginformationfromtheInternet.Itcanofferplentyofspecialinformationautomaticallytoindividua

5、lswithdifferentdemandsandinterests,andthusmakingthepersonalizedrecommendationserviceaccomplished.Basedondomainknowledge,theinformationrecommendationcouldofferusersinterestedmessagesaccordingtotheconnectionofknowledgepointsandpersonalappetites.Recommen

6、dationsystemhastwoaspects,includingtherecommendationofpersonalhotspotandcommonhotspot.Thisprojectwillsolvedthreeprimaryproblems.Q.1User’sinterestsmodelanddynamicrenovation.Tobuilduser’sinterestsmodel,firstlydataofuser’sbehaviorsincludingexplicitaspect

7、sandimplicitaspectsshouldbecollected.Andsecondly,usevectorspacemodeltoexpresstheuser'spersonalinterests.Finally,byexploringthebrowsinghistoryandsearchingkeywordsofuser’sinterestsandbacktrackingallthekeywordsofuserbygeneratingalgorithmKnowledge-baseofu

8、ser'sinterestsaredynamicallysetup.Q.2Textintelligentanalysis.Firstly,buildingdomainknowledgebase,andsettinguptherelationshipbetweentwopointsartificially.Secondly,thetitleandtextshouldbeextractedfromHTMLcodebyusingregularexpressions,andremoving

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。