欢迎来到天天文库
浏览记录
ID:15995787
大小:1.03 MB
页数:33页
时间:2018-08-07
《基于领域知识库的信息推荐系统-智能文本篇章分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2013届毕业论文----智能文本篇章分析题目:基于领域知识库的文本信息推荐系统姓名:谷林学号:0921121010学院:数学科学学院专业:信息与计算科学级别:2009级本科指导老师:林荣德时间:2013年5月摘要推荐系统是为解决Internet上成千上万的信息过载而设计的一种智能的代理系统,它能从Internet上大量的信息中向特定用户自动推荐符合其个人兴趣偏好或需求的信息,从而实现个性化的推荐服务。基于领域知识库的信息推荐即是根据知识点之间的相关性和用户的兴趣来向其推荐用户感兴趣的信息,推荐信息包括个人热点推荐和公共热点推荐。
2、本项目需要解决的主要问题有如下三个方面:第一、建立用户兴趣模型并进行动态更新。建立用户兴趣模型,首先,要收集用户的行为数据,其方式主要有显式和隐式两种;其次,用基于向量空间模型(VSM)来表示用户的个人兴趣;最后,处理用户浏览记录挖掘用户感兴趣的知识点的关键词,通过回溯用户所有关键词的生成算法动态建立用户兴趣知识库。第二、对文本篇章进行智能分析。首先,需要建立领域的知识库,并且人为设定每两个个知识点之间的相似包含关系;其次,从网页HTML源文件中提取文章的标题和正文,用正则表达式匹配的方法获取标题,用分块提取汉字的思路分析提取出文
3、章正文,剔除图片、贴吧、广告等;最后,将提取出的文章进行分词和评分。第三、依据用户个人的兴趣知识库产生推荐信息。产生推荐信息,首先,系统通过搜索引擎自动搜索用户关键词,从搜索结果中提取有效的网页地址;其次,二次访问获得的有效网页,进行文本篇章智能分析,通过评分情况判断是否推荐。测试结果表明,本项目已经能够很好地依据用户的个人兴趣实现个性化的文章信息的推荐,并且通过处理用户浏览过推荐网页来挖掘用户潜在的兴趣,从而实现用户兴趣知识库的动态更新。至此,推荐系统核心功能的框架已经基本搭建完成,为以后扩展至更多的领域的研究打下了坚实的基础。
4、关键词:推荐系统用户兴趣模型智能文本篇章分析推荐信息AbstractRecommendationsystemisanintelligentagentsystemsolvingthousandsofoverloadinginformationfromtheInternet.Itcanofferplentyofspecialinformationautomaticallytoindividualswithdifferentdemandsandinterests,andthusmakingthepersonalizedrecommend
5、ationserviceaccomplished.Basedondomainknowledge,theinformationrecommendationcouldofferusersinterestedmessagesaccordingtotheconnectionofknowledgepointsandpersonalappetites.Recommendationsystemhastwoaspects,includingtherecommendationofpersonalhotspotandcommonhotspot.Thi
6、sprojectwillsolvedthreeprimaryproblems.Q.1User’sinterestsmodelanddynamicrenovation.Tobuilduser’sinterestsmodel,firstlydataofuser’sbehaviorsincludingexplicitaspectsandimplicitaspectsshouldbecollected.Andsecondly,usevectorspacemodeltoexpresstheuser'spersonalinterests.Fi
7、nally,byexploringthebrowsinghistoryandsearchingkeywordsofuser’sinterestsandbacktrackingallthekeywordsofuserbygeneratingalgorithmKnowledge-baseofuser'sinterestsaredynamicallysetup.Q.2Textintelligentanalysis.Firstly,buildingdomainknowledgebase,andsettinguptherelationshi
8、pbetweentwopointsartificially.Secondly,thetitleandtextshouldbeextractedfromHTMLcodebyusingregularexpressions,andremovingpict
此文档下载收益归作者所有