欢迎来到天天文库
浏览记录
ID:32007001
大小:1.38 MB
页数:52页
时间:2019-01-30
《rss个性化内容聚合框架》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、复旦大学硕士学位论文RSS个性化内容聚合框架姓名:李永锋申请学位级别:硕士专业:计算机技术指导教师:杨卫东20071028论文独创性声明本论文是我个人在导师指导下进行的研究工作及取得的研究成果。论文中除了特别加以标注和致谢的地方外,不包含其他人或其它机构已经发表或撰写过的研究成果。其他恩志对本研究的启发和所做的贡献均已在论文中作了明确的声明并表示了谢意。作者签名论文使用授权声明日期:丝!苎z本人完全了解复旦大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可
2、以采用影印、缩印或其它复制手段保存论文。保密的论文在解密后遵守此规定。⋯名:铡聊躲氍嘲半苫中文摘要RSS作为内容聚合标准,已被许多门户网站和博客软件支持,用户通过订阅的方式获得信息服务。RSSFEED内容都采用X)4L格式表述,于是可以把它作为XML数据流,利用XML数据流处理技术对Feed内容进行过滤。于是本文提出了一个较完整的基于XML流的RSS个性化内容聚合运行模型,模型由XML流处理、Feed资源中心、内容中心、用户中心和内容Portal共五个模块组成。为用户提供三个层次的个性化内容聚合服务:第一个层次是用户原始频道订阅服
3、务,第二个层次是基于关键词过滤的定制频道服务,第三个层次是基于用户偏好分析和内容标签的智能推荐服务。同时针对RSSFEED提出一种新的X札流查询算法,支持谓词查询并可定义查询返回结果,算法是将查询构造为带有多个输出节点的解析树,匹配过程使用堆栈存储路径匹配候选集和输出结果集。关键词:内容聚合,XML数据流,RSS中图分类号:TP393ABSTRACTTheRSSisastandardofcontentsyndicationservice.Ithasalreadybecomeac,OrBRlOnrun.ionofmanyportal
4、sitesandBolgerso仔wa]'e.Theuserscanacquiretheinformationbysubscribingfeeds.WecanfilterthecontentoftheXMLformattedfeedasstreamingXMLdata.InthispaperweproposethertmtimemodeloftheRSScharacteristiccontentsyndicationthatbasedontheXMLstream.Thismodelcomposedofthefivemodulesi
5、ncludingFilteroverXMLStreams,FeedResourceManagement,ContentService,UserServiceandContentPortal.Itprovidesthethreelevelsserviceforlasers.(1)Subsc邱tionoftheoriginalchannel.(2)Subscriptionofuserself-definedchannel.(3)Serviceofintelligentrecommend.Wealsoproposeanovelalgor
6、ithmforfilteringRSSfeeds.Thequerysupportspredicateevaluation,andcalldefinetheoutputparameters.Thealgorithmconstructsatree—shapedparserwithmuhipleoutputsaccordingtoaqueryexpression.ItuseSstacktostorethecandidatesofpathmatchesandoutputduringevaluate.KEYWORDS:ContentSynd
7、ication,XMLDataStream,RSSCLC:TP3932I.I研究背景第一章引言近几年,网络技术的迅猛发展及互连网内容的快速膨胀,已经使互联网成为人们学习工作和生活中不可缺少的平台,但是人们要在浩如烟海的信息中获得对自己正真有用的信息,却总是不尽人意。如何帮助用户快速便捷地从互联网获得所需信息,完成最佳用户体验,是互联网技术一直在追求的目标,我们简单回顾一下互联网信息内容服务模式的发展历程。第一代互联网内容服务模式是基于门户的目录服务,知名的门户网站有YAHOO、SOHU、SINA等。它们的技术思路是一致的,都受到传
8、统的图书情报管理方法的影响,对信息采用分类的方法,提供目录服务。这样用户就可以按照目录分类进行信息的收集和阅览。但是这些网站所采用的分类体系,比起传统文献分类体系来说,比较简单且不规范,而且没有全球统一的标准,每个门户网站的分类千差万别,使用户查找
此文档下载收益归作者所有