R语言数据挖掘

R语言数据挖掘

ID:41268437

大小:6.86 MB

页数:21页

时间:2019-08-20

R语言数据挖掘_第1页
R语言数据挖掘_第2页
R语言数据挖掘_第3页
R语言数据挖掘_第4页
R语言数据挖掘_第5页
资源描述:

《R语言数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、.R语言数据挖掘论文题目:数据挖掘实战之网站智能推荐服务指导老师:张敏小组成员:周犬义王宁..数据挖掘实战之网站智能推荐服务一、背景与挖掘目标伴随着计算机技术、通信技术的日益成熟和广泛应用,互联网自90年代初开始得到迅猛发展,至今虽然只有短短几十年的时间,但它已经发展成为现今信息时代人类生活中不可或缺的重要组成部分,并成为全球范围内传播信息的主要渠道。随之而来的是互联网上信息资源越来越丰富,人们要在浩如烟海的“混乱的”互联网信息世界中找到自己真正感兴趣信息却存在很大的困难,具体表现在:用户不知道如何贴切表达真正想要的网上资源的需求,也不知道如何去更准确有效地寻找,即所谓的“信息迷失

2、”问题;和对收到的或已经下载的大量无关的信息难以消化,即所谓的“信息过载”问题。虽然我们可以借助于搜索引擎来检索Web上的信息,但仍不能满足不同背景、不同目的和不同时期的查询要求,因为大多数搜索引擎缺少主动性,没有考虑用户的兴趣偏好和用户的不同,无法有效地解决信息过载和信息迷失的问题。为了适应用户不断增长的信息需求,有效地解决信息过载和信息迷失给人们带来的种种问题,研究人员纷纷从人工智能中寻找突破口。在许多探索性研究中,个性化推荐服务作为一种崭新的智能信息服务方式,应用前景广泛,十分引人注目。与搜索引擎不同,推荐系统并不需要用户提供明确的需求,而是通过分析用户的历史行为,根据用户的

3、行为主动推荐能够满足他们兴趣和需求的信息。因此,对于用户..而言推荐系统和搜索引擎是两个互补的工具。搜索引擎满足有明确目的的用户需求,而推荐系统能够帮助用户发现感兴趣的内容。因此,在电子商务领域中推荐技术可以起到以下作用:第一,帮助用户发现其感兴趣的物品,节省用户时间、提升用户体验;第二,提高用户对电子商务网站的忠诚度,如果推荐系统能够准确地发现用户的兴趣点,并将合适的资源推荐给用户,用户就会对该电子商务网站产生依赖,从而建立稳定的企业忠实顾客群,提高用户满意度。本案例研究的对象是泰迪智能科技有限公司的泰迪杯竞赛网站,泰迪科技是一家专业从事大数据挖掘应用研发、咨询和培训服务的高科技

4、企业。泰迪杯竞赛网致力于为用户提供丰富的泰迪杯竞赛信息、数据挖掘培训咨询服务,并为参赛者提供了往届优秀作品作为参考,为高校提供了丰富的教学资源,如:案例教程、教学视频、教学书籍、建模工具等。随着网站量增大,其数据信息量也在大幅度增长。用户在面对大量信息时无法及时从中获取自己需要的信息,对信息的使用效率越来越低。这种浏览大量无关信息的过程,造成了用户需要花费大量的时间才能找到自己需要的信息。为了能更好地满足用户需求,依据其网站海量的数据,研究用户的兴趣偏好,分析用户的需求和行为,发现用户的兴趣点。引导用户发现自己的信息需求,将网页精准地推荐给所需用户,帮助用户发现他们感兴趣但很难发现

5、的网页信息。为了能够更好的满足用户需求,依据其网站海量的数据,研究用户的兴趣偏好,分析用户的需求和行为,发现用户的兴趣点,从而引导用户发现自己的信息需求。..行为记录原始数据:利用read.csv函数把原始数据导入R语言RStudio中,整理数据进行下一步的处理。当用户访问网站页面时,系统会记录用户访问网站的日志,其访问的数据记录了访问序号、内容id、访问内容、用户id、ip等多项属性的记录,并针对其中的各个属性进行说明,如表2-2所示。表2-2访问记录属性表属性名称属性说明属性名称属性说明id访问序号browser_type浏览器类型content_id内容idbrowser_v

6、ersion浏览器版本page_path网址platform_type平台类型username用户名称platform_series平台系列userid用户idplatform_version平台版本sessionid一次浏览标识data_time访问时间ipip地址mobile_type手机类型country国家agent代理商area区域uniqueVisitorID唯一浏览ID..依据所提供的原始数据,确定挖掘目标如下:挖掘目标:1、借助大量用户的访问记录,发现用户的访问行为习惯,对不同需求的用户进行相关服务页面的推荐;2、根据用户访问内容、访问次数等属性特征,深入了解用户对

7、访问网站的行为和目的及关心的内容二、推荐系统架构总体流程主要步骤:1.从系统中获取用户访问网站的原始记录。2.以用户访问jhtml后缀的网页为关键条件,对数据进行处理。3.对数据进行多维度分析,用户访问时间,用户访问内容,流失用户分析以及用户分群等分析。4.对数据进行预处理,包含数据去重,数据删选,数据分类等处理过程。5.对比多种推荐算法进行推荐,通过模型评价,得到比较好的智能推荐模型。通过模型对样本数据进行预测,获得推荐结果..数据抽取:1.网页类型分析图一结论:从

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。