数据挖掘报告书.doc

数据挖掘报告书.doc

ID:53961987

大小:1.43 MB

页数:21页

时间:2020-04-11

数据挖掘报告书.doc_第1页
数据挖掘报告书.doc_第2页
数据挖掘报告书.doc_第3页
数据挖掘报告书.doc_第4页
数据挖掘报告书.doc_第5页
资源描述:

《数据挖掘报告书.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、数据挖掘报告书题目:关联规则算法在电影爱好中的应用院系:经济管理学院专业:信息管理与信息系统班级:07304班小组成员:王梦宇李肖楠黄林橙沈岁张舒2010年6月〇、SQLServer2005MicrosoftSQLServer2005是微软公司在2005年12月推出的一个全面的数据库平台,使用集成的商业智能工具,提供了企业级的数据管理。使用BusinessIntelligenceDevelopmentStudio在AnalysisServices项目中定义数据源、数据源视图、维度和多维数据集,并可以利用其现有的数据挖掘算法方便简单

2、的对数据进行分析。SQLServer2005包括算法主要有:决策树,关联规则,神经网络,时序,聚类分析等。微软公司的数据库产品SQLServer2005中包含了数据挖掘特性,可以直接从数据库或者数据仓库中进行数据挖掘操作,实现数据挖掘与数据库以及应用程序的紧密耦合,从而大大提高数据挖掘效率。Microsoft关联规则算法属于priori关联规则算法家族,该算法适用于挖掘频繁项集的非常流行和有效的算法。在关联算法中有两个步骤:第一个步骤是挖掘频繁项集;第二步是基于频繁项集来生成关联规则。关联规则算法对算法参数的设置非常敏感。以下是用

3、于Microsoft关联规则算法的一系列参数:1.Minimum_Support:定义了项要成为频繁项集所必须满足的最小支持度。2.Maximum_Support:定义了频繁项集的最大支持度阈值。3.Minimum_Probability:定义了一个关联规则的最小概率。4.Minimum_Importance:重要性小于它的规则会被过滤掉。5.Maximum_Itemset_Size:指定项集大小的最大值。6.Minimum_Itemset_Size:指定项集大小的最小值。7.Maximum_Itemset_Count:定义项集数

4、目的最大值。一、引言当今社会是网络的社会,人们通过上网能做很多事情,比如学习、看新闻、交友等等。当然我们觉得有很多人会和我们一样,无聊的时候上网看看电影电视剧。因此说随着网络的发展,电影事业的也得到了发展。现在电影的种类也越来越丰富,不过不是所有电影都符合大家的口味,有的人喜欢惊悚的,有的人喜欢搞笑的等等。这些我们认为都和人们各自的兴趣爱好有一定的关系,同时我们也觉得也能通过人们喜欢看什么样的电影反应出那个人的兴趣爱好。所以我们小组想通过数据挖掘的关联规则算法对电影(movies)和爱好(hobbies)的关系进行挖掘,并希望通过

5、这次的研究挖掘,对SQLServer2005和数据挖掘能有进一步的了解。二、应用背景情况数据来源:数据库MovieClick挖掘算法:关联规则算法三、数据挖掘算法的实施1、添加数据库:打开SQLServerManagementStudio,建立连接,然后右击数据库,点击“附加”,然后添加数据库MovieClick,确定后数据库就添加成功。2、创建新项目:打开businessintelligencedevelopmentstudio,选择“文件”→“新建”命令,新建一个AnalysisServices项目。在“名称”文本框中将新项目

6、命名为AdventureWorks,点击“确定”按钮。3、创建数据源及视图:在解决方案管理器中,右击“数据源”,从弹出的快捷菜单中选择“新建数据源”命令。系统将打开数据源向导。单击“新建”按钮,向数据库添加连接。系统将打开“连接管理器”对话框,在提供程序下拉列表中选择“本机OLEDBSQLNativeClient”选项,在服务器名下拉列表中选择承载MovieClick在“选择或者输入一个数据库名”下拉列表中选择MovieClick选项,再点击确定。在创建视图时,在解决方案管理器中,右击“数据源视图”,从弹出的快捷菜单中选择“新建

7、数据源视图”,系统将打开数据源视图向导。在“选择数据源”页的“关系数据源”下,默认选中在上一步中创建的MovieClick数据源。单击“下一步”,在“选择表和视图”页上选择表movies和hobbies,然后单击右箭头键,单击“下一步”。在“完成向导”页上,默认情况下,系统将数据源视图命名为MovieClick。单击完成。系统将打开数据源视图设计器,显示该数据源视图。在数据源视图设计器的数据源视图窗格中,选择Hobbies中的CustomerID列。将该列托到Movies表中,并将其放到CustomerID列上。4、创建关联挖掘结

8、构:在解决方案管理器中,右击“挖掘结构”从弹出的快捷菜单中选择“新建挖掘结构”命令。在“选择定义方法”页上,确保已选中的“从现有关系数据库或数据仓库”选项,在单击“下一步”按钮。在“选择数据挖掘技术”页的“您要使用何种数据挖掘技术?”列表框中选中“

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。