关联规则挖掘在板球比赛技战术分析中的应用研究

关联规则挖掘在板球比赛技战术分析中的应用研究

ID:10066054

大小:30.50 KB

页数:8页

时间:2018-05-23

关联规则挖掘在板球比赛技战术分析中的应用研究_第1页
关联规则挖掘在板球比赛技战术分析中的应用研究_第2页
关联规则挖掘在板球比赛技战术分析中的应用研究_第3页
关联规则挖掘在板球比赛技战术分析中的应用研究_第4页
关联规则挖掘在板球比赛技战术分析中的应用研究_第5页
资源描述:

《关联规则挖掘在板球比赛技战术分析中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、关联规则挖掘在板球比赛技战术分析中的应用研究【摘要】板球教练常需要分析大量的比赛数据信息,进而判断队员的场上表现,制定科学有效的作战方案。但随着比赛信息量的增大,人脑已经无法做出精准的分析。为了挖掘出有用的信息规则,帮助教练调整比赛战术,提高全队的比赛成绩,本文使用关联规则挖掘算法,挖掘比赛中准确而有用的关联规则,保证比赛战术的有效性。研究证明,该算法具有一定的可行性和正确性,能为我国的板球运动发展提供有益参考。【关键词】关联规则;数据挖掘;体育数据分析近几年体育视频分析已成为一个研究热点。由于体育比赛具有巨大的商业价值和受众群体,许多科研机构都投入了大量

2、的研究工作。数据挖掘应用在体育比赛分析领域,主要是提取一些有用的隐藏在数据之中的信息规则[1-2]。板球是近几年在我国兴起的一项运动,但还处在起步阶段,现在的板球国家队有很多队员都是我院的学生。为了更好的推进我国板球事业的发展,提高我国板球队的技战术水平,本研究无疑提供了很好的借鉴和参考。1国内外研究现状8目前,国内外已在体育数据挖掘方面做了很多研究工作。IBM[3]对NBA篮球比赛进行数据挖掘研究,采用基于对象的数据模型来处理比赛数据,并利用Apriori算法挖掘数据模式间的相互关联,同时完成了数据分类。Smith等人[4]提出了基于贝叶斯分类法预测棒球

3、赛扬奖的获奖者,通过赛场的表现如胜利、失败、好球的加权平均值,投手失分率和球队胜率等。新西兰板球协会已开始对板球比赛进行数据挖掘研究,旨在帮助球队教练和队长,根据赛场局势排兵布阵,特别是在局点的重要关头做出一些决策来保证比赛胜利。然而,如何利用板球比赛中的关联规则进行数据挖掘仍然有待研究。2研究对象与方法2.1研究对象以世界老牌劲旅印度男子板球国家队为研究对象,搜集了包括2013年世界杯比赛在内的40场比赛。通过专门设计的板球信息采集系统,对比赛中的一些重要信息,如:击球方法、落点、得分、砸桩等进行记录,形成含有10000条数据的板球关系数据库,利用本文的

4、关联规则算法进行数据挖掘和技术分析。2.2研究方法8由于生成的板球关系数据库结构比较复杂,存在一些不相关的规则信息,为了提高挖掘效率,首先采用主成分分析法对数据库进行降低维度,通过归纳总结生成频繁模式。然后针对生成的频繁项集,利用关联规则挖掘算法提取出重要的关联规则。最后,通过专家访谈和文献查阅,对关联规则的语义进行科学的解释,形成板球比赛中的重要规律。具体过程如图1所示。图1关联规则挖掘过程3关联规则挖掘算法3.1主成分分析对于板球比赛的原始数据,本数据库描述了每次比赛的整个细节,包括队员姓名、角色、属性、队员间的相互关系及队员们的打法等。数据录入之后,

5、还需要执行一致性检查来确保数据的准确性。由于生成的数据库结构比较复杂,同时存在着一些数据冗余,为了提高挖掘频繁模式项集的效率,通过主成分分析法,对数据库进行降维,提取出高度相关的属性变量,形成高内聚的板球比赛数据集。3.2频繁模式生成算法针对压缩的数据集采用频繁模式生成算法挖掘频繁项集,该算法是基于两阶段频集思想的算法。在这里,所有项集的支持度大于最小支持度的模式集称为频繁模式集。我们假定最小支持度为61.4%,通过频繁模式算法生成的频繁模式集如表2所示。表1列出了板球比赛中技术动作的英文缩写。表1板球技术动作代码表2板球频繁模式集8输入:压缩数据集输出:

6、频繁模式集算法:ri表示第i条记录。Pi表示第i个频繁模式。L表示生成的频繁模式集。Min_Support表示最小支持度。Fori=1ton{IfP(ri)错误!未找到引用源。P(rj)其中,错误!未找到引用源。thenCount(Pi)++;}Fori=1ton{IfCount(Pi)>=Min_SupportthenL=LPi}End其中,错误!未找到引用源。(1)8RNi表示模式i得分的次数,Ti表示模式i各种情况的总次数。如果模式i的得分次数比大于或等于Min_Support,那该该模式就是重要的频繁模式集。3.3关联规则挖掘在生成频繁模式后

7、,通过关联规则挖掘来提取频繁模式集之间的重要关联。假定PK为一个频繁模式集,PK={P1,P2,…,PK}。如果{P1,P2,…,PK-1}=>PK,且满足最小置信度,那么就是重要的关联规则。输入:频繁模式集输出:重要的关联规则算法:i=0;Ci={f1,f2,…,fn}ForeachCi,Iffi=>fjthenConfidence(fi=>fj)=P(fj/fi)=count(fj错误!未找到引用源。fi)/count(fi)  IfConfidence(fi=>fj)>=Min_ConfidencethenSr=Sr错误

8、!未找到引用源。(fi=>fj)ElseDeletether

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。