数据挖掘及其应用datamininganditsapplications

数据挖掘及其应用datamininganditsapplications

ID:40237846

大小:1.96 MB

页数:33页

时间:2019-07-28

数据挖掘及其应用datamininganditsapplications_第1页
数据挖掘及其应用datamininganditsapplications_第2页
数据挖掘及其应用datamininganditsapplications_第3页
数据挖掘及其应用datamininganditsapplications_第4页
数据挖掘及其应用datamininganditsapplications_第5页
资源描述:

《数据挖掘及其应用datamininganditsapplications》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、数据挖掘及其应用DataMininganditsApplications印 鉴中山大学信息科学与技术学院2021/10/51数据挖掘及其应用主要内容动机:为什么要数据挖掘?什么是数据挖掘?数据挖掘:在什么样的数据上挖掘?数据挖掘功能所有的模式都是有趣的吗?数据挖掘的主要问题应用例子2021/10/52数据挖掘及其应用为什么要数据挖掘?数据的爆炸性增长:从TB到PB数据收集和数据可用性自动的数据收集工具,数据库系统,Web,计算化的社会丰富数据的主要来源商业:Web,电子商务,事务,股票,…科学:遥感,生物信息学,科学仿真,…社会:新闻,数码相机,我们正淹没在数据中

2、,但却渴望知识!“需要是发明之母”—数据挖掘—自动化的大规模数据集分析2021/10/53数据挖掘及其应用数据库技术的演化1960s:数据收集,数据库创建,信息管理系统IMS和数据库管理DBMS1970s:关系数据模型,关系DBMS实现1980s:RDBMS,高级数据模型(扩展关系的,OO,演绎等.)面向应用的DBMS(空间,科学,工程等.)1990s:数据挖掘,数据仓库,多媒体数据库,和Web数据库2000s流数据管理和挖掘数据挖掘和它的应用Web技术(XML,数据集成)和全球信息系统2021/10/54数据挖掘及其应用什么是数据挖掘?数据挖掘(从数据中发现知识

3、)从海量数据中提取感兴趣(重要的,隐含的,以前未知的和潜在有用的)模式或知识数据挖掘:用词不当?其他的名称数据库中的知识发现(挖掘)(KDD),知识提取,数据/模式分析,数据考古学,数据捕捞,信息收获,商业智能等.当心:所有的都是“数据挖掘”么?简单的搜索和查询处理(演绎的)专家系统2021/10/55数据挖掘及其应用为什么要数据挖掘?—潜在的应用数据分析和决策支持市场分析和管理目标市场定位,客户关系管理(CRM),购物篮分析,交叉销售风险分析和管理预测,客户保持,质量控制,竞争分析欺诈检测和不寻常模式的检测(离群点)其他的应用文本挖掘(新闻组,email,文档)

4、和Web挖掘流数据挖掘生物信息学和生物数据分析2021/10/56数据挖掘及其应用Ex.1:市场分析和管理数据从哪来?—信用卡交易事务,会员卡,优惠券,客户投诉电话,公众生活方式研究目标市场寻找“榜样”客户的聚类,他们共享相同的特征:兴趣,收入水平,消费习惯等确定客户在一段时间的购买模式交叉市场分析—寻找产品销售之间的关联/相关性,以及基于这些关联进行预测客户轮廓(profile)—什么类型的客户买什么产品(聚类或分类)客户需求分析为不同的用户识别最好的产品预测什么因素将吸引新的客户摘要信息提供多维摘要信息报告统计学总结信息(数据中心的趋势和变化)2021/10/

5、57数据挖掘及其应用Ex.2:公司分析和风险管理财经计划和资产评估现金流分析和预测资源计划总结比较资源和开销竞争监控竞争对手和市场方向细分客户类别,制定基于类别的定价过程在激烈竞争市场中建立价格策略2021/10/58数据挖掘及其应用Ex.3:欺诈检测和挖掘异常模式方法:为欺诈和离群点分析进行聚类和模型构建应用:医疗保健,零售业,信用卡服务,电信业.汽车保险:检测出那些故意制造车祸而索取保险的人洗钱:可疑的资金流向医疗保险检测出职业病人不必要、不相关的医学检验电信业:电话欺诈电话模式:呼叫目的地,持续时间,每天或每周的次数。分析与预期标准相背离的模式零售业分析师评

6、估认为38%的零售业萎缩是因为不诚实的雇员反恐怖主义2021/10/59数据挖掘及其应用知识发现(KDD)过程数据挖掘—知识发现过程的核心数据清理数据集成数据库数据仓库知识任务相关的数据选择数据挖掘模式评估2021/10/510数据挖掘及其应用数据挖掘:多种技术的融合数据挖掘数据库技术统计学机器学习模式识别算法其他技术可视化2021/10/511数据挖掘及其应用为什么不是传统的数据分析?庞大的数据算法必须能够高度可伸缩以便处理TB数量级的数据高维度的数据Micro-array可能有成千上万个维度数据的高复杂性数据流和传感器数据时间序列数据,时间数据,序列数据结构数

7、据,图,社会网络和多链接数据异构数据库和遗产数据库空间,时空,多媒体,文本和Web数据软件程序,科学仿真新的和复杂的应用2021/10/512数据挖掘及其应用数据挖掘:在什么样的数据上进行?面向数据库的数据集及其应用关系数据库,数据仓库,事务数据库高级数据集和高级应用数据流和传感器数据时间序列数据,时间数据,序列数据(包括生物序列数据)结构数据,图,社会网络和多链接数据对象-关系数据库异构数据库和遗产数据库空间,时空数据多媒体文本数据库World-WideWeb2021/10/513数据挖掘及其应用数据挖掘功能多维概念描述:特征和区分概括,汇总,和对比数据特征,如

8、,干旱VS

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。