internet环境下协同工作与数据挖掘研究

internet环境下协同工作与数据挖掘研究

ID:33079359

大小:3.66 MB

页数:120页

时间:2019-02-20

internet环境下协同工作与数据挖掘研究_第1页
internet环境下协同工作与数据挖掘研究_第2页
internet环境下协同工作与数据挖掘研究_第3页
internet环境下协同工作与数据挖掘研究_第4页
internet环境下协同工作与数据挖掘研究_第5页
资源描述:

《internet环境下协同工作与数据挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、y955{28後旦大学博士学位论文学校代码:10246学号:021021076Internet环境下协同工作与数据挖掘研究院专姓系:让篡垄l皇焦皇堇垄丕业:盐簋扭鏊鲑生堡迨名:送篮指导教师:塑运筮麴援(f复旦大学博士学位论文摘要摘要Intemet的不断普及导致信息量的飞速膨胀,同时其又是一个结构异常复杂的自治体系。能否克服Intemet的不足发挥其长处,从而获得更大的价值,是一个值得研究的课题。本文面向Internet,着眼于Intemet环境低可靠、高延迟、极端异构、海量数据的特点,探索综合利用CSCW和数据挖掘技术来解决Intemet环境下信息

2、交互和信息获取两大现实问题。本文涉及的研究领域主要包括异步协同工作中的工作流研究、同步协同工作中的实时协同编辑以及数据挖掘中的频繁模式挖掘等。本文的研究和创新工作主要包括以下几点:1.提出了一个基于知识的多Agent协同工作模型(KMAW)及其扩展工作流管理系统是实现非实时协同工作的一种重要手段。本文采用基于知识推理和任务分解的模式,利用Agent的推理能力,提出了一种基于知识的多Agent协同工作模型。此模型在描述能力上强于传统的过程式工作流模型,可以实现常见的各种工作流模式,并且能够实现包括正确性验证、异常处理、动态流程等高级工作流特性。此模型

3、具有很好的柔性和很强的描述能力,是一个很好的面向Intemet的通用协作集成框架。本文还将数据挖掘技术与KMAW模型结合了起来,构成了基于知识挖掘的扩展KMAW模型(MKMAw),此模型可以自主挖掘知识,具有动态决策、动态流程优化等能力。2.基于KMAW模型,设计实现了Athena协同工作平台此平台基于w曲Service和异步消息机制,面向Intemet上异构系统间的集成和协同工作。本文中设计了Athena规则语言及支持此语言的协同工作引擎;开发了XML数据映射引擎及可视化映射工具,解决了异构系统间数据交互的问题;内置了UDDI服务,并对其作了扩展

4、,支持UDDI服务与异步事件的绑定;设计了可视化流程建模工具,可自动生成业务流程的Athena规则。Athena协同工作平台降低了在Intemet环境下实现异构系统业务集成的成本和风险。本平台在863重大专项课题中获得了初步应用,取得了重要阶段性成果。3.在实时协同编辑中,提出了操作群的概念和相关算法实时协同编辑是实时协同工作的一个重要研究领域,Intemet环境下的实时协同编辑以操作变换算法为基础。本文首先描述了一类传统操作变换算法无法解决的冲突。为了解决上述问题,本文在操作变换中引入了操作群的概念。本文中定义了两类操作群:T.群和S.群,给出了

5、维护T-群的操作变换算法,给出了其证明及算法实例,同时给出了维护S.群的系统策略。最后,本文简单讨论了操作群与锁机制、复合操作群等相关问题。复旦大学博士学位论文摘要4.基于FP-tree提出了两种新的频繁模式挖掘算法关联规则挖掘和频繁模式挖掘是获取知识的有效途径,面对海量Intemet数据,许多算法在可伸缩性和鲁棒性上有所欠缺。研究发现不同数据集数据分布特征对于算法的效率具有较大影响,这启发我们采用一种自适应的方式,在挖掘过程中根据数据分布特征动态地调整挖掘策略,从而加强鲁棒性,获得整体上的最优。本文首先提出了一种直接在FP.tree上挖掘的算法—

6、—简单深度优先搜索算法(NDSP),此算法在稠密数据集上具有相当高的效率;然后把NDSP和FP—growth算法结合起来,构造了自适应的FP挖掘算法(SAFP)。通过实验比对证明,此算法比上述两种算法都要更优,对于不同数据集的鲁棒性明显好于上述两种算法。关键词:Intemet、CSCW、数据挖掘、工作流、实时协同编辑、操作变换、操作群、频繁模式挖掘、FP.treeOL复旦大学博士学位论文ABSTRACTMoreandmoreinformationhasbeenaccumulatedwitllthegrowthoftheIntemet.however

7、theIntemetisacomplicatedautonomicsystemthathasfeaturesoflowreliability,highlatency,extremeheterogeneityandhugedata.ItisavaluablesubjecthowtoovercomeitsdeficiencieswhiletakingadvantageoftheInternet,SOthatwecangainmorebenefitsfromit.Inthisthesisweexploreasystematicwaytosolvetwop

8、racticalproblemsofinformationexchangeandinformationusageinthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。