从大数据到大知识hace+bigke-departmentofcomputerscience

从大数据到大知识hace+bigke-departmentofcomputerscience

ID:32358197

大小:1.78 MB

页数:18页

时间:2019-02-03

从大数据到大知识hace+bigke-departmentofcomputerscience_第1页
从大数据到大知识hace+bigke-departmentofcomputerscience_第2页
从大数据到大知识hace+bigke-departmentofcomputerscience_第3页
从大数据到大知识hace+bigke-departmentofcomputerscience_第4页
从大数据到大知识hace+bigke-departmentofcomputerscience_第5页
资源描述:

《从大数据到大知识hace+bigke-departmentofcomputerscience》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第42卷第7期自动化学报Vol.42,No.72016年7月ACTAAUTOMATICASINICAJuly,2016从大数据到大知识:HACE+BigKE吴信东1;2何进1陆汝钤3郑南宁4摘要大数据面向异构自治的多源海量数据,旨在挖掘数据间复杂且演化的关联.随着数据采集存储和互联网技术的发展,大数据分析和应用已成为各行各业的研发热点.本文从大数据的本质特征开始,评述现有的几种大数据模型,包括5V,5R,4P和HACE定理,同时从知识建模的角度,介绍一种大数据知识工程模型BigKE来生成大知识,并对大知识的前景进行展望.关键词大数据,知识挖掘,异构,碎片化知

2、识,在线学习引用格式吴信东,何进,陆汝钤,郑南宁.从大数据到大知识:HACE+BigKE.自动化学报,2016,42(7):965¡982DOI10.16383/j.aas.2016.c160239FromBigDatatoBigKnowledge:HACE+BigKE1;2134WUXin-DongHEJinLURu-QianZHENGNan-NingAbstractBigdatadealswithheterogeneousandautonomousmulti-sources,andaimsatminingcomplexandevolvingrelatio

3、nshipsamongdata.Withthefastdevelopmentofdatacollection,datastorageandnetworkingtechnologies,bigdataanalyticshasbecomeahottopicforresearchanddevelopmentinvarious¯elds.Thispaperstartswiththeessentialcharacteristicsofbigdata,reviewsexistingpopularmodelsforbigdata,including5V,5R,4Pandt

4、heHACEtheorem.Also,fromtheviewpointofknowledgemodeling,thispaperintroducesBigKE,abigdataknowledgeengineeringmodelforbigknowldedge,anddiscussesthechallengesandopportunitiesofbigknowledgeresearchanddevelopment.KeywordsBigdata,knowledgemining,heterogeneity,fragmentedknowledge,onlinele

5、arningCitationWuXin-Dong,HeJin,LuRu-Qian,ZhengNan-Ning.Frombigdatatobigknowledge:HACE+BigKE.ActaAutomaticaSinica,2016,42(7):965¡982随着互联网的不断发展,我们可以收集和获取科技大厂IBM对其进行了应用并加以扩充,获得了的数据以不可预计的速度增长.尽管数据的收集、存4V或5V:包括了大数据巨大的数据量(Volume)、储和处理技术还在不断进步并日趋成熟,但基于如快速的分析和处理速度(Velocity)、多样化的数据此复杂的数据背景,

6、我们仍然面临着许多分析和处种类和数据来源(Variety)、对商业领域巨大的价值理数据的问题与挑战.因此,大数据的分析及其应用(Value)和其隐藏知识的真实性(Veracity)[2].大数成为了一大科研热点.对大数据的本质特征的概括据广阔的应用背景,使其不仅在科研领域,乃至于在始于2001年美国高德纳公司(GartnerGroup)的商业、政治、经济、医疗和文化等多领域内,都在引分析师Laney等提出的3V特征[1].之后IT业界的发和领导一场变革.在网络2.0时代,用户已经从被动的信息接受收稿日期2016-03-03录用日期2016-05-31Manu

7、scriptreceivedMarch3,2016;acceptedMay31,2016者转变为主动的创造者.一些数字可以说明这个事国家重点基础研究发展计划(973计划)(2013CB329604),国家自然实:美国每年的线上零售交易记录数量、推特网的科学基金(61229301),教育部长江学者和创新团队发展计划多源海量动态信息处理"(IRT13059)资助发帖数量、各大物理实验室和天文望远镜观测记录SupportedbyNationalBasicResearchProgramofChina(973值,就足以产生大约1.2ZB的电子数据,由此,美Progr

8、am)(2013CB329604),National

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。