基于全球典型油气田数据库的数据挖掘预处理

基于全球典型油气田数据库的数据挖掘预处理

ID:37376575

大小:635.20 KB

页数:5页

时间:2019-05-22

基于全球典型油气田数据库的数据挖掘预处理_第1页
基于全球典型油气田数据库的数据挖掘预处理_第2页
基于全球典型油气田数据库的数据挖掘预处理_第3页
基于全球典型油气田数据库的数据挖掘预处理_第4页
基于全球典型油气田数据库的数据挖掘预处理_第5页
资源描述:

《基于全球典型油气田数据库的数据挖掘预处理》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、2016年2月大庆石油地质与开发Feb.,2016第35卷第1期PetroleumGeologyandOilfieldDevelopmentinDaqingVn1.35N0.1DOI:10.3969/J.ISSN.1000.3754.2016.01.013基于全球典型油气田数据库的数据挖掘预处理李大伟熊华平石广仁牛敏(1.中国石油勘探开发研究院,北京100083;2.大庆油田有限责任公司勘探开发研究院,黑龙江大庆163712)摘要:石油工业早已进入大数据时代,数据挖掘是充分利用数据资产价值的有效途径,而数据预处理是数据挖掘研究的热点之一。分析了数据挖掘以及数据预处理的意义及其现状,

2、提出了在石油工业进行数据挖掘的基本思路;以某国际石油勘探开发技术服务与咨询公司研制的全球典型油气田数据库为例,以“采收率”为挖掘对象,详细解析了各种常用的数据挖掘预处理方法和具体做法,主要包括数据获取、属性选择、数据清理、数据集成、数据变换、数据规约和数据消密;提出了源数据的“5c”标准,即Correctness(正确性)、Curency(适时性)、Completeness(完整性)、Consistency(一致性)、Confidentiality(保密性)。研究成果可为石油行业开展数据预处理等工作提供参考。关键词:数据挖掘;预处理;油气田;数据库;5C标准中图分类号:TEl9文献

3、标识码:A文章编号:1000—3754(2016)01-0066—05PREPROCESSINGOFTHEDATATAPPINGBASEDoNGLoBALTYPICALOILANDGASFIELDDATABASELIDawei-X1ONGHuaping,SHIGuangren,NIUMin(1.PetroChinaResearchInstituteofPetroleumExplorationandDevelopment,Beijing100083,China;2.ExplorationandDevelopmentResearchInstituteofDaqingOilfieldCo

4、.Ltd.,Daqing163712,China)Abstract:Oilindustryhasenteredupon“bigdata”epochformanyyears,thedatatappingorminingisaneffec—tivemethodtofullyutilizethevalueofthedataasset,andthedatapreprocessingisoneofthestudyfocusesofthedatamining.Thesignificanceandsituationofthedataminingandpreprocessingareanalyze

5、d,thebasicthinkingofthedatamininginoilindustrywaspresented.TakingGlobalTypicalOilandGasFielddatabasefromaninterna—tionalpetroleumexplorationanddevelopmentserviceandconsultantcompanyastheexample,thedetailedmethodsofthedataminingpreprocessingaredissectedbytaking“recoveryfactor”astheminingobject.

6、Thesemethodsin—clude:dataacquisitionIattributeselection,datacleaning,dataintegration,dataconversion,dataspecificationanddataconfidentialitytreatment:finally“5C”criteriaforthesourcedataareproposed:correctness,currency,com—pleteness。consistencyandconfidentiality.Theseachievementscanproviderefere

7、ncesfortheresearchersontheda—tapreprocessingandSOoninoilindustry.Keywords:datatapping/mining:preprocessing;oilandgasfield;database;5CCriteria收稿日期:2015—07—14改回日期:2015—08·30基金项目:国家油气重大科技专项“全球剩余油气资源研究及油气资产快速评价技术”(2011ZX050)。作者简介:李大伟,男,1969

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。