欢迎来到天天文库
浏览记录
ID:54018193
大小:356.83 KB
页数:10页
时间:2020-04-28
《基于基因表达式编程的频繁函数集挖掘.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第ZS卷第S期计算机学报Vol.ZSNo.SZ005年S月C~INESEJOURNALOFCOMPUTERSAug.Z005基于基因表达式编程的频繁函数集挖掘贾晓斌唐常杰左劼陈安龙段磊汪锐四川大学计算机学院数据库与知识工程研究所成都610065)摘要函数挖掘旨在从观测数据中发现有效的函数关系传统的函数挖掘以发现单个函数为挖掘目标难以处理复杂数据集.为解决上述问题作者做了如下工作:1)提出了描述能力更强的频繁函数集FFS概念;Z)提出并实现了基于基因表达式编程的频繁函数集挖掘算法FFSM;3)在GEP中采用了精度阈值队列策略PT有效地提高了FFSM的成功率;4)用实验证实了FFS更强的
2、描述能力和PT的有效性其中在挖掘高精度复杂函数时PT使FFSM的成功率提高了55倍.关键词频繁函数集;精度阈值队列;基因表达式编程;函数挖掘中图法分类号TP311MiningFre3、ctionMiningaimsatdiscoveringvalidfunctionsfromobservationdata.~oWeverthetraditionalFunctionMiningaimsatsinglefunctionandhenceitisdifficulttoprocessincom-plexdataset.TosolvethisproblemthispaperproposesaneWconceptcalledFreCuentFunctionSetFFS)WithpoWerfuldescribingabilitypresentsandimplementsaneWa4、pproachnamedFre-CuentFunctionSetMiningFFSM)tomineFFSbasedonGeneExpressionProgrammingandimprovesthesuccessprobabilityofinFFSMbyaneWstrategynamedPrecisionThresholdueuePT).ExtensiveexperimentsdemonstratethepoWerofFFSandofPTthatitimprovesthesuccess-probabilityby55timesforminingcomplexfunctionWithhi5、ghprecision.KeywordsfreCuentfunctionset;precisionthresholdCueue;geneexpressionprogramming;functionmining工程中有着重要意义l引言计算机技术广泛地渗透在科学的各个分支领域中如生物学~物理学~经济学等这些应用为利用计找出客观事物之间的联系并用数学函数准确地算机进行函数关系挖掘奠定了基础表示是科学研究的基本任务.例如:G=m>g简洁~基因表达式编程GeneExpressionProgram-准确地揭示了物体质量m重力加速度g和物体所mingGEP)是函数关系挖掘的新方法它继承和发受重力G6、之间的联系发现函数关系在实验科学和展了遗传算法GeneticAlgorithmGA)和遗传编程收稿日期:Z004-01-09;修改稿收到日期:Z005-05-09.本课题得到国家自然科学基金60473071)和高等学校博士学科点专项科研基金SRFDPZ00Z0610007)资助.贾晓斌男19S0年生硕士研究生主要研究方向为数据库~数据挖掘.唐常杰男1946年生教授博士生导师主要研究方向为数据库~知识工程~数据挖掘等.E-mail:tangchangjie!cs.scu.edu.cn.左劼男1977年生博士主要研究方向为数据库与知识工程.陈安龙男1971年生博士研究生主要研究方向为数据7、库与知识工程.段磊男19S1年生硕士研究生主要研究方向为数据库~数据挖掘.汪锐男1979年生硕士研究生主要研究方向为数据库~数据挖掘.1Z4S计算机学报Z005年(GeneticProgramming9GP).足这一要求本文主要工作如下C(1)分析传统函数挖掘的不例2考虑气态方程P>V/T=COnst的挖掘足9提出频繁函数集的概念来描述数据集上具有一过程其中P为气体的压强9V为气体的体积9T为定支持度的函数关系簇;(Z)提出基于GEP的频繁气体的温度9CO
3、ctionMiningaimsatdiscoveringvalidfunctionsfromobservationdata.~oWeverthetraditionalFunctionMiningaimsatsinglefunctionandhenceitisdifficulttoprocessincom-plexdataset.TosolvethisproblemthispaperproposesaneWconceptcalledFreCuentFunctionSetFFS)WithpoWerfuldescribingabilitypresentsandimplementsaneWa
4、pproachnamedFre-CuentFunctionSetMiningFFSM)tomineFFSbasedonGeneExpressionProgrammingandimprovesthesuccessprobabilityofinFFSMbyaneWstrategynamedPrecisionThresholdueuePT).ExtensiveexperimentsdemonstratethepoWerofFFSandofPTthatitimprovesthesuccess-probabilityby55timesforminingcomplexfunctionWithhi
5、ghprecision.KeywordsfreCuentfunctionset;precisionthresholdCueue;geneexpressionprogramming;functionmining工程中有着重要意义l引言计算机技术广泛地渗透在科学的各个分支领域中如生物学~物理学~经济学等这些应用为利用计找出客观事物之间的联系并用数学函数准确地算机进行函数关系挖掘奠定了基础表示是科学研究的基本任务.例如:G=m>g简洁~基因表达式编程GeneExpressionProgram-准确地揭示了物体质量m重力加速度g和物体所mingGEP)是函数关系挖掘的新方法它继承和发受重力G
6、之间的联系发现函数关系在实验科学和展了遗传算法GeneticAlgorithmGA)和遗传编程收稿日期:Z004-01-09;修改稿收到日期:Z005-05-09.本课题得到国家自然科学基金60473071)和高等学校博士学科点专项科研基金SRFDPZ00Z0610007)资助.贾晓斌男19S0年生硕士研究生主要研究方向为数据库~数据挖掘.唐常杰男1946年生教授博士生导师主要研究方向为数据库~知识工程~数据挖掘等.E-mail:tangchangjie!cs.scu.edu.cn.左劼男1977年生博士主要研究方向为数据库与知识工程.陈安龙男1971年生博士研究生主要研究方向为数据
7、库与知识工程.段磊男19S1年生硕士研究生主要研究方向为数据库~数据挖掘.汪锐男1979年生硕士研究生主要研究方向为数据库~数据挖掘.1Z4S计算机学报Z005年(GeneticProgramming9GP).足这一要求本文主要工作如下C(1)分析传统函数挖掘的不例2考虑气态方程P>V/T=COnst的挖掘足9提出频繁函数集的概念来描述数据集上具有一过程其中P为气体的压强9V为气体的体积9T为定支持度的函数关系簇;(Z)提出基于GEP的频繁气体的温度9CO
此文档下载收益归作者所有