欢迎来到天天文库
浏览记录
ID:53909976
大小:596.47 KB
页数:11页
时间:2020-04-27
《面向大数据流的半监督在线多核学习算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第9卷第3期智能系统学报Vol.9№.32014年6月CAAITransactionsonIntelligentSystemsJun.2014DOI:10.3969/j.issn.1673-4785.201403067网络出版地址:http://www.cnki.net/kcms/doi/10.3969/j.issn.16734785.201403067.html面向大数据流的半监督在线多核学习算法张钢,谢晓珊,黄英,王春茹(广东工业大学自动化学院,广东广州510006)摘要:在机器学习中,核函数的选择对核学习器性能有很大的影响,而
2、通过核学习的方法可以得到有效的核函数。提出一种面向大数据流的半监督在线核学习算法,通过当前读取的大数据流片段以在线方式更新当前的核函数。算法通过大数据流的标签对核函数参数进行有监督的调整,同时以无监督的方式通过流形学习对核函数参数进行修改,以使得核函数所体现的等距面尽可能沿着数据的某种低维流形分布。算法的创新性在于能同时进行有监督和无监督的核学习,且不需要对历史数据进行再次扫描,有效降低了算法的时间复杂度,适用于在大数据和高速数据流环境下的核函数学习问题,其对无监督学习的支持有效解决了大数据流中部分标记缺失的问题。在MOA生成的人工
3、数据集以及UCI大数据分析的基准数据集上进行算法有效性的评估,其结果表明该算法是有效的。关键词:大数据流;在线多核学习;流形学习;数据依赖核;半监督学习中图分类号:TP18文献标志码:A文章编号:1673-4785(2014)03-0355-09中文引用格式:张钢,谢晓珊,黄英,等.面向大数据流的半监督在线多核学习算法[J].智能系统学报,2014,9(3):355-363.英文引用格式:ZHANGGang,XIEXiaoxian,HUANGYing,etal.Anonlinemulti-kernellearningalgorith
4、mforbigdata[J].CAAITransactionsonIntelligentSystems,2014,9(3):355-363.Anonlinemulti-kernellearningalgorithmforbigdataZHANGGang,XIEXiaoshan,HUANGYing,WANGChunru(SchoolofAutomation,GuangdongUniversityofTechnology,Guangzhou510006,China)Abstract:Inmachinelearning,aproperke
5、rnelfunctionaffectsmuchontheperformanceoftargetlearners.Commonlyaneffectivekernelfunctioncanbeobtainedthroughkernellearning.Wepresentasemi-supervisedonlinemultipleker-nelalgorithmforbigdatastreamanalysis.Thealgorithmlearnsakernelfunctionthroughanonlineupdateprocedureby
6、readingcurrentsegmentsofabigdatastream.Thealgorithmadjuststheparametersofcurrentlylearnedkernelfunctioninasupervisedmannerandmodifiesthekernelthroughunsupervisedmanifoldlearning,soastomakethecontoursur-facesofthekernelalongwithsomelowdimensionalitymanifoldinthedataspac
7、easfaraspossible.Thenoveltyisthatitperformssupervisedandunsupervisedlearningatthesametime,andscansthetrainingdataonlyonce,whichreducesthecomputationalcomplexityandissuitableforthekernellearningtasksinbigdatasetsandhighspeeddatastreams.Thisalgorithm’ssupporttotheunsuper
8、visedlearningeffectivelysolvestheproblemoflabelmissinginbigdatastreams.Theevaluationresultsfromthesyntheticdatasetsge
此文档下载收益归作者所有