面向大数据流的半监督在线多核学习算法.pdf

面向大数据流的半监督在线多核学习算法.pdf

ID:53909976

大小:596.47 KB

页数:11页

时间:2020-04-27

面向大数据流的半监督在线多核学习算法.pdf_第1页
面向大数据流的半监督在线多核学习算法.pdf_第2页
面向大数据流的半监督在线多核学习算法.pdf_第3页
面向大数据流的半监督在线多核学习算法.pdf_第4页
面向大数据流的半监督在线多核学习算法.pdf_第5页
资源描述:

《面向大数据流的半监督在线多核学习算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第9卷第3期智能系统学报Vol.9№.32014年6月CAAITransactionsonIntelligentSystemsJun.2014DOI:10.3969/j.issn.1673-4785.201403067网络出版地址:http://www.cnki.net/kcms/doi/10.3969/j.issn.16734785.201403067.html面向大数据流的半监督在线多核学习算法张钢,谢晓珊,黄英,王春茹(广东工业大学自动化学院,广东广州510006)摘要:在机器学习中,核函数的选择对核学习器性能有很大的影响,而

2、通过核学习的方法可以得到有效的核函数。提出一种面向大数据流的半监督在线核学习算法,通过当前读取的大数据流片段以在线方式更新当前的核函数。算法通过大数据流的标签对核函数参数进行有监督的调整,同时以无监督的方式通过流形学习对核函数参数进行修改,以使得核函数所体现的等距面尽可能沿着数据的某种低维流形分布。算法的创新性在于能同时进行有监督和无监督的核学习,且不需要对历史数据进行再次扫描,有效降低了算法的时间复杂度,适用于在大数据和高速数据流环境下的核函数学习问题,其对无监督学习的支持有效解决了大数据流中部分标记缺失的问题。在MOA生成的人工

3、数据集以及UCI大数据分析的基准数据集上进行算法有效性的评估,其结果表明该算法是有效的。关键词:大数据流;在线多核学习;流形学习;数据依赖核;半监督学习中图分类号:TP18文献标志码:A文章编号:1673-4785(2014)03-0355-09中文引用格式:张钢,谢晓珊,黄英,等.面向大数据流的半监督在线多核学习算法[J].智能系统学报,2014,9(3):355-363.英文引用格式:ZHANGGang,XIEXiaoxian,HUANGYing,etal.Anonlinemulti-kernellearningalgorith

4、mforbigdata[J].CAAITransactionsonIntelligentSystems,2014,9(3):355-363.Anonlinemulti-kernellearningalgorithmforbigdataZHANGGang,XIEXiaoshan,HUANGYing,WANGChunru(SchoolofAutomation,GuangdongUniversityofTechnology,Guangzhou510006,China)Abstract:Inmachinelearning,aproperke

5、rnelfunctionaffectsmuchontheperformanceoftargetlearners.Commonlyaneffectivekernelfunctioncanbeobtainedthroughkernellearning.Wepresentasemi-supervisedonlinemultipleker-nelalgorithmforbigdatastreamanalysis.Thealgorithmlearnsakernelfunctionthroughanonlineupdateprocedureby

6、readingcurrentsegmentsofabigdatastream.Thealgorithmadjuststheparametersofcurrentlylearnedkernelfunctioninasupervisedmannerandmodifiesthekernelthroughunsupervisedmanifoldlearning,soastomakethecontoursur-facesofthekernelalongwithsomelowdimensionalitymanifoldinthedataspac

7、easfaraspossible.Thenoveltyisthatitperformssupervisedandunsupervisedlearningatthesametime,andscansthetrainingdataonlyonce,whichreducesthecomputationalcomplexityandissuitableforthekernellearningtasksinbigdatasetsandhighspeeddatastreams.Thisalgorithm’ssupporttotheunsuper

8、visedlearningeffectivelysolvestheproblemoflabelmissinginbigdatastreams.Theevaluationresultsfromthesyntheticdatasetsge

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。