欢迎来到天天文库
浏览记录
ID:33874040
大小:1.04 MB
页数:56页
时间:2019-02-28
《基于gpu的并行排序学习算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、国内图书分类号:TP391.3学校代码:10213国际图书分类号:621.3密级:公开工学硕士学位论文基于GPU的并行排序学习算法研究硕士研究生:范希贤导师:叶允明教授申请学位:工学硕士学科:计算机科学与技术所在单位:深圳研究生院答辩日期:2012年12月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.3U.D.C:621.3ThesisfortheMasterDegreeinEngineeringASTUDYOFGPU-BASEDPARALLELLEARNINGTORANKCa
2、ndidate:XixianFanSupervisor:Prof.YunmingYeAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyAffiliation:ShenzhenGraduateSchoolDateofDefence:Dec.,2012Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘
3、要搜索引擎的出现帮助用户在纷繁杂乱的互联网信息中寻找相关的信息,因此检索结果的排序是至关重要的。作为新兴信息检索技术的排序学习算法是解决互联网信息检索问题的新的解决方案。传统排序学习算法是在小规模文本基础上进行,针对互联网信息总量规模快速增加问题,大规模数据对于传统的排序学习算法出现瓶颈,排序学习算法的性能成为未来排序学习研究的一个方向。因此,本文提出新的排序学习算法并结合图形处理器(GraphicProcessingUnit,GPU)并行计算技术并验证算法的效果。本文主要研究内容如下:(1)对排序学习
4、算法的相关理论和GPU并行计算进行归纳和阐述,总结现有的排序学习算法,阐述排序学习算法的评价度量准则和并行编程模型。(2)深入分析信息检索技术特点并结合相关度更高的信息更重要的特点,本文采用基于有序对的排序学习算法研究方向。对数据输入空间进行重新划分,以大于偏序关系的文档对作为输入空间。(3)提出一种基于贝叶斯个性化排名框架的排序学习算法,即线性评分排序学习模型(LinearScoringLearningtoRankModel,LSLRM)。通过估计输入文档对的正确排序而构建的排序学习模型来解决查询排序
5、问题,将排序学习训练模型问题转换为二值分类问题,并对特征进行分析,找出对相关度区分具有决定性的重要特征。(4)算法结合GPU并行编程模型和存储器模型等特点,解决排序学习算法在大规模数据的性能瓶颈。(5)实验证明基于GPU的并行排序学习算法的优越性。将本文算法与RankSVM-Struct等算法在微软亚洲研究院发布的基准实验结果进行对比分析,得到的结论是本文算法总体优于其他算法,在大规模数据集上相对于CPU取得10-11倍的加速比。关键词:排序学习;有序对;大规模数据;GPU;并行计算-I-哈尔滨工业大学
6、工学硕士学位论文AbstractTheemergenceofsearchengineshelpspeoplefindrelevantinformationintheInternet.Sortingofretrievedresultsiscrucial.Learningtorank,asanovelinformationretrievaltechnique,isanewsolutiontotheproblemofinformationretrieval.Thetraditionalresearchofle
7、arningtorankalgorithmisbasedonsmall-scaledatasets.DuetothescaleofInternetinformationthatincreasesrapidly,itischallengingformanyexistingalgorithmstohandlesuchlarge-scaledata.Theperformanceoflearningtorankhasbecomeaseriousproblem.Thispaperpresentsanewlearn
8、ingtorankalgorithmandcombinesgraphicsprocessingunit(GPU)parallelcomputingtechnologyandverifiestheperformanceofthealgorithm.Thecontentofthepapercontainsseveralpointsasfollows.(1)Summarizeandelaboratethetheoryoflearningtoran
此文档下载收益归作者所有