欢迎来到天天文库
浏览记录
ID:35181094
大小:2.52 MB
页数:80页
时间:2019-03-21
《基于b细胞算法的排序学习方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、太原理工大学硕士研究生学位论文太原理工大学硕士研究生学位论文太原理工大学硕士研究生学位论文基于B细胞算法的排序学习方法研究摘要排序学习是一种利用训练数据自动构建排序模型的技术,广泛应用于信息检索领域。传统基于损失函数的排序学习方法存在优化目标不直接以及计算复杂度高等缺陷,为了能够直接将信息检索领域的评价指标函数作为优化对象,出现了基于遗传算法和克隆选择算法的排序学习方法,虽然解决了优化目标不直接这一问题,但是学习时间仍然没有得到有效改善。为了既能保证最优排序函数的质量,又同时降低学习时间,本文将B细胞算法用于解决排序学习问题,研究基于B细胞算法的排序学习方法,研究内容主要包含以下三个
2、方面:(1)针对排序学习问题定义抗原、抗体和亲和力,以将B细胞算法应用于排序学习。B细胞算法是一种基于克隆选择机制的免疫算法,为了能够将其应用于解决排序学习问题,需要将抗体、抗原以及亲和力针对排序学习问题进行具体定义。本文将抗体定义为候选排序函数,将抗原定义为以查询为单位的文档列表,将亲和力定义为评价排序函数性能的评价指标函数。(2)构建抗体的先序编码序列,以实现抗体上的连续区域变异。研究表明B细胞算法比克隆选择算法收敛速度更快,其原因在于B细胞算法使用一种连续区域变异算子。由于抗体使用树结构进行表示,无法直接在树上进行连续区域变异。所以,本文定义抗体树的先序编码序列,先序编码序列中
3、的连续区域与树结构中的连续区域具有对应关系。在抗体树的先序编码I太原理工大学硕士研究生学位论文序列上定义连续区域变异算子以及变异规则,抗体树先序编码的另一个优点是降低计算复杂度,因为每个节点变异无需遍历树,只需在线性序列上执行。(3)对B细胞算法并行化,以提高学习效率。B细胞算法是一种快速、简单的群智能优化算法,具有天然的并行特征,所以在研究其他并行算法的基础上,将B细胞算法并行化。并行B细胞算法能够充分利用现代计算机多核处理器的优势,在同样的学习任务上成倍降低计算时间。除了减少学习时间,本文在并行算法中添加交叉操作以丰富种群多样性,提高学习的精度。在以上研究的基础上,提出基于B细胞
4、算法的排序学习算法RankBCA以及基于并行B细胞算法的排序学习算法PRankBCA。通过实验将这两个算法与RankSVM、RankBoost、AdaRank-MAP和ListNet进行比较,实验证明在OHSUMED数据集上RankBCA表现优于RankSVM和RankBoost,而PRankBCA的表现优于4种算法且更稳定。在MQ2007数据集上,RankBCA和PRankBCA表现优于AdaRank-MAP而低于另外三种。每个数据集上的PRankBCA均优于RankBCA。在学习时间方面,PRankBCA有着较好的加速比,在同样问题规模的条件下,PRankBCA将学习时间大幅度降
5、低,并且随着问题规模的增大,并行算法的优越性会进一步凸显。这些结果证明了B细胞算法能够有效解决排序学习问题。关键词:信息检索,并行算法,B细胞算法,排序学习,排序函数II太原理工大学硕士研究生学位论文RESEARCHONLEARNINGTORANKBASEDONB-CELLALGORITHMABSTRACTLearningtorankisatasktoautomaticallyconstructarankingmodelusingtrainingdataandwidelyusedinInformationRetrieval(IR).Traditionallearningtorankm
6、ethodsbasedonlossfunctionhavetheflawsofindirectoptimizationandcomplexcomputation.Fortreatingtheevaluationmeasuresininformationretrievalastheoptimizationtarget,scholarshaveproposedthemethodsbasedongeneticalgorithmandclonalselectionalgorithm.Thoughtheoptimizationtargetisdirect,thelearningtimestil
7、lhasnotbeeneffectivelyimproved.Inordertoguaranteequalityofoptimalrankingfunctionaswellasreducethelearningtime,theBcellalgorithmappliedtolearningtorankisdiscussedindetailinthispapermainlyincludingthefollowingthreeaspects.(1)Theanti
此文档下载收益归作者所有