基于深度学习的专家排序方法

基于深度学习的专家排序方法

ID:39474610

大小:197.50 KB

页数:8页

时间:2019-07-04

基于深度学习的专家排序方法_第1页
基于深度学习的专家排序方法_第2页
基于深度学习的专家排序方法_第3页
基于深度学习的专家排序方法_第4页
基于深度学习的专家排序方法_第5页
资源描述:

《基于深度学习的专家排序方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于深度学习的专家排序方法魏斯超云南机电职业技术学院,昆明,650203摘要:关键词:1引言专家检索是垂直信息检索的研究热点,用以对专家特定人群进行更精确的查询。专家检索是指根据查询和专家的相关度对专家进行排序,将最相关的专家排在前面。其中专家排序方法的好坏对专家检索效果起着至关重要的作用。目前专家排序方法主要包括专家模型排序方法,文档模型排序方法,投票模型排序方法和链接分析模型。针对专家排序不应只计算单个专家的相关性而应该考虑整个专家列表上的排序损失,第三章提出了基于列表的专家排序方法。这种方法在很大程度上提高了专家检索的精度,但存在局限性。该方法采用的神经网络模型由于随机初始化

2、容易陷入局部最小而且训练时间过长,此外浅层的神经网络不能更好的模拟排序函数。近期在机器学习领域研究火热的深度学习最初是由Hinton等人2006年提出的一种深度可信网络模型[45],该算法至今仍是深度学习的主流方法。深度可信网络DBN模型被认为由一层BP网络和若干层RBM堆叠而成,训练过程中训练实例作为底部RBM的输入,下一层RBM的输出作为上一层RBM的输入,由此从低到高逐层训练RBM来构建深度可信网络模型,每层RBM通过反复训练求得最优参数。这一模型绕过直接从整体上训练DBN的高复杂度,而将其转化为对多个RBM层的训练问题。最后通过顶层BP神经网络算法对深度可信网络模型进行整体

3、微调,提高了建模能力。深度学习在语音识别和图像处理上取得了显著的成就。微软亚洲研究院和谷歌的研究员通过使用DNN技术在语音识别上降低了20%~30%的错误率,取得了十几年来突破性的进展。在图像处理领域也降低了10%左右的错误率。深度学习在自然语言处理的诸多领域也得到了广泛的研究和应用。如陈宇[47]等提出的利用深度学习进行中文名实体关系抽取方法,证明了深度学习非常适用于基于高维空间特征的信息抽取任务;又如奚雪峰[48]等提出的利用深度学习机制进行基于语义特征的代词指代消解方法,表明增加RBM7训练层数可以提高系统性能。深度学习方法通过RBM无监督的自训练得到很好的参数来逐层初始化权

4、重,进而构建深度可信网络DBN模型能够很好的克服神经网络的局限。综合上述考虑本文提出了基于深度学习的专家排序方法。2深度学习模型2.1深度可信网络DBNDBN(deepbeliefnets)模型是由多层无监督的RBM(restrictedBoltzmannmachine)网络和一层有监督的反向传播BP网络组成的一种深层神经网络。其结构如图4.1所示。DBN模型在训练过程中主要分为两步:首先分别单独无监督的训练每一层RBM网络,求得每层最优参数,确保特征向量映射时,尽可能多地保留好的特征信息,弱化次要信息和错误信息,即多层RBM对特征集合聚类的过程;然后DBN的顶层的BP神经网络接收

5、最后一层RBM输出的特征向量作为其输入特征向量,进行分类并微调整个DBN模型。图1DBN结构图7DBN训练的具体过程是:1.将专家文档的特征向量赋值给底层RBM的可视层作为输入;2.RBM通过自训练求得最佳层内权重参数,并输出隐含层特征;3.低层RBM的输出作为顶层RBM的输入,逐层从低向上传播,直到最顶层RBM;4.BP神经网络接收最顶层RBM的输出作为其输入特征,进行对专家进行分类排序,并微调每层RBM的权重参数。其中RBM网络训练模型是DBN的核心。它通过自训练得到层内最优参数,可以看作是对一个深层BP网络参数的初始化,克服了BP神经网络因随机初始化参数而容易陷入局部最小和训

6、练时间过长等缺点。底层RBM网络接收原始的特征向量,顶层RBM将低层RBM的输出作为其输入,在自底向上的传递过程中,具体的特征向量逐渐转化为抽象的特征向量,在顶层的RBM网络形成更易于分类排序的组合特征向量,而且传递过程中会弱化次要信息和错误信息。深层网络可以更好的逼近排序函数,因此理论上深层网络的排序效果比浅层网络要好。2.2受限玻尔兹曼机RBM自训练过程RBM是DBN的核心,由一个可见层v和一个隐含层h组成。层间的节点两两相连,层内的节点互不相连,其结构如图4.2所示。图2RBM结构图RBM模型在给定可见层单元状态下,各隐含层单元的激活条件是独立的;反之,在给定隐含层单元状态下

7、,可见层单元的激活条件也是独立的。假设RBM模型有n个可视单元和m个隐含单元,表示可视单元和隐含单元之间的权重矩阵,表示可视层的偏置向量,表示隐含层的偏置向量。RBM自训练的目的是确定参数使联合概率分布。在自训练过程中,首先将可视层向量值映射给隐含单元;然后通过隐含层向量值重建可视单元;重建的新可视单元再次映射给隐含单元,又可以获取新的隐含单元。反复执行这种步骤叫做吉布斯采样。可视层的输入通常是已知的,底层RBM可视层的输入是训练样例,上一层RBM的输入是低层RBM的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。