欢迎来到天天文库
浏览记录
ID:20599183
大小:2.59 MB
页数:60页
时间:2018-10-14
《基于深度学习的自然语言处理中问题分析的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士研究生学位论文基于深度学习的自然语言处理中问作者:程颖涛指导教师;唐浩漾副教授学科(专业):计算机控制系统二?一八年六月^论文日期:单位代码11664学号1504210003分类号TP391密级西安邮电大学硕士研究生学位论文题(中、英文)目基于深度学习的自然语言处理中问题分析的研究ResearchonProblemAnalysisinNaturalLanguageProcessingBasedonDeepLearning.作者姓名程颖涛指导教师姓名、职务唐浩漾副教授学科门类工学学科(专业)计算机控
2、制系统提交论文日期二○一八年六月摘要摘要问答系统是自然语言处理领域的重要研究内容,问题分析是该系统实现的基础,而分词处理和问题分类是问题分析中主要的处理步骤。传统的分词处理方法,难以判定过长语句中前后词语的关联,而在问题分类过程中,存在对较短语句时序判断不明确和语义深度信息挖掘不足的问题。本文利用深度学习技术,对问题分析中的分词处理和问题分类方法进行研究,构建不同的神经网络模型,通过提取问题的深度特征,改善了分词处理和问题分类方法的处理效果。本文主要工作及创新点如下:在分词处理方面,针对现有分词方法难以保证文本语义的长距离依
3、赖关系和训练预测时间长的问题,提出了一种基于混合网络中文分词处理方法。该方法将双向门循环神经网络模型(BI-GRU)应用于中文分词处理,并利用条件随机场(CRF)模型对语句进行序列标注,有效地解决了文本语义的长距离依赖关系,缩短了网络训练和预测的时间。实验表明,该方法对于分词的处理效果与BI-LSTM-CRF模型的处理效果接近,但平均预测的处理速度是BI-LSTM-CRF模型的1.88倍,有效地提升了分词处理的效率。在问题分类方面,针对已存在的分类方法在语句时序判断不明确和深度语义信息挖掘不足的问题,提出了一种基于词频率的B
4、I-LSTM-CNN问题分类方法。该方法首先利用改进的词频率方法提取语句的问题特征,然后利用BI-LSTM网络学习语句序列的语义关系,最后通过CNN网络挖掘语句的深度信息并进行归类。实验表明,该方法对问题分类体系中数字、描述、时间、人物和地点的分类预测F1值都高于90%,与长短期记忆卷积神经网络(L-MFCNN)模型相比较,大、小类分类预测F1值分别提升了1.07%、4.83%,提高了问题分类的准确性。关键字:问题分析;分词处理;问题分类;LSTM;GRUIABSTRACTABSTRACTThequestionansweri
5、ngsystemisanimportantresearchcontentinthefieldofnaturallanguageprocessing.Theproblemanalysisisthebasisoftheimplementationofthesystem,andthewordsegmentationandproblemclassificationarethemainprocessingstepsintheproblemanalysis.Thetraditionalwordsegmentationmethodisdi
6、fficulttodeterminetheassociationbetweenwordsbeforeandafterthelongsentence.However,intheprocessofproblemclassification,thereisaproblemthattheshortsentencetimingjudgmentisnotclearandsemanticdepthinformationminingisinsufficient.Inthispaper,deeplearningtechnologyisused
7、tostudythewordsegmentationandproblemclassificationmethodsinproblemanalysis,anddifferentneuralnetworkmodelsareconstructed.Byextractingthedepthfeaturesoftheproblems,theprocessingeffectofwordsegmentationandproblemclassificationmethodsareimproved.Themainworkandinnovati
8、onofthisarticleareasfollows:Intermsofwordsegmentation,itisdifficulttoguaranteethelong-rangedependenceoftextsemanticsandthelongtrainingtimeforexis
此文档下载收益归作者所有