欢迎来到天天文库
浏览记录
ID:37062661
大小:4.90 MB
页数:67页
时间:2019-05-17
《基于深度学习的多语种短文本分类方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代码10184:REZil3分类号:TP183,TP391.1工学硕士学位论文基于深度学习的多语种短文本分类方法的研究RESEARCHONMULTILINGUALSHORTTEXTCLASSIFICATIONMETHODBASEDONDEEPLEARNING刘娇计算机应用技术延边大学10184学校代码:分类号:TP183TP391.1?;工学硕士学位论文基于深度学习的多语种短文本分类方法的研究RESEARCHONMULTILINGUALSHORTTEXTCLASSIFICATIONMETHO
2、DBASEDONDEEPLEARNING刘娇计算机应用技术延边大学国内图书分类号:TP183TP391.1密级:公开;国际图书分类号UDC:15010455:学号20()工学硕士学位论文基于深度学习的多语种短文本分类方法的研究硕士研究生:刘娇一导师:崔荣教授副导师:赵亚慧副教授申请学位:工学硕士学科、专业:计算机应用技术所在单位:工学院答辩日期:2018年5月19日授予学位单位:延边大学ClassifiedIndex:TP183TP391.1;UDC:D’issertationforthe
3、MastersDereeofScienceinEnineeringggRESEARCHONMULTILINGUALSHORTTEXTCLASSIFICATIONMETHODBASEDONDEEPLEARNINGCandidate:LiuJiaoSupervisor:Prof.CuiRonigyAssistantSuervisorProf.ZhaoYahuipAcademicDegreeAppliedfor:MasterofScienceinEngineeringSpeciality:Comp
4、uterApplicationTechnologyAffiliation:CollegeofEngineeringDateofDefence:May,2018De-Conferr-YanbianUniversitgreeinInstitution:yg本论文已达到工学硕士学位论文要求—?答辩委(4*i:席李徳r(印)答辩委W会委WMtl(印)答辩委W仝委W金小峰(印)答辩香(14会委!4金瑕镟印),,-1答辩委W会委M.怀丽波(印)v答辩委w仝委wmM(印)延边大学2018年5月19
5、日学位论文独创性声明本人郑重声明,:所呈交的学位论文系本人在导师指导下独立完成的研究成果。尽我所知除了文中特别加以标记和致谢的部分外,论文中不包含其他人已经发表或撰写过的研究成一果,也不包含本人为获得任何教育机构的学位或学历而使用过的材枓.与我同工作的同事对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意,本人如违反上述声明一,愿意承担由此引发的切责任和后果.研究生签名:糾日期:M泠年t月冰曰所学位论文使用授权声明本人在导师指导下所完成的学位论文,学校有权保存其电子和纸制文档,可以借阅或上网公布本学位论文的全部或部分内容、,可以向有关
6、部门或机构送交并授权其保存借阅或上网公布本学位论文的全部或部分内容.对于保密论文,按保密的有关规定和程序处理。本学位论文属于:1.保密口,在年解密后适用于本声明;2.不保密□. ̄々^研究生签名:丄导师签名:日期一年月日外延边大学工学硕士学位论文摘要多语种交互是自然语言处理的重要研宄方向,对不同语言下的数据进行一分析和融合变得越来越不可或缺。已有文本分类器的规则大多数都是针对种语言训练的,在转换语言领域的时候,分类器往往需要用新的规则来适应。不同语种的数据集,因此对多语种文本分类的研宄和应用具有重要的价值本学位论文针对中、英、韩三国语言
7、表述的科技文献摘要,研究多语种短文本分类问题,采用多语种文本特征的转换和融合策略解决分类器在不同语言中的领域适应性问题,,并利用深度学习策略提高分类器的精度为多语种信息处理提供基础依据。首先,收集来自多国语文献管理系统项目的科技文献摘要9万余篇,构成了由中英韩三种语言组成的平行语料库一。科技文献的摘要大多在百字到三百字不等,它的特点是术语居多且分类界限模糊,仅凭词语特征与现有的概率统计模型很难对其进行准确分类。本学位论文借助深度
此文档下载收益归作者所有