欢迎来到天天文库
浏览记录
ID:35106377
大小:7.30 MB
页数:83页
时间:2019-03-18
《基于监督学习的写作风格建模方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、密级:硕±学位论文'论文题目基于监督学习的写作风格建模■方法研究作者姓名陈得福指导教师杨建刚教授学科(专业)计算机技术所在学院计算机科学与技术学院提交日期2016年1月10日1j■J■'.JADissertationSubmittedtoZheianjgUniversityfortheDegreeofMasterofEngineeringTITLE:The民esearchonWritingStyleModelingMethodBasedonSuper
2、visedLearningAuthor:ChenDefuSuervisor:Prof.YangJianGangpSubject:ComputerApplicationTechnologyCollee:ComputerScienceandTechnologygSubmittedDate:Jan.2016独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研巧工作及取得的研究成果。据我所知,除了文中恃别加W标注和致谢的地方外,论文中不包含其他人己经发表或撰写过的研巧成果,也不包含为获得浙江大学或其他
3、教育机构的学位或证书而使用过的材料一。与我同工作的同志对本研巧所做的任何贡献均己在论文中作了明确的说明并表示谢意。学位论文作者签备签字曰期:wi;年之月7曰学位论文版权使用授权书、本学位论文作者完全了解渐江欠学有关保留、使用学位论文的规定,有权保留并向国家有关部口或机构送交论文的复印件和磁盘,光许论文被查阅和借阅。本人授权浙江大学可将学位论文的全部或部分内容编入有关数据库进行检索。,可W采用影印、縮印或扫描等复制手段保存、汇编学位论文(保密的学位论文在解密后适用本授权书)/学位论文作者签名:嘴、减爲导师签名:■签字曰期::风^年J
4、月1曰签字曰期批成年言月曰]’学位论文作者毕业后去向::工作单位:电话通讯地址:邮编浙江大学硕±学位论文摘要摘要,也越随着移动互联网技术快速发展,人类依赖计算机从事的工作越来越多需要计算机能够智能地理解和处理海量的自然语言信息。在自然语言处理中,个人言语、作品风格分析是计算语言学的经典的研究工作,也是难W得到突破的研究。一一写作风格是个主观性的描述,目前还没有个严谨的数学模型能够表达写作风格,用形式。本课题的研究思路是结合语言学对写作风格定义和可计算方式,化的数学模型表达,然后机器学习的方法进行实验佐证通过实验反过来修改理
5、一论,最终得到个比较严谨的数学表达。,结从这个研究思路出发,本课题首先查阅国内外文献合前人工作与风格理,论,用数学符号形式定义了文章的写作风格并扩展如何用机器学习算法学习写作风格的定义。定义写作风格模型后,提出了整体总体的建模方案,而且针对建。模过程中的关键问题,本课题进行展开详细说明为了验证模型和建模的有效性,本课题展开了写作风格特征提取分析、刻画化及识别研巧。在写作风格特征提取刻画研究中,提出了聚类分析来自动提取风格特征,然后使用四分位差统计法来刻画写作风格,最后的实验结果驗证了写作风格的定义,,。在写作风格识别中使用了支持向量机算法来
6、建立写作风格分类器实验结果证明特征并不是越多越好,经过自动提取优化的特征集会提升识别准确。为了对比及改善支持向量机算法,提出了两种基于集成学习算法的写作风格识别方法。,实验结果证明提出的两种方法可W提高识别的准确率关键词:计算机语言,机器学习,写作风格,模型,监督学习i浙江大学硕±学位论文AbstractAbstractWiththerapiddevelopmentofmoWleIntern巧technology,themoreactivityrelyoncomputereoleengaedinthemorene
7、edforintelligentcomutercanunderstandppg,pandprocessvastamountsofnaturallanguageinformation.Innaturallanguageprocessing,studyandcalculationthespeechfeatureofpersonalandliteraryworksiso打eclassicresearchofCom
此文档下载收益归作者所有