欢迎来到天天文库
浏览记录
ID:12698810
大小:194.00 KB
页数:15页
时间:2018-07-18
《基于svm的宋词风格分类的设计与开发》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、JDFJKDHFKAHGJHLKFHJHAKHFLJKDHFKLJASHDFKJHAKLDFHDLSFHKLDSJ题目:基于SVM的诗词风格分类(自然语言处理结课论文)姓名:学院:系:专业:年级:学号:2013年12月29日DFSGSJDFKGHERUHJKDHKLSHDKJHKSHKFHLKGHDLSFGHDSKLFHGLDKSFHGLKFGDSJDFJKDHFKAHGJHLKFHJHAKHFLJKDHFKLJASHDFKJHAKLDFHDLSFHKLDSJ[摘要]为了提高宋词风格划分的准确性,本文提出了基于SVM和协同学习的宋词风格自动判定方法,在小规模人工标注
2、训练语料上,利用协同学习方法,在大规模未标注全宋词语料库上进行半监督学习,并训练得到风格SVM分类器。在本文搭建的模型系统上进行的实验表明,本文所提出的研究方法,初步解决了宋词的风格划分,也为后继的相关研究提供了理论依据和实验基础。[关键词]风格划分宋词SVM分类DFSGSJDFKGHERUHJKDHKLSHDKJHKSHKFHLKGHDLSFGHDSKLFHGLDKSFHGLKFGDSJDFJKDHFKAHGJHLKFHJHAKHFLJKDHFKLJASHDFKJHAKLDFHDLSFHKLDSJ目录第1章引言-4-1.1研究背景及意义-4-1.2计算诗学综述-4
3、-1.3本文的工作和主要内容-5-第2章基于SVM的古诗场景时间判定-6-2.1SVM概述-6-2.2基于SVM的宋词风格判定-6-2.3训练样本的获取-7-2.3.1文本预处理-7-2.3.2文本表示模型-8-2.3.3特征选取-8-2.3.4文本特征权重计算-9-2.3.5训练集的标注与构建-9-2.4SVM分类器的构建-10-2.4.1协同训练算法概述-10-2.4.2基于协同训练算法的半监督学习-11-2.5实验与结果分析-11-2.5.1实验数据-11-2.5.2实验结果分析-12-第3章总结与展望-13-参考文献-14-DFSGSJDFKGHERUHJK
4、DHKLSHDKJHKSHKFHLKGHDLSFGHDSKLFHGLDKSFHGLKFGDSJDFJKDHFKAHGJHLKFHJHAKHFLJKDHFKLJASHDFKJHAKLDFHDLSFHKLDSJ第1章引言1.1研究背景及意义中国古典诗词源远流长,博大精深,是中华民族文化艺术宝库中的瑰宝。在信息化高度发展的今天,如何运用新的技术形式来传承、保护及开发中国古典诗词,对于传统文化的传承与发展至关重要。其中的宋词作为宋代文学的典范,赢得了众多文人骚客的青睐,成为中国古代诗词中的一颗璀璨的明珠。因此,通过对宋词进行研究进而了解宋代文化一直是语言文学研究工作者的一个
5、研究热点。本文以宋词为研究对象,研究宋词风格的计算机自动分类。宋词的分类研究,可以帮助读者更好地把握整个诗歌的整体意境,了解诗歌的思想感情。1.2计算诗学综述本设计所依托的理论研究基础主要是计算诗学。厦门大学周昌乐教授在其著作《心脑计算举要》中首次提出了计算诗学这一概念。所谓计算诗学[1],指的是采用计算思想、方法和技术等从事诗歌(推而广之,也可以包括其他文学形式)的研究工作。广义的计算诗学,主要是对诗歌文本的各种规律的研究,例如诗歌机器分类、诗歌风格的计算机辅助归纳、诗学知识的计算机辅助发现、诗歌创作的计算机辅助系统工作、诗歌用词用语的统计、诗学语料库、文献库等等
6、。而狭义的计算诗学,则主要是指使计算机系统具备诗歌理解、欣赏和创作的能力,如诗歌作品的计算机理解、计算机诗歌创作系统以及计算机歌曲创作系统等。由于诗歌语言的独特复杂性,计算诗学是计算语言学研究领域中充满挑战的一个年轻的研究分支。就中国古典诗词而言,自20世纪90年代后,北京大学计算语言学研究所、台湾元智大学中国语文学系、重庆大学计算机学院以及厦门大学艺术认知与计算实验室等不少学术机构和学者陆续在诗歌语料库及知识库的建设[2-4]、韵律分析DFSGSJDFKGHERUHJKDHKLSHDKJHKSHKFHLKGHDLSFGHDSKLFHGLDKSFHGLKFGDSJD
7、FJKDHFKAHGJHLKFHJHAKHFLJKDHFKLJASHDFKJHAKLDFHDLSFHKLDSJ[5]、风格分析[6-8]、情感分析[9]和诗歌自动生成[10-13]等领域开展了汉语计算诗学的广泛研究。北京大学计算语言学研究所与台湾元智大学合作,在90年代后期开发了“古诗研究的计算机支持环境”模型系统[14],初步实现了超文本阅读,全文检索、关键词检索以及计算机语言学辅助研究等功能。其随后开发的“宋代名家诗自动注音系统”将基于统计的语言模型与宋词的音韵特点相结合,采用条件概率策略、互信息策略以及规则策略三种多音字自动注音策略,实现宋词的自动注音[2
此文档下载收益归作者所有