欢迎来到天天文库
浏览记录
ID:5356473
大小:349.48 KB
页数:5页
时间:2017-12-08
《基于最大匹配和马尔科夫模型的对联系统》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、*基于最大匹配和马尔科夫模型的对联系统郑亚斌曹嘉伟刘知远孙茂松智能技术与系统国家重点实验室,清华信息科学与技术国家实验室(筹)清华大学计算机科学与技术系,北京100084{yabin.zheng,dover2cindy,liuliudong}@gmail.comsms@mail.tsinghua.edu.cn摘要:对联,雅称“楹联”,俗称对子,它言简意深,对仗工整,平仄协调,是一字一音的汉语语言独特的艺术形式。可以说,对联艺术是中华民族的文化瑰宝。本文开发了一种基于前向最大匹配和一阶马尔科夫模型的对联系
2、统。首先对用户输入的上联进行前向最大匹配的切分,进而发现匹配结果的若干候选,利用一阶马尔科夫模型假设和动态规划算法找到和上联最为匹配的下联,初步的实验结果表明我们的方法具有一定效果。关键字:前向最大匹配;一阶马尔科夫模型;动态规划;对联CoupletSystemBasedonMaximumMatchingandMarkovModelZhengYabinCaoJiaweiLiuZhiyuanSunMaosongStateKeyLaboratoryonIntelligentTechnologyandSyst
3、emsTsinghuaNationalLaboratoryforInformationScienceandTechnologyDepartmentofComputerScienceandTechnology,TsinghuaUniversity,Beijing100084,ChinaAbstract:CoupletisconsideredasChinesenation’sculturaltreasures.Itisalwaysbriefandtothepoint,andalsohasneatantith
4、esis,harmonioustone.Wedevelopedacoupletsystembasedonforwardmaximummatchingandfirst-orderMarkovmodel.FirstwesegmentthefirstlineofacoupletonascrollusingFMM,thenfindmatchedcandidatesfromthecorpus.UsingassumptionoffirstorderMarkovmodelanddynamicprogrammingte
5、chnique,wefinallygetthesecondlineofacoupletthatbestsuitstheinput.Preliminaryexperimentshowstheeffectivenessofourproposedmethod.Keyword:ForwardMaximumMatching;First-orderMarkovModel;DynamicProgramming;Couplet1前言对联[1]是由两个工整的对偶语句构成的独立篇章。其基本特征是字数相等,平仄相对;词性相近
6、,句法相似;语义相关,语势相当。对联作为一种雅俗共赏的文学体裁和文化现象,孕育在“骈语”和“律句”之中,形成在“骈文”和“律诗”之后,独立在“骈文”和“律诗”之外;又与“书法艺术”相表里,发达在“骈文”和“律诗”之上。对联文字长短不一,短的仅一、两个字;长的可达几百字。对联形式多样,有正对、反对、流水对、联球对、集句对等。但不管何类对联,使用何种形式,却又必须具备以下特点:一要字数相等,断句一致。除有意空出某字的位置以达到某种效果外,上下联字数必须相同,不多不少。*本文承国家自然科学基金(项目号6057
7、3187)的资助。二要平仄相合,音调和谐。传统习惯是“仄起平落”,即上联末句尾字用仄声,下联末句尾字用平声。三要词性相对,位置相同。一般称为“虚对虚,实对实”,即名词对名词,动词对动词,形容词对形容词,数量词对数量词,副词对副词,而且相对的词必须在相同的位置上。四要内容相关,上下衔接。上下联的含义必须相互衔接,但又不能重覆。目前,微软亚洲研究院[2,3]已经推出了计算机自动对联系统,首先用户给定上联,然后系统自动提供若干下联供用户选择,用户可以通过交互手段优选字词来生成满意的下联;当确定一副对联后还可以
8、生成若干四字横批供用户参考。目前可处理十字以下的对联,但是不支持嵌字联、拆字联、音韵联。本文尝试搭建一个简单的对联系统,以期比较满意的给出候选下联。首先,我们借助中文分词中的前向最大匹配[4]算法的思想,对用户输入的上联进行切分;其次,我们找到语料库中和切分结果匹配的候选序列,结合一阶马尔科夫模型[5]假设,同时考虑了纵向的对仗工整和横向的语意连贯通顺,给出概率最大的匹配序列作为下联返回。本文的组织结构如下:第二节主要介绍我们提出的对联产生
此文档下载收益归作者所有