哈尔滨工业大学硕士毕业论文模板 - 香港中文大学

哈尔滨工业大学硕士毕业论文模板 - 香港中文大学

ID:34453135

大小:1.42 MB

页数:75页

时间:2019-03-06

哈尔滨工业大学硕士毕业论文模板 - 香港中文大学_第1页
哈尔滨工业大学硕士毕业论文模板 - 香港中文大学_第2页
哈尔滨工业大学硕士毕业论文模板 - 香港中文大学_第3页
哈尔滨工业大学硕士毕业论文模板 - 香港中文大学_第4页
哈尔滨工业大学硕士毕业论文模板 - 香港中文大学_第5页
资源描述:

《哈尔滨工业大学硕士毕业论文模板 - 香港中文大学》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、硕士学位论文音乐领域中文实体关系抽取研究RESEARCHOFCHINESERELATIONEXTRACTIONINTHEFIELDOFMUSIC周蓝珺哈尔滨工业大学2009年6月国内图书分类号:TP391.1学校代码:10213国际图书分类号:681.37密级:公开硕士学位论文音乐领域中文实体关系抽取研究硕士研究生:周蓝珺导师:刘挺教授申请学位级别:工学硕士学科、专业:计算机科学与技术所在单位:计算机科学与技术学院答辩时间:2009年6月学位授予单位:哈尔滨工业大学ClassifiedIndex:TP391.1U.D.C.:681.37DissertationfortheMasterDeg

2、reeinEngineeringRESEARCHOFCHINESERELATIONEXTRACTIONINTHEFIELDOFMUSICCandidate:ZhouLanjunSupervisor:Prof.LiuTingAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2009Degree-Conferring-HarbinInstituteo

3、fTechnologyInstitution:哈尔滨工业大学工学硕士学位论文摘要随着互联网上信息的快速增长,人们迫切需要一些自动化的工具帮助其在海量信息中迅速找到真正需要的信息。信息抽取(InformationExtraction)研究正是在这种背景下产生的,关系抽取(RelationExtraction)是信息抽取的子任务之一。实体关系抽取的任务是从文本中抽取出两个或者多个实体之间预先定义好的语义关系。本文将实体关系抽取定义为一个分类问题,主要研究内容是中文音乐领域的实体关系抽取。针对这一问题,本文首先构建了中文音乐实体关系语料库,然后分别采用了基于序列模式挖掘的无指导的方法和基于特征提

4、取的有指导的方法来解决这一问题。在语料库的建设过程中,本文参考了ACE语料的构建过程,首先定义了包含11种实体关系的中文音乐领域关系类型体系;接着制定了详细的标注规范并完成了10,000句语料的标注工作。与此同时,本文针对音乐领域和中文的语言学特点,定义了音乐领域的序列模式。由于BootStrapping方法的引入,实体关系种子可自动扩展并可从互联网上挖掘大量的高准确率的序列模式。在评测集上,该方法取得了平均准确率为94.40%的结果。最后,本文基于已标注完成的语料库,研究了音乐领域实体关系抽取的特点,并根据其特点进行了特征选择的研究,分别使用最大熵(Maxent)和支撑向量机(SVM)对

5、特征抽取的结果进行了实验,在相同的测试集上,SVM分类器取得了更好效果。另外,本文还将序列模式分类器与支撑向量机分类器进行了级联,在评测集上取得了平均F值为80.85%的结果。最后,本文还设计和实现了中文音乐实体关系抽取实验平台,在该平台上,研究人员可以集中精力进行挖掘方法和特征选择的改进,提高了研究效率。关键词关系抽取;音乐实体关系;序列模式挖掘;最大熵模型;支撑向量机;-I-哈尔滨工业大学工学硕士学位论文AbstractAstherapidgrowthofinformationontheinternet,toolswhichcouldhelppeopletoautomaticallyf

6、indoutwhattheywantfromamassofinformationareneededurgently.Theresearchofinformationextractionemergesunderthisbackground.Relationextractionisasubtaskofinformationextraction.Thetaskofrelationextractionistoextractpredefinedsemanticrelationsbetweentwoormorenamedentitiesfromtexts.Inthispaper,thetaskofre

7、lationextractionisdefinedasaclassificationproblem.Accordingtothisproblem,acorpusofrelationextractionbetweenmusicalnamedentitiesisbuiltfirstly.Thenanunsupervisedmethodbasedonsequentialpatternminingandasupervisedme

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。