企业经营范围自动分类及多语种经营范围术语自动获取

企业经营范围自动分类及多语种经营范围术语自动获取

ID:35146429

大小:1.02 MB

页数:72页

时间:2019-03-20

企业经营范围自动分类及多语种经营范围术语自动获取_第1页
企业经营范围自动分类及多语种经营范围术语自动获取_第2页
企业经营范围自动分类及多语种经营范围术语自动获取_第3页
企业经营范围自动分类及多语种经营范围术语自动获取_第4页
企业经营范围自动分类及多语种经营范围术语自动获取_第5页
资源描述:

《企业经营范围自动分类及多语种经营范围术语自动获取》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工学硕士学位论文企业经营范围自动分类及多语种经营范围术语自动获取AUTOMATICCLASSIFICATIONOFENTERPRISEBUSINESSSCOPEANDAUTOMATICACQUISITIONOFMULTI-LINGUALBUSINESSSCOPETERMS周向根哈尔滨工业大学2009年6月国内图书分类号:TP391.3学校代码:10213国际图书分类号:681.37密级:公开工学硕士学位论文企业经营范围自动分类及多语种经营范围术语自动获取硕士研究生:周向根导师:赵铁军教授申请学位级别:工学硕士学科、专业:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2009年6月

2、授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.3U.D.C.:681.37ADissertationfortheDegreeofM.EngAUTOMATICCLASSIFICATIONOFENTERPRISEBUSINESSSCOPEANDAUTOMATICACQUISITIONOFMULTI-LINGUALBUSINESSSCOPETERMSCandidate:ZhouXianggenSupervisor:Prof.ZhaoTiejunAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerSc

3、ienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofOralExamination:June,2009University:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要自然语言处理是人工智能和语言学领域的分支学科。在这个领域中探讨如何处理及运用自然语言实现特定的应用。本文提出了一种实现自然语言处理应用的方法,称为面向应用的受限文法模型实现方法,该模型通过分析问题来形式化地定义一些语言单位,并描述利用语言单位实例实现目标应用的方法,然后通过建立语言单位的受限

4、文法模型快速获取语言单位实例来实现应用。这包括两种情况:一种是应用所处理的语言对象本身是复杂的,如文本语言、对话语言。但可基于某些假设从中定义语言单位及建立受限文法模型,然后通过实验对这些假设进行验证。另一种情况是应用所处理的语言对象本身是简单的,易于建立所需语言单位的受限文法模型,例如机构名称、机构地址。企业经营范围描述企业从事经营活动的业务范围,这些业务范围是进行企业经济行业划分的依据。从语言结构上来看,这些描述是比较简单的,本文利用所提出的方法实现了一个中文企业经营范围自动分类系统。最后,针对经营范围字段中大量出现的术语,本文提出了一种多语种术语自动获取的方法,该方法利用维基百科建立

5、一个以英语为主语种的多语种术语词典。关键词:自然语言处理;形式语言;文本分类;经营范围;维基百科-I-哈尔滨工业大学工学硕士学位论文AbstractNaturallanguageprocessing(NLP)isafieldofcomputerscienceandlinguisticsconcernedwiththeinteractionsbetweencomputersandhuman(natural)languages.ThispapermainlydiscussesanaturallanguageprocessingmodeltoachieveNLPapplications.Them

6、odeldefinessomelanguageunitsformallybyanalysingapplicationanddescribesthewaytoachievetheapplicationbyusinginstancesoflanguageunit.Afterthatthismodelaccessesinstancesquicklybybuildingarestrictedgrammarmodel(RGM)toachievetheapplication.Themodelisapplicabletotwocases:Inonecasethetargetlanguageiscompl

7、exsuchasnaturallanguage,dialog,butwecandefinelanguageunitsandbuildtheRGMbysomehypothesiseswhichwillbeverifiedbyexperiment.IntheothercasethetargetlanguageissimplesuchasChineseorganizationsandChineseaddresssowecanb

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。