基于内容相关度计算文本结构的分析方法地研究论文

基于内容相关度计算文本结构的分析方法地研究论文

ID:32282401

大小:6.50 MB

页数:150页

时间:2019-02-02

基于内容相关度计算文本结构的分析方法地研究论文_第1页
基于内容相关度计算文本结构的分析方法地研究论文_第2页
基于内容相关度计算文本结构的分析方法地研究论文_第3页
基于内容相关度计算文本结构的分析方法地研究论文_第4页
基于内容相关度计算文本结构的分析方法地研究论文_第5页
资源描述:

《基于内容相关度计算文本结构的分析方法地研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、,JJ■■■■■●_l●1J●1●■●—1●◆Ph.D.DissertationSubmittedtoShanghaiJiaoTongUniversityStudyonMethodtoAutomaticallyAnalyzetheTextStruct-ureBasedontheRelevancyComputingofTextContentAuthor:MaoshengZhongAdvisor:Prof.RuzhonLuSpecialty:ComputerScienceandTechnologyDepartmentofComputerScienceandEngineeringSh

2、anghaiJiaoTongUniversityJune2009●●附件四上海交通大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式·标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:讲’易日期:。跏fo年多月/3日●◆j上海交通大学上海父逋大字学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的

3、复印件和电子版,允许论文被查阅和借阅。本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。、保密口,在一年解密后适用本授权书。本学位论文属于/不保密似(请在以上方框内打“√刀)学位论文作者躲榔括导教师签名c)秀缎钐日期:必,o年:;月(00日日期:刎p年岁月膪日■◆●●上海交通大学博士学位论文答辩决议书所在姓名钟茂生学号0060339016计算机科学与技术(计算语言学)学科指导教师陆汝占答辩2010..03..21答辩上海交大徐汇校区新建楼2027室.日期地点论文题目皋于内容j1I关度计算的文本毛-

4、i构分析方法研究评语和决议:隽谤车硖故。.兰:!;竺构分析是臼然语吉处理中重要但义尚少见0J『究的较为幽难领域.有重要的理论价霉竺’誊堡膨川前景a论文选题士要针对文本结构分析【fJ的线性用j层次结构分忻两个f问瑟j:!::誊毒鍪要结擘表示、汉语词汇语义天系,汉语』二卜文句际天系、文本线性分刑、文本葚次笺竺2卡斤等儿个方面,采川基丁.内弈相关度计算的方法进行研究。研究I:作比较系统瓠蠢义.,‘研究方法有创新,Z-要自‘:。’⋯.!.、。篓出_种基丁人的认知行为的、综合“内涵概念上的天联张度”平¨“使川上的陂赖胜度”的词语相荚度计算方法,取得了很女r的成效,芹为厉继岍究奠定基础:i

5、‘⋯⋯⋯一.⋯j:曼曼了_箩机器臼动识别上卜文句际语义关系的方法(定性方法),以及~.pI'++-J--,t+-j语相天度的句f间相天度计算方法(定繁方法):。。.::.芋一翼声相天度计算方法、句际语义相笑关系分忻与计算方法,提出了一种基丁-内容相天性分析的文本分割方法:一。,⋯4、对~类较规范的文本类型,探索文本层次结陶分析方法,提出了,基于Na.1.veBayes模型雨I基丁生物序列比对算法的两种新的文本结翰分析方法。。⋯,.算文立论止确·条理清晰·实验数据详实可靠.只有创新性。论文作者已牢矧掌握本fj学科的基础理论和专fJ知识,有位慢的独立科研能力。~‘一.该同学在答辩过

6、稗中表述清楚t正确同答了所提问题,经答辩委员会无记名投票。~致同意通过论文答辩,建议囊—一授予j11:学博十学位。一獬耋≯讳关主彳孥矶少吖.职务姓名职称单伉签名主席吴立德教授复旦大学矢扦I答委员虞慧群教授华东I悝工人。誊.衍移鹰辩。委委员顾君忠教授华东师范大学捻艇员彻流会委员张丽清教授上海交通大学成职.纪员委员吕宝粮教授上海交通大学y签委员名委员秘书陈玉泉副教授一l二海交通大学徭锣浆●’■●摘要基于内容相关度计算的文本结构分析方法研究摘要文本结构可分为物理和逻辑结构两种形式,文本的物理结构是指组成文本的基本要素(如标题、段落、句子、词汇和标点符号等)在文本中的实际位置所决定的结

7、构,可以用向量空间模型予以表示;文本的逻辑结构是指组成文章思想内容的主题、层次、段落、句子、主题词在概念意义上所形成的逻辑关系,通常用树或图予以表示。文本结构自动分析就是期望计算机能够自动将一个文本划分成互不相交的若干文本单元,或者从语义上将文本解析成为一棵层次结构树,以便获得文章本来的逻辑结构。文本结构分析对于实现文本理解和文本推理具有重要意义,只有从宏观上把握文章的逻辑结构,才能更合理的从全局的视角理解文章的主题及中心思想;同时,文本结构分析结果对于文本自动摘要、基于篇章段落的信息检索、

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。