汉越双语新闻事件检索方法研究

汉越双语新闻事件检索方法研究

ID:35087216

大小:5.89 MB

页数:62页

时间:2019-03-17

汉越双语新闻事件检索方法研究_第1页
汉越双语新闻事件检索方法研究_第2页
汉越双语新闻事件检索方法研究_第3页
汉越双语新闻事件检索方法研究_第4页
汉越双语新闻事件检索方法研究_第5页
资源描述:

《汉越双语新闻事件检索方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号密级UDC昆明理工大学硕±学位论文汉賊双语新闻事件捻索方法研究研究生姓名秦广顺指导教师姓名、职称余正涛教授学科专业计算机应用技术研究方向信息检索论文工作20?起止日期14年12月2016年3月2016年4月论文提交日期?学位论文出版授权书我同意将本人学位论文著作权中的数字化复制权、发巧权、汇编权和信息网络传播权的专有使用权在全世界范围内授予中国学术期刊(光盘版)电子杂志社(下""简称杂志社),同意其在《中国优秀博硕±学位论

2、文全文数据库》和CNKI系列。数据库中出版,未经杂志社书面许可,我不再授权他人数字化形式出版本文我同意《中国优秀博硕±学位论文全文数据库出版章程》规定享受相关权益。如有任何第H方未经杂志社许可使用本人论文,杂志社应追究其法律责任,诉谗的全部费用由杂志社承担。胜诉后,由杂志社与本人按5:5的比例分配所获赔偿金°作者签名:底)W杉'学位论文作者信息论文题目汉越双语新闻事件检索方法研究名秦广顺学号2013204029答辩日期2016年5月21日 ̄论文级别^击口硕

3、±口/院/系/所信息工程与自动化学院计算机系业计算机应用技术|联系电话Email_通信地址(邮编):备注:4开□保密(月至月)(保密的学位论文在解密后应遵守此协马__年____年_议,)--联系电话:01062791951拍79317662790693传真:01062791814-通信地址48信箱采编中也邮编;100084:北京清华大学邮局84-递守学术行为规范承诺本人己熟知并愿意自觉遵守《昆明理工大学研巧生学术规范实施细则(试行)》的所有内容,承诺所提交的毕业和学

4、位论文是终稿,不存在学术不端行为,一且论文的纸质版与电子版内容完全致。二独创性声明本人声明所提交的论文是我个人在导师指导下进行的研究工作及取得的研巧成果。尽我所知,除了文中特别加W标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得昆明理工大学或其他教育机构的学位或证书而使用过的材料一。与我同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。本人完全意识到本声明的法律结果由本人承担。H关于论文使用授权的说明本人完全了解昆明理工大学有

5、关保留使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可W公布论文的全部或部分内容,可W采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵守此规定)《。一""本学位论文属于(必须在巧下相应方框内打V,否则律按非保密论文处理):1、保密论文:□本学位论文属于保密。2、非保密论文:□本学位论文属于内部论文,网上延后公开。回本学位论文不属于保密范围,适用本授权书。是否同意授权W下单位(必须在W下相应方框肉打"V"一",否则律按同意"处授权理)

6、;因徊意授权□不同意授权将本人学位论文著作权中的数字化复制权、发行权、汇编权和信息网络传播权的专有使用权在全世界范围内授予中国学术期刊(光盘版)电子杂志社,并在《中国优秀博硕±学位论文全文数据库》和CNKI系列数据库中出版。2研巧生本人签名;签字日期:0八年月W曰:至/研究生导师签名;f签字日期:20it年f月的日句5§摘要越南与我国云南邮邻,,在桥头堡战略大环境下越南与国内交流密切,处理好与越南的国际关系对国家经济发展、政治稳定等方面有着重要的作用。借助搜索引擎从互

7、联网上获取事件信息己经是用户的迫切需求。但是,由于互联网上的信息急剧膨胀,通用搜索引擎返回的结果往往量很大且查询不准确。用户在输入某些关键字后,得到的有用信息并不多,对事件类信息的检索更是如此。因此,汉越双语新闻事件检索的研究具有重大的意义和价值,本文围绕面向事件元素的查询扩展方法和基于图思想的汉越双语新闻事件排序方法展开了相关研究,主要完成W下特色研究工作:一(1)针对互联网新闻网页结构多样化的恃点,提出种基于定制模板的新闻数据自动采集方法,结合HtmlUnit和XPath技术定制新闻数据采

8、集模板,通过对新闻页面进行解析,得到新闻网页的标题、时间及正文等内容,实现新闻数据的自动采集。一(2)针对用户获取更多事件元素信息的需求,提出种基于事件元素无向图的查询扩展方法,将事件元素分为共性元素和特性元素,根据候选事件与查询项的分析,扩展不同类别事件元素。首先分析候选事件与查询的关系,确定待

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。