文本挖掘中若干关键技术研究

文本挖掘中若干关键技术研究

ID:35082904

大小:6.26 MB

页数:121页

时间:2019-03-17

文本挖掘中若干关键技术研究_第1页
文本挖掘中若干关键技术研究_第2页
文本挖掘中若干关键技术研究_第3页
文本挖掘中若干关键技术研究_第4页
文本挖掘中若干关键技术研究_第5页
资源描述:

《文本挖掘中若干关键技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP391学校代码:10712UDC:004.62研究生学号:2009060228密级:公开2016届攻读博士学位研究生学位(毕业)论文文本挖掘中若干关键技术研究学科专业:农业电气化与自动化研究方向:农业信息计算机应用研究生李梅指导教师:张阳教授完成时间:2016年5月中国陕西杨凌Classificationcode:TP391Universitycode:10712UDC:004.62Postgraduatenumber:2009060228Confidentialitylevel:OpenDissertatio

2、nforDoctorDegreeNorthwestA&FUniversityin2016RESEARCHONKEYTECHNIQUESINTEXTMININGMajor:AgriculturalElectrificationandAutomationResearchfield:AgriculturalInformationandComputerApplicationNameofPostgraduate:LiMeiAdviser:Prof.ZhangYangDateofsubmitted:May,2016YanglingSh

3、aanxiChina研究生学位(毕业)论文的独创性声明本人声明:所呈交的博去学位(毕业)论文是我个人在孕师指孕下独立进行的研究工作及取得的研究结果;论文中的研究数据及结果的获得完全符合学校《关于規范西北农林科技大学研究生学木道德的暫行规定》,如果违反此规定,一切后果与法律责任均由本人承担。尽我所知,除了文中特别加标注和致谢的地方外,论文中不包含其他人巳经发表或撰写过的研究结果,也不狂含其他人私自己本人已获得西北农林科技大学或其它教育机构的学位或证书而使用过的材料一。与我同工作的同事对本研究所

4、做的任何贡献均已在论文的致谢中作了明确的说明并表示了谢意。研究生签名:植时间;如《年^月曰水j导师指导研究生学位(毕业)论文的承诺本人承巧:我的博击研究生;所呈交的博去学位(毕业)论文是i我指导下独立开展研記工作及取得的研究结果,属于我现岗职务工作的结果,并严格按照学枝《关于规范西北农林科技大学研究生学术道德的誓行规定》而获得的研巧结果。如果违反学校《关于规范西北农林科技大学研究生学禾道德的帮行规定》。,我愿接受按学校有关规定的处罚处理并承担相症导师连带责任导师签名:时间:义月案日

5、》^年关于研究生学位(毕业)论文使用授权的说明科技本学位(毕业)论文的知识产权归属西北农林科技大学。本人同意西北农林大学保存或向国家有关部口或机构送吏论文的纸质化和电子化,允许论文被查权汇阅编和借阅;同意西北农林科技大学将本学位(毕业)论文的全部或部分内容授录入《中国博壬学位论文全文数据库》进行出版,并享受相关权益。本人保证,在毕业离开(或者工作调离)西化农林科技大学忘,发表或者使若用本学位(毕业)论文及其相关的工作成果时,将法W西北农林科技大学为第一署法律单位,否则,愿意按《中华人氏共和国著作

6、权》等有关规定接受处理并承担责任任何收。存和保管本论文各种化本的其他单位和个人(包括研究生本人)未经侵本论犯文著作者的导师同意,不得有对本论文进行复制、修改、发行、出租、化编等作权的行为,否则,按违背《中华人表共和国著作权法》等有关规定处理并追究法律责任。或担描(保密的学位论文在保密期限内,不得W任何方式发表、借阅、复印、缩印研复制手拽保存、汇编论文)究生整名:时间:又〇/£年居月曰导师签名;时间:么9处年店月i曰龄文本挖掘中若干关键技术研究摘要随着计算机、传感、通信等技术的迅速

7、发展,互联网作为全球信息资源网络,日益融入到人们的工作和生活中,文本作为信息的主要载体,也因此呈现爆炸式增长。文本挖掘旨在从丰富的文本信息中获取有用知识,已成为学术界前沿研究领域之一。文本分类技术和文本摘要技术是文本挖掘研究的重要分支,广泛用于网络监测、垃圾邮件过滤、信息检索等应用中。传统文本分类算法仅使用全标注文本样本学习分类模型,然而实际应用中标注文本真实类别的代价十分昂贵,大量文本都是未标注,或仅可标注是否为正例样本。因此,研究仅采用正例与未标注文本进行学习的文本分类算法有着重要的意义。文本摘要技术对大量的文本快速地

8、压缩、提炼,生成文章的主旨,帮助人们快速获取信息,其中句子排序在文档摘要句子提取中起着关键作用。本文围绕正例与未标注文本分类问题展开研究,同时对文档摘要中句子排序技术进行了探索。主要工作如下:(1)针对现有两阶段策略对正例与未标注文本学习时,第一阶段从未标注样本抽取可靠负例数量较少,质量较低的问题,提出

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。