欢迎来到天天文库
浏览记录
ID:35070391
大小:6.99 MB
页数:71页
时间:2019-03-17
《基于语义分析的文本检索模型技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、r分类号密级UDC编号幸中种私大考硕±学位论文义子语义分如巧文未检奎换型技术研完学位申请人姓名:走务申请学位学生类别:全巧制巧壬申请学位学科专业:计义机应巧拔术指导教师姓名:张浅元教援巧古学按论文TESS?MASRTHEIS硕±学位论文基于语义分析的文本检索模型技术祈巧论文倘:说靴专业:计urnefl技术向:中文倍ftaa华中!学巧2016年5月巧去学按论文'#MASTERSTHESISResearchon
2、TechniquesofTextRetrievalModelBasedonSemantic乂nalsisyAThesisSubmittednPartialFidtoReurementsifiUmenftheqiFortheM.S.DegreeinComputerapplicationtechnologyByYuanFangPostgraduateProgramSchoolofComputerCentralChinaNormal
3、UniversitySupervisor:ZhangMaouan.yAcademicTitle:ProfessorSignatureApproved^May.2M6巧去学按论文MA‘巧#STERSTH扮华中师苑大学学位论文原创性声明和使巧授权说巧原创巧旁巧本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研巧工作所取得的研巧成果。除文中己经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研巧做出贡献的个人和集体
4、,均已在文中W明确方式标明。本声明的法律结果由本人承担。拉/《;《作者签名;日期年月f日钟学住若文换权使巧援权韦,即学位论文作者完全了解华中师范大学有关保留、使用学位论文的规定:研巧生在校攻读学位期间论文工作的知识产权单位属华中师范大学。学校有权保留并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被查阅和借阅,学校可W公布学位论文的全部或部分内容,可W允许采用影印、缩印或其它复制手段保存。()、汇编学位论文保密的学位论文在解密后遵守此规定,在年解密后适用本授权书。
5、保密论文注释:本学位论文属于保密。非保密论文注释:本学位论文不属于保密范围,适用本授权书方作者签若;导师签名:禾巧麥■^>日日期:>化年(月日日期:户年^月/>《""本人己经认真阅读CALIS髙校学位论文全文数据库发布章程,同意将本"""CALIS人的学位论文提交高校学位论文全文巧据库中全文发布,并可按章"一程中的规定享受相关权益。同意论文提交后滞后;□半年:□年:□二年发布。作者签若:n导师签日期:W乂年(月:月^/日曰期HA学化逆史WEa^MASTERS
6、THESIS巧要""随着在创新2.0下互联网+这种新业态的出现,社会生活的各个领域都与互联网变得密不可分。这也导致了互联网上的各类非结构化数据,结构化数据,i半结构化数据的大数据爆炸式増长。虽然互联网公司可Ul对巧杂的各类数据进行"挖掘,分析出用户行为背后习惯爱好,针对各种用户需求设计出更符合他们口"味的产品与服务,;但是对于大多数普通用户而言如何通过计算机从如此庞大的海量数据中自动检索到有用的信息变得越来越具有挑战。‘WLDA模型为代表的主题模型是信息检索系统中常用的语义挖掘
7、工具,这类基于概率统计方法的语义巧掘模型可W用来识别语料库中潜藏的主题信息,通一过多个概率分布矩阵,最终可W获得每篇文档的个词频向量。自然语言的不确定性主要表现为随机性和模糊性,基于概率统计的语义挖掘模型只能解决自然语^,而忽略了自然语言的模糊性1,言的随机性问题1^及文档中词语之间的语义关联因此随着网络数据信息的増长,基于概率统计的语义挖掘模型在用于信息检索时虽然可W返回用户需要的有关信息,但没有完全把握用户的中也主题思想,返回。的信息涉及的范围较广不够精确,不能让用户满意为此,论文展开
8、的研巧工作包括W下几个方面:一第,引入云模型作为桥梁,在传统的标签主题模型上融入语义知识信息,扩展得到一个新的主题模型一,即基于云模型的语义标签主题模型。该模型利用一系列的云空间转换,将标签基于语义知识的矩阵与标签的概率矩阵融合成个新的语义标签矩阵,并利用送个新的语义标签矩阵来进行主题建模。云模型利用定量表示与定性表达之
此文档下载收益归作者所有