基于移动搜索日志的用户搜索位置意图的研究

基于移动搜索日志的用户搜索位置意图的研究

ID:35068624

大小:6.10 MB

页数:64页

时间:2019-03-17

基于移动搜索日志的用户搜索位置意图的研究_第1页
基于移动搜索日志的用户搜索位置意图的研究_第2页
基于移动搜索日志的用户搜索位置意图的研究_第3页
基于移动搜索日志的用户搜索位置意图的研究_第4页
基于移动搜索日志的用户搜索位置意图的研究_第5页
资源描述:

《基于移动搜索日志的用户搜索位置意图的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、叩霄夺因种^若若大赛UniversitofScienceandTech打oloofChinaygy硕±学位论文‘’'.心.1作讀....,.,?"I妻..秦.畔读论文题目子移勢坡秦日志巧A用户投秦侄置意固巧研楚孙选凡作者姓名计算柄软钟理冷学科专业蘇恩么教援导以巧姓名二0一六?年巧月完成时间中通种營接术夫#硕±学位论文儀基于移动搜索日志的用户搜索位置意图的硏究作者姓名:孙逸凡学科专业:计算机软

2、件理论导师姓名:陈恩红教授二〇—完成时间:六年四月十八日UniversitofScienceandTechnolofChinaygyoA’dissertationformastersdereeg馨M,iningUsersLocationIntentionfromMobileSearchLog’Au化orsName:YifanSunSpecialty:ComputerSoftwareandTheorySupervisor:Prof.

3、EnhongChen化Finishedtime:Aril182016p,中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果,。除已特别加标注和致谢的地方外论文中不包含任何他人己经发表或撰写过的研巧成果一。与我同工作的同志对本研究所做的贡献均己在论文中作了明确的说明。作者签名;签字日期;中国科学技术大学学位论文授权使用声明一作为申请学位的条件之,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即;学校有权

4、按有关规定向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可^将学位论文编入《中国学位论文全文数据库》等有关数据庙进行检索,可W采用影印、缩印或扫描等复制一致手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相。保密的学位论文在解密后也遵守此规定。囚么开□保密()年作者签名:诗金R导师签名:严签字日期:;八0签字日期摘耍摘要一随着移动互联网的快速发展,移动搜索领域成为现今的个研究热点。在个一人语音助手的不断涌现下,移动搜索的市场份额己

5、经占据了半^心上。越来越多的手机应用开始试图获取手机的位置信息,,此来提高用户的搜索体验。然而即使获取了用户的位置信息,还是不够的,还需要判断查询语句是否带有位置意图,判断获取的位置信息是否对搜索有帮助,对哪些类型的搜索有帮助,因此,如何判断搜索查询语句的位置意图,成为解决问题的关键点。在此背景下,本文提出了对移动搜索的位置意图进行分类的思想。根据搜索,,只有这样语句的位置意图的不同分布进行相应的辅助操作,才能完整的正确的解决搜索语句的位置意图问题。在本文中,我们把搜索的位置意图分为H类:"

6、"一首先,第类为固定位置意图的查询。此类查询语句的特点是它们总是一和个固定的地点名词相关联,位置意图是确定的,不随环境变化的。例如査询""""""""""黄山,北京、词天安口、自由女神像、他们的位置意图分别为纽约""一和安徽。这类查询的关键词多是些著名的景点、大学、知名建筑物、政府一机关等等。远类查询所需要的辅助信息是各自相应的地点名词,且的是唯。""接着,第二类为本地意图的查询。此类查询的持点是用户想搜索在自己"""""一附近的或者所在城市的信息。送类的查询例如:附近的宾馆、火车站、房"""价

7、、天气预报等等。这类查询所需要的辅助信息是用户所在的地理位置信息。""最后,第H类为无位置意图的查询。此类查询并不需要地理位置作为辅""""""助信息,直接搜索即可。例如:诸葛亮、红楼梦、搞笑视频等等。一针对第类查询的识别,我们设计了包含词频和占比两个因子的选择函数,一通过设定定的占比闽值,并同时调节词频的变化,获得了大量的查询词和地点名词组成的二元组,91%的准确率并达到了。=二,针对第类和第类的分类问题,我们采用了文本分类的流程通过分词、去除停用词,我们设计、特征选择、分类等步骤,得到

8、了很好的分类效果。其中了新的特征选择函数阳ICHI,并和五种基础的特征选择函数做了对比实验,证""明了新方法的正确性和优越性。接着,我们针对本地意图查询的分类问题,把我们的结果和其他两位学者的方法做了对比实验,并证明了我们的方法的优越一性,系列的辅助性实验,采用了多个数据集合,多个数据划分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。