基于概率主题模型的情境建模方法研究

基于概率主题模型的情境建模方法研究

ID:32974454

大小:14.11 MB

页数:123页

时间:2019-02-18

基于概率主题模型的情境建模方法研究_第1页
基于概率主题模型的情境建模方法研究_第2页
基于概率主题模型的情境建模方法研究_第3页
基于概率主题模型的情境建模方法研究_第4页
基于概率主题模型的情境建模方法研究_第5页
资源描述:

《基于概率主题模型的情境建模方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国料孽艘求犬誊博士学位论文万方数据基于概率主题模型的情境建模方法研究作者姓名:学科专业:导师姓名:完成时间:怀宝兴计算机应用技术陈恩红教授二。一四年十月万方数据UniversityofScienceandTechnologyofChinaAdissertationfordoctordegreeAStudyofContextModelingbasedonProbabiliStiCModelsAuthor:BaoxingHuai●DICl-Speciality:ComputerApplicationTechn

2、ologySupervisor:Prof.EnhongChenFinishedTime:October,2014万方数据中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除己特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均己在论文中作了明确的说明。作者签名:么丝中国科学技术大学学位论文授权使用声明作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:

3、学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。作者签名:导师签名:万方数据摘要随着IT产业尤其是互联网的蓬勃发展,人类社会逐渐进入了大数据时代,我们每天都可以通过多种渠道接触到海量的信息。如何从信息的海洋中获取知识逐渐变得非常困难,为了应对这种信息过载的问题,数据挖掘

4、技术应运而生。然而,传统数据挖掘方法的解空间通常较大,其挖掘结果仍然难以满足用户需求。幸运的是,移动互联网的崛起和智能移动设备的应用普及,使得与用户的行为和周边环境相关的情境数据被大规模的记录、收集并逐年积累。通过对实体(用户以及与其有交互关系的实物如商品、文本等)进行情境感知的建模,挖掘出实体在不同情境下的特性以及模式的情境数据挖掘,成为解决传统数据挖掘方法解空间过大问题的有效途径,具有重要的研究价值和应用意义。在此背景下,本文系统地研究了情境数据挖掘方法及其应用问题。特别的,本文在传统互联网环境以及移动

5、互联网环境这两个角度分别研究了三类问题:移动用户的情境识别、移动情境中的用户联系人意图建模以及面向互联网信息的命名实体情境建模。具体而言,本文的主要研究内容如下:首先,提出了一种面向移动用户的半监督情境识别模型。为了挖掘带有语义信息的移动用户情境,以便为用户提供更好的信息服务,学者们提出了有监督模型或者无监督模型的移动情境建模方法。然而,有监督模型过分依赖于标注数据,使得这类方法在现实应用中难以应用,而无监督模型挖掘出来的情境缺乏潜在的语义信息,这使得挖掘出来的结果没有很强的实用性。针对以上问题,结合在现实

6、环境中容易获得用户部分有标注情境数据的现状,本文提出了可以融合有标注和无标注数据的半监督模型对移动用户的情境进行建模,同时本文还设计了对应的半监督学习算法。在模型中,我们称移动用户情境潜在的语义信息为情境主题,因为不同用户其情境主题是个性化的,意味着每个用户有着不同的情境主题,且数目也不相同,因此,模型需要事先知道用户的情境主题数目方能为其进行情境建模,因为传统求解方法需要通过不断尝试不同值然后判断出合适的主题数目而导致效率低下,因此本文提出了无参估计模型来万方数据摘要对解情境主题的数目进行建模,该模型能够

7、较为理想的对情境主题数目进行估计,同时在模型训练阶段,其算法迭代结束后的一些变量可以直接用于情境建模模型的初始化过程中,实验表明这使得情境建模的模型训练时间缩短,并且,与随机始化的方式相比能够取得更优的建模效果。另外本文还提出了一个完整的半监督情境识别的系统框架图,不仅包括标注数据的收集与处理,也包括建模和估参等过程。最后在真实数据上的大量有针对性的实验表明本文提出的半监督情境识别模型具有优于己有研究工作的良好效果。其次,通过研究用户的移动情境以及联系日志,提出一种基于概率主题模型的联系人意图建模方法,解决

8、了移动用户意图理解的困难。随着智能移动设备的普及,以及各种智能互联网应用的广泛使用,“联系”操作在诸多场景中被频繁使用。另一方面,由于智能移动设备存在一些弊端(如屏幕小等),这使得对用户的联系人意图进行建模从而为智能服务提供理论基础显得十分必要。针对该联系人意图理解的问题,本文在数据预处理阶段提出了简单有效的情境会话划分算法以及情境区域划分算法,并在此基础之上提出了一种假设:用户在执行一个联系操作的过程中通常会基

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。