基于文本分析的微博用户性格获取模型

基于文本分析的微博用户性格获取模型

ID:23647403

大小:50.00 KB

页数:5页

时间:2018-11-09

基于文本分析的微博用户性格获取模型_第1页
基于文本分析的微博用户性格获取模型_第2页
基于文本分析的微博用户性格获取模型_第3页
基于文本分析的微博用户性格获取模型_第4页
基于文本分析的微博用户性格获取模型_第5页
资源描述:

《基于文本分析的微博用户性格获取模型》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于文本分析的微博用户性格获取模型毕崇武(华中师范大学信息管理学院湖北武汉430079)摘要:微博在改变信息传播方式的同时,受到社会各界的广泛关注。如何通过用户发布内容确定用户性格成为微博营销所要解决的关键问题之一。文章依据现阶段网络爬虫、文本分析、心理学性格分类研究的相关进展,提出一种基于微博内容分析确定微博用户性格的方法,对微博营销中基于用户性格的个性化推荐方式提供了有力保障。.jyqkBIT、九型人格、霍兰德职业兴趣理论等),通过实践与心理学理论相结合的方法,进而更加具体地描述微博用户拥有的性格特征。在行为心理学一个多世纪的发展过程中,行为与人类心理理

2、论的研究成果已经非常丰富,可以基本描述用户的性格——行为关系;并且在进行行为——性格表的制定的同时,还得可以运用诸如信息组织方面的技术手段,将行为表达词与性格表达词的格式进行规范化,以求最终得到符合使用要求的标签词用来建立行为——性格关系映射表。2.3用户性格获取模型的构建行为标签词库与行为——性格关系映射表的建立可以实现通过分析微博用户发布内容,抽取用户微博行为标签(揭示微博用户行为的标签可以是一个,也可以是多个);然后依据行为——性格关系映射表中微博用户行为与性格的对映关系,获取用户的性格。在此过程中,可以借鉴信息检索中相关性判断机理以及语义判定等方面的

3、理论,将行为——性格关系映射表中表示行为的词与行为标签词库中的词进行语义上的匹配,并从量化的角度判断两个相似词之间的相关程度,从而判断该标签词所能代表多大程度上的某种性格。该步骤的主要目的是将行为——性格关系映射表中表示行为的词与行为标签词库中的词进行统一规范化处理。在对同一用户性格进行描述时,一个用户可能具有多种性格,用户性格获取模型对用户性格分析的结果可以从多个方面进行量化。当然这一切必须在行为标签词库与行为——性格关系映射表建立的基础上,运用数学建模方面的技术手段及其原理,将整个运行机制生成一种可操作的模型,并将通过分析微博用户发布内容生成的行为标签词

4、输入该模型,然后对应输出相关性格的排序。总体来说,用户性格获取模型应该包括:微博用户发布内容获取工具(如爬虫)、文本分词系统、行为标签词库、行为——性格关系映射表、用户性格综合判定模型,以及可视化输入输出界面。3模型科学性的检验方法及优化使用用户性格获取模型判定微博用户性格特征的科学性需要通过实际数据进行检验。在此,本文提出一种模型合理性的检验方法,仅供读者参考:使用python编写爬虫程序抓取数据时,在抓取的用户群中运用统计学的方法进行合理采样,抽出在部分用户作为样本;将抽取的微博用户发布的内容进行行为标签词处理,输入最终形成的模型当中,得出相应微博用户的

5、性格特征;采用心理学人物性格分析方法,对抽取的样本用户发送心理学中有关性格调查方面的问问卷,进行用户性格测试;问卷回收之后,采用心理学人物性格分析方法对问卷进行整理分析,进而得出较为准确的用户性格;将问卷调查结果与模型分析结果相比较。运用相关性理论以及心理学方面对于两个描述性格特征近义词的相关理论进行判断,或者根据相关词典中对于语义的解释进行人为主观判断专家打分法,得出模型分析结果与问卷调查结果匹配的相似度;依据得到的相似度对构建模型的科学性进行评判,并作为模型改进的重要依据。以上方法不仅可以作为评价构建模型科学性、合理性的重要手段,而且可以作为模型改进的重

6、要依据,但在选取调查用户样本和设计调查问卷时应带注意样本选取的合理性以及问卷设计的科学性。4基于用户性格的个性化推荐方法基于性格的推荐主要有两种实施方法:一是只考虑用户性格特征,指通过用户性格来计算用户相似度;二是通过在传统的协同过滤模型中加入用户性格这一指标,综合考虑用户性格特征和用户评分,通过加权计算得出最终用户相似度。第一种方法首先需要获取用户的性格特征,然后考虑不同用户性格特征之间的相似度,选取不同用户之间相似值小于一定阀值的用户进行群体推销。在推销过程中可以选择以用户为角度、以对象为角度以及基于项目的不同推荐模式,最终实现基于用户性格的个性化推荐方

7、法,为微博营销中的个性化推荐提供有力保障。第二种方法相比第一种略微复杂,需要综合考虑不同的用户属性以加权的方式获取用户的总体特征,并计算用户之间的相似值,但基本原理与第一种方法相当。5结语从当前企业不能很好结合微博用户性格进行微博营销这一实际出发,提出一种通过运用传统词频分析生成用户微博行为标签(该标签揭示微博用户发布某内容所表达的行为及含义),构建行为——性格关系对映表的微博用户性格获取模型,使基于微博内容的用户性格特征分析得以系统化、模型化实现,并为微博营销中基于微博用户性格的个性化推荐奠定了基础。..

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。