欢迎来到天天文库
浏览记录
ID:28140197
大小:18.13 KB
页数:5页
时间:2018-12-08
《基于信息融合的中文微博可信度评估方法》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。基于信息融合的中文微博可信度评估方法 摘要:针对中文微博信息的特点及这些特点的可测量性和实际任务,系统地梳理了中文微博信息可信度测量指标,并将其进行了谱系化分析,提出一个基于信息融合的中文微博可信度评估框架CCM-IF。首先,为本质不同的三个异构特征:文本内容、信息作者与信息传播使用了不同的度量方式;其次,基于决策层可信度的模糊认知特点,采
2、用了多维证据理论进行特征融合;最后,收集了新浪微博两个真实数据集进行了一系列实验。实验结果表明,与传统信息检索排序方法平滑语言模型相比,CCM-IF符合用户需求的信息占比提高了10%~20%。因此,作为一个静态质量评估指标,CCM-IF可直接用于微博检索排序、垃圾微博过滤等实际任务。 关键词:中文微博;可信度;信息融合;四象限法则;证据理论 中图分类号:TP391 文献标志码:A 0引言为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学
3、生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。 最近几年,社会媒体得到迅猛发展,特别是微博、微信等社交软件,已发展成为互联网上的巨擘。中国互联网络信息中心于XX年7月发布的《第34次中国互联网络发展状况统计报告》显示,截至XX年6月,我国微博用户规模为亿,网民使用率为%,微博已进入平稳成熟期。但是微博固有的草根特性带来的问题
4、依然存在,也即用户对微博内容的真实性和价值依然难以判断。因此,针对微博在信息书写、信息传播、社会网络分析等方面的固有特点,分析、评估微博内容、用户,并将其应用于微博信息综合或垂直搜索、垃圾微博过滤等领域的研究,已经成为微博研究领域的重要内容之一[1]。 由于时间因素,目前对微博质量研究的实例大多集中于Twitter分析,例如文献[2-4]。这些研究可以分为两类,一类是利用传统分类技术的定性分析,这类研究需要大量样本,获取的是二值或多值的逻辑值;另一类是针对不同性能指标的定量算法,这些质量评估算法多数只关注信息本身或
5、某一侧面,缺少系统、全面的分析和评估,更没有从模糊认知的角度进行度量。目前针对中文微博质量分析的研究多数集中于内容分析以及特定用户或主题提取,缺少专门针对质量进行定量评估的系统方法,例如高承实等[5]构建的三维空间就是针对微博舆情评估的指标。为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装
6、到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。 本文从中文微博信息的特点入手,兼顾了这些特点的可测量性和实际任务,系统地梳理了中文微博信息可信度测量指标,并将其进行了谱系化分析,最终抽取出文本信息、信息作者与信息传播三个高层异构特征。考虑到可信度的模糊性本质,提出一个基于信息融合的中文微博可信度评估框架,并依据中文微博特点以及信息融合技术实现了用于计算并融合三个高层异构特征的具体方法。最后,收集了新浪微博两个真实数据集进行了一系列实验。实验结果表明,本文提出的微博可信度评估方式
7、作为一个静态质量评估指标可直接用于微博检索排序、垃圾微博过滤等实际任务;而且和传统信息检索排序方法平滑语言模型相比,该框架和计算方式在准确性方面有明显优势。 1相关工作 从社会媒体角度看,“可信度是主观认知的可信度,是指传播过程中,信息受播人对传播媒体的信赖度的主观评量”。微博是一种典型的社会媒体,对其可信度的研究属于质量评测的一种。下面从微博质量评估角度来讨论现有工作。为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康
8、教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。 中文微博发展时间短,目前对微博质量研究的实例大多集中于Twitter分析。Castillo等[2]利用典型的分类算法对Tw
此文档下载收益归作者所有