欢迎来到天天文库
浏览记录
ID:28195397
大小:18.00 KB
页数:5页
时间:2018-12-08
《网络民航事件虚假评论的识别研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。网络民航事件虚假评论的识别研究 摘要:互联网的开放性使得当前对于互联网上用户的评论内容没有质量控制机制,用户发表的内容中存在大量虚假评论,如何识别这些虚假评论信息成为重要问题。运用信息增益,支持向量机等方法对民航事件的评论进行特征提取和分类,识别虚假评论。通过对比四种不同的核函数,本文选定基于RBF核函数的SVM分类器进行虚假信息的分类识别,其F-measur
2、e值为90%,具有较优的分类效果。 关键词:虚假评论;信息增益;支持向量机;特征提取;核函数 Abstract:Forthereasonofinternet’sopenness,usersareallowedtocommentfreelywithoutqualitycontrolsystem,thepublishedcontentincludesmanyfalsereviews.Howtoidentifythesefakecommentsbecomeanimportantissue.BasedonInformationGainand
3、SVM,thisresearchidentifythefalsereviewsthroughfeatureextractionandclassification.Bycomparingfourkernelfunctions,RBFkernelfunctionofSVMclassifierisselectedfortheidentificationofthefalseinformation.TheF-measurevalueis90%,withqualifiedclassificationresults. Keywords:falser
4、eview;informationgain;为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。supportvectormachine;featureextraction;KernelFunction 0引言 随着Web广泛
5、使用以及用户深入参与,出现社会热门事件后,用户会通过网络发表事件相关评论,但由于用户评论时的随意性,导致其中必然包含不实信息。自XX年起,虚假信息识别这一课题受到关注。国外研究成果已获一定进展,而国内研究仍处于探索时期,同时虚假信息识别大多数研究却只是集中于电子商务产品、互联网销售等新式专用领域,而关于民航事件评论中的虚假信息识别研究却仍亟待起步。基于如上背景需求,针对如何从海量民航事件评论信息中识别出虚假评论,本文将展开详尽论与阐析。 本文以民航事件评论信息为研究对象,提出评论描述上述特征,并采用信息增益方法对各个特征计算权重,再使
6、用支持向量机的4种核函数模型分别对训练集评论进行训练,得出四种分类器,对比性能后壳优选基于RBF函数的分类器,能够对真实评论和虚假评论进行更佳分类,从而高效、准确地识别出民航事件评论信息中的虚假评论。 1虚假评论识别模型 虚假评论识别模型中展示了识别虚假评论的步骤及流程。模型构建表示如图1如下。 模型图中主要方法介绍如下:为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资
7、源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。 虚假特征的确定 本文通过支持向量机模型对贴吧、微博用户关于民航事件的评论进行虚假评论识别,在这一过程中,特征的选取会直接影响到模型的识别效果。通过对评论的分析研究,本文分别从评论者、评论本身、评论内容3个方面进行虚假评论特征的选择,特征如下: 1)以评论者为中心的特征 评论者是否匿名:本文关注的事件样本是受到国内乃至国际广泛关注的民航重大事件,多数情况下,非匿名评论比匿名评论真
8、实性强,可信度更高。其中,蓄意误导价值观,或具有反社会倾向的评论者,以引导舆论,扰乱社会为目的,通常会隐藏身份,选择匿名的可能性较大。 2)以评论本身为中心的特征 评论是否重复出现:普通评论者发表评论目
此文档下载收益归作者所有