欢迎来到天天文库
浏览记录
ID:46448480
大小:70.50 KB
页数:4页
时间:2019-11-23
《情感倾向性分析调研》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、情感倾向性分析调研意见挖掘研究的U的L!前,互联网上的信息与日剧增,蕴藏着巨人的信息量。但是,耍想在很短的时间内获得人们对于诸如人物、事件、传媒、产晶等冇价值的评价信息,往往是十分困难的。例如,对产品的各种评价出现在各人论坛、电子公告板以及门户网站上,厂商需要了解顾客使用其产品的反馈意见,潜在的购买者也需要作出是否购买某个产品的决定。如果采用人工方式对这浩如烟海的信息进行查询、统计,显然是低效和不切合实际的。而对这样的现实问题,意见挖掘技术应运而生。一方面,它基于数据挖掘(DataMining)和
2、文本挖掘(TextMining)技术,另一方面,它又具有相当的文木理解(TextUnderstanding)的能力。所以,它是比文本挖掘技术更接近人工智能冃标的一种新技术。它与以往的信息抽取(InformationExtrac2tion)、文木分类(TextClassification)和文木摘要(TextSummarization)技术不同。虽然信息抽取和意见挖掘都需要深层的语义理解,但信息抽取主要是获取具体的语言表达结构,如命名实体、命名实体关系、事件等,这些成分一般为显式表达结构;而意见挖掘
3、是挖掘意见的元素和它们Z间的关系,即主题、意见持冇者、陈述、情感和它们之间的关系,这些成分表达形式多样,而且常常不是显式地、独立地表达。文木分类是在预定的用户需求卜•把文木进行分类,并没有涉及到深层次的语义理解。文木摘要是用简练的语言表达长篇文木的中心思想,但文木中刈•事物的具体看法和评价则没有被淸晰地提取出来。实际上,意见挖掘技术弥补了上述这些技术的不足,是更具有应用价值的一种新技术。意见挖掘涉及各个语言分析层而,不但涉及到词汇层(如分词和词性标注)、句法层(如命名实体识别和语法分析)和语义层(
4、如语义分析),还涉及到篇章层(如跨句的指代消解)。意见挖掘与一些语言技术有关,例如,信息检索、文木分类、信息抽取、口动摘要、数据融合、问答系统、自然语言生成、对话系统、机器翻译等。意见挖掘技术可以应用于现实生活中的许多方面,如电子商务、商业智能、信息监控、民意调查、电子学习、报刊编辑、企业管理等。例如,釆用意见挖掘系统从來自网上的产甜(如笔记木电脑)评价意见中快速地获得意见分类统计结果,可以捉供给厂商以进一步改进产品的质量,可以提供给潜在的顾客作为选择购买什么型号产品的参考,也可以提供给代销商作为
5、进货品种和数量的依据。(文木意见挖掘综述姚天1,程希文2,徐飞玉2,汉思•乌思克尔特2,3,王睿3中文信息学报第22卷第3期)根据主题的木体概念和语义倾向使用启发式规则选择陈述。在此基础上,使用统一的表示集成具有情感知识的语言特征,然后采用朴素贝叶斯分类器分类情感极性。此后,Tsou等人在上述研究工作基础上对中国四地(北京、香港、上海、台北)报刊上有关四位政治人物(克里、布什、小泉纯一郎、陈水扁)褒贬性的新闻报道进行了分类研究[33]。在研究中,首先通过标记语料库获得文本中的极性元素(PolarE
6、lements),然后主要采用了三个衡量指标,即极性元素的散布(Spread).极性元索的密度(Density)和极性元素的语义强度(Intensity)来对每个文本进行统计,得出文本贬褒分类和强度人小的结果。其屮对确定极性元素之间的关系虽有所提及,但没有深入研究。在BBS文本研究方而,邱立坤等人提出了一种在BBS环境下进行热门话题挖掘的算法[34]。这种算法在一般文木聚类算法基础上,应用BBS所特有的点击数、冋复数进行热度排序,然后采用基于特征词捉取的话题归并,从而挖掘出最受BBS用户关注的热门
7、话题。意见挖掘研究的U的冃前,互联网上的信息与口剧增,蕴藏着巨大的信息量。但是,要想在很短的时间内获得人们对于诸如人物、事件、传媒、产品等有价值的评价信息,往往是十分困难的。例如,对产品的各种评价出现在各大论坛、电子公告板以及门户网站上,厂商需要了解顾客使用其产品的反馈意见,潜在的购买者也需要作出是否购买某个产品的决定。如果采用人工方式对这浩如烟海的信息进行查询、统计,显然是低效和不切合实际的。而对这样的现实问题,意见挖掘技术应运而生。一方面,它基于数据挖掘(DataMining)和文本挖掘(Te
8、xtMining)技术,另一方面,它又具有相当的文本理解(TextUnderstanding)的能力。所以,它是比文本挖掘技术更接近人工智能冃标的一种新技术。它与以往的信息抽取(InformationExtrac2tion)、文木分类(TextClassification)和文木摘要(TextSummarization)技术不同。虽然信息抽取和意见挖掘都需要深层的语义理解,但信息抽取主要是获取具体的语言表达结构,如命名实体、命名实体关系、事件等,这些成分一般为显式表达结构;而意见挖
此文档下载收益归作者所有