欢迎来到天天文库
浏览记录
ID:36619435
大小:673.96 KB
页数:12页
时间:2019-05-13
《基于HowNet的词汇语义倾向计算》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、万方数据中文信息学报第20卷第1期JOURNALOFCHINESE刑K佩MAl∞NPROCESSINGV01.20No.1文章编号:1003—0077(2006)01—0014—07基于HowNet的词汇语义倾向计算朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德(复旦大学计算机科学与工程系,上海200433)摘要:在互联网技术快速发展、网络信息爆炸的今天,通过计算机自动分析大规模文本中的态度倾向信息的技术,在企业商业智能系统、政府舆情分析等诸多领域有着广阔的应用空间和发展前景。同时,语义褒贬倾向研究也为文本分类、自动文摘、文本过滤等自然语言处理的研究提供了新的思路和手段。篇章语义倾向研究的基础
2、fi-作是对词汇的褒贬倾向判别。本文基于HowNet,提出了两种词汇语义倾向性计算的方法:基于语义相似度的方法和基于语义相关场的方法。实验表明,本文的方法在汉语常用词中的效果较好,词频加权后的判别准确率可达80%以上,具有一定的实用价值。关键词:计算机应用;中文信息处理;态度分类;语义倾向;知网中图分类号:唧91文献标识码:ASemanticOrientationComputingBasedonHowNetZHUYan-lan,MINJin,ZHOUYa-qian,HUANGXuan-jing,WUⅡ·de(1)qⅪrhI脚tofComputerScienceandTechnolog
3、y,FudanUniversity,Shanghai200433,Chi.a)Abstract:Nowadays,withthedevdopmentofIntemetandinformationexplosion,automatedtechniquesfor舭姐慨allthor’sattitudestowardsspecificeventswillmakegreatefforttobusinessintelligenceandpoblicopinionsurvey.Senlanticorientationinferencehasbecomeam朗lliIlgfultool,which
4、couldprovideusefulirffonnationfortextclassification,剐咖mad刎∞,6lt既ingetc.Measuringthesen训corientationofwordswouldgreatlycontributetopredictingtheauthor’Sattitudeinapassage.Inthispitper。asimpleHowNet-basedmethotforsemanticorientationcolnpuLationofChinesewordsisintroduced.Althoughthismethodl_e恤only
5、afewseedwords,satisfactoryIestdtScanstillbeobtained.Andtheperfonrmnc沱isevenbetterforhe—quenflyusedwords,withthefrequency-weightedaccuracyofabove80%.Keywor凼:computerapplication;CJfineseinformationprocessing;sentimentclassification;semanticorientation;HowNet1简介面对浩瀚的网络资源,如何通过有效的手段获取所需的信息,是目前计算机领域研
6、究的热点。语义倾向性研究正是在这一背景下应运而生的。人们根据各自所关注的问题在Web上进行搜索,通过阅读大量相关文献、介绍、评论,逐渐形成自己的观点。由于网络资源过于庞大,搜集一阅读一评价的工作变得十分繁琐和耗时。因此迫切地需要一套能够自动搜索、评价、归纳的系统替人们完成这一任务。困难是显而易见的,计算机虽然具有极快的处理速度,14收稿日期:2005—05一Cr7定稿日期:2005—11—01基金项目:国家自然科学基金资助项目(60435020);上海市科技攻关计划资助项目(035115028)作者简介:朱嫣岚(1982·),女,硕士生,主要研究方向为自然语言处理.万方数据但如何使其
7、能够自动完成对文本的语义倾向的推断,仍然是个需要研究的课题。所谓词汇的语义倾向,即对于词汇的褒贬程度计算出一个度量值。为了便于统计和比较,目前比较常用的做法是将度量值规定为位于±1之间的实数。当度量值高于某阈值时,判别为褒义倾向;反之,则判为贬义倾向。此外,我们可以通过对篇章中词汇的语义倾向值求平均的方式,获得篇章的语义倾向。因此,对词汇的语义倾向计算是此类研究中的关键工作。语义倾向研究具有极大的实用价值。在商业领域中,能够为企业进行市场分析、市场调查、顾
此文档下载收益归作者所有