资源描述:
《网络新闻口语评论文本中人物对象识别方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第24卷第4期中文信息学报Vol.24,No.42010年7月JOURNALOFCHINESEINFORMATIONPROCESSINGJul.,2010文章编号:1003-0077(2010)04-0025-07网络新闻口语评论文本中人物对象识别方法林琛,李弼程,周杰(解放军信息工程大学信息工程学院,河南郑州450002)摘要:网络新闻口语评论文本中的人物对象是网络舆情的重要内容,是口语评论情感倾向性分析的基础。该文结合新闻口语评论中人物对象特点,提出了一种有效的人物对象自动识别方法。该方法首先在分词基础上,采用多频率综合判别对单字作为人
2、物对象的可靠度进行评估,以获得稳定的识别线索;其次,根据线索划定处理窗口,利用改进频繁项挖掘算法,从窗口中提取候选人物对象;最后,对结果中存在的冗余进行优化处理。实验结果表明,新方法能够完整、有效地识别网络新闻口语评论文本中的人物对象。关键词:计算机应用;中文信息处理;网络舆情;口语评论;人物对象;频繁项挖掘中图分类号:TP391文献标识码:ARecognitionofPersonNamesinNetnewsOralReviewsLINChen,LIBicheng,ZHOUJie(SchoolofInformationEngineering
3、,InformationEngineeringUniversity,Zhengzhou,Henan450002,China)Abstract:ThepersonisanimportantobjectofcommentintheinNetnewsoralreviews,andthustheidentificaitonofpersonanamesisessentialtothesentimentanalysisfororalreviews.Thispaperresentssanefficientmethodfor-identifyingthep
4、ersonnamesbasedonthetextfeaturesinNetnewsoralreviews.Themethodfirstlyevaluatestherel-iabilityofawordasapartofpersonalobjectsviathemult-ifrequencyasthediscriminatingclue;Secondly,certainwindowsaresetupaccordingtothecluesandanimprovedalgorithmoffrequentpatternminingareapplie
5、dtogetthecandidates.Lastly,theresultsareoptimizedbyaseriesofways.TheexperimentalresultsdisplaythemethodcanefficientlyidentifythefullpersonnamescommentedinNetnewsoralreviews.Keywords:computerapplication;Chineseinformationprocessing;publicopinioninInternet;oralreviews;person
6、names;frequentpatternmining聊天,指出他上网主要关注人们关心什么问题,对这1引言些问题的看法、态度、意见等。目前,网络舆情分析技术正处于起步阶段,国内随着互联网在全球范围内的飞速普及,它已成为外研究不是很多,没有具体的研究内容和统一定义。人们发布、交流信息的重要渠道。社会舆情在互联网网络新闻口语评论文本(以下简称网络新闻口语评上反应为网络舆情,社会舆情和网络舆情在内容上具论)的分析研究则更少,而它作为网民意见的最直接有一致性。但由于网络表达快捷、信息多元,方式互动和最重要的载体,是舆情分析的重要内容。我们结[1-2
7、]等特点使得网络舆情形成迅速,对社会影响更巨大。合舆情学、舆论学的研究成果,给出以下定义:近年来,社会管理部门急需了解当前人们关注定义1:网络新闻口语评论分析事件、舆论方向等信息,能够对出现的网络舆情进行网络新闻口语评论分析是对突发、热点和重点及时地监控。2008年6月,胡主席在人民网与网友网络新闻事件的相关评论进行分析,获取重要舆情收稿日期:2009-06-10定稿日期:2009-07-15基金项目:国家863计划资助项目(2007AA01Z439)作者简介:林琛(1982)),女,博士生,主要研究方向为机器学习、文本数据挖掘;李弼程(1
8、970)),男,教授,博导,主要研究方向为人工智能、信息处理;周杰(1984)),男,硕士生,主要研究方向为文本情感分类。26中文信息学报2010年信息,即评论者对评论对象的态度