面向音乐领域的文本检索与挖掘系统

面向音乐领域的文本检索与挖掘系统

ID:32419378

大小:531.44 KB

页数:7页

时间:2019-02-04

面向音乐领域的文本检索与挖掘系统_第1页
面向音乐领域的文本检索与挖掘系统_第2页
面向音乐领域的文本检索与挖掘系统_第3页
面向音乐领域的文本检索与挖掘系统_第4页
面向音乐领域的文本检索与挖掘系统_第5页
资源描述:

《面向音乐领域的文本检索与挖掘系统》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、*面向音乐领域的文本检索与挖掘系统付瑞吉,秦兵,刘挺哈尔滨工业大学计算机学院信息检索研究中心哈尔滨150001Email:{rjfu,bqin,tliu}@ir.hit.edu.cn摘要:本文介绍了一个面向音乐领域的文本检索与挖掘系统——八维音乐资讯,主要通过信息抽取技术,对音乐领域的大量半结构化和非结构化的文本进行深层次的挖掘,从中抽取出有价值的信息,转换为结构化数据,目的是为用户提供精准化、全方位的音乐检索结果。该系统从人、物、时、空、评价、数量、事件和关系八个角度出发,集成了命名实体识别、关系抽取、事件抽取、倾向性分析、问答等多项自然语言处理和信息抽取

2、技术。系统设计采用MVC架构,包括3层结构:模型层、控制层和视图层。总之,该系统将已有的信息抽取技术应用于音乐垂直检索系统,具有一定的新颖性和实际意义。关键词:八维音乐,信息抽取,垂直搜索TextRetrievalandMiningSystemforMusicDomainFuRuiji,QinBing,LiuTingResearchCenterforInformationRetrievalofComputerScience&TechnologySchool,HarbinInstituteofTechnology,Harbin150001Email:{rjfu

3、,bqin,tliu}@ir.hit.edu.cnAbstract:Thispaperpresentsatextretrievalandminingsystemformusicdomain,named8weiMusicInformation.Bymeansofinformationextraction(IE),itcanmineagreatdealofsemi-structuredandunstructuredtextdeeply,extractvaluableinformationfromitandconverttheinformationintostru

4、ctureddata,whichaimstoreturnaccurateandoverallsearchresultstousers.Frompersons,objects,time,space,opinions,quantity,eventsandrelations8standpoints,8weiMusicsystemintegratesmanykindsofnaturallanguageprocessing(NLP)technologiesandIEtechnologies,suchasnamedentityrecognition,relationex

5、traction,eventextraction,sentimentclassification,question-answering,etc.TheMVCsoftwareframeworkisusedinthesystem,whichconsistsofthreecomponents:Model,ViewandController.Inbrief,existingIEtechnologiesareusedformusicverticalsearchsystem,whichhasacertainnoveltyandpracticalsignificance.

6、Keywords:8weiMusic;InformationExtraction;VerticalSearch1引言随着互联网技术的发展,尤其是进入web2.0时代以来,博客、RSS、WIKI、SNS等社会软件的涌现,使每一个用户都可以成为信息的发布者,网络上的信息迅猛增长。因此我们迫切需要一些自动化的工具帮助人们在海量信息源中迅速找到真正需要的信息。在这个背景下产生了信息检索(InformationRetrieval,IR)技术和信息抽取(InformationExtraction,IE)技术。信息检索是指将信息按照一定的方式组织和存储起来,并根据用户的需

7、要找出相关信息的[1]过程。目前成功的信息检索系统有Google,百度,Yahoo!,Bing等著名的搜索引擎,但这些都是通用搜索,返回的信息过于繁杂,噪音很大,这极大地增加了用户甄别信息价值的时间,并不能满足特殊用户群、特殊领域的精准化信息服务需求。于是人们开始关注垂直搜索引擎,针对某[2]一个领域进行精准、细致、全面的搜索。这就需要信息抽取技术,从非结构化的文本中抽取出特定的信息,对海量的信息进行精准全面的挖掘。1八维音乐资讯就是一个以信息抽取为基础的音乐领域的垂直搜索引擎系统。八维指的是描*基金资助:国家自然科学基金项目(60803093,609750

8、55);国家863项目(2008AA01Z144)作

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。