面向社会网络应用的人物关系抽取方法研究

面向社会网络应用的人物关系抽取方法研究

ID:35187403

大小:3.09 MB

页数:73页

时间:2019-03-21

面向社会网络应用的人物关系抽取方法研究_第1页
面向社会网络应用的人物关系抽取方法研究_第2页
面向社会网络应用的人物关系抽取方法研究_第3页
面向社会网络应用的人物关系抽取方法研究_第4页
面向社会网络应用的人物关系抽取方法研究_第5页
资源描述:

《面向社会网络应用的人物关系抽取方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士研究生学位论文面向社会网络应用的人物关系抽取方法研究ResearchonPersonalRelationExtractionMethodforSocialNetworkApplication姓名:洪军建指导教师:珠杰院(部、中心):藏文信息技术研究中心专业:计算机系统结构研究方向:数据挖掘完成日期:2016年04月III面向社会网络应用的人物关系抽取方法研究摘要人物关系抽取是信息抽取领域的热门研究方向之一,指的是从非结构化或半结构化的文本中识别用户感兴趣的人物关系,并以结构化的形式进行存储的过程。在这个信息爆炸的大

2、数据时代,需要信息抽取技术快速准确地发现形式多样的人物关系,为社会网络及其他相关领域的应用研究奠定基础。本文对基于堆叠降噪自动编码器的人物关系抽取方法进行了深入研究,并在此基础上对基于人物关系抽取技术的社会网络构建方法进行了研究,主要研究内容归纳如下:首先,提出了基于互动百科的人物关系语料自动生成系统的设计方案,对数据抓取、网页正文抽取、文本分析处理、人物关系语料生成四个模块进行了详细的论述与设计;提出了由语言技术平台(LTP)和NLPIR汉语分词系统相结合并协同互动百科进一步确认的人名对识别算法以及基于互动百科的人物

3、关系类型识别算法。其次,研究了基于堆叠降噪自动编码器的人物关系抽取方法,并通过实验的方式对该方法的性能进行了评估。在句子级别的人物关系抽取中,针对特征词过少导致特征向量高度稀疏这一问题,提出了基于同义词词林扩展特征词规模的缓解方法;考察了词特征、词性特征、相邻位置特征、依存句法特征和语义特征对人物关系抽取性能的贡III献;探究了不同网络深度的堆叠降噪自动编码器的人物关系识别效果。最后,研究了基于人物关系抽取技术的社会网络构建方法,构建了适合大规模社会网络分析应用的社会网络矩阵并通过社群图的形式对社会网络的构建效果进行了

4、展示。本文提出的基于互动百科的人物关系语料自动生成系统,为后续的基于堆叠降噪自动编码器的人物关系抽取模型的参数训练以及性能测试所需的语料提供了一个语料自动获取工具;提出的基于人物关系抽取技术进行社会网络构建的方法适用于利用大规模互联网数据进行社会网络构建,为社会网络的进一步分析应用奠定了基础。关键词:社会网络,人物实体识别,人物关系抽取,降噪自动编码器,深度学习IVResearchonPersonalRelationExtractionMethodforSocialNetworkApplicationABSTRACTP

5、ersonalrelationextractionisataskthatautomaticallyrecognizespersonalrelationfromunstructuredorsemi-structureddocuments,andstoredtheminastructuredformat.Inthisbigdataeraofinformationexplosion,itisnecessarytofinddiverseofrelationshipsbetweenthepersonsrapidlyandaccu

6、ratelyutilizedthetechnologyofpersonalrelationextraction,tolaythefoundationfortheapplicationandstudyofsocialnetworkandotherrelatedfields.Inthispaper,westudiedthepersonalrelationextractionmethodbasedonthestackeddenoisingautoencoders,andfurtherbuiltasocialnetwork.T

7、hemainresearchcontentsaresummarizedasfollows:Firstly,westudiedtheinformationacquisitiontechnologybasedontheInternetandtheautomaticgenerationtechnologyofrelationinstancedatasetsbasedonhudongbaike.Thedesignmethodoftopiccrawlersystemforpersonalrelationextractionapp

8、licationandthenamerecognitionmethodcombinedLTPandNLPIRandfurtherconfirmedbyVhudongbaikeandtheautomaticannotationmethodofrelationinstancebasedonhudongbaikewereproposed

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。