基于文本挖掘的图书评价体系中作者维度评价模型的研究

基于文本挖掘的图书评价体系中作者维度评价模型的研究

ID:35065804

大小:2.59 MB

页数:45页

时间:2019-03-17

基于文本挖掘的图书评价体系中作者维度评价模型的研究_第1页
基于文本挖掘的图书评价体系中作者维度评价模型的研究_第2页
基于文本挖掘的图书评价体系中作者维度评价模型的研究_第3页
基于文本挖掘的图书评价体系中作者维度评价模型的研究_第4页
基于文本挖掘的图书评价体系中作者维度评价模型的研究_第5页
资源描述:

《基于文本挖掘的图书评价体系中作者维度评价模型的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、冢诵—、.':三-与>学校名齋学校代胁igm:东北师范大学三一t怒1—:看;叫If,;f一^P、''、':、.常:龍觀苗研究生学号2013102805-:两庐心分类每,S诗勇窜:.、|'’.'.'古'‘‘.:V海>、J.;,说妒,;"".懼'^瞧..辦嚇会,、if:.......’":.-麵..謂寒f..嗦硕d:学位论文V'—一賴難■一一■:,為;'一?一。、一、V.,^■fr-■?f^tv:il基于义本化推的巧令评祈体《中巧者推戍、■-?■??.?--.T、r

2、r.??、,?;.接艇祭^.r;I的巧费芭v评所模巧;R’esearchonAuthorsEva山ationModdhiBook、-点Eva山ationSs化mDevelomentBasedonTextMinin;:>ypg7,;难竊弊邊"1I讓1棚胤胃-'一:击矿'二’:计*奶软件与理论缀学科.二我掉:品咕护;心一鸣.'、巧究方向:麵細:.V導鹿V.;媒;>\’知声部.二学輯郵学术巧±‘.^声纖.巧蘇给J..驗擊‘..'零:.、‘.电也r.盛。带丈巧

3、裝線發赛繞親兹''游寒的^"—’’'|'一’’.、:.-:兩:^.巧;這輿,門梦巧苦蛛’东北大位评定员师范学学委会屬5月年'鞠,.??.:侣.纔鶴\式苗輯繫'^、...,.麵镶痛辨,、,,,,V。_'?巧、:.-驚薛錠市打.4滞鷄蘇i縣鄭記y微亦證璃',;環1鶴謹to餘s餐議賴拆兴接鑛fc^雜.韻懿讓懿豁管織廣麵#顯麵議讓、壓巧擁学校代码:10200学校名称:东北师范大学分类号:TP31研究生学号:2013102805硕士学位论文基于文本挖掘的图书评价体系中作者维度评价模型的研究Researc

4、honAuthor’sEvaluationModelinBookEvaluationSystemDevelopmentBasedonText-Mining作者:张斯雯指导教师:李雁翎教授一级学科:计算机科学与技术二级学科:计算机软件与理论研究方向:数据挖掘学位类型:学术硕士东北师范大学学位评定委员会2016年5月独创性声明本人郑重声明:所提交的学位论文是本人在导师指导下独立进行研究工作所取得的成果。据我巧知j,除了特别加UI标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果。对本人的研究做出重要贡献的个人和集体,均已在文中作

5、了明确的说明。本声明的法律结果由本人承担。读t学位论文作者签名:日期;心叫4的学位论文使巧授权书本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,目P;东北师范大学有权保留并向国家有关部口或机构送交学位论文的。复印件和电子版,允许论文被査阅和借阅本人授权东北师范大学可W将レ学位论文的全部或部分内容编入有关数据库进行检索,可ッ采用影印、缩印或其它复制手段保存、汇编本学位论义。(保密的学位论文在解密后适用本授权书)学位论文作者签名;如采作指帛獅签知气[‘::冶山4曰期OfkAM日期'y)

6、摘要随着全面阅读的火热开展,图书在人们生活中的地位急速提升,图书评价也得到越来越多的人的关注。作者是图书的基本属性之一,因而作者评价是图书评价的基本组成部分。近年来,国内外学者对图书评价已有广泛讨论和多种观点,但针对作者评价方面的研究却寥寥无几。本文分析了现有作者评价的传统方法,提出了基于文本挖掘的作者评价方法。本文主要工作如下:⑴对国内外作者评价的方法进行了调查研究,分析了当下作者评价偏重主观性的特点,提出了以大量作者信息为数据基础、基于文本挖掘算法的作者评价思路。力求为作者评价提供客观的数据支撑。⑵从互联网的海量数据中采集本文研究所需的作者信息作为

7、研究的数据基础。对网络爬虫技术进行研究、对数据源进行分析,尽可能采集全面而详尽的作者信息。通过文本去重、文本去噪以及文本抽取技术对原始数据进行文本预处理,得到1527429条作者信息以便后期使用。同时,将图书编目数据与处理后的作者信息相关联,丰富图书编目的广度。⑶在采集的作者信息的基础上,进行了大量的统计计算。通过对计算结果的分析,选取了作者的工作单位、职称、获奖情况以及代表作者学术水平的h指数四个部分作为作者评价的主影响因子。⑷构建了基于文本挖掘的作者评价模型。提出了评价作者的自动化处理方法:采用朴素贝叶斯算法替代过去的主观评价方法,解决了作者评价主观

8、性过强的问题,使作者评价能够在少量人工干预的前提下,快速有效地处理海量作者信息数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。