读者行为挖掘与分析的大数据技术及应用.pdf

读者行为挖掘与分析的大数据技术及应用.pdf

ID:49330839

大小:222.17 KB

页数:4页

时间:2020-02-29

读者行为挖掘与分析的大数据技术及应用.pdf_第1页
读者行为挖掘与分析的大数据技术及应用.pdf_第2页
读者行为挖掘与分析的大数据技术及应用.pdf_第3页
读者行为挖掘与分析的大数据技术及应用.pdf_第4页
资源描述:

《读者行为挖掘与分析的大数据技术及应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、读者行为挖掘与分析的大数据技术及应用1,2◎任娟(1.上海出版传媒研究院,上海200093;2.上海出版印刷高等专科学校,上海200093)【摘要】出版业是随着大数据技术应用的推动在内容生产、营销方式、盈利模式上正发生深刻变革的重要领域之一,基于网络平台产生的读者行为大数据蕴含着丰富的商业价值。文章对读者行为挖掘这一主题的研究现状进行了文献回顾,重点对基于大数据技术的读者用户行为挖掘与分析方法进行了归纳总结,对面向读者用户行为挖掘的大数据应用方向进行了分析,结论指出了我国读者行为挖掘领域发展中存在的问题,对读者行为挖掘与分析的发展提出了建议。【关键词】读者行为 大数据技术 数据挖掘

2、 行为大数据【中图分类号】G252 【文献标识码】A 【文章编号】1003-6687(2017)1-031-04【DOI】10.13786/j.cnki.cn14-1066/g2.2017.01.005[1]一、文献回顾的人。这个概念相对于图书馆学的“读者”而言,倾读者行为挖掘与分析属于读者学的研究分支,读向于图书市场消费者的定位。吴平认为,编辑出版学领者学又属于出版学的子学科,由出版家宋原放于1985年域的读者学研究进展缓慢,“停滞不前”;应重启读者[2]提出并创立,初期的读者研究主要集中在上个世纪80年学研究。笔者认为,一方面,随着出版界的读者意识代。笔者以“读者学”“读者”“

3、读者行为”“阅读行不断增强,其实不乏研究读者的学者,由于技术限制等为”等为检索关键词,在CNKI的《中国学术文献网络出原因导致进展缓慢。刘志伟和路健行认为,出版业数据版总库》中进行检索发现,近年来对读者行为进行研究出现“信息孤岛”的原因,在于传统的出版内容未有效的学者分散于图书馆学、信息管理学、出版学等学科。嵌入互联网数据链中,尽管网络上用户行为大数据在不其论文多发表在《图书情报工作》《图书馆学》等图书断积累,若出版机构不善于甚至没有能力研究用户的行[3]情报类期刊上,少数发表在《中国出版》《出版科学》为,便显得殊为可惜。另一方面,由于互联网进入大等新闻学与传播学类期刊以及分散于其

4、他学科的专业期数据时代,“用户至上、体验至上”的用户思维使得研刊中,这说明现有文献中“读者行为”研究主要活跃在究者倾向于将“用户”代替“读者”的提法,导致CNKI公共图书馆的读者服务领域。本文界定的读者与图书中使用“读者”作为关键词不能获得完全有效的搜索结馆界定的读者不太相同,这里采用王涛鹏(2013)的观果。尚策认为传统出版与数字出版分野的一个重要体现[4]点,读者指具有阅读能力并通过购买获得图书或阅读器便是不再提“读者”,而是强化“用户”概念。“用【基金项目】上海市教育委员会科研创新重点项目“大数据背景下图书在线评论对销售绩效的影响研究”(14ZS169);上海出版传媒研究院招

5、标课题(SAYB1416)【作者信息】任娟(1981—),女,湖南湘阴人,管理科学与工程专业博士,上海出版传媒研究院研究人员,上海出版印刷高等专科学校出版与传播系讲师,主要研究方向:数据挖掘,用户行为分析。2017.1书业031户”和“读者”并非只是表述不同,关键在于其思维方点,而读者分析与挖掘结果的前提是读者数据的获取。式、盈利模式的差异,用户思维强调的是为用户服务,一直以来,读者数据是出版企业重点关注的数据类型。而非单纯将内容推送给读者,仅有“内容为王”是不够在线统计工具和数据挖掘技术日趋成熟,为读者研究提的。出版业在数字化转型、如何将“读者”转变为“用供了实证基础。本文认为,

6、面向读者行为分析的大数据户”的过程中,积累了不少可供借鉴的应用案例,其共处理,指基于Hadoop分布式存储系统等大数据平台,对性做法是“挖掘读者需求——研发、创新满足读者需求读者在图书购买网站、读书社区、社交媒体等平台上生的产品或技术——用户体验——盈利”,而读者需求的成的数据报文、日志等结构化或非结构化数据,进行采获取除传统出版进行的问卷调查方法,在互联网时代更集、过滤分类、存储和数据挖掘,并从分析结果中发现多是隐藏在海量的读者行为大数据中,需通过大数据技读者行为的规律性,进一步为图书营销策略提供依据。术进行挖掘和分析。大数据对读者研究的改变在于,大一般而言,常见的大数据处理模型

7、包括数据采集、数据数据下读者研究的方法,从传统的统计抽样方法变为数预处理、数据与文本挖掘和数据可视化四大模块。据的全体研究。大数据时代,人们更加关注数据总体,就出版业而言,读者(用户)行为数据的采集是较并试图从数据总体中直接获取有价值的信息。薄弱环节。有学者认为,相对于出版业大数据核心层、出版大数据是大数据技术在出版业的实践,是涉及产品层、业务层的数据采集而言,针对用户层的数据采选题策划、内容生产、编排制作、营销推广、读者服务集最为复杂多变,采集难度最大。目前个人读者

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。