欢迎来到天天文库
浏览记录
ID:43622062
大小:272.08 KB
页数:10页
时间:2019-10-11
《大数据给社会学带来了什么挑战》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、大数据给社会学带来了什么挑战?大数据给社会学带来了什么挑战?邱泽奇:信息社会50人论坛成员,北京大学社会学系教授,北京大学中国社会与发展研究中心主任我准备与大家讨论三个问题:第一,什么是大数据。关于大数据大家说的很多,但是其中错误概念也非常多,我想从我的角度来给澄清一下大数据是什么。第二,大数据和社会学研究到底有没有关系。相信这也是人家比较关心的议题。第三个,大数据对社会学研究带來了什么挑战。大数据给当今社会带來的挑战非常多,但对社会学研究而言,到底有什么样的挑战呢?我口己有三点看法与各位分享。I
2、什么是大数据?大数据是痕迹数据汇集的并行化、在线化、生活化、社会化。对社会学研究,我们最熟悉的是社会活动,我称其为人类活动。其实今大,不仅仅社会活动,你的私密活动也在数据之中,我没有加“社会”两个字,道理就在于人类的活动都在慢慢地数据化。在人类活动中,冇一个概念叫做造痕,考古挖掘的,就是人类社会生活留下的痕迹。过去,我们通常拿这些痕迹做证据,比如考占学、历史学和社会学的许多研究活动。这些证据有一些会被数据化,数据化了的证据就叫做数据。既然很早以前就有“数据”,今天怎么就出来一个大数据呢?一个非常重
3、耍的因素,就是网络化汇集和网络化存储,把过去的数据集屮起来,这才构成了大家讨论的大数据。那么,什么叫大数据?麦肯锡从行业和业务价值链的角度给了一个定义:数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘与运用,预示着新一波生产率增长和消费者盈余浪潮的到来。麦肯锡认为,大数据将是一个生产力的來源。今天,我们在讲“互联网+”,背后有一个非常重要的概念,叫数据驱动。过去,我们的研究活动叫理论驱动,今天,数据驱动已经变成了人类社会研究中非常重要的概念。“大数据”概念最
4、早从哪里来呢?没冇确切的证据,但是IBM很早就开始谈大数据了oIBM给大数据的定义是“4个V”:数量(Volume)>形态(Variety).价值(Value)>速度(Velocity)o这是从数据本身做的定义。Bytes(字节)今KBTMBTGB今TB今PB今EB今ZB今丫B今BB今NBTDB1KB=210沿着IBM提出的“4个V”,先做一个简单的说明和解释。首先,从数量来看,大数据的数据量已经超出了任何个人在可接受时间范围内搜集、利用、管理和处理数据的能力了。2012年,对数据的计量已经从MB
5、级跃升到TB级了。现在讲人数据,基本都是在PB级及以上。这个量级,超出任何单部计算机乃至人型机的处理能力。其次,从数据形态来看,传统的数据,通常是结构化数据,大数据则是混合形态的数据。在大数据中,有一部分是结构化的数据,如SQL(结构化杳询语言)数据,更多的则是非结构化的数据,如口志、音频、视频、图片和地理位置等数据,大都是非结构化的。第三,从商业领域来看,大数据的价值密度比较低。传统的数据,通常是目标导向数据,有非常明确的价值,比如说CFPS(中国家庭动态跟踪调查)。大数据则是记录导向的,是为了
6、记录数据而不是为了得到某个特定事件的数据,不是为了解释某个事件而记录数据。这是数据获取方式上非常重要的变化。大数据第四个重要特征是速度。传统的数据,从测量到可用,需耍相当长的时间,赫尔曼•霍尔瑞斯在统计1890年人口普查数据时,发明了读卡机,用1年的时间完成了原本耗时8年的人口普查活动;CFPS从调查结束到数据可用,也需要1-2年的时间。大数据,儿乎随时可用,每时每刻都在记录数据,每时每刻这些数据也可用;不过,可用,也有一定的约束性。对研究而言,不是针对一个具体研究问题可用,而是说,如呆你想研究某
7、个尚未模型化的问题,可以随时截一段数据來,进行数据清理的可用。从社会研究的视角,我自己给大数据一个定义——大数据是痕迹数据汇集的并行化、在线化、生活化、社会化。数据汇集的并行化是一个计算机科学概念。并行,指可以同时运行很多个线程。在线化,就是数据本身在线上,不在你的桌面计算机或移动硬盘中。社会化,指每个人都有可能是数据的提供者。在过去,大多数都是由机构或者个人找“样本”提供数据;但是今天,每个人,只要接触传感器,甚至走在大街上,都是数据的提供者,同时,也是数据的使用者。生活化,则指数据的无处不在,
8、无论是工作中述是生活中,数据始终伴随着人们。简单地说,大数据,就是形态数字化、非结构化、在线流动着的数据,容量至少在PB级或以上,与社会行为相伴生、通过设备和网络汇集的数据。大数据是完整的,却不一定是系统的,它无时无刻都在记录着人类的行为。因此,对社会学研究而言,大数据是一种新的研究数据来源,一种永不停息的、流动的研究资源,不一定是对其他来源数据的全面替代。2大数据和社会学研究冇关系吗?大数据和社会学研究关系密切,对其应用,目前,看起来似乎没那么紧迫,且主要对实证社会学产生较大的影
此文档下载收益归作者所有