欢迎来到天天文库
浏览记录
ID:22762960
大小:462.46 KB
页数:15页
时间:2018-10-31
《新浪微博数据:2016年幸福中国白皮书》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、幸福中国白皮书(2016年)清华大学社科学院幸福科技实验室微博数据中心一、数据采集本次数据由微博数据中心提供,采集自2016年中国所有用户发送的微博信息。2016年底微博月活跃用户数量已经突破3亿,本次报告正是基于该大数据样本的社会科学研究报告。数据采集步骤如下:1.微博数据中心采集了2016年的微博所有数据2.进行分词处理3.根据清华大学心理学系做的类似研究中产出的词表进行匹配4.排除了微博系统认定为垃圾的账号的相关发博5.进行否定词处理6.按照P(快乐)E(投入)R(关爱)M(意义)A(成就)五个维度对所有341个城市进行2016年的每个日期的汇总
2、*本次数据不包括港澳台地区二、数据计算1.任何维度的得分等于这个维度的正向词出现的总数除以负向词出现的总数,即:2.对PERMA各维度的得分计算Z分数,即该城市的得分在全国所有城市的得分里,距离平均值有多少个标准差:3.幸福指数(WB)为各维度Z分数之和,即:WB=åZx注意此处定义的幸福不仅仅是主观幸福感,即快乐的心情、良好的感觉,而是积极心理上所定义的人生蓬勃状态,是一种包括了快乐、投入、关爱、意义和成就的全面的、可持学续的、包括了主观和客观的幸福。三、数据清理部分城市PERMA得分异常的情况,将去除任何维度上离平均值4个标准差之外的城市,共11个
3、。因此有效幸福计算的城市总数为341–11=330个。四、数据分析4.1中国幸福地图1.省级根据前述计算WB,2016年的中国省级行政区划幸福地图如图所示,绿色代表幸福指数高,黄色代表幸福指数低。省、直辖市、自治区排名排名省、直辖市幸福指数排名省、直辖市幸福指数排名省、直辖市幸福指数1江西67.9113河南50.6725陕西43.602浙江58.0514山东49.7826甘肃43.473湖南56.5415河北49.5227北京41.604重庆56.5016辽宁49.3828西藏40.695福建56.5017黑龙江49.2329内蒙古40.466广东55
4、.6818上海46.9330宁夏37.267安徽54.5119广西46.8331青海36.038江苏53.3020山西46.479四川53.0121新疆46.2610贵州52.6122吉林44.8311海南52.5123天津44.8012湖北51.0124云南43.922.地级市2016年的中国城市幸福地图如图所示,绿色代表幸福指数高,黄色代表幸福指数低。2016年微博幸福指数前20名城市排名城市幸福指数排名城市幸福指数1泸州91.1511抚州75.132和田84.3312赣州73.533铜陵82.7813眉山73.384鹤岗81.1314三明72.3
5、05安阳80.4015自贡71.156黄山78.7816吉安70.757阿里77.6517景德镇69.358衡阳76.5518宜春68.589河源76.4519陇南68.5010鹰潭75.9520安庆68.302016年微博幸福指数重点城市排名排名城市幸福指数排名城市幸福指数排名城市幸福指数35宁波64.18163青岛48.18262长春42.2344大连60.90172武汉47.75268福州41.8861南昌57.26178哈尔滨47.38271昆明41.7572重庆56.50188上海46.93272南宁41.7079合肥55.43221贵阳45
6、.33273北京41.6086厦门54.31228天津44.80277西安41.03104海口52.62238石家庄44.28281太原40.60111深圳52.02242郑州43.90295兰州39.05117杭州51.56245成都43.53304呼和浩特37.73139长沙49.89250沈阳43.18320拉萨35.80146南京49.42251乌鲁木齐43.10321银川35.73155广州48.44257济南42.60325西宁33.034.2幸福与GDP的关系清华大学幸福科技实验室从国家统计局下载了各地级市的2016年GDP总值,并结合该
7、市人口,计算出各市人均GDP(其中有70个城市的数据无法获得,最终得到279个城市的有效“幸福-人均GDP”数据对)。结果发现,幸福与人均GDP呈现明显的倒U曲线。以下是曲线拟合结果(注意为了方便显示,横坐标为人均GDP的对数,而非人均GDP本身)。DependentVariable:WBModelSummaryandParameterEstimatesEquationModelSummaryParameterEstimatesRSquareFdf1df2Sig.Constantb1b2Quadratic.0283.7642266.024-211.4
8、0791.158-9.785TheindependentvariableislogGDP.根据
此文档下载收益归作者所有