欢迎来到天天文库
浏览记录
ID:28120631
大小:746.00 KB
页数:10页
时间:2018-12-08
《美国总统大选也变成了大数据科学家的角斗场.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、美国总统大选也变成了大数据科学家的角斗场 近年来,大数据在各行各业落地开花,得到了广泛的应用。美国总统大选也变成了大数据科学家的角斗场。2016年的美国总统竞选中,希拉里·克林顿采用了大数据分析来优化竞选策略,然而她还是败给了唐纳德·特朗普。这篇发表于牛津出版社博客(OUPBlog)的最新文章,对其失败的原因进行了分析。 本文作者加里·史密斯是美国波莫纳学院经济学教授,耶鲁大学经济学博士。主要从事金融市场效率,统计谬误和数据滥用方面的研究。累计发表学术论文80余篇,专著12本。他的评论文章曾发表于福布斯杂志、
2、纽约时报、华尔街日报、商业周刊等。史密斯是牛津大学出版社即将出版的新书《TheAIDelusion》的作者。 HowTrumpbeatAda’sbigdata 2008年的民主党总统初选本该是希拉里·克林顿的加冕典礼。她是当时胜算最大的总统候选人,党内支持率最高且竞选资金雄厚。 然而希拉里并未如愿以偿。一位名不见经传的黑人男子——贝拉克•奥巴马最终赢得民主党总统候选人提名。奥巴马在随后的总统选举中一举击败共和党候选人约翰·麦凯恩。让人难以抗拒的个人魅力和一流的演讲口才是奥巴马的制胜秘诀,而大数据在竞选中
3、扮演的角色似乎更为重要。 奥巴马的竞选团队收集了每位潜在选民的个人信息并录入数据库,包括:年龄、性别、婚姻状况、种族、宗教信仰、地址、职业、收入、车辆信息、房屋价值、捐赠历史、杂志订阅、休闲活动、脸书好友以及能找到的任何其它相关的信息。 竞选团队每周对潜在选民进行电话调查,试图测算出每个人投票的可能性及将票投给奥巴马的概率。在统计学上,选民的投票倾向与某些个人特性紧密相关,利用大数据建模就能推断出潜在选民的投票倾向。因此,奥巴马竞选团队能够利用数据库中的选民信息,建模分析并预测每位选民的投票可能性及支持奥
4、巴马的概率。 这种数据驱动的分析模式使得奥巴马的竞选团队能精准地定位到每位选民,并采取有针对性的措施(电子邮件、普通邮件、面对面拜访或电视广告)来影响他们,从而获得政治捐款或是鼓动投票。2008年1月是总统大选的关键时期,这时奥巴马就已筹集到3600万美元捐款,创下候选人筹款纪录,这一数额几乎是希拉里筹款额的3倍。在奥巴马获得提名后,筹款仍在继续。2008年全年,奥巴马共筹集到7.8亿美元捐款,是其竞选对手约翰·麦凯恩募集金额的两倍多。单就筹款金额而言,麦凯恩已毫无胜算,最终奥巴马以365票对173票战胜麦
5、凯恩赢得大选。 8年后,希拉里·克林顿再次参加总统大选,并利用大数据助阵。 希拉里的竞选团队聘请了60位数学家和统计学家,其中几位曾为奥巴马服务过,他们开发了一款名为“阿达”(Ada,为纪念19世纪的女数学家阿达·洛芙莱斯)的软件程序。若成功当选美国历史上首位女总统,希拉里将向世人炫耀“阿达”就是其成功的秘诀。多么棒的故事! 希拉里竞选团队 希拉里的竞选团队将70%的竞选资金用于电视广告,而这些广告上花费的每一美元都由“阿达”来决定。团队并没有征求有经验的媒体顾问的建议。 没有人知道“阿达”是如何作
6、出这些决策的,但人们深信,分析了海量数据的她功能非常强大。所以,人们觉得她就像一个无所不知的女神。无需置疑,只需听从。 我们都知道,在“阿达”的程序设计中,蓝领选民是民主党稳定的票仓,因为一直以来他们都支持民主党,上一次投给了奥巴马,所以这次也会一如既往地支持希拉里。有了蓝领选民的绝对支持,希拉里只要说服少数派和自由派精英为其投票就能胜选。 民主党数据分析公司官网 然而这一次,大数据失败了。 “阿达”只是一个计算机程序,和所有计算机程序一样,它们都缺乏常识,或者说并没有智慧。任何一个关注总统选举的人都
7、注意到希拉里在与伯尼·桑德斯的对决中险些败下阵来,而伯尼·桑德斯只是一位来自佛蒙特州的籍籍无名的74岁参议员,而且他还是一名社会主义者。在他决心挑战希拉里之前,甚至还不是民主党人。对于这样一匹黑马,人们肯定会试着弄清楚为什么桑德斯能做得这么好,然而“阿达”忽略了这些。 当希拉里在密歇根州初选中被桑德斯击败时,那些经验丰富的政治专家和竞选工作人员们显然知道原因。他们实地与选民沟通过后,就能感受到桑德斯的民粹主义倾向所拥有的巨大的吸引力,并且知道不能想当然地认为蓝领选民一定会支持民主党,然而“阿达”却没有注意到这些
8、。 “阿达”的分析数据只覆盖了希拉里的拥趸,并没有考量更大规模人群情绪的变化。因此,首先是桑德斯被忽略,后来则是唐纳德·特朗普。因为“阿达”的分析模型中没有衡量热情的参数,即使是大数据也无法识别出选民的能量和激情。这就意味着希拉里数据驱动的竞选策略缺失了对选民能量和激情的考量。对于一台计算机而言,如果某些参数无法测量,就不会纳入分析范围。 比尔·克林顿可能是我们见
此文档下载收益归作者所有