现如今,世界上最毁天灭地的
不是核武器,也不是病毒武器
而在我们的身边……
没错,它就是大数据。
3月,美国纽约时报和英国观察者报共同发布了深度报道,曝光Facebook上超过5000万用户信息数据被一家名为“剑桥分析”(Cambridge Analytica)的公司泄露,用于在2016年美国总统大选中针对目标受众推送广告,从而影响大选结果。
Facebook和 Cambridge Analytica丑闻的爆料人:Christopher Wylie
01
社交媒体搜集大数据
“我们定位你的选民,打动他们让他们采取行动。”
这是数据分析公司Cambridge Analytica政治服务部门的广告语。如今,这家由共和党大金主、对冲基金亿万富豪罗伯特·默瑟投资,美国总统特朗普前首席战略顾问班农担任董事的数据公司,再次把Facebook推向了风口浪尖。
Cambridge Analytica是如何收集用户数据的呢?
通过收集Facebook数据,了解用户的性格特征:参与测试的受访者需要用自己的Facebook账号登录应用,研究人员则可以通过开发者端收集登录者Facebook账号上的个人信息和点赞记录。
除了受访者本人之外,该应用还能收集受访者Facebook好友的数据资料。一共有约32万名美国选民参与了此次测试,但加上每人的Facebook好友,一共收集到了超过5000万Facebook用户的数据。
得到数据后,研究人员将个性测试的结果与Facebook用户的数据进行匹配,以推测用户的心理模式并制定算法。这之后,研究人员将所有Facebook用户的数据与选民记录等资料相结合,运用算法为每位选民推算出上百个数据点,包括年龄、性别、工作、政治观点、具有煽情点的兴趣爱好等。掌握选民的个人背景后,Cambridge Analytica再根据不同选民的特征推送极具针对性的政治广告和消息。
想想平时我们见到的那些“非常懂你”的广告推送,其实也是同样的一波操作。
02
Facebook操纵选举?
此消息一出,首当其冲就是Facebook股价大跌:
当地时间3月19日,Facebook股价开盘后即出现陡状下跌。
马斯克与小札“割袍断义”,单方面删除了特斯拉和SpaceX的Facebook账号。
丑闻不断发酵,爆料人Christopher Wylie甚至将矛头直指硅谷大佬Peter Thiel,声称他联合创始的大数据公司Palantir与Cambridge Analytica进行了秘密合作,违规利用Facebook用户数据。
那么硅谷最神秘低调的Palantir又是什么来头呢?从官网看,它是一家大数据分析公司,估值超过200亿美元,绝不上市;员工不许接受媒体采访;记者不许拍摄公司内景;不许员工接触客户的真实资料,所有客户和项目均以代号命名。
然而仔细分析媒体只言片语的报道后,你会发现Palantir 的第一笔投资来自CIA(美国中央情报局)旗下的In-Q-Tel风投基金,第一张订单也来源于美国政府部门。发展至今,30%-50%的业务与政府事务挂钩。
按照之前新闻的说法,2016年美国总统大选,是Facebook暗中推特朗普上台;同年的英国脱欧,也是Facebook一手斩断英国和欧盟的姻缘……
这么一想,真是细思极恐。
03
数据分析成热门岗位
Facebook 公司的首席分析师Ken Rudin曾提到:“大数据关系到公司的生死存亡”。
它是一把双刃剑:通过大数据获取用户画像,能对企业带来巨大帮助;但也能利用大数据有目的性地引导用户,是一个无形的武器。随着人工智能和区块链的兴起,大数据的作用会愈发凸显,数据分析也成为炙手可热的岗位。
近年来,数据分析专业也成为留学生们竞相申请的专业,热门程度几乎赶超金融:
美国DA/DS专业项目数量增长情况
与之密切相关的其他专业:
Business Intelligence/Analytics/Informatics (商业智能/分析/信息)
Decision Analytics/Science (决策分析/科学)
Information/Quantitative Management (信息/量化管理)
Information/Management Science (信息/管理科学)
以及更为specific的专业:
Strategic Analytics(战略分析)
Risk Management (风险管理)
Health Data Science(医疗/健康领域的DS)
Data Science for Public Policy(公共政策领域的DS)
04
数据行业最常见岗位+薪资
从处理数据的各个步骤可以看出各个岗位的参与环节:
这里介绍一下5个最常见的岗位:
1)数据分析师 Data Analyst:指熟悉相关业务,熟练搭建数据分析框架,掌握和使用相关的分析常用工具和基本的分析方法,进行数据搜集、整理、分析,针对数据分析结论给管理销售运营提供指导意义的分析意见。2017年3月更新平均工资水平:
2)数据工程师 Data Engineer:收集和处理大规模的原始数据(包括脚本编写,网页获取,调用APIs,编写SQL查询等);将非结构化数据处理成适合分析的一种形式,然后进行分析;根据所需要的和专案分析商业决策。平均工资水平:
3)数据科学家 Data Scientist:通过统计模型、编程实现,设计、开发和部署能支持业务决策算法和工具,管理大量数据,创建可视化以帮助理解。平均工资水平:
4)商业分析师 Business Analyst:中文也叫业务分析师。是一种介于客户和IT团队之间的角色,负责在IT项目中负责发掘、分析、传达和确认客户需求;同时了解有关业务上的各种问题并发现新的机会,搭建业务和IT人员之间的沟通桥梁,并推荐问题的解决方案以实现组织的目标。平均工资水平:
5)市场营销分析师 Marketing Analyst:主要帮助公司和组织决定以什么价格,向哪些客户,销售哪些产品和服务。 通过研究市场条件,竞争对手的活动和消费者行为来得出结论。更专注于行业或公司内部的市场营销职能,主要从市场的角度分析数据团队提供的结果,给出建设性的意见。平均工资水平:
05
美国现在致力于大数据分析的公司
1. Cloudera
Cloudera 技术很强大,CEO是前Facebook高端数据科学家哈默巴赫,发展前景非常乐观。主要注重的是Hadoop ecosystem的建立和把控,所覆盖的范围比较广,可以作为一般性互联网公司的首选。
2. Horton works
Hortonworks 更多专注于细分市场,主要专注于machine log的挖掘和处理, 因此发力更集中,前景也不错。
3. Palantir Technology
目前大数据领域估值最高的非上市公司,在国防、金融等领域有成熟的产品和解决方案。国防安全最著名的案例是帮助美国政府猎杀本拉登。金融领域在反欺诈领域比较突出,通过将各类数据进行关联,分析,和可视化,为专业分析人员提供决策支持。在同一方块中的Digital Reasoning是这家公司紧密的合作伙伴,在分析技术上有合作。
4. Tableau
第二个上市的大数据企业,专业的数据可视化工具公司,将数据运算与美观的图表完美地嫁接在一起。它的程序很容易上手,各公司可以用它将大量数据拖放到数字“画布”上,转眼间就能创建好各种图表。目前很多大型新闻媒体的图表都是用这个软件生成的。
5. DOMO
商业智能软件公司,用户数量增长迅速,而且收入也很高,DOMO的强项在于将很多不同来源的数据以实时而且可视化的方式来进行展现,Domo的客户包括eBay、The Sage Group、Telus Corp和《美国国家地理》等大牌企业。