2016年6月25日星期六

[转]数据科学家:21世纪“最性感的职业”

小佛爷说
 

如果说"性感"意味着需求庞大而又为数稀少的素质,"数据科学家"这一职业已然称得上"性感"。


 

曾投过FacebookLinkedIn的早期风投公司格雷洛克风险投资公司就对于数字人才的紧缺感到非常焦虑,并因此建立了特别招聘团队。 


 

该团队负责人丹•波蒂略(Dan Portillo)说:"一旦有了数据,企业就需要能够管理和洞察它们的人"。

每日日一获

20066月,乔纳森•高德曼(Jonathan Goldman)进入商务社交网站LinkedIn工作。作为斯坦福大学物理学博士,他醉心于无处不在的链接和丰富的用户资料。虽然这两者通常只能形成混乱的数据和浅显的分析,但当他着手挖掘人际联系时,却从中发现了"新大陆"。


 

他开始构建理论、检验预设,并研究出了模型。通过这些模型,他可以预测出某账号所归属的人际网络。高德曼觉得,在探索基础之上形成的新功能也许能为用户提供价值。 


 

幸运的是,LinkedIn的联合创始人兼时任CEO雷德•霍夫曼(现执行总裁),在贝宝(PayPal)的工作经验让他对分析学的威力深信不疑,因此,他给了高德曼高度的自主权。


 

他给予高德曼一个不同于传统产品发布套路的新方式—在网站黄金页面以广告的形式挂出小型加载模块。这一测试最终大放异彩,成为了我们现在熟知的"你可能认识的人"(People You May Know)。


 

高德曼代表着组织中新的关键角色—"数据科学家"(Data Scientist)。他们是一群训练有素、乐于在大数据的世界中进行探索的高级专家。


 

在种类纷繁的职业里,数据科学家还只是个新生儿。这一概念直到2008年,才由本文作者之一D.J. 帕蒂尔和杰夫•哈默巴赫尔创造,随后LinkedInFacebook在数据和分析领域各领风骚。数据科学家在商业世界中崭露头角反映出一个事实:企业正在应对前所未有的庞大而多样的信息。


 


 


 

是数据科学家?


 

如果说,对大数据的利用很大程度上依赖于聘用稀缺的数据科学家,那么管理者面临的挑战就是学习如何发现和招聘这些人才并为公司所用。这些任务一旦与管理者的其他组织角色结合,便不再像看上去那么简单明了。
 


 

事实上,所有大学都尚未设置数据科学的学位(课程)。同样,数据科学家在组织中的诸多问题也未有定论,比如他们应该扮演什么角色,这一角色如何才能创造最大价值,以及该如何衡量他们的表现。


 

因此,解决数据科学家短缺的第一步,是理解他们在企业中的职责,然后再思考,他们应该具备什么技能?这些技能最容易在什么领域找到?


 

数据科学家徜徉于数据海洋的同时,最重要的是进行探索。为身边的世界导航正是他们的拿手好戏,他们在数据领域得心应手,能够将大量不规则数据组织起来,使之成为可分析的数据。


 

他们找出丰富的数据源,并与其他数据源(可能是不完整的数据源)连接起来,清理、简化运算结果。在充满竞争的世界中,挑战随时变化,数据流动不息,数据科学家能帮助决策者从特设分析(ad hoc analysis)转向与数据持续不断的对话。


 

数据科学家认识到所面临的技术限制,但是他们不愿意停下研究等待新解决方案的出现。一旦他们有了新成果,就非常乐于传播新成果,并阐明该成果对企业未来发展方向的影响。


 

通常他们在信息可视化展示以及令模式清晰化、更具有说服力方面颇有创意。他们依据数据所显示出的信息,为企业高管和产品经理提供产品、流程、决策方面的建议。


 

由于这项业务正处在发展初期,数据科学家往往还要承担起改进数据分析工具甚至开展学术研究的任务。雅虎是早期雇用数据科学家的公司之一,在开发数据分析工具Hadoop方面贡献良多。还有许多数据科学家参与了改善技术工具的过程,这种情况尤以数据驱动型企业为甚,如谷歌、亚马逊、微软、沃尔玛、eBayLinkedInTwitter


 

功的数据科学家应具备什么能力?


 

答案是:他(或她)应该是数据黑客、分析师、传播者和靠谱顾问的综合体,这样的组合可谓极其强大,同时也极其罕见。
 


 

数据科学家最基本和普遍的能力是写代码。但5年后,当比今天多得多的人把"数据科学家"这一头衔印在名片上时,这一点可能没那么绝对。比写代码能力更持久走俏的,是能够用所有利益相关者都能听明白的语言进行交流的能力。他们要能够展示出用数据说话的能力,包括口头表达和形象化展示,最好两者兼备。


 

但我们认为,数据科学家身上最重要的品质是强烈的好奇心,即透过现象看本质并将之提炼为清晰的、可验证的假说的能力。这一点通常需要联想思维,正是联想思维塑造了各个领域中最富创造力的科学家。


 

之所以把这个职位设置成为"科学家",就是其他他们能像实验物理学家一样设计实验装备,收集数据,开展多个实验并传播研究成果。谨记科学家的职业概念非常重要,因为"数据"一词很容易将研究引入歧途。


 

定量分析者也许善于分析数据,但却不擅长应对一大堆混乱无序的非结构化数据并将其整理为可分析的数据形式。一个数据管理专家或许擅长生成数据、将数据整理为结构化形式,但却不擅于将非结构化的数据结构化,也不善于对数据进行切实分析。表达能力不那么强的人可以成为传统数据专家,但却无法成为数据科学家。


 

数据科学家必须要拥有一套能力体系,包括坚实的数学、统计学、概率学以及计算机科学基础,还要有良好的思维习惯、具有商业感觉和客户同理心。


 

什么吸引数据科学家?


 

薪水当然是一个因素。一个出色的数据科学家会面对很多企业抛出的橄榄枝,薪水也随之水涨船高。一些供职于初创型企业的数据科学家说,他们已经提出甚至得到了一笔庞大的股票期权。即便一些人由于其他原因接受了该职位,薪资依然代表着受尊重的水平和企业对该职位价值回报的预期。


 

但是,我们对数据科学家的心理排序所做的非正式调查却显示出一些或许更基础、也更重要的东西。这群人想要想要站上浪潮之巅,实时地观察脚下滚滚而来的机会。


 

考虑到招聘和留住数据科学家的困难,企业应该思考出一个好的策略吸引他们来做顾问。大多数咨询公司都还没有配备大量的数据科学家,即使像埃森哲、德勤和IBM全球服务这样的"大象"们,也还处在为客户引入大数据项目的早期阶段。


 


 


 

本文所讨论的数据科学家们想要进行创造,而不仅是给决策者提供建议。因此,他们必须接触公司内外的社会实践。支持合作与技术分享的新的会议和非正式联盟正在不断涌现,企业应当本着"水涨船高"的理念鼓励科学家参与其中。


 

权限过少的情况下,数据科学家难有出色表现。他们应该得到进行试验和探索可能性的自由,也就是说,他们需要与企业其他部门密切联系。他们最需要与之建立联系的人应该是负责产品和服务的主管,而不是总揽企业全局的人。

 

面对的期待越多,数据科学家往往越有动力。有时,获取和组织大数据的挑战占据了太多时间和精力,使数据科学家难以进行预测和优化复杂分析。然而,如果主管们声明他们不满足于简单报告,数据科学家将会奉献出更多的精力来进行高阶分析。大数据不应该被等同于"小数学"。

没有评论:

发表评论