Airbnb 数据科学家的建议:如何走出学术界,向企业转型?

来自:36kr      时间:2017-06-01
编者按:对于学术人员和研究人员来说,硅谷以及整个科技行业长期以来一直是对他们极具吸引力的一个就业方向,但要实现从学术界到企业的跨越其实并非易事。Airbnb 数据科学团队成员 Avneesh Saluja、 Alok Gupta 和 Cuky Perez 在本文中为那些希望从学术领域转换到 Airbnb的求职者提供了一些建议,向他们介绍了 Airbnb 在学术界所寻求的一些技能和品质。

在你读研究生阶段,对你而言,继续留在这象牙塔内看上去似乎是唯一可行的职业选择。原因也显而易见:你的导师和同学很有可能会鼓励你也遵循他们所选择的职业发展路径前进。确实,这种选择性偏见在你周围的人群中表现的最为强烈。如果你是一名教授,你就会认为唯一能够扩大你知识体系、教授并且指导他人的工作就是留在这个学术环境内。

但是,纵观现在的博士就业市场,我们便会发现每年新获得博士学位的人数其实已经超过了现有需求职位的数量。并且,对于学术人员和研究人员来说,虽然硅谷(和整个科技行业)长期以来一直是对他们极具吸引力的一个就业方向,但要实现从学术界到企业的跨越其实并非易事。Michael Li 在他最近的一篇博客文章中记录了完成这一跨越所需的心态转变,并且在对快速呈现具有业务影响力的结果(企业领域)和呈现完美的结论(学术领域)进行对比这一背景下,对这一转变进行了具体描述。

虽然我们对这一此消彼长的转变持赞同态度,但在 Airbnb,我们感觉这种心态转变其实更加微妙一些。在这篇文章中,我们首先探讨一下,对于那些希望能够从学术领域转换到 Airbnb的求职者来说,我们希望在他们身上看到的一些技能(包括硬技能和软技能)。然后,对于那些希望能够进入硅谷快节奏的初创企业环境的人,我也为他们提供了一些具体的建议。

在从学术界跨越来的数据科学家身上,我们希望看到的四点:

对于技术型企业和初创企业中那些与数据相关的所有业务来说,数据科学都是非常重要的一个术语。数据科学是数学/统计学、商业领域知识和“黑客”三方面知识的交集。数据科学家需要具备从数据中洞察问题,从而推动公司指标良性发展的能力。在 Airbnb,这可能意味着处理数据,以决定下一次启动哪个实验或者是构建一个机器学习模型来优化用户体验。在 Airbnb,在对那些从研究生院高等学院课程毕业的人员进行考察时,除了技术因素以及核心价值观一致两大方面以外,我们还会考虑以下四个方面:

1. 初学者心态

由于您已经取得了高等教育学位,可以想象您可能已经处于该领域的顶尖水平,从学术上来看也一定是非常成功。但是,学术上的成功和经验并不一定就意味着企业领域内的成功。我们希望这些申请求职者能够保持冷静的心态,能够意识到他们在业务领域存在一些不了解的内容。Airbnb 导师文化氛围浓厚,非常注重员工的个人成长,来到 Airbnb 并不意味着学习生涯的结束,还有许多需要学习的地方。那些有着强烈的学习欲望,秉持开放的思想,能够在他们的专业领域之外拓展新技能的求职者,正是我们需要的人。

2. 自启动意识

我们希望这些获得博士生学位的求职者懂得自我管理这门艺术。毕竟,研究生阶段,他们应该学会了如何进行、如何安排并且优化自主学习。老道的研究人员通常会更早地分辨出研究方向是否接近死胡同,并迅速地调整自己,关注那些更有成效的研究方向。在竞争性领域进行的研究也会为他们挑战同行、推翻假设提供机会。在 Airbnb 数据科学团队中,我们希望他们能将这一特质转化为不接受现状,用于打破假设的界限。

3. 注重交流沟通

有些情况下,我们会发现高等学位获得者在沟通方面表现不佳。Airbnb 是一个非常注重协作性的工作环境,数据科学家除了与其它数据科学家进行合作以外,还会与工程师、设计师、产品经理和非技术人员合作。擅长数据处理技能是很重要的一个方面,但是在 Airbnb,我们需要这些数据观点能够很好地传达给所有观众,从团队的数据科学家到公司的 CEO,否则,这些建议可能就无法发挥它们本该有的作用。所以,无论是书面还是口头交流,对于观点、方法和假设的阐述必须清晰、令人信服,并且让观众产生同感。

4. 是短途冲刺,而非马拉松

在学术界发表文章可能需要数年时间,但是在企业领域,要做出成效的周期明显要短得多,速度也快得多。但这并不意味着质量就低,只是在 Airbnb,我们希望能够尽快得出数据产品的一个版本,然后继续迭代进行潜在的改善。在 Airbnb 数据科学部门求职者面试过程中,我们寻找得是一种企业家精神,能够成功通过的求职者需要提出一个完美的解决方案,来推出一款数据产品或者是分享自己的观点。

给有意向做数据科学家的学术人员的四个建议

在从象牙塔向企业领域进行过渡时,学术人员的个人经验会由于其所处的不同领域而存在很大的不同。鉴于现在企业领域和学术领域(尤其是计算机科学和应用经济学领域内)之间存在主题的紧密耦合现象,一个研究思想到整合到最终产品之间的时间差由以往的几年时间缩短到现在的几个月。因此,那些实现这一学术到企业不同领域跨越的人,往往拥有了这项工作所需的“硬技能”,例如扎实的编程和计算机科学知识。但是,学习软技能,并且让自己的心态真正的适应工业企业领域,就没那么容易了。我们将这种心态转变分成为四个方面:

1. 将更多的想法和创造力放在考虑如何解决问题上

在将核心问题从现实中包裹着这一问题的杂乱细节中提取出来这一方面,学术研究确实有着出色的成果。有时,我们得到的是一系列经过精心策划和清理过后的培训数据,评估也是建立在证据充足并且有其它许多人已经评估过的基准测试集基础之上。一些想法可能会用于进行额外的数据清理,数据中包含的大部分信息,尤其是培训标签,都是给定的。其他时候,我们可能会收集我们自己的数据,但是这些数据也是来自于我们严格控制的领域或者是我们能够实现数据污染最小化的实验室。

但不幸的是,在企业领域却并非如此。我们必须首先将更多的想法和创造力放在考虑如何解决问题上。我们从存入数据中提取或导出的标签是我们需要用来解决问题的信号吗?仪器有错误吗?我们是否已经存入了我们所需的信息?数据科学家需要深入了解问题,并使用该信息来转换问题和数据,产出有意义的东西。能够让自己的产出结果在快速变化的环境中发挥作用,所需要的是绝不低于解决抽象研究问题所需的创造力。

2. 80% 准则

在学术界,我们往往是以一种与企业领域非常不同的机制来对待问题。质量培训和测试数据优先,我们通常是以探讨新颖的、最先进的解决方案为任务,将现有的已经很强大的性能提升到更强大的层次。另一方面,企业领域的任务则是部署一个以前没有的模型。没有可以比较的对象,将内在评估指标(例如AUC)转换为企业影响力极具挑战性,同时又具有很大的风险。

考虑到这些现实情况,建议在这样的条件下先部署一个不完美的模型,但是要“达到 80% 的要求程度”。因为如果一开始就对其余的 20%进行优化,那这不仅是对优先次序(“过早优化”)认识不足的一种表现,而且由于内在和外在评估指标的断层,这种 20% 的优化可能根本就不具有现实可行性。

3. 知识效应的最佳平衡点

虽然 Michael 在他的帖子中提到,发挥底线影响比传播知识更重要,但在 Airbnb,我们的终极目标是实现这两者之间的平衡状态。我们中有许多人一开始会选择进入学术界,就是因为我们是发自内心地喜欢产出和传播知识,到了企业环境内,能够有效地传播知识框架,避免炒冷饭、做无用功则是他们很重要的价值所在。为此,Airbnb 已经创建了一个知识库,并在最近进行了开源。这个知识库就是一个我们内部人员进行评论的出版物论坛,我们鼓励数据科学家能够尽可能积极地参与到这一论坛当中。除此之外,我们每周还会举行研讨会,数据科学家或者领域内的其它领导者可以在研讨会上展示他们的工作和成果。我们在整个公司内部都强调导师文化氛围。

4. 积极主动的态度

一个成功的研究人员不仅要了解各种困难问题的解决方案,还要发出正确的问题。这就需要积极主动的态度,需要鉴别机会、抓住机会,然后摸索正确的调查方向,而不只是一味地等待着别人将问题交到自己手上。积极主动的探究问题是学术界一个非常优秀的作风,也正是因为这一品质,Airbnb 鼓励顶级学者能够向我们发出求职申请。

在这里,我还要重申一条众所周知的名言:“聘用聪明人,然后再告诉他们该怎么去做这是毫无意义的事情;我们聘请聪明人,是希望他们告诉我们该怎么去做”。我们聘用那些具有不同学术背景和资质的人,正是因为他们所拥有的这些不同的优势能够赋予我们一系列独特的工具,用来解决我们在 Airbnb 所遇到的各种有趣的并且具有挑战性的问题。

翻译自:medium.com