刚毕业的大学生们,恭喜你们!欢迎成为劳动者的一员。在你所有可能申请的工作中,“数据科学家”这个风骚无比的职位也许最难得到的一个,同时也许是最具有潜在丰厚回报的一个。但是别害怕:Datanami在这里以一个实际数据科学家从业者的身份给你一些建议,告诉你怎样成为他们中的一员。
开始成为数据科学家的第一条建议是别被这个职位的要求所挫败。没有一个刚毕业的大学生能满足即是数学\统计天才,又精通市场、产品、网络安全,还是专业的Python、Java、R程序员。(提示:这就是为什么数据科学家被称为独角兽——因为他们不存在)
“在数据科学的屏蔽伞下隐藏着许多的技能,我们不能期望一个人能精通里面的所有东西。” Booz Allen Hamilton的数据科学家Kirk Borne说(http://www.boozallen.com/)“数据科学家人才短缺的最好解决方案是组成一个数据科学家团队。所以我建议有应该精通两个多个领域的同时对其他领域也能有一个基本的了解”
根据Kirk Borne所说的,你需要抓紧好好温习数据科学的核心技能,例如,机器学习、信息管理、统计学以及数据信息可视化。同时你也需要懂得数据库的周边知识和数据结构,最少掌握几门像Python、R、SAS、Spark这样的编程语言。熟悉图分析、自然语言处理、最优化也能使你的数据科学简历更好看一些。还需要进行数据建模和一些模拟练习。
“对学习物理学、生物学、天文学、化学或其它科学的学生来说,一个好消息是他们可以很容易地将它们的科学技能转换到数据科学这一领域”他说。
你应该返回学校继续修炼吗?
尽管最近数量可观的博士级别的数据科学编程者的出现一定程度上解决着这个“独角兽”短缺的问题,可是你不想再在学校待太长时间。一个硕士学位就已经足够了。Borne如是认为。
“最近越来越多的机构愿意雇佣既有一定课堂知识,又有一定实际经验的中等学位的数据科学家。”他对Datanami.说“学位最终对职业提升是十分重要的(对于一个包含商业分析的MBA来说也许是最重要的),所以要重视获得你的学位——它只是在你刚开始从事数据科学家职业之前不是必须的。”
Hadoop服务提供商Qubole (http://www.qubole.com/)的CEO也针对评估做出了回应
。虽然具有所需的如数学、数据挖掘、统计学、概率论、SQL等坚实背景,数据科学家还是有很多路要走,最终要从象牙塔进入产业界来获得最重要的元素:有趣的数据。
“在产业界去获得这些技能是十分重要的”Apache Hive联合创造者Thusoo说“你有坚实的知识基础,但是为I了运用这些技能你需要获得数据。很多有趣的数据集是和现实产业紧紧绑在一起的。现在不再像20或30年前那样——绝大多数的数据都在研究机构”。