以服务于中国广大创业者为己任,立志于做最好的创业网站。

标签云创业博客联系我们

导航菜单

投资项目分析师有用吗 项目评估分析师

原地址:www.shulanxt.com/doc/dbdoc/sjkxjv

Medium网站上的很多用户都在寻找数据科学家或数据分析师的职位,所以他们对这两个职位的面试过程都很感兴趣。树懒先生来就这个问题发表自己的看法。

一、数据科学家面试

数据科学家有望在自己的公司中实现手动流程的自动化。通过使用sklearn和TensorFlow等库中的机器学习包,他们可以提取数据、清理数据、训练和评估模型,并为最终用户提出建议或预测。在这个过程中,一部分侧重于编程和算法,而另一部分侧重于软技能,例如开发业务问题和向最终用户解释结果。您还将使用木星笔记本等工具,以及Python和R(有时是SAS)等编程语言。

面试情景

数据科学家面试的准备过程可能让人抓狂。希望下面的步骤能给你带来一些启发和帮助,让你在接下来的数据科学家面试中充满信心。

一般来说,招聘过程包括招聘人员或经理对你的电话筛选。之后,与团队就概念和编程进行面试(有些面试不包括编程,但会让你对公司未来可能遇到的常见业务问题进行评估项目)。接下来,你需要向其他数据科学家或高级产品经理解释你的发现。最后,总结一下你从之前的面试中学到了什么,为什么你是这个职位的最佳人选。

二、数据分析师面试

理想的数据分析师应该能够查询数据库表、执行连接、子查询和报告数据请求。将与其他利益相关方合作,收集与每个索赔相关的内容。会使用SQL、PostgreSQL等工具或其他查询平台,包括Tableau、PowerBI等图表工具。

数据分析师的整个面试过程中有很多步骤和数据科学家非常相似。但两者的区别和独特之处在于面试过程中的概念和编程题目。面试开始时,招聘人员或招聘经理会给你打电话面试。然后,您将会见团队中的其他数据分析师,并与他们讨论数据库等关键概念。之后,您需要完成一个编程挑战,这通常涉及到连接和子查询等常见的SQL问题。接下来,您必须向另一个数据分析师或利益相关者(如客户成功经理)解释您得到了什么

结果。最后,你会和招聘经理讨论之前的面试,以及你对整个团队的看法,并讲讲为什么你可以胜任该公司的数据分析师。


三、相同点与不同点

接下来你会看到,数据科学家和数据分析师的面试是一个相似的过程。不过,虽然他们的过程可能相似,但细节却大有不同,这点我会在后文提到。以下是面试过程中的一些共性:


相同点:


  • 招聘人员的电话初选——与招聘人员间的通话
  • 招聘经理的筛选——与未来招聘经理的通话
  • 专业概念面试——与职位专业人员面试(团队中的另一位数据科学家或数据分析师)
  • 专业性编程面试——与职位专业人员面试(团队中的另一位数据科学家和数据分析师)
  • 领导面试——向非技术用户解释结果
  • 招聘经理的最终面试——总结自己为什么适合该职位

常用工具:SQL,Tableau和Jira(票务平台)


不同点:


虽然过程上大致相同,但在这两个职位在专业面试的方面还是有很大区别。


1.专业概念面试


数据科学:


常见的机器学习算法,比如随机森林(random forest)和逻辑回归(logistic regression)。


常见的机器学习和数据科学,比如无监督学习和有监督学习。


数据分析:


join之间的区别,如内连接(inner)、外连接(outer)、左连接(left)和右(right)连接


  • 子查询(Sub-queries)
  • 索引编制(Indexing)
  • 通过…分组(Group by)
  • Where子句(Where clauses)

2.专业编程面试


数据科学:


使用Python进行编程(循环for loops,数组arrays和函数functions)


用R进行编程


在Jupyter Notebook中编程并注释代码


有时候,不一定会是编程面试,也可能是一项take-home项目,需要后续合并数据,探索性分析和清理数据,构建模型,输出并对结果进行解释。


数据分析:


SQL查询


Tableau(不是编程相关,而是一种特殊技能,需要了解常用界面中的常见函数和计算)


3.领导力面试


数据科学:


向非技术用户解释模型及预测


数据分析:


向非技术用户解释查询及结果


四、总结

你可以发现,这些职位和他们面试过程间出现的相似之处可能比你想象得多。其实,很多相似之处都来自整体面试的过程,以及一些常见的工具,如SQL。其他相似之处是开发新项目、会见不同的利益相关者所需要了解的软技能。


毫无疑问,职位间的专业性之间是存在关键差异的。比如数据分析师会使用Tableau进行更为复杂的SQL查询和报告,而对于数据科学家而言,会重点关注例如决策树(decisions trees)和时间序列(times series)之类的常用机器学习算法,还会使用Python编写一些典型的函数以及用于将来职位的循环(for loops)