现在的职场竞争越来越激烈,不学上一两门新技能,保持自己知识更新,很容易被年轻后辈超越。有些人选择学一门外语,有些人选择学习职场上为人处事的能力。
随着大数据技术和互联网行业的蓬勃发展,数据分析师接触到的数据和应用的技术也在不断增加,这不仅为数据分析师提供了更大的发展空间,而且也对数据分析师提出了更高的要求。
传统的数据分析师的工作重心更多地体现在输出报表、提供分析报告等工作上,基于目前的发展趋势,数据分析师一方面需要强化这部分的技能,另一方面需要不断地学习和提高,掌握新技术,如数据挖掘、数据可视化知识以及R、Python、SQL 等编程语言。以上提到的知识和技能会在面试中得到集中的体现,只有掌握了它们,才能在面试中脱颖而出。
下面是7个关于数据分析师面试的时候会常涉及到的几个问题。
基本工具
包括规定动作和自选动作两类。
规定动作
SQL查询,从数据库中提取数据是数据分析的第一步。另外我们的数据规模是TB级的,所以还要能使用SQL让集群做一些简单的计算,不然都下载到本地的话运算资源是肯定不够的。可能还会问一些非常基础的问题,比如PRIMARY KEY、int、str、double之类。Excel:数据透视表、VLOOKUP、COUNTIFS、SUMIFS、VAR.P、条件格式等等,可能会涉及到诸如VLOOKUP中的TRUE和FALSE参数有什么区别,VAR.P和VAR.S有什么区别等细节问题。
自选动作
根据简历来问,简历上写什么就问什么,会问得比较深入。简历作为敲门砖,撰写也是非常重要的。Python、Stata、R、SPSS、SAS、EViews都算比较常见的数据分析工具。比如简历上写“精通Python”,所以就可能会被问到pandas,regular expression,DataFrame.iterrows()返回的是Series还是dictionary还是list of tuples,tuple和list的区别的时候好歹都得答出来吧……
逻辑思维
主要分为两方面,对业务逻辑的理解能力和行文的逻辑水平。
业务逻辑
对业务逻辑的考察主要通过自身以往的相关项目经历,所以至少要对简历上的项目经历非常熟悉,对答如流。对于业务指标,看是否可以快速理解它们之间的联系?对于新的数据需求,能否逻辑清晰地将它拆分成指标进行各种计算? 面对复杂的局部最优化和全局最优化需求,能否迅速找到关键影响因素并加以优化?思维和逻辑跟不上,做好这份工作也不容易吧。
行文逻辑
数据分析最终产出是一份报告,所以报告的整体文章结构还是很重要的,一定要先说结论,再讲具体摘要。
理论储备
也可以分为规定动作和可选动作两方面。
规定动作
主要是基础的统计学理论,如方差、协方差、算数平均数、几何平均数、中位数、众数、分位值、双峰数据、长尾数据、假设检验、期望迭代法则、贝叶斯原理等。
自选动作
根据简历来问,简历上写什么hr一定会问什么。简历里的写的内容自己要知道原理、适用条件、局限性等。不然随机聊起的问题你接不上来,场面就会很尴尬。
对细节的敏感度
由于数据分析师每天要关注大量数据指标,所以对细节的敏感度是非常必要的。这主要分为两方面,对统计口径和对数据的敏感度。
统计口径
统计口径一致是确保数据可比性的基础,这非常考验数据分析师的敏感度和行业经验。比如转化率,是点击算转化还是注册算转化还是购买算转化?配送时间,是从用户下单开始计时还是从订单确认开始计时还是从商品出库开始计时?客单价包不包括配送费、打包费、代金券形式的折扣优惠?
数据
面试者对数据异常波动、离群值、平均数没有代表意义等情况的迅速识别能力。比如已知套餐单价1,500,酒水单价300,平均客单价2,500,能不能马上想到这可能是双峰数据或者长尾数据,抑或既双峰又长尾的数据?
学习能力
互联网行业发展迅速,只看数据的存储就有Oracle、MySQL、Hadoop、Spark、Hive、Impala等一堆要学习的东西。互联网行业的从业者经常要面对新需求、新工具、新方法。能否迅速掌握新知识,解决新问题面试者必须证明给hr看。主要考察的方式是了解过往项目经历,或者做面试题。
排版和简单设计
数据分析报告必须简洁、清晰、重点突出。主要考察方式是出作业题让面试者限时交一份PPT出来。能掌握标准的设计语言将会使面试更出彩。
价值观
主要看工作热情、态度、道德水平等等,这方面的问题比较随机。
你或许可以感受到数据分析师这个岗位的特殊性。面试找工作不是一朝一夕就可以完成的事情,而且失败的面试经历未必是坏事,积累面试经验也是一种进步,希望这里可以帮到你。