跳至主要内容

“我快毕业了,想找数据科学的工作,能分享下你的经验吗?”

这些年来,LinkedIn上总是能收到类似的站内信,累计下来和不下20个人聊过天。仔细想想,大部分人问的问题都很类似,需求也基本相同(想找工作/实习)。今天想挑几个大家都好奇的问题来说说。


先简单介绍一下我的经历。我学的是经济+统计,本科毕业后就直接工作了。第一份工作是经济咨询 (economic consulting),不同于管理咨询,有非常多的数据分析需求。两年后跳到了F家。刚开始的title是Operations Analyst,后来转title成了Data Scientist。在F家做了将近5年后跳到了N家,title比较奇怪叫Analytics Engineer,但和F家的Data Scientist基本做的是同类型工作。总体来说,我走的主要是Analytics Track外加一些Inference Track(下面会聊不同的Track),比较少做modeling。

好了进入正题吧,罗列一下大家都好奇的问题 + 一些常见的误区吧。


Photo Credit: Franki Chamaki

1. 个人技能

1.1 问题:“Data Scientist / Data Analyst / Business Analyst…到底有什么区别”
数据分析行业的title特别多,让人非常困惑。遇到过new grad说只想看Data Scientist title的工作,不考虑Data Analyst。也遇到过new grad说担心Data Scientist的要求太高,只想关注Data Analyst的工作。然而实际上,数据分析行业对于title并没有统一的定义。举个例子,F家的Data Scientist, Analytics需要的技能基本等同于G家的Product Analyst,也基本等同于N家的Analytics Engineer。如果一个求职者不知道这些,只是一味地去找“Data Scientist” title的职位,那可能会错过很多其实相似的职位。为什么会出现这个情况呢?除了没有统一的定义之外,很多公司为了能吸引更多的求职者,会尽量把title写成Data Scientist —— 科学家听起来多厉害呀。这个方法亲测有效,可以吸引一大波求职者😝 那求职的时候改怎么应对这样的title不统一的情况呢?有3点:
  • 依靠大体上的判断:从大体上来分,Data Scientist的technical skill expectation一般还是比Data Analyst更高,尤其是在一个公司又有Data Scientist又有Data Analyst这两种职位上的。当然,这个说法并不一定适用于cross company comparison,比如G家的PA = F家的DS
  • 看具体职位的Job Description:这是一个最靠谱的手段。Title太迷惑,但Job Description是骗不了人的。可认真读一下Job Description上面的Requirements和Responsibilities
  • 了解自己的需求:在读Job Description的时候,思考的维度不用局限于这是不是想象中的Data Scientist,而是应该关注对岗位的描述感不感兴趣,背景和要求匹配不匹配。真正找到喜欢又合适的岗位才是最重要的,title都是排在后面的

1.2 误区:“Data Scientist = 做Modeling的”, “厉害的Data Scientist主要是Technical特别强”
这个恐怕是对Data Scientist一个很常见的误解,也是比较狭义的定义。广义上来分析一下Data Scientist到底是做些什么的吧。
  • 从支持的业务部门来分,基本可以分成Product Org和Business Org。有一些大一点的公司还会有Infra Org和Research Org。根据Org的不同,Data Scientist需要解决的问题不同。比如Product Org的目标是把产品变得更好,通过改feature,改设计来增加日活等等,key lever is the product。有一些公司也会把算法归于product的范畴之下, key lever就是核心算法啦(插一句,很多公司的核心算法是software engineer做的,并不是Data Scientist)。Business Org的目标是增加revenue,key lever是sales and marketing programs,也有一些internal product和process来助力sales和marketing。有些公司会把Product Org的数据分析岗叫做Product Analyst,而Business Org的数据分析岗叫做Business Analyst。这个是业务部分的分法
  • 虽然业务部门不同,但数据分析岗的skillset基本还是处于一个大框架的范畴下的(如图)。大方向上可以分3个Track:Analytics,Inference,和Modeling。观察下来,现实中的Data Scientist基本都会主攻一个Track,然后偶尔也做其他另外两个Track的项目。比如像我这种Analytics Track的,70%的时间都在做Analytics,而30%在做Inference (causal inference, A/B testing)。框架的底层是不管哪个track都需要的skillset,比如数据处理能力(sql/python/r),包括build data pipeline的能力(够用就好,不用到达data engineer的程度),visualization能力等等。软实力非常重要,而且是随着经验增长,越来越重要,逐渐变成区分出好的Data Scientist和一般的Data Scientist的标杆。当然也有一些nuances,比如纯modeling的领域,硬实力的“够用”要求会比analytics的“够用”高。篇幅有限,就不一一赘述啦


针对这个误区最后啰嗦一句,不管是哪个部门,不管是哪个Track,归根结底,知道什么是最重要的问题并且能解决问题的能力是最重要的。解决问题的手段只是工具。当然,有更多的工具可以帮你解决更多的问题。

2. 部门职能

2.1 问题:“Data Science function和其他部门如何合作的?”
短的回答:Data Science是自己的一条线,和其他线合作,contribute at high level vision as well as in execution。

长的回答得先从Org structure来说起。Product org一般是Product Manager + Engineer + Data Scientist,外加Design,UX等等。Business org一般是Program Manager + Engineer + Data Scientist,外加sales,marketing等等。还有一些大点的公司有Infra org和Research org,和上述的架构也类似。可能有人会认为,在这样的结构下,Product Manager定方向,engineer执行,data scientist通过a/b test来看执行的结果。但实际上并不是这样干巴巴地划分的。首先,能做好本职工作肯定是基本要求:一个写不出code的engineer和做不出分析的data scientist肯定不是好的合作对象。其次,everyone contributes to the strategy,而不是只做好自己的那一小块。产品经理的本职是定方向,组织大家,最后拍板,但所有人所有部门都得have a seat at the table,献计献策。很多项目的想法是data scientist driven或者engineer driven或者business driven的。比如,数据分析发现了这个机会,和大家聊聊;business有一个idea,和大家聊聊。总体来说,除了自己function的技能过硬外,重要的是不要局限自己,而是始终有一个thought leader的mindset来思考如何能把这个项目做得更好。纯执行的data scientist不是好的data scientist。

2.2 误区:“Data Scientist每天的主要工作是在屏幕后面产出”
从时间分配上来讲,初期的Data Scientist可能会有80%的时间是一个人在屏幕后面做manager分配的project的的。但随着经验的积累,开会的时间会越来越多,甚至达到50%以上。因为做对的事比做出一点事更重要,而开会和沟通是找到什么是对的事情的重要手段。也会花很多时间分享自己的finding和educate others about data。做的东西再fancy,合作的人不能理解或者insights不能落地的话,都是空谈。

3. 职业发展

3.1 问题:“Data Science的Career Path是什么样的?”
可以一路爬变成越来越Senior的Data Scientist。当然,最“自然”的路是爬corporate ladder,变成Data Science Manager等等。Data Science Management的空缺一般比特别Senior Data Scientist的多,而且也更容易scale and show your impact。也有很多人发现自己更喜欢做产品,那可以变成产品经理,当一个产品经理里面最懂数据的。特别喜欢写码的,可以考虑直接转software engineer。换跑道并不容易,需要很多努力,但是是可以实现的。

3.2 误区:“小公司会学得更多成长更快,大公司的分工太细,impact和成长都会受限制”
这个并不是绝对的。大小公司个有优缺点。
  • 小公司:优点是可以接触非常广的业务面,从想法到实践需要的时间很短,可以快速地尝试和学习,也会促进很多新的思维。缺点是小公司可能没什么解决问题的体系,系统学习会困难很多。人员关系也有它的复杂层面。还有一个缺点是资源有限,体现在1)可能会被抓壮丁做一些其他活 2)受资源的限制无法做某些活 3)一直在survival mode,压力可能会更大。破解方法是找靠谱的小公司来确保上面说到的风险会被弱化,比如,有够靠谱的前辈来带路就能让系统学习容易很多
  • 大公司:优点是资源很多,可以向很多不同的同事学习,许多公司也提供系统学习的方式,而且可以快速了解成熟的运作模式,也有机会了解各方各面的业务。缺点是从想法到实践流程会比小公司慢很多,所以学习速度可能会下降。另外,大公司真的很大,在一个地方呆久了容易被那个地方的思维所局限。破解方法是保持一颗好奇心,不断地激起自我学习的意识
这篇就先写这么多啦。以上都是基于我个人的经历,而我个人的经历也有限,希望大家能多和不一样类型的业界人士聊聊/读读相关文章,扩充自己对行业的了解。数据分析是一个很有意思也很有弹性的行业,希望能有越来越多的人在了解这个行业之后,开心地投入进来💪

评论

此博客中的热门博文

金刚功长寿功近半年的体验

初次接触金刚功 大学的时候就因为妈妈的介绍接触过八段锦,这么多年来可能练过的次数两个手就能数出来。去年10月底的一天,因为机缘巧合,在播客里听说了金刚功,说是“比八段锦更见效”,就抱着好奇的心态开始学习。 排病反应 像大部分网友一样,我也是跟着张至顺道长的视频学的金刚功。还记得第一次是在某天下午三点左右跟着视频练动作,但没想到就这么比划了十几分钟后,居然开始流鼻血了。我小时候常流鼻血,但这几年次数少了很多,所以我也觉得很惊奇。在小红书上搜索了一波,了解到金刚功可能会有排病反应。刚开始还觉得有可能是巧合,但后来连着3天下午练功后都流鼻血,就觉得可能是排病反应跑不了了。后来,我把练功时间改成了早上8点以前,就没怎么流过鼻血了。 身体变化 (一)睡眠变好。 生完娃以后,我经常夜醒难以入睡,但练功几周后,就发现睡眠有明显的改善,到点就困得不行,哪怕半夜醒来,也比较容易睡回去,早上还有一种睡不醒的感觉。这种睡不醒的感觉我特别珍惜!前些年求之不得的。 (二)白天精神变好。 以前白天经常觉得很疲惫,现在只有午饭后会比较困,其他时候精力充沛。 (三)来例假的时候巨累,但一次次地变好。 练功以前,我来例假的时候会稍微有点累,但还能正常行动。练功以后,明显发现头几次来例假的时候整个人特别虚弱,基本只能躺一会儿,再起来做一会儿事。发现好像也有其他人是这个体验,不知道是不是气血在进行整体的调整。但过了5个月后,例假的时候就没有那么累了,甚至还能打羽毛球😂 (四)胃口变好,会饿。 以前我吃好饭总有一种肿胀感,似乎消化东西需要花很久,很难有饿的体会。这几个月以来,肿胀感小了很多,也时不时会饿得想吃东西了。体重也有所增加🙈 (五)指甲上的月牙一会儿大一会儿小。 虽然不确切知道指甲上的月牙代表什么含义,但练功这几个月,我本来只有大拇指有月牙,后来突然有一天发现食指也长了月牙。这是这十几年都没发生过的事情。但最近,食指上的月牙都在缩小,几乎要看不见了。这些变化也蛮有意思的。 当然,这一年来生活的其他方面也有诸多的调整,也不能完全归功于金刚功,但我觉得帮助肯定是很大的。 长寿功 + 站桩 除了早上练金刚功外,我睡前也开始练长寿功进行搭配,一样也是跟着道长的视频学习的。金刚功打起来觉得很有精神,长寿功打起来很舒服。我总是边打边哈欠连天,甚至偶尔会冒点眼泪,据说也都是排病反应。...

恐男?

工作场合中和亲密关系之外,我和男性的接触很少。甚至连客户都尽量想避免男性。 这周末Tgroup的体验,让我开始consciously正视,我可能有的恐男情绪。 1. 这个年龄的我遇见男性的反应: 陌生男性,不会有接触的 : 如果外表看起来比较有倾略性,会主动选择避开。否则,indifferent 刚认识的男性,要稍有接触: 场景:新见到一对couple、参加活动进门时看到有男性等等 反应:快速assess对方的外表。如果比我高,会不自觉地有些紧张,并且注意保持距离的同时,分配attention在对方身上。这种attention混杂着“警惕”和“在意”。如果对方比我矮,这些感觉会有所降低。如果对方比我矮且会有自嘲式幽默,会更加降低紧张感 认识的男性,再次接触: 场景有:playdate再次见到的爸爸、因为活动原因再要接触的男性 反应:如果第一次认识的时候,对方是有小孩的爸爸,“爸爸”属性会占上风,我们以父母的身份相处,紧张感少,但又会陷在“父母身份相处模式中”。如果第一次认识的时候,对方没有小孩,根据之前的接触体验,紧张感会有adjustment,但不会消失 工作场合中的男性: “同事”属性占上风,没有因为性别原因造成的紧张感 这些紧张感背后的story是一种内化了的凝视:对方是否在assess我?It makes me feel uneasy. How do I “win” the 凝视?How do I get out of the 凝视? 2. 紧张感的成因 小时候的bully代表,D,是一个比我高的男性。身型瘦,声音尖。他的嘲笑声和脸一直存在我的脑海里,随时可以调度出来。笑我的那个Trauma场景里,似乎他一个脚在椅子上,人坐在桌子上,俯视我。场景里,我爸也在,也是比我高,不但没有帮到我,也是这件事情的导火索,事后还火上焦油,让我彻底失望 and feeling deeply disconnected,从而寻求其他的coping mechanism。 如果故事到这里结束,我可能对男性有的就是恐惧和厌恶,或者纯粹的警惕。但后来有个反转。D开始对我表示好感,天天给我家打电话,还偷父母的钱给我送礼物。这个经历让我很困惑。我一下子从被嘲笑的对象,变成了要捧着的对象。而且,我在过程中,感受到了power shifting t...

天使睡眠娃养成记

离开月子中心前,月嫂语重心长地和我说,“你们回家自己带要吃苦了。球球睡觉真的不行,不像小霸王。” (注:小霸王是月子中心另外一个宝宝,比球球大4天) 结果啪啪打脸。球球2个月不到就戒了夜奶,3个月不到就基本睡整觉了。 时间线 12/14: 球球出生,入住月子中心 1/20:从月子中心回家,二打一带娃。娃每天半夜2-3点要吃夜奶 1/27:请了白天带娃的阿姨,晚上继续自己带娃 2/7: 第一晚没有喝夜奶🎉,但还需要塞奶嘴接觉 2/24: 第一次自己睡整觉🎉 回家前 时间倒回到月子中心最后那几天。我也知道球球睡觉不好,所以也一直在思考怎么办。一方面,抓紧最后的时间向我们月嫂取经。另一方面,咬牙斥资买了妈妈群里推荐的课:taking cara babies,开始认真看。 我们月嫂带了80+娃的经验是,宝宝晚间睡眠好最重要的就是得断夜奶。什么时候可以断呢?她觉得两个月就能开始了(注:医生的说法是出生体重翻倍)。夜奶怎么断呢?并不是一下子断的,而是需要循序渐进。先从减量开始,比如开始一顿是3oz,可以减到2.5oz,过几天再减成2oz。也可以配合拉长时间。比如娃哭了不马上喂,先哄一哄(塞奶嘴或者抱哄),过15分钟再喂,过两天变成过20分钟,30分钟等等。当娃习惯了不吃夜奶,晚间睡眠也就会越来越好。 Taking cara babies也有一个体系,其中我觉得最受益的就是三点: 第一,白天要摄入足够卡路里,这样能减少晚上饿醒的程度。 第二,娃哭了之后,不能立刻抱哄或者喂奶,而应该逐渐升级干预程度。她的口诀是SITBACK:S就是stop, 先观察一下,有时候娃只是哼唧。I就是Increase sound machine volume, 增强白噪音。T就是touch, 拍拍宝宝胸口,但不抱。B就是binky,塞奶嘴。A就是add in rocking:摇晃宝宝; C就是cuddles,终于抱抱啦;K就是ok,it's feeding time, 这是真的饿了,该吃奶了。 第三,白天小觉想睡好,需要了解wake windows和sleepy cues。小月龄宝宝只能醒1-1.5个小时,随着月龄增长,wake window也会逐渐拉长。sleepy cues包括表情呆滞,揉眼睛,揉耳朵,红眉毛等等。 有了这些理论知识支持后,我和DD(瑟瑟发抖地)回了家,开启了(短暂的)...