大牛请问下,data science看起来要求很高,那么data analyst呢,我这专业适合data analyst吗
Analytical methods: statistical modeling (e.g., linear regression, GLMs, time series), supervised machine learning (e.g., random forests, neural networks), design of experiments, segmentation/clustering, text mining, network analysis (e.g., location allocation), optimization, simulation
o Analytics tools: Data wrangling (SQL, R, Python, PostGRESql, Spark, Hadoop/Hive), Data Modeling (R, Python, SAS, RapidMiner, SPSS), Data visualization (Tableau, Microstrategy)
这个要求太多了?有必要要求这么杂这么广吗?人家脸书数据科学家都只要求sql,其他进去培训几个礼拜就行了。其实我觉得也差不多这样,一会儿做python, 一会儿做R,语法规则都把我绕晕了?只是好奇?楼上的专家是业内人士,请教一下,数据科学家,我说的就是这种不研究算法的,大家现在都这样广义的定义数据科学家,我们就不深究这个定义正不正确。只会一两样就没法做数据科学的分析?还是都会,至少到中级水平,才能有干活的实力?只上几门网课肯定只有初级水平吧?还是要去kaggle中级比赛实战训练训练才行,把什么spark, hive练熟悉,拿个top 10?
楼主虽然还是个学生,但是你如果在加州或者美国其他地方做学生,估计很容易进入硅谷的公司拿个数据分析甚至数据科学的职位,但是在加拿大确实困难点,要求一大堆,每一样都要有几年的实践经验,这个确实不公平,所以争取去美国是正道,你可能一毕业就能进好公司,只要四五年就能出来自己开公司教书育人。在加拿大你可能工作四五年后都还在想办法进这类公司,因为这类公司相对太少了,职位太少,所以要求也是广而全
Analytical methods: statistical modeling (e.g., linear regression, GLMs, time series), supervised machine learning (e.g., random forests, neural networks), design of experiments, segmentation/clustering, text mining, network analysis (e.g., location allocation), optimization, simulation
o Analytics tools: Data wrangling (SQL, R, Python, PostGRESql, Spark, Hadoop/Hive), Data Modeling (R, Python, SAS, RapidMiner, SPSS), Data visualization (Tableau, Microstrategy)
这个要求太多了?有必要要求这么杂这么广吗?人家脸书数据科学家都只要求sql,其他进去培训几个礼拜就行了。其实我觉得也差不多这样,一会儿做python, 一会儿做R,语法规则都把我绕晕了?只是好奇?楼上的专家是业内人士,请教一下,数据科学家,我说的就是这种不研究算法的,大家现在都这样广义的定义数据科学家,我们就不深究这个定义正不正确。只会一两样就没法做数据科学的分析?还是都会,至少到中级水平,才能有干活的实力?只上几门网课肯定只有初级水平吧?还是要去kaggle中级比赛实战训练训练才行,把什么spark, hive练熟悉,拿个top 10?
楼主虽然还是个学生,但是你如果在加州或者美国其他地方做学生,估计很容易进入硅谷的公司拿个数据分析甚至数据科学的职位,但是在加拿大确实困难点,要求一大堆,每一样都要有几年的实践经验,这个确实不公平,所以争取去美国是正道,你可能一毕业就能进好公司,只要四五年就能出来自己开公司教书育人。在加拿大你可能工作四五年后都还在想办法进这类公司,因为这类公司相对太少了,职位太少,所以要求也是广而全
既然专家都背书了这些技能是必须的,那我学起来就有动力了,否则一边学一边怀疑,效果很差。DS本来要求就杂,统计,编程,机器学习,数据处理,业务知识都需要。我们组为例,即要能写production code,还要能组织给Sr Executives的会议,跨度还是挺大的。
Facebook有两种DS,anaytics那边的更像DA,虽说电面只考察SQL和lc中等难度的算法题,但onsite的难度非常大,不是简单一句只需要SQL就能概括的。至于FB家的research scientist,看看这几个中国人的名字你就知道什么水平了:caffe作者贾扬清,黑暗森林作者田渊栋,高考状元,resnet和fast rcnn作者何恺明。
说起刷Kaggle的话,可巧我就是Kaggle master,金银铜牌都拿过。
所以我可以负责的说,你贴的这些技能点,还真都是必须的。