我是想往Data warehousing 方向发展。不知可好?
DW的核心建模方式是Kimball,这个理论上其实不难。Informatica,Datastage,SSIS等ETL工具也不难上手。但核心竞争力是对所在行业业务的深入理解,接下来才是对各种数据源以及各类数据质量问题处理方式和技巧的了解。
技能上我会建议楼主先下大功夫把SQL解决了,一个办法是刷leetcode上的sql题,Stanford有个SQL的公开课也不错。这个东西,一次学习终身受益。你看SQL这几十年来几乎没什么变化,但同期的开发工具都已经换了多少代了。
Facebook找Data Engineer,你猜他们最看重的技术技能是什么?第一,SQL,第二,Python,第三,Data Visulization。至于用过Hadoop,Spark,Redshift这些MPP数据处理平台的那都是锦上添花了。