2014年7月8日 星期二

資料科學家 vs 資料工程師

        今天看到了這篇文章Data Scientist vs Data Engineer裡面提到"資料科學家",與"資料工程師"的差異:資料科學家重點在於從DATA中找到insight,建立解釋模型、並說出一個好故事;而資料工程師更為著重如何取得與儲存DATA,並維持資料系統的運作。


       儘管在學習的路上,兩者有交疊之處,兩者也有各自有趣的領域值得探究,但是還是要時時提醒自己真正要鑽研的方向是哪塊。


        資料科學目前是一個跨領域的學科,來自統計、行銷、企管、資科、資管的人士都想跨進來,每個領域的人士其實都是從自己擅長的領域跨進來後,開始學習其他自己不足的部分。正因為對其他領域的不了解,剛好可以透過這張圖找到自己的切入點以及下個需要努力的方向。


        以我自己來說,原本是社會科學領域,在統計和人類行為詮釋上有一定基礎,但是相對我的數學及Programming稍微薄弱,儲存設備以及硬體部分更是幾乎0知識。由於我對自己的定位是"資料科學家",因此目前就得補強數學和程式這一塊。但是在補強弱點的同時,也不能忘記"資料科學家"的重點在於建立解釋模型以及用DATA說故事。


圖片來源:http://datascience101.wordpress.com/2014/07/08/data-scientist-vs-data-engineer/