當手上的分析專案越來越多,管理不同的專案變成一個令人頭大的事情。先前我都會將不同專案設置在不同資料夾,將相關的語法以及分析檔案放在一起。但是當專案越來越多,例如我今天分析銷量、明天分析折扣,其中有些DATA是共用的,或是有些分析步驟是共用的,如果重複擺放一來浪費空間,二來在分析時也會浪費不必要的時間,有時候還會涉及到版本的問題又更複雜,是個相當惱人的問題。
在使用SAS EG時,由於每個分析的步驟都以圖像化的方式表現出來,在專案頁面也可以使用註解來標示,對於專案的管理相對容易,只要透過適當的註解和新的分析,就能將需要用到相似DATA和步驟的專案放在一起管理。
R相對來說就沒有SAS EG那麼方便(賣那麼貴也不是賣假的),但是精神差不多。我目前的作法也是利用R-Studio來建立專案,將相關的DATA和script放在一起,因為沒有圖形化介面,各檔案的名稱和關聯性必須標示的更加清楚,文件中的註解也絕對不能少,以現在專案的量來說,不用說半年前寫的,過了一個月再看程式碼都覺得陌生(難道是初老徵兆!),有人說寫程式最難的就是命名和註解,可真是一點也不假。
圖片來源:http://wintlogix.com/project-management/
說實在的,在習慣SAS EG之後,實在很難習慣其他統計軟體,但是每年SAS的開銷實在不小,如果能夠從軟體上精簡成本,說不定老闆會把這筆錢拿來直接投資在我身上。
其實四、五年前就接觸過R,但是當時R的介面實在很陽春,而且如果DATA又多又大,在原始的R裡面是很難查看的。但是最近上課認識一套很棒的IDE,讓R操作起來相對平易近人很多。
這套IDE是叫做 RSTUDIO (https://www.rstudio.com/) 除了保有原本R的介面之外,另外還整合了Script、Data、以及Help視窗,對於不習慣直接寫script的人來說相當友善。
這次認真地摸了一下R之後,發現R的幾個特色: