2014年6月11日 星期三

資料脈絡與詮釋

        數字會說話?錯,說話的永遠是人,這是最近很紅的一本書"精準預測"中的名言。如果只會看數字講話,那很容易跌入陷阱。別忘記,蒐集資料的是人,解讀資料的是人,使用資料的也是人,就算是演算法的設計,也是跟人有關,所以解讀數字時千萬不能脫離資料的脈絡。


        何謂資料脈絡,就是資料從何產生,如何產生,以及如何使用的過程。例如這次圖片中的評價分數表,這個資料夠單純了吧?就是一個五等分量表,問受訪者對某個東西的評價,我們再把幾千個樣本的分數加起來平均,就是對某個事物的平均分數。這個量表廣泛應用在各種商業調查中,特別是客戶滿意度的調查。就連那麼簡單、單純的數字,也具備各種詮釋可能。

        舉例來說,一般餐廳現在桌上都會放著意見調查表,裡面就有類似的滿意度問卷:"請問您對今天的服務覺得如何? 最高五分,最低一分"。今天蒐集資料結果回來,如果平均三分,請問一個資料分析人員要如何解讀?
        1. 客戶對我們餐廳的服務感到沒啥感覺(因為數值在中間,通常五等分量表的中間代表沒有意見或普通好)

        2.客戶填表的結果合理,因為一般都會集中在中間的數字,服務沒有需要改進的地方
   
       不論遇到何種結果,我們都應該回到數字產生的脈絡來思考:
       1. 跟來客數相比,總共多少人填寫? 填寫的人的基本資料和餐廳客戶相符合嗎?
     
       2. 餐廳問卷是強迫填寫嗎? 還是自由填寫?

       3. 如果是自由填寫,什麼樣的人會拿來寫? 是特別不爽的客戶? 還是覺得服務生表現棒棒的客人?

       4. 服務生會強迫客人填寫嗎? 客人填寫時服務人員會站在旁邊嗎? 問卷有具名或留基本資料嗎?

        因為有這些脈絡的思考,我們發現單看回收來的問卷分數來做績效考核還不夠,我們還必須釐清脈絡中相關問題,才能幫助我們更正確解答數字。我們可能要估計一下來客數,透過隨機抽樣或普查的方式請客人填寫問卷,填寫問卷時服務生需不再現場,要不要留基本資料就看餐廳的目的在於蒐集客戶基本資料還是需要蒐集真實聲音,之類等等的措施和配套,才能幫助我們看到數字背後真實的意義。資料分析人員絕對不能單純地"看數字說話"