2014年2月25日 星期二

資料分析鍊金術(五)-TAG的威力

        DATA MINING最重要的觀念也是最常用的功能就是集群(Cluster)和關聯(Correlations)。在分析資料時,可以透過消費者(或產品)不同的特性來加以集群或測量關聯,例如35-44歲消費者的消費模式類似的分群,或年紀越高購衣頻次越高這樣的關聯分析。集群或關聯本身操作都很容易,難的事前的準備工作,也就是將消費者(或產品)標上不同的特性。能蒐集的特性越多,能分析的東西也就越多。
   
 
        消費者的特性通常在資料庫開始就設定好了,例如性別、年齡、消費次數、最近消費日期等等,當然我們也可以透過POS系統計算出一些更詳細的消費者屬性,例如購物週期、購物類別等等。但是另外一些人格特質、生活風格甚至媒體使用行為,或其他產品使用行為,就難以從資料庫中挖掘。這時候可以透過另外的調查,適度地做些資料fusion(資料融合),來取得會員資料庫中沒有的資料,以便做更多的分析。不過 data fusion是另外一門學問,將來也會開專文來說明。

        而產品的特性,除了一些基本的重量、尺寸外,其他難以量化的特性,例如風格、設計元素,就要用TAG的方式來加以建立了。TAG直譯為標籤,也就是用文字化的方式(質性)的方式來說明產品特性,並切成一個個分開獨立的元素。例如我們將一件褲子,除了它的材質、尺寸外,另外加上幾個標籤像是:獨立的、叛逆的、風格強烈的、歐洲風、花紋。如此一來我們就有更多的變項能夠分析消費者的購買行為,比如說某個或某類的消費者,都很常購買具備"狂野"TAG的服飾,未來在推薦上或是商品組合上,就能更精準地將具有狂野特性的服飾推薦給消費者。

        很經典的例子就是NETFIX,他們之所以能快速掌握消費者喜好的節目,就是在每個影集掛上成堆的TAG,當消費者看了幾部影集之後,就能透過TAG之間的關聯性,推斷使用者喜愛的電影、電視風格,在尋找有相同TAG元素的影集推薦給消費者,造成消費者的高黏著性和收視率。

        TAG的建立可以是封閉式的--如讓產品設計者登陸TAG;或是開放的--讓消費者自由的添加新的TAG;前者的優點是容易管理,後者的優點是更貼近消費者的使用概念。TAG的用途在於將原本難以量化的產品特性變成一個個獨立可以分析的元素,當抽象的元素變成可分析的變項後,DATA MINING就可以介入發揮其效用。