2014年8月30日 星期六

[R] PTT推文文化的社群網絡分析(Social Network Analysis),帶你一窺社群網絡中的互動情況




        PTT是台灣最大的社群網站(http://zh.wikipedia.org/wiki/批踢踢),很多人介紹過我就不多費脣舌,PTT中很特別的功能就是可以推文回應作者,畢竟回文相對來說比較正式,推文感覺更加閒聊的性質.Wxxxxd版相對PTT中的其他版來說,由於有每日發文限制,版友之間更頃向利用推文的方式來互動,而且因為男多女少的緣故,通常女生的推文比較多人推,男生(例如我)可能發文都沒人鳥,然後網友之間彼此也會利用推文互動,本文就是要以圖像化的方式來展現這種推文互動關係。


資料科學愛好者年會開始囉!




今天是第一屆的資料科學愛好者年會http://twconf.data-sci.org票卷在九十分鐘內賣光,來不及報名的朋友可以來這裡看投影片和實況.
投影片在這裡:資料科學愛好者年會粉絲團 https://www.facebook.com/twdsconf?fref=ts
hackpad上的文字實況:https://hackpad.com/2014--yoCSWnghDWb


資料分析鍊金術(七)-insight?

圖片來源:http://www.cgma.org/Resources/Reports/Pages/insight-to-impact-big-data.aspx?TestCookiesEnabled=redirect

        這幾年除了Big Data被超級濫用之外,Insight也是個聽到爛掉的名詞。人們已經無法滿足於單純的分析,而是想更進一步取得Insight,像是Custimer Research變成Customer Insight、或是乾脆用Insight代替Analysis的說法也有。那到底什麼是Insight?

2014年8月25日 星期一

社會網絡分析(Social Network Analysis)--前言


        我們都知道資料科學或是統計科學就是在找X變項與Y變項之間的關係,而一般我們在做資料分析或統計分析的時候,資料都會以下圖的方式呈現:


圖片來源:http://pages.bangor.ac.uk/~pes004/resmeth/msc/spss10.htm

每一行(row)代表了一個調查對象(可能是人、家戶、消費者),每一列(column)代表的是調查單位的屬性(attribute),可能是年齡、性別、居住地區、購物次數等等。大多數的分析方式都研究變項之間的關係。像這樣資料紀錄的方式和分析方式,每個調查對象彼此之間都是獨立的
,看不到之間的關係,在資料分析上產生了盲點。

2014年8月21日 星期四

[職涯] 累積你的人生,做出更多"對"的決定

        今天早上看到這篇文章累積你的人生,做出更多「對」的決定很有感觸,跟大家分享一下心得。

  • 人生不是做錯一個決定就毀了
        生活中總是充滿著意外,不論是感情上、工作上、或是日常瑣事中,我們總是做錯很多決定,有時候為此懊悔不已。

        "早知道當初就多陪她一點"、"早知道當初薪水談多一點"、"早知道當初應該堅持自己的看法"...等族繁不及備載。但是我們的生命很長,就算當下無法挽回,難道未來就沒有機會? 

2014年8月18日 星期一

[R][翻譯] 快速計算統計資訊(使用dplyr 套件)

        dplyr是個實用好用的套件,主要功能是用來取代運算慢的SQL套件,來做變項的aggregate運算。(不過在我還是新手的時候SQL套件真的幫了我很多忙XD) 這篇文章的原文為:

Using R: quickly calculating summary statistics (with dplyr)

2014年8月13日 星期三

工作與生活的平衡(?)--小琉球海龜超近距離接觸!



        前陣子我離職了XD,在接續下一段工作之間,給自己放一段小假,去了一直很想去的小琉球潛水,看了很爽的演唱會(山海屯音樂節) ,陪了疏忽很久的女朋友。這段期間完全放空自己,不但沒工作,書也沒看、教學影片什麼的也沒有看,網誌沒寫,也沒碰任何程式,將自己從過去平常的生活模式完全抽離出來。