2014年8月30日 星期六

[R] PTT推文文化的社群網絡分析(Social Network Analysis),帶你一窺社群網絡中的互動情況




        PTT是台灣最大的社群網站(http://zh.wikipedia.org/wiki/批踢踢),很多人介紹過我就不多費脣舌,PTT中很特別的功能就是可以推文回應作者,畢竟回文相對來說比較正式,推文感覺更加閒聊的性質.Wxxxxd版相對PTT中的其他版來說,由於有每日發文限制,版友之間更頃向利用推文的方式來互動,而且因為男多女少的緣故,通常女生的推文比較多人推,男生(例如我)可能發文都沒人鳥,然後網友之間彼此也會利用推文互動,本文就是要以圖像化的方式來展現這種推文互動關係。


        我知道大家對程式語言沒興趣,所以我先講怎樣看圖:


  1. 每個圈圈代表一個網友,圈圈的大小代表該網友被“不同人”推文的文章次數
  2. 箭頭代表的推文的方向 A -> B表示A推B的文章,而且不同大小的圈圈
從圖中來看,可以發現網友之間的互動真的非常密切和多樣,除了幾位人氣王之外,也有很多小團體和出現眾星拱月的情況.人氣王彼此之間的互動也不在少數,相信有逛過wanted版的朋友看起來會更有感觸.至於ID的部分我就隱藏起來了,雖然是這是公開資料,但是畢竟不是每個人都喜歡被別人分析XD

        以下講的是做法:本次分析包含資料截取到畫圖都是利用R軟體來實做,用的主要方法包括爬網和社群網絡分析(social network analysis),以下是原始碼:



6 則留言:

  1. 作者已經移除這則留言。

    回覆刪除
  2. 作者已經移除這則留言。

    回覆刪除
  3. 您好:
    請問一下抓網址那邊為什麼i只放數字,但實際上不是還會夾雜英文嗎?
    如:/bbs/Wanted/M.1446388368.A.CB2.html

    我剛剛也試了直接在網址(https://www.ptt.cc/bbs/Wanted/index.html)中的index後加數字
    看起來是日期的不同???

    回覆刪除