我知道大家對程式語言沒興趣,所以我先講怎樣看圖:
- 每個圈圈代表一個網友,圈圈的大小代表該網友被“不同人”推文的文章次數
- 箭頭代表的推文的方向 A -> B表示A推B的文章,而且不同大小的圈圈
從圖中來看,可以發現網友之間的互動真的非常密切和多樣,除了幾位人氣王之外,也有很多小團體和出現眾星拱月的情況.人氣王彼此之間的互動也不在少數,相信有逛過wanted版的朋友看起來會更有感觸.至於ID的部分我就隱藏起來了,雖然是這是公開資料,但是畢竟不是每個人都喜歡被別人分析XD
以下講的是做法:本次分析包含資料截取到畫圖都是利用R軟體來實做,用的主要方法包括爬網和社群網絡分析(social network analysis),以下是原始碼:
作者已經移除這則留言。
回覆刪除作者已經移除這則留言。
回覆刪除歡迎轉貼~請註明來源
刪除您好:
回覆刪除請問一下抓網址那邊為什麼i只放數字,但實際上不是還會夾雜英文嗎?
如:/bbs/Wanted/M.1446388368.A.CB2.html
我剛剛也試了直接在網址(https://www.ptt.cc/bbs/Wanted/index.html)中的index後加數字
看起來是日期的不同???
會另外去讀取每一頁中的文章代碼
刪除作者已經移除這則留言。
刪除