27日晚“趙本山”被大家在微博刷屏了,一大波“趙本山被抓,家中搜出20噸黃金”的微博撲面而來。正好睡不著,于是本數據分析師開始工作了。
分析關鍵詞
這樣大的事件一定要用到新浪微博的搜索功能,不過我們需要先找出這條“新聞”(姑且叫新聞吧)的關鍵詞:20噸、黃金、趙本山。趙本山當然是這三個詞中的核心。
看關鍵詞趨勢
打開新浪微博指數查詢頁面(index.weibo.com),輸入“趙本山”。首先出來的是這張30天趨勢圖。
不過由于微博指數的滯后,這張圖是看不到27日的具體數據。我們需要看實時趨勢,下圖是關鍵詞“趙本山”的24小時指數。圖中有4個地方數據突變:15:00,21:00,22:00,23:00。從這條新聞的持續(xù)發(fā)酵來看,15:00是這條新聞的起源顯然是不可能的。
初步鎖定21:00是該新聞的開始傳播點。
微博源頭是誰?
回到微博頁面搜索“20噸+黃金+趙本山”,發(fā)現第一條微博是個只有幾百個粉絲的草根在23:04發(fā)出來的,顯然不是他??紤]到謠言在傳播過程中的多樣性和變化性,我去掉關鍵詞趙本山改搜索“20噸+黃金”,發(fā)現共有9748條微博,這樣多的微博一條一條的去找源頭是不可能的(新浪也不讓你看50頁后的搜索結果)。結合上面提到的關鍵時間,我再次縮小搜索范圍。我的秘訣是用微博高級搜索,一般人我不告訴他(今年的昆明火車站砍人事件我就是用這個方法搜出了來自現場的第一條微博的)。
秘訣如下圖
這樣搜索出來的微博只有兩條。其中一條明確的指出了新聞來源。
老沉是誰?原新浪網的總編輯,現在是小米公司副總裁。按我對老沉的了解,他應該不會去主動傳播這樣的新聞的。不過既然指向了他,我就去他的微博看看。沒有,沒有這條微博,可能是刪了。不過我找到一條相關的微博。
從而確定新聞源頭,確實來自老沉。通過其他網友的截圖,我找到了到時的微博(發(fā)出來的時間21:28,和我前面的判斷一致)及10分鐘后老沉的解釋微博。
如何傳播開來的?
如果你看過馬爾科姆·格拉德威爾的《引爆點》這本書的話,一定記得流行三法則:人物法則、附著力因素法則和環(huán)境威力法則。三法則我理解就是關鍵人物,新聞價值,傳播渠道。
這個新聞三個要素完全具備:關鍵人數老沉,新聞價值是20噸黃金(初期還不是趙本山),傳播渠道新浪微博。20噸黃金不是新聞,但是在這個謠言就是遙遙領先的預言時代,老沉這16個字足夠讓別人浮想聯翩的了。
由于這條微博被刪,我看不到評論中大家的聯想和演變過程,也就看不到是如何和趙本山扯上關系的。不過我能看到很多網友跑到趙本山最有一條微博下留言,大家也是閑的。
雖然老沉后了解釋了這句話的來歷,是最近上映的一部電影臺詞??墒窃谖⒉r代,三法則中的環(huán)境威力法則發(fā)揮了巨大的作用,微博對社會熱點新聞的傳播那是相當的病毒式的傳播,何況趙本山最近本來就是輿論的中心。
病毒式傳播怎樣個恐怖的
放大24小時微博指數圖給大家看。如果以20:00的指數為基數的話21:00-凌晨1:00這是個小時,“趙本山”這個關鍵詞依次上漲了2倍,5倍,21倍,47倍(這個時段可是晚上0:00-1:00哦)。23:00是一個飆升的時間窗口,各種微博大小號爭相報道,至此這個烏龍事件徹底被輿論“坐實”了,趙本山和老沉躺槍。
哎,寫了這么多,和我又有什么關系?還是洗洗睡吧。本文是討論數據分析技術,不討論趙本山在哪?趙本山怎么樣了?這樣的話題。請大家不要過度解讀!
大家愛看