周梓樂逝世ㅤ觸發破紀錄大數據現象
李鴻彥2019/11/8 — 21:54
科大學生周梓樂 11 月 8 日離世,大批市民晚上到他高處墮下的將軍澳尚德停車場悼念。
大數據看到什麼?
為什麼 14:00 要史無前例發出「緊急警示」?不少朋友問我究看到什麼,在不影響客戶(Full Report 只提供予客戶)下,嘗試以部份數據與大家分享或說明。
評估輿情的數據有很多組,同時亦要將不同數據進行比較及分析,其中有兩組我比較關心,第一組是互動率(Interaction Speed),第二組是趨勢移動平均(Trending Moving Average, TMA),甚麼是 Interaction Speed 及 TMA,慢慢講。(涉及商業敏感部份我不方便公開)
我們取所有的數據均來自網上公開資料,其中最重要的是一個叫互動率(Interaction Speed),即是大眾對個別新聞或發帖的互動,這些互動包括分享(Share)、留言(Comment)以及讚好(Like),再與時間進行線性比較,結果得出每分鐘有多少互動次數及得出互動速率(Interaction/Time),有沒有短時間內加速或減速等等。
《立場新聞》題為〈周梓樂今早去世〉的新聞出街,旋即錄得每分鐘 3,621 次的破紀錄互動,即是即使一個人看到這則新聞同時分享留言以及按嬲嬲,每分鐘亦有超過 1,200 個人有反應,這個紀錄是過去 6 個月或有系統以來最高。
最高有多高?且以過去一個月排第 2 至 4 的新聞作比較:
- 《東方日報》11 月 5 日題為〈消息指墮樓科大生腦幹死亡正準備拔喉〉的新聞,最高互動率是 1,601 次;
- 《蘋果日報》11 月 2 日題為〈保時捷車主播《榮光》ㅤ遭強拉落車拘捕ㅤ失控警大叫途人「過街老鼠」〉的新聞,最高互動率是 2,214 次;
- 《蘋果日報》10 月 11 日題為〈校隊泳將 15 歲「發夢」少女離奇變浮屍ㅤ警:死因待確定〉的新聞,最高互動率是 1,650 次。
比較過互動率後你會知道,這則新聞正廣泛地影響網上受眾。再看截至 8 時的 12 小時關鍵詞熱溫圖,涉及科大學生周梓樂的新聞佔了超過 75%(紅框),即是幾乎抽乾了過去 12 小時的所有新聞關注度。這是第一點,評估新聞的爆炸性及滲透性。大家可能會說,在網上有反應不代表會轉化成行動,網上反應轉化成行動的比率(Call to Action, CTA)一直是最困難的部份。
明白互動率的運後進入第二部份,TMA。TMA 主要評估某個別關鍵詞的搜索量變化。大家要明白什麼人會在網上搜索?付諸行動的人。
所以透過 TMA 我們可以評估有多少人會將互動轉化成行動。我們評估「白花」及「花店」的 TMA 數據,發現在午後有關資訊的需求量急升,意味大眾會將互動轉化成購買白花等行動,踏上街頭,亦是令我們發出「緊急警示」的主要原因之一。
當然,誠如上文所言,大數據須要端視多組不同的數據,基於商業考慮我只提了互動率及趨勢移動平均數這兩組數據,實際上我們還同時評估了多組不同的數據,多組不同的數據幾乎同時出現警示,意味 11 月 8 日晚上極度高危,是「反修例」運動以來不曾出現的。
緊急警示在下 14:00 發出,截至 21:00 也即是執筆之時,全港有 23 個地區出現悼念活動。
(標題為編輯改擬,原題為〈為什麼要發出緊急警示?〉)