立場新聞 Stand News

【拋磚引玉】林超英那詮譯有誤的趨勢線

2020/7/21 — 11:01

前天文台台長林超英一直都關心疫情發展,前日發表了一幅圖表,指港人的努力得以回報,疫情不再急增。說法無疑令人鼓舞,但細看之下總覺得圖表怪怪的。

林超英用了一幅 Semi-log 圖表,所謂 Semi-Log,即是 X-軸——日期——為線性尺度 (Linear Scale) ,而 Y 幅——每日新增個案數——則是對數尺度 (Logarithmic Scale) 。他再在圖表畫上兩條 Trendline ,指 12 日前(8/7) 每日新增感染數仍然急速上升,但經過「我們集體的防疫努力」後,升勢得以壓止,並劃下另一條 Trendline ,表示升幅的確有下跌。

我不明白。我不明白有至少兩點。一,我不明白他的兩條 Trendline 怎樣畫出來;二,我不明白他是不是假設新增確診數必然會,如他所說,幾何級上升?

廣告

好奇心驅使下,我先嘗試重製林超英的圖表(上圖)。他沒有說明圖表抽取了哪幾天,數據也是從何而來。我用的是 Worldometer 6 月 23 至 7 月 19 日期間的數據,與林超英一樣,我將新增確診數據分作兩部份: 6 月 23 至 7 月 5 日和 7 月 5 日至 7 月 19 日,並將新增確診數轉換為對數尺度 [1]

廣告

圖一/香港每日新增確診個案趨勢線

圖一/香港每日新增確診個案趨勢線

然而,畫好圖表(圖一)後,我發現跟林超英的有些不同,有興趣的可按此了解我有沒有畫錯。我畫的是圖表估計包含的數據只比林多了一兩天,但我未見林所說的升幅有「緩減」,反而有稍為上升趨勢。我懷疑是不是因為我包括了 19/7 108 個新增確診數字,所以我再排除了該數字,發現都不太影響趨勢,升幅趨勢只是稍為下跌了一點點。感覺上他可能是 Cherry Pick 了一段時間,令圖表出現他口中所說的「努力成果」。

但我仍不太明白為甚麼他要以 Semi-log 表達增幅,因為以我所知以「每日新增個案」而言, Linear Graph 較能表達到疫情發展趨勢,如文友 Everest 所指:「每日新增個案數字平穩,甚至有上升趨勢,絲毫沒有值得慶幸之處。林先生圖表的緩和趨勢,恐怕只是 semi-log 引致的視覺錯覺。」。事實上,Semi-log 可能會較適用於表達累計確診數(圖二)。

圖二/香港累計確診數字 (Log-Transformed)

圖二/香港累計確診數字 (Log-Transformed)

再看看林的圖表,會留意到他根據橙色線的 Trendline,直接推算疫情會繼續幾何級上升。我對此假設有點保留。最簡單的理由,是人口中總會有人康復、短時間內不會再受感染、也總有些人傳染力較低,更不是每一個感染者都一定會「通處走」,傳染所有人。YouTuber 3Brown1Blue 的影片就簡單解釋到不可以直接「拉直線」當作預測的原由

實際上,我們也可從衛生防護中心數據可見,大多數確診者有各自的「感染群 (cluster)」,而從累計圖表中雖有上升趨勢,但未可以很肯定地說明顯會出現幾何級上升趨勢。這樣說不是指疫情不會完全失控,但比起疫情初(11 月– 1 月)爆發,即使假設政府政策完全無效,由於港人整體衛生意識上升,其實或多或少也控制了疫情。當然,其他因素也可能會令此「破功」,令社區大爆發再生,例如正常醫療系統負荷過重,或者群眾全無保護下聚集等。這也是為甚麼所有衛生專家都會跟你說:「不要丟以輕心,疫情可以很嚴重」的原因。

林超英圖表另一個問題,是他假設所有「抗疫措施」都有立竿見影的效果。然而由一個人受感染,到真正被發現,中間其實有一定 Delay 。防疫效果有多少,都需要時間觀察,斷不能數日就見到成果。與此同時,也不要忘記數字增幅多少也非常取決於有多少人獲檢測之類的因素。

我對公共衛生研究不多,也還有很多疑問,而林和我所做的每日新增個案 Semi-log 圖表的對了解香港第三波爆發的實際意義也不大,但至少可以跟你說,預測疫情發展只靠拉直線就絕對不行。林先生,你兩條趨勢線,畫得也太有誤導性了吧。

#大家小心身體
#戴口罩
#SocialDistancing

註:
[1] 我所用的是 Log base 10
[2] 朋友 TC 提醒,Worldometer 數據可能誤將最近香港 Probable Case 也當作總數字 ,有機會出現 Double Count,此分析我未有修正此數據。

文章同時刊於作者博客、作者 Facebook 專頁

發表意見