立場新聞 Stand News

統計分析不可能告訴大家到底有沒有「被自殺」

2019/9/17 — 14:01

作者製圖

作者製圖

今日看到一個分析最近香港自殺數據的貼文(下文稱為原文),結論是今年九月初的自殺數目比六月激增。

我使用了Benny Yeong的二零一九年香港自殺資料數據庫重做了一次分析,也同樣做了 10 日平均線,但我的結論是七月初和三月初的自殺率比九月還要高得多。

原文得不到如此結論,我懷疑原因有二:

廣告

1。 10日平均線我使用的是移動窗口,並非將時間切開為一個個距離為10天的區間。這做法是一般Time Series分析 (包括股市)的常用處理手法,比夠能夠消去數據的隨機性。

2。 不肯定原文的數據來自何方。但我使用的數據庫,有專人閱讀報章剔除被重覆計算的案件。大家可以檢視原數據的可靠性。

廣告

注意原文分析的時間僅由今年六月到九月,我認為只有一季的數據太短,數據的隨機性會令結論可信性減弱。但即使同樣使用六月到九月的數據,我仍然得不到原文的結論。我認為七月初的自殺率顯著比九月高。

當然,大家要注意我所用的數據也只有九個月,仍然不足以顯示長期規律。由於自殺數據很受季節性影響,我認為只有用五年或以上的數據來進行比較,才有較大參考價值。

目前我做出來的這個圖表,顯示今年三月與七月的自殺數字比較高,也即是說,九月至今自殺數字沒有太不符規律的增長。

請注意:統計分析是不可能告訴大家到底有沒有「被自殺」個案的。基本上,除了實質證據(如太子站內閉路電視)能告訴我們事實真相,其他數字都只能作為一般參考。

原文(雲吞博士的語言藝術
2019年香港自殺資料統計(Benny Yeong)

(標題由編輯所擬)

發表意見