立場新聞 Stand News

祇得一個「假陽性」? !  從數學角度看全民測試的數據

2020/9/22 — 16:42

為期十四天的普及社區檢測計劃於 9 月 14 日結束。

為期十四天的普及社區檢測計劃於 9 月 14 日結束。

【文:方圓人】

全民測試落幕了。178萬市民參加了測試,佔人口約四分一。港府稱花了5.3億公帑,共找出32 確診者及一位「假陽性」人士。32位確診者,表示社區帶病毒的人根本就不多。最奇怪的是祇有一位「假陽性」個案。

這其實牽涉一個高中的數學課題 — 條件性慨率。慨率即是機會率。條件性概率是一件事件在某條件下發生的機會率。

廣告

例如一個真帶病毒的人,他在測試中呈陽性的機會是0.99。 即是100個真有帶病毒的人接受測試, 99個人會被測出是陽性。 這個數字就稱為該試劑的「敏感度」。當然敏感度越高越好。

如果這個帶病毒的人,他在測試中呈陰性,就表示「假陰性」發生了。從以上的例子,發生假陰性的機會率就是1 - 0.99 = 0.01。

廣告

又例如一個沒有帶病毒的人,他在測試中呈陰性的機會是又是0.99。 即是100個真的沒有帶病毒的人接受測試, 99個人會測出是陰性。 這個數字就稱為試劑的「特異度」。當然特異度越高越好。

如果這個沒有帶病毒的人,在測試中呈陽性,這表示「假陽性」發生了。從以上面的例子,發生假陽性的機會率就是1 - 0.99 = 0.01。

總結一下。試劑的「敏感度」和「特異度」 越高越好。 這兩個數字可以在實踐中找得到的。 例如愛滋病的測試劑一般的敏感度和特異度都超過99%。 但關於冠狀病毒的測試劑的敏感度和特異度,在網上找不到官方科學認證的數據。祇有8月29日頭條日報報導華昇公司的特別顧問稱華大試劑通過多國認證,假陽性及假陰性比率均少於1%。但坊間卻流傳一些負面新聞,投訴中國大陸的測試劑準確度(大都沒有說明是敏感度或是特異度)如何不濟。(可網上參考菲律賓、西班牙、土以其等國的聲稱)。

基於很多原因,世上沒有百分之一百準確的測試劑。為免對中國試劑有偏見,本文會假設本次在香港使用的試劑的「敏感度」 和「特異度」都是99%。是十分準確的試劑。

以上兩個數字對一個全民測試的成效十分重要。另一個重中之重的數據就是究竟總人口中有多少人帶病毒。這個數字本可以透過隨機樣本設計去估算出來。但網上找不到本港科學實驗數據。究竟今天在社會中有多少帶病毒者在社區遊走?祇有天知。十四天的全民測試共找出32確診病例。近期確診人數已回落至極低水平。九月一日(開始全民檢測日期)前後確診人數約在低雙位數字,相信帶病毒的人不會很多,可能是幾百人,真的無人知道。

特首在八月七日稱聲要抽出1500隱形帶病毒者,羅致光局長則話有750至3000人(見蘋果報道)。該日前後日子確診每天有七八十人,九月一日前後約有一二十。相信在社區遊走的隱形帶病毒者沒有當時特首或羅局長說的這麼多。但我們使用的公式時,一定需要這個社區隱形帶病毒的比例數。(數學上這個數字稱為「盛行率」),總的要給個估算。因為檢測已做完,知道了結果。就當這個測試是一個樣本,推算九月一日社區有多少帶病毒人數吧。

估算是 7500000 x 32÷1780000 =135人。噢,原來這麼小。特首和羅局長高估了!所以「盛行率」是135 ÷ 7500000 = 0.000018, 約0.002%。換言之,本港居民身上沒有帶病毒的機會率就是 1 - 0.000018 = 0.999982, 約99.998%。

現在就使用以上三個數據來製作樹形圖。這是中五數學的課題,應該不難看明白。

全民檢測,對象是750萬香港市民。基於多種原因,一定沒有可能全部人參加。政府稱178萬人參與了。即23.7%。那麼便會有76.3%的市民没有参加。即135 x 76.3% = 103人隱形帶病毒病人無法從檢測中找出來,因為他們沒有參加。當然越多人檢測,越能找多些真實的目標人物出來。這是人人皆知的道理。

基於以上假設的數據,我們得出以下數字,在178萬人中,當中有32人確帶病毒的:

  1. 真帶病毒及被測出是陽性人數 = 1780000 x 0.000018 x 0.99 = 31.71 約32 人
  2. 真帶病毒及被測出是陰性人數(假陰性) = 1780000 x 0.000018 x 0.01 = 0.32 人
  3. 沒有帶病毒及被測出是陽性人數(假陽性)= 1780000 x 0.999982 x 0.01 = 17800人,即有17800無辜人士被誤診為帶病毒人士,混雜在32名真正有帶病毒人士之中。難題就在這裡發生。
  4. 沒有帶病毒及被測出是陰性人數 = 1780000 x 0.999982 x 0.99 = 1762168 人。絕絕絕大部份都是這類人。

從數據1和3,被測出是陽性的有 32 + 17800 = 17832人。如果你被測出是陽性,請不必擔心,你絕絕大機會是虛驚,因為你真帶病毒的機會是 32 ÷ 17832 x 100% = 1.8%。即是100個測出是陽性的個案,98個最後都不是的。大家會問,為甚麼會這樣?秘密就是0.999982這個極趨近1的數字。這是因為絕絕絕大部份的人都是沒有帶病毒的。真正要找到該32真隱形帶菌者,就要再對這 17832人(或可能要包括其緊密接觸者)進行另外的測試或醫療行動等。最終才能找到32名確診者。單是經濟代價,據稱港府付5.8億元(場地、人手、物流和宣傳等),另需加上中央政府的承擔若干费用(實驗室、檢測人員、試劑等)。單就政府的支出,每抽出一位確診者,成本就是5.3 億 ÷ 32人 = 1700萬,但市面上,仍有135 - 32=103位帶病毒者在社區遊走。真的,找這32人有如大海撈針。但178萬人參與檢測,雖然佔人口約四分一,都算是一個大數目。至於是否達標,政府因從不實說期望要有多少人參與,故無從評斷是否達標。全世界除了中國某些城市做過全民測試之外,世上沒有國家或城市做全民(百萬計的)測試。

本文假設的試劑的「敏感度」是99%,由於要找的人原來祇有32人,所以幾乎能找出全部的人來(見上面數據1),「假陰性」幾乎是0,即沒有漏網之魚 (數據2)。

最奇怪的是:報章上稱發現一位「假陽性」,原因是在交給衛生署的確診個案中,該樣本劑量太少無法做第二次測試,所以無法分類為「確診人士」,故歸類為「假陽性」。

但從我們上面的數學展示,應該有17800個「假陽性」個案(見數據3)。為何祇得一個假陽性?有三個可能。

第一,是大家對「假陽性」的定義不同。數學的定義是一個沒有帶病毒的人在一次的測試中被驗出是陽性。在此要強調,是「一次」。定義就是定義,所有人都要以定義作依歸。若果有人不依這個定義給出數據,自然結果會大不同。

第二,我們對使用的試劑低估其「特異度」,即低估了試劑能對沒帶病毒的人驗出是陰性的率。在上,我們所假設的「特異度」為99%,已經很高了。現重新計算一次。如果要得出祇有一人「假陽性」,「特異度」應該是多少才可能做到呢?結果是99.9999%(計算:(1 - (1÷(1780000 x 0.999982)))x 100%)。意思是指若有一百萬沒有帶病毒的人測試,就有999999人能測出是陰性。基於醫學或人為的侷限,我們都不會期望有一種特異度是百分之一百的試劑。從數學的使用,下表列出特異度和假陽性人數的關係。(公式:假陽性人數 = 測試總人數x(1 - 盛行率)x (1 - 特異度))供大家參考。

特異度  假陽性人數
 90% 177,996
 95% 88,998
 99% 17,800 
 99.9%  1,780 
 99.99%  180 
 99.9999%  1 

在178萬人中,要達到祇有一位假陽性,試劑敏感度要99%及特異度要有99.9999%。世上有如此準確的試劑嗎?不知道。

第三,可能化驗室把找到的初步陽性的樣本重新再檢測一次,才將第二次陽性的樣本交予衛生署跟進,這時候陽性樣本會大幅下降,從17832下降至209人(計算:1780000 x (0.000018 x 0.99 x 0.99 + 0.999982 x 0.01 x 0.01)。當中32人真陽性,即177人假陽性。要使第二次覆檢後的假陽性人數調至一人,就要將本文對「敏感度」和「特異度」的假設調升,例如敏感度和特異度雙雙提升至99.95%才可做到。(計算:略。鼓勵有興趣的中六或以上學生自行試算一下。)另一個做法是進行第三次覆檢,那麼假陽性的個案自然會下降至個位數。此時才送交衛生署。

以上三個可能,第一個是定義問題。第二個近乎無可能發生。第三個不能排除。當局如公佈清楚,便可釋疑。

全民檢測,利多於弊,還是幣多於利,政府和專家都說了很多。本文祇從一個純數學的觀點出發,讓大家多了解此案例中一些數學變量,如盛行率、敏感度和特異度之間的關係,豐富學生於高中數學課題「條件性概率」的生活應用之興趣吧。

後記:以下是一條將真正盛行率、檢測盛行率(當中包含真陽性和假陽性)、敏感度和特異度四個變量之間的關係公式:

真正盛行率 = (檢測盛行率 + 特異度 - 1)÷ (敏感度 + 特異度 - 1)

數學老師可以此作教材,在中五「概率」課中提及。例如試代入不同的敏度度、特異度、真正盛行率,便可推出檢測盛行率,從而計算出假陽性率是真陽性率的倍數。

聰明的高中學生們,如有能力和興趣,請證明以上公式。(提示:樹形圖,代數技巧)。如能證明,你的數學能力應該達文憑試五級或以上。試試吧!

(作者為中學教師)

發表意見