立場新聞 Stand News

誰是香江最「紅」人?開放數據使用實例

2018/6/21 — 17:05

大部份人應該會同意,行事透明的政府更容易受到人民愛戴和鞭策。增加透明度、防止言論被壟斷的方法之一,是發放因掌握公權力和基建而收集到的數據;台灣零時政府的構思如是。而最近香港亦有人架建了類似平台 g0vhk.io ,以便搜索和存取公共數據。

以上的價值觀難免有點抽象。本文利用「青年內地交流資助計劃款項」作示範,展示一旦掌握(準確)數據,要抽取有助了解香港的資訊十分容易。畢竟,市民透過納稅默默支持了兩地交流,但過程及成果並不一定顯然易見。我們來認識一下背後含辛茹苦組織一切的愛國人士、肯定他們的貢獻,豈不美哉?

數據來自 g0vhk.io 抽取的立法會記錄,描述了 2012 至 2017 年間政府撥款支持的每項活動、撥款數目、申請機構以及參加人數。產生圖像的代碼亦已上載到 GitHub

廣告

首先,來看看年度趨勢:到底舉辦了多少交流活動,而它們又一共獲得多少資助呢?從下圖可見,2012–17 年間政府每年花費約千萬計港元,資助青年團到內地交流。活動數量和撥出金額,均在 2015 年飆升兩至三倍;這個改變很明顯,亦有待解釋。(有留意時事的話,心中多半早有答案。)

耐人尋味的是,根據 HK01 報導審計處發現 「2012/13年度的活動開支由2,640萬元,增加至上年度約1.3億元,累計增加四倍」。下圖的左端與報導相符,但到後來金額卻比 1.3 億元少了一半。到底是 g0vhk 數據收集不全,還是審計處和媒體擁有未公開資料呢?

廣告

除了時間上的趨勢,單一年度的數據也有很多故事;為時效起見,本文採用了最新的 2016–17 年數據。

既然要認識及表揚愛國人士,我們應該問:哪些機構獲得了最多的資助,或者舉辦了最多的項目呢?同屬兩類頭十的,又是誰呢?寥寥幾行 Python 代碼後,答案呼之欲出 — 見下圖。

可能是筆者離開香港太久了,這些機構一概沒有聽聞過;我們就隨便選一個深入了解吧。不過,當筆者嘗試到訪(看似是)未來之星同學會的官網時,防毒軟件卻警告說網站被木馬感染;看來專門貫徹愛國事務的人們,生活也不容易啊。

不過,機構在 YouTube 上還是有活動記錄的:例如掛名《文匯報》的頻道,就記錄了未來之星北上的經歷。一看頻道簡介,果然由媒體集團撐腰,而頁首的回顧影片亦提到機構得到中聯辦和相關部委支持。

「未來之星同學會」是在香港大公文匯傳媒集團領導下,以組織香港青少年學生開展兩地交流活動為常態的公益性組織。2017年6至8月,「未來之星同學會」先後組織十個交流和實習活動,共吸引近四百名香港學子參加,近千名學子踴躍報名。

各活動的內容,包括了解國家互聯網政策、基本國情等講座和體驗;足跡踏遍北京創科中心中關村、江蘇以及一帶一路上的各國。總言之:多姿多彩。

看過影片的讀者們應該會留意到,雖然字幕採用了繁體中文,但配音旁述卻由純正的普通話男音操刀,字字鏗鏘。這不禁令人好奇:影片的目的觀眾是誰呢?為什麼混雜了兩地的語言習慣呢?恕筆者愚笨,未能解答。

簡單的探索到此為止。筆者希望本文能夠拋磚引玉,引起大家對開放數據的興趣。香港地方雖小,但城中各色各樣的故事、人物和事蹟依然值得探討;而我們只需寥寥幾行代碼,就能獲得深入探究的線索。

另外,星斗市民作為納稅人,亦可以透過開放數據及其引申的圖像和分析,了解自己到底為香港作出了甚麼隱性貢獻。公帑用得其所,難道不是大家樂見的嗎?

可是,數據的不齊全以及格式不一致,都會成為分析的障礙;最耗時的環節其實在此。更重要的是,正如莫乃光議員指出,政府和交通機構對全面開放數據持消極和抗拒的態度;雖然政府的資料一線通日趨完善,但比起世界其他大城市開放程度依然強差人意。

總言之,路漫漫其修遠矣。隨著香港數據慢慢開放,希望大家能夠踴躍參與啊!

發表意見