Excel 漏數據之亂──英國 1.6 萬 COVID-19 患者沒追蹤到

23

轉載從: Tech News 科技新報

Excel 漏數據之亂──英國 1.6 萬 COVID-19 患者沒追蹤到

為什麼不要用 Excel 記錄確診病例?這個答案或許問英國公共衛生部最知道。

漏了近 1.6 萬人

10 月 5 日,COVID-19(武漢肺炎)確診病例飆破 51.8 萬人的英國,傳出 9 月 25 日到 10 月 2 日 8 天內,將近 1.6 萬新確診病例沒有追蹤,這代表原本應該接受隔離治療的患者依舊在外頭跑,加劇疫情蔓延的風險。

將 Excel 當成大型資料庫

而這 1 萬 5,841 起確診病例之所以被英國公共衛生部(Public Health England)漏掉,原因就出在英國公共衛生部將微軟 Excel 試算軟體當成大型資料庫使用,沒有注意到 Excel 並不適合記錄和追蹤每天增幅調整的確診病例數據。

Excel 漏數據之亂──英國 1.6 萬 COVID-19 患者沒追蹤到

▲ 倫敦街頭,人們走過英國國民保健署(HNS)提醒大眾對抗武漢肺炎的廣告看板。

為什麼會漏數據?

如果要還原整起漏數據事件,必須先從英國公共衛生部如何記錄武漢肺炎確診病例說起。

每天,英國各地的公私立檢測中心會將確診病例和檢測人數等數據以 CSV 檔寄給英國公共衛生部,英國公共衛生部再將收到的數據匯入 Excel 資料庫。

雖然 CSV 檔案大小沒有限制,但英國公共衛生部使用的舊版 Excel 檔案格式 XLS 只能呈現 65,536 列,這代表多出來的數據會自動刪除,這也是為什麼確診病例數會遺漏。

如果是新版 Excel,檔案格式 XLSX 可容納 1,048,576 列,能記錄的檢測數據量是前者 16 倍,相對來說不容易發生數據遺漏問題。

要存大數據,Excel 不適合

不過 IT 專家指出,不管是 1987 年的 Excel XLS 檔案格式,還是 2007 年更新的 XLSX 檔案格式,都不適合存放武漢肺炎的檢測數據,箇中道理連中學生都知道。

英國劍橋大學計算機實驗室通訊系統教授克羅克洛夫(Jon Crowcroft)說:「一直以來,Excel 都是專門設計給小型公司處理數據,並大致看看數據長相的軟體。」

「當你要做某些比較嚴肅的正事時,你會用為正事量身打造處理數據的方式,你有很多其他選擇,但你不會用 Excel,沒人會用這個起頭。」

Excel 漏數據之亂──英國 1.6 萬 COVID-19 患者沒追蹤到

▲ 5 日這天,英國衛生大臣韓考克在下議院提到 Excel 漏數據事件,他承諾除了會深入調查意外,也會立刻升級過時的電腦系統。

英國公衛部:「技術問題」已解決

回到 Excel 漏數據事件。發現漏掉 1 萬 5,841 起確診病例沒有追蹤後,英國公共衛生部表示已立刻回溯追蹤,並在 3 日凌晨 1 點大致補完,這項「技術問題」已經解決。

衛生大臣:這起意外根本不該發生

5 日英國衛生大臣韓考克(Matt Hancock)在下議院接受質詢時,也提到 Excel 漏數據事件,他坦言整起事件肇因於英國公共衛生部使用「老舊系統」統計確診和檢測數據,兩個月前當局就決定要更換系統。

「這起意外根本不應該發生」,韓考克承諾當局除了會深入調查意外,也會立刻升級過時的電腦系統。

比一團亂糟多了

對這起意外,工黨的影子衛生大臣阿什沃斯(Jonathan Ashworth)表示,就算英國公共衛生部事後力挽狂瀾,人民的生命安全照樣因延遲追蹤而陷入危險。

阿什沃斯說:「成千上萬的人根本不知道他們曝露在染疫的風險下,住院人數不斷增加的情況下,這種致命的病毒很有可能廣泛散播。」

「這起事件不僅是一團亂,這比一團亂還更糟」。

除了漏數據,還有很多地方做不好

蘇格蘭愛丁堡大學全球衛生治理學程主任斯里達(Devi Sridhar)說:「這起事件發生的時機不能更糟了,隨著時序準備進入冬季,我們早就知道到時病例數會增加,現在正是需要當局『檢測和追蹤系統』(test-and-trace system)好好發揮功用的時候。」

沒想到,英國公共衛生部的檢測和追蹤系統卻出了這種大包。斯里達繼續說,除了漏數據,當局防疫還有許多地方做不好,像是把人送去離家好幾百公里遠的地方檢測、實驗室檢測速度太慢、累積大量民眾沒有檢測等。

Excel 漏數據之亂──英國 1.6 萬 COVID-19 患者沒追蹤到

▲ Excel 不是萬用的,某些情況就不適合使用 Excel 處理數據。(Flickr/Christiaan Colen CC BY 2.0)

解決之道:拆成小檔案匯入 Excel

面對各方撻伐,發生 Excel 漏數據事件的英國公共衛生部表示,他們現在將檢測數據拆分成小堆匯入能容納大量數據的 Excel 模板,如此一來就不會發生數據量超過上限,數據自動刪除的情況。

然而 IT 專家表示,英國公共衛生部該做的是找到更適合的資料庫軟體取代 Excel,而不是繼續使用 Excel。

其實,Excel 不是萬用

據《衛報》報導,Excel 雖然是全世界最受歡迎的商業工具,但某些情況下並不適合使用 Excel 記錄數據,過去也有不少企業使用 Excel 出錯,結果付出高昂代價的例子。

舉例來說,2013 年摩根大通集團(JPMorgan)使用 Excel 出錯,損失將近 60 億美元(約台幣 1,741 億 5 千萬元)。當時 Excel 試算表的單元格錯誤地除以兩種利率的總和,而不是除以平均值。這個錯誤也讓美國康乃狄克大學法律系教授柯克(James Kwak)警告大眾,Excel 其實「非常脆弱」。

人人都能用,但不一定用得好

柯克說:「對初學者來說,Excel 沒辦法追蹤數據從哪裡來,Excel 也沒有審計追蹤功能,所以你有可能不小心重複輸入某些數字,但你自己不知道。此外,Excel 也沒有簡單方式測試試算表是否有錯。」

「Excel 最大的問題在人人都能生出 Excel 試算表,但可能做得不好,因 Excel 操作太簡單,人們製作重要試算表時並沒有侷限於一定要給了解程式設計的人去做,也沒有以系統性、能追蹤製作紀錄的方式製作。」

(本文由 地球圖輯隊 授權轉載;首圖為英國博爾頓鎮的一處 COVID-19 檢測站內,人們正在自行採檢。圖片來源:達志影像)