轉載從: Tech News 科技新報
就像 Facebook、Google 這些科技公司需要更多數據了解用戶,醫學界近 10 年來也致力於建立「生物資料庫」,希望能探索人類的基因密碼與疾病之間的關聯性。
英國跑最快,幫民眾做基因體定序
根據台灣人體生物資料庫統計,這股熱潮至少已在全球 16 個國家展開,包括南韓、日本、愛沙尼亞、德國、美國、加拿大等,每個國家的遺傳基因都有獨特性,生活型態與致病因素也與其他國家不同,因此均建立專屬的人體生物資料庫。像是冰島人口雖不到 40 萬,卻有四分之一參與生物資料計畫。
其中,英國的進展格外受到矚目。2006~2010 年間,英國人體生物資料庫(UK BioBank)收集了 50 萬名志願者的血液、尿液和唾液樣本,並在參與者同意後,取得病歷和訪談生活習慣。另外,也透過磁振造影(MRI)掃描約 10 萬名參與者的腦部及腹部。
值得注意的是,他們在 2018 年 4 月宣布投入約 3,000 萬英鎊(約新台幣 11.7 億元),要幫參與資料庫的 5 萬人執行全基因體定序(whole genome sequencing),目標延伸到所有參與者;10 月,更首次有研究團隊運用資料庫數據,發表兩篇論文至《Nature》期刊。
鏡頭轉到台灣,台灣人體生物資料庫於 2012 年正式展開運作,計畫邀請 20 萬名一般民眾參與,同時也邀請 10 萬名常見的 10 至 15 種疾病患者加入。收集的資料包含參與者健康情形、醫藥史、生活環境資訊與生物檢體, 長期追蹤健康參與者與疾病患者的健康變化情形與治療狀況。
台灣人體生物資料庫,6 年累積 11 萬人參與者
▲ 統計發現,台灣人體生物資料庫的參與者,超過 9.2% 有家族肝癌病史。(Source:台灣人體生物資料庫)
統計至 2018 年 11 月 30 日止,台灣人體生物資料庫已累計約 11 萬參與總數,並延伸出多項成果。像 2015 年時,透過資料庫篩選出台灣人特有的 65 萬個基因,從中比對出「41 個」與糖尿病相關基因,未來若能連結健保資料庫,讓民眾透過抽血檢測這 41 個基因位置,就能提高預測未來罹患糖尿病的機率。
根據台灣人體生物資料庫網頁,目前規劃釋出的數據,包含約 27,700 筆全基因體定型資料(Whole-genome genotyping);2,000 筆全基因體定序資料。數量雖不算多,但高雄大學與高雄醫學大學的研究團隊,分析其中 3,000 多筆資料,2018 年找出「ABCG2」是造成國人痛風的主要基因,顯示人體生物資料對精準醫學的發展,仍有巨大幫助。
「我認為要透過 AI 分析基因體數據與疾病的關聯性,至少需要 10 萬筆資料,最好能有百萬筆。」台大醫院基因醫學部主治醫師陳沛隆表示。
由台灣人工智慧實驗室創辦人杜奕瑾領軍的 AI 基因分析平台 TaiGenomics,正是希望能加速分析、比對基因的漫長過程。不過,即便他們能取得已公開的台灣人體生物資料庫的基因定序資料,數量仍相當有限。
篩檢費用高,基因樣本取得不易
再加上「價格因素」,即便是龍頭教學醫院──台大醫院,也無法輕易獲得大量檢體。
「基因篩檢幾萬塊費用,並不是所有病人都願意付」,台大醫院基因學部暨小兒部主治醫師胡務亮,同時也是「台大醫神──精準醫療人工智慧輔助決策系統」的成員之一,他認為,醫師的價值在於基因比對後的分析與判斷,但光是前期的基因樣本取得,其實很有難度,因此只能透過計畫補助費,幫患者免費嘗試。
由於全台 19 處的人體生物資料庫,目前並未有統一的數據規格,不利於研究團隊運用。因此,行政院正在研擬統整,並串連健保資料庫,希望讓基因分析更有效率。
台灣投入基因資料、分析的時間點,或許落後其他國家,但當 AI 工具、生物資料庫都有進展時,又有本土強大醫療團隊協助,邁向精準醫療的步伐,正逐漸加速。