Some images has been designed using resources from Unsplash & Pixabay & Pexels & Freepik and some icons from Flaticon
跳到主要內容
:::
研究資料集
:::

第1期:COVID-19資料集

#以下內容為節錄版,完整週報檔請見  雙週報PDF檔(2022.8.3 , 0001期  

各位同仁大家好:

     與大家分享一個好消息!「臺北榮總COVID-19大數據研究資料集」已經準備完成,所有有想法有興趣卻苦無資料同仁可以著手撰寫IRB提出申請案,COVID-19研究領域一展身手!!

    過去兩年防疫期間臺北榮總不只辛苦守護台灣,院長指示我們應該更進一步,分析北榮累積寶貴研究資料(real world data),讓榮總在世界上扮演重要領先地位。在陳院長、候副院長與高副院長指導下,大數據中心主動與資訊室、家醫部、兒童醫學部、醫企部、醫研部一起努力將本院2021/1-2022/6疫情期間資料整理並初步分成三個資料集:

如下:

項次

COVID-19 資料集名稱

01

疫苗資料集

02

新冠PCR篩檢資料集

03

確診資料集

       這些資料都是珍貴的真實世界證據(real world evidence),在疫情期間全世界很少有單位有如此完整資料,可以針對疫苗與篩檢的可靠性完整性、確診後症狀相關性等許多議題進行創新研究,歡迎同仁多加利用。

       這個資料集誕生並不容易,尤其是疫情期間政策滾動式修正,每個時間點資料不一致需要統整。在院長、副院長指導下,許多同仁攜手接力串聯才有辦法完成。

       首先必須瞭解資料產生過程:感謝家庭醫學部彙整並提供兒童醫學部如何在門診系統中輸入疫苗、產生疫苗紀錄、上傳系統等細部過程;感謝醫企部提供產生新冠篩檢紀錄、COVID-19確診病患如何編碼..等細節,感謝資訊室工程師們從主責單位開始到資訊室追蹤資料流(data flow)流向將病歷紀錄轉換成院內資料。接著進行資料驗證確保資料正確性,工程師必須抽樣反向從院內資料逆向回推到資訊室大型主機資料庫,以確保資料完整性,接著由大數據中心進行匿名化編碼(pseudo-anonymity)保護病患隱私,資料分割(data partition),將資料由大型資料庫導出成研究資料表。最後大數據中心會依照各主持人IRB申請,資料欄位再次處理加密後,切分成一般研究者可以分析之文字檔案。

      大數據結果往往影響深遠,提醒各位朋友,在發揮創意使用資料前請向人體試驗委員提出申請,與專家討論最適當的資料處理策略,保護主持人義務與病患隱私唷!


注意:

1. 研究者須先申請 IRB 同意後再至依原申請流程申請資料

2. 去個資匿名化資料,請勿嘗試破解以維護病患隱私

最後更新:

回到最上