每日經濟新聞 2020-04-13 11:23:33
在新冠疫情全球蔓延之際,追蹤疫情實時動態(tài)的數據逐漸成為了人們關注的焦點。約翰斯·霍普金斯大學發(fā)布的疫情地圖高頻出現在各媒體報道中。這張數據圖是如何誕生的,又為什么會成為權威數據來源呢?近日,《每日經濟新聞》記者采訪到了這張地圖的開發(fā)者董恩盛,他向記者講述了這張疫情地圖背后的故事。
每經記者|張凌霄 每經編輯|高涵

圖片來源:約翰斯·霍普金斯大學官網截圖
黑色的背景點綴著大小不一的紅點,實時反映著全球新冠疫情的動態(tài)。由美國約翰斯·霍普金斯大學發(fā)布的這樣一張可交互、可視化的疫情地圖近來頻繁出現在全球各大機構和媒體的報道和分析當中。
數據顯示,該地圖自今年1月初上線以來,日均訪問量從開始的2億次,上升到了3月初的12億次,高峰時每日近20億次訪問。
“這張地圖是如何誕生的?背后是一個怎樣的團隊?又如何成為了如今最權威的實時疫情參考呢?”這是很多人心中的疑問。
為此,《每日經濟新聞》記者采訪到了開發(fā)和維護這張數據地圖的核心人員之一,約翰斯·霍普金斯大學土木和系統(tǒng)工程系的系統(tǒng)科學與工程中心(CSSE)一年級博士生董恩盛,他向記者講述了這張地圖背后的故事。
董恩盛告訴記者,一開始做這個地圖只是想要收集數據來了解疫情的發(fā)展,而隨著疫情的蔓延,他們決定公開數據。“團隊現在所做的都是義務勞動,所有的數據都是免費開源的,這便于學術研究的開展。”
地圖上線83天:從人工到自動化
去年底以來,新型冠狀病毒肺炎疫情開始引發(fā)全球關注,各官方機構和學術界對于實時疫情數據的需求也隨之增加。
“最早我們做這個疫情地圖,單純是想看一下這個疫情會怎么發(fā)展,我們也想收集一些一手數據,沒有想到它會引起這么大的關注。”董恩盛告訴《每日經濟新聞》記者。
董恩盛在美國學習已有七八年時間,從今年開始,他和另一位中國留學生杜鴻儒一起成為了約翰斯·霍普金斯大學土木和系統(tǒng)工程系一年級的博士生,他們的導師是本系的副教授勞倫·加德納(Lauren Gardner),研究方向包括與流行病學相關的數學建模和網絡分析等。
而正是這位導師給予了董恩盛制作可視化數據地圖的建議。出于對疫情動態(tài)的關注和搜集數據的需要,董恩盛在導師的指導下在1月22日就完成并上線了最早一版的新冠疫情地圖。距離美國出現第一例確認感染新型冠狀病毒的病例僅僅遲了兩天。
自此以后的一個多月中,長時間的連軸轉工作就成了他生活的常態(tài)。“最開始的時候,我一天甚至有20個小時左右都花在地圖更新和維護上,經常晚上不睡覺,這樣持續(xù)了大概有一個月左右時間。”
隨著疫情向全世界范圍蔓延,更多的人參與到了這份地圖的開發(fā)和更新中來,地圖的覆蓋范圍開始擴大,數據的精度也被不斷完善。2月1號開始,杜鴻儒也加入到了數據收集和圖表的制作中。
“地圖上線以后主要有三次大的更新。”董恩盛回憶道。“第1次更新是從人工更新轉變成半自動化更新。第2次更新是把美國部分的疫情地圖精度升高為county level(郡縣級)層面,然后第3次更新就是讓地圖盡量全部自動化。”
董恩盛介紹,目前地圖數據的更新是以自動搜集和人工審核相結合。“基本上所有的數據都是我們學校內部收集,大部分是可以實現自動化的,但是數據還是需要人工參與核實。”
“我現在大概每天只花6、7個小時在地圖上,因為有很多學校其他部門的人和一些志愿者來幫我們。我們的團隊目前大概有四五十號人,每個人分工不一樣,現在更多的是需要編寫一些自動化的程序。做人工審核這部分的工作的大概有10個人,”他說道。
他還表示:“到目前為止,我們都是在做義務勞動,所有數據都是開源免費的。雖然有很多公司都找我們對接,想給我們資助,但是我們都拒絕了。”

董恩盛 圖片來源:受訪者供圖
日訪問量20億次背后:實時、覆蓋廣、開源受青睞
日益嚴峻的疫情形勢之中,不斷增加的病例數一直牽動著全世界人的心。約翰斯·霍普金斯大學新冠病毒研究中心官網顯示,其疫情地圖自上線以來,每日平均訪問量從1月底的2億次,上升到了3月初每日12億次,高峰時每日近20億次。
董恩盛介紹,大約從3月上旬開始,也就是歐洲疫情暴發(fā)和美國當地疫情加重之后,疫情地圖的訪問量大幅增加,服務器壓力也變大了很多。
《每日經濟新聞》記者注意到,除了約翰斯·霍普金斯大學,信息數據更新網站Worldometers、彭博社、《金融時報》和世界衛(wèi)生組織等也都在其網站上提供全球疫情數據。
那么約翰斯·霍普金斯大學的這張疫情地圖為什么會吸引到如此巨大的流量呢?
在董恩盛看來,與其他的地圖相比,自己所在團隊開發(fā)的疫情地圖在數據精度和廣度、實時性和可交互性、以及開源程度上有著一定的優(yōu)勢。
約翰斯·霍普金斯大學疫情地圖的病例數據是由全球多個權威可靠來源的數據整合而成,其來源包括世界衛(wèi)生組織、美國疾病控制和預防中心、歐洲疾病預防和控制中心、中國國家衛(wèi)生健康委員會、美國的華人中文社區(qū)網站“1畝3分地”(1point3Acres)、實時信息數據更新網站Worldometers、荷蘭BNO新聞網、各個州和國家政府的衛(wèi)生部門、當地媒體報道以及全球最大的在線醫(yī)學內容社區(qū)丁香園等。
董恩盛表示,“從覆蓋面上講,現在能覆蓋到全球范圍的地圖不多,而其中一些地圖采用的是我們的數據。各個國家和一些地方政府也有建立類似的dashboard(數據展示圖),但這些主要是針對當地的情況(開發(fā)的)。”
在數據更新頻率方面, 在線科技出版物Digital Trends曾對幾大主要數據發(fā)布平臺進行了對比。
3月18日,Digital Trends發(fā)布了文章《最可靠的新冠疫情通報平臺》(The most reliable coronavirus dashboards),其中列出了約翰斯·霍普金斯大學、BBC、《紐約時報》、美國疾病控制與預防中心、微軟必應搜索(Bing)和世界衛(wèi)生組織六個疫情數據通報平臺。文章稱約翰斯·霍普金斯大學的數據地圖“是我們能找到的更新最為頻繁的數據展示圖”。
在談到與其他疫情地圖的對比時,董恩盛告訴《每日經濟新聞》記者:“微軟必應的地圖之前做的比較籠統(tǒng),而且不開源?!都~約時報》做地圖做的比較早,也一直有展示到county level(郡縣級)的數據,但是他們的地圖初期不屬于交互式的地圖。哈佛大學與清華大學、牛津大學等也合作開發(fā)了疫情地圖(Health Map),但是這個地圖的數據公開沒有特別及時,對于研究人員來說,獲取數據不是那么方便。”
董恩盛強調,目前為止地圖的所有數據都完全公開,研究人員都可以獲取實時數據來幫助研究。
百年名???ldquo;疫”:不僅是數據
擁有144年歷史的約翰斯·霍普金斯大學是美國第一所研究型大學,也是世界頂級的私立大學之一,2020泰晤士高等教育世界大學排名世界第12,美國第9,學校的教員與職工共有39人曾獲得過諾貝爾獎。
該大學的醫(yī)學院和公共衛(wèi)生學院一直在全球范圍內名列前茅,知名度極高,醫(yī)學院的教學研究單位約翰斯·霍普金斯醫(yī)院已經連續(xù)21年被評為全美最佳醫(yī)院。在整個約翰斯·霍普金斯大學體系內,從事醫(yī)學研究、實踐和輔助工作的人員高達2.5萬人以上。
在這次疫情中,約翰斯·霍普金斯大學身在“震中”的美國,自然也沖鋒在前,投身到了抗“疫”一線。其在科學研究、信息分享和病毒檢測和治療等多個領域都作出了較大貢獻。
其醫(yī)學院自3月開始與美國疾病控制與預防中心和學校所在的馬里蘭州的衛(wèi)生部開展合作,向大眾提供病毒檢測,并開發(fā)出了新的病毒篩查方法。約翰斯·霍普金斯醫(yī)院也在全力收治新冠病人。
在這樣一所頂級醫(yī)學研究院校中,董恩盛所在的系統(tǒng)科學與工程中心雖然并不屬于醫(yī)學院,但其研究的內容仍與醫(yī)學息息相關,如董恩盛就曾經研究過美國和太平洋地區(qū)的麻疹和斯里蘭卡的登革熱,而這也是他和他的同學杜鴻儒得以參與到這次戰(zhàn)“疫”中的原因。
他向記者解釋:“我們和公共衛(wèi)生學院的傳染?。▽I(yè)學生)聯系很緊密,經常會和他們一起開組會,所以各方面信息都是比較通暢,平常學術方面也有一些合作。所以我覺得(我們做出疫情地圖)應該是屬于一種水到渠成的結果。”
自一月末以來,整個地圖項目團隊幾乎全身心地撲在了這張實時地圖上。在疫情地圖更新逐漸自動化后,團隊也已開始向數據抗“疫”的下一步邁進,即在數據展示的基礎上進行更多的分析和預測。
此前,加德納副教授在接受《科學》(Science)雜志采訪時曾提到,自己90%的精力已經回歸本職工作,即疾病的數學模型上。她認為,比起直接的追蹤數據,自己還應該通過已有數據對疾病進行預測,提前通知決策者可能會出現疫情變化的地區(qū)。
董恩盛在談到疫情地圖下一步的優(yōu)化方向時向《每日經濟新聞》記者透露,本周會對地圖進行第4次主要更新。“我們要多加一些圖表,致死率、感染比例,住院數等等這些信息都會放上去。我們還會出一些風險評估報告之類的內容。”
董恩盛盼望著疫情早日結束,“這樣的話我們也不用再這么辛苦的收集數據,可以留出時間做自己的學術研究。”
封面圖片來源:約翰斯·霍普金斯大學官網截圖
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP