《18AI防疫專題論壇.pdf》由會員分享,可在線閱讀,更多相關《18AI防疫專題論壇.pdf(40頁珍藏版)》請在三個皮匠報告上搜索。
1、 1 18AI 防疫 2 帝國理工郭毅可:抗疫政策的評估,數據科學的應用整理:智源社區 蔣寶尚在第二屆北京智源大會的“AI 防疫”專題論壇上,英國皇家工程學會院士、英國帝國理工計算機系教授郭毅可做了題為抗疫政策的評估:數據科學的應用的報告。在報告中,郭毅可詳細介紹了如何根據數據建立數學模型預測疫情。郭教授表示:傳染病學、流行病學是一門標準的數據科學,同時數據科學并不一定非常復雜,換句話說,針對傳染病的數據科學研究都是比較直觀的。在報告中,郭教授還具體介紹了動態和靜態兩種傳染病模型的細節,也對之前的建模預測效果進行了展示,同時對中國和歐洲的兩種抗疫政策進行了簡單評價。以下是文字整理:圖 1:什么
2、叫流行性傳染???今天演講的題目是抗疫政策的評估:數據科學的應用,我先從流行傳染病開始談起。傳染病與普通疾病的最大區別在于:普通疾病的患者影響自己,傳染病由于其傳染性在,會進一步影響患病率,而患病率影響發病率,一個病例就可能是一個危險因素。另外,患病率不僅是衡量人口疾病負擔的指標,而且也是遇到感染者的概率,其和人與人之間的接觸模式高度相關。3 圖 2:流行病學是一門關于數據的科學因此,傳染病一旦出現,沒有患病的人們關心自己會不會受到傳染,政府則關心如何讓更少的人被傳染。這時,首先需要進行的是數據科學研究,即通過觀察有多少人患?。ɡ邕M行關于病毒的核酸檢測),判斷病毒的潛伏期、傳染性和傳播模式。政
3、府也應出臺相應的防疫政策,雖然政策能在一定程度上限制傳染病的流行,但卻給經濟發展帶來了風險,這時則需要對政策進行全面的分析和評估。因此,傳染病學、流行病學是一個標準的數據科學。一、靜態傳染病模型:求解概率方程圖 3:帝國理工對武漢疫情的早期預測數據科學并不一定復雜,換句話說,針對傳染病的數據科學研究都是比較直觀的。例如帝國理工對武漢疫情最早的預測:我們不知道武漢有多少人感染,但我們知道從武漢出國的人每天有 3300 人;到 1 月 18 日有 7 個出國的人確診感染了;另外,一個感染者從感染到發現的平均時間是 10 天,那么我們就可以簡單地估算出武漢大 4 致感染的人數。因為我們可以把武漢出國
4、的人作為樣本,通過求解概率方程式就能得出感染人數。具體而言,如果考慮武漢機場覆蓋人口為武漢周邊地區 1 千 9 百萬,那么感染人數就是 4030 人,如果考慮武漢機場覆蓋人口為武漢地區成年居民 900 萬人,那么感染人數就是 1909 人。圖 4:2020 年 1 月 28 日湖北省新冠肺炎疫情情況這個簡單的預測非常有價值,因為當時抗疫政策的制定必須要知道感染的規模。該預測結果也在 1 月 29 日得到了驗證,根據當時衛健委的報告,湖北省有 3500 人感染,武漢有 1900 人感染,由此可見當時的預估是較為準確的。二、動態傳播模型:用流動數據講述生命圖 5:傳播動態系統數學模型的發明者上面是
5、簡單的數據科學,下面介紹復雜一些的動態變化。關于動態變化,傳染病學最重要的一個工作,是所謂的 SIR,即傳播動態系統的數學模型,由兩個物理學家發明。此傳染模型帶有普遍性,是一個 General Model,其概括了傳染過程中的三個人群:易感者、感染者,恢復者。5 先來看一個簡單的動態模型,即假設治愈的患者能獲得“終身免疫力”,不再傳染其他人;再者,還要去除干擾因素。這時所研究的對象是兩個部分,一是從易感者到感染者的傳播速率,二是從感染者到免疫/死亡者的周期。針對這兩部分,動態模型會描述三個狀態:易感狀態、感染狀態、治愈狀態。圖 6:傳染病動態系統模型另外,此動態模型對人群也有三個假設:1.每個
6、人都在四處游走,沒人會在同一地方待很長時間;2.每人與感染者接觸的概率相同;3.所有人不斷地混雜在一起。圖 7:三個動態變化的人群:三種狀態變量三個動態變化的人群對應三種狀態變量,其中易感人群:在某時刻可能會被感染的人群;傳染人群:在某時刻已被感染并會傳染的人數;免疫、死亡人群:在某時刻已免疫(或死亡)的人數,不會被傳染,也不會傳染別人。有了假設、變量之后,然后根據 SIR 模型找出動態變化規律,即需要確定個體狀態如何轉換、兩個轉化速率:6 不感染到被感染、感染到治愈。圖 8:感染速度:S I rate以上就是基本模型的基本思想,雖然會涉及一些數學,但非常簡單。例如從易感到被感染取決于什么?當
7、然取決于被感染人數,如果感染人數很多,或者很多人被感染,感染速度就會加快;或者被易感暴露的人群很多,那么感染速度也會加快。此外,還會涉及到一個參數,即針對速度的參數,其受兩方面的影響,一是,有效接觸的可能性;二是,接觸導致感染的可能性。也就是說,如果對應人群比較活躍的社會互動,那么參數就大;如果對應隱居的群體,疾病難以傳播,那么參數就小。圖 9:恢復速率:I R rate上面是感染的速率,那么恢復速率由什么決定呢?其實,只取決于一個變量,就是感染的數量。假定不考慮采取的醫療措施(因為醫療可以加快治愈率),感染的數量與恢復速率成正比。但是數學表達式中也 7 會有一個回復速率參數,取決于如何讓之前
8、感染的不再感染了。這里有兩種方式,一種是治好,一種是死亡。圖 10:SIR 模型及轉化速率其實,這一非常簡單的傳染病模型預示著會有“疾病峰值”的出現:剛開始的時候隨著時間的推移,很多易感人群被感染了,感染率就上去了,到了一定規模以后所有人都生病了,沒有人可以感染了,感染率就會下降,隨后出現的都是治愈病例。其實,所謂的群體免疫基本上符合這種思想。圖 11:基本繁殖率有了這個模型以后,其實可以做很多事情,其中一項非常重要的工作就是實時模擬各國現在處于各種各樣干預政策中的傳染率。這里會涉及一個重要的參數,叫做基本繁殖率 R0,即單一個體可以引起多少個新的感染者。如果沒有干擾政策,此 R 就是基本繁殖
9、率,如果存在干擾政策,那么模型的易感比例就會改變,此時的 R 叫做有效繁殖率。8 如果 R0 大于 1,那么傳染模型就是指數型,R0 等于 1 則感染保持恒定,R0 小于 1 則感染消失。圖 12:基本繁殖率的決定因素R0 由什么決定呢?基本上是三個參數:1.每次受感染者和易感人群接觸后,病毒的傳染率(因為接觸不一定傳染);2.接觸率,接觸的頻率;3.感染持續時間。而 R0 的數學表達式則是由這三個參數相乘。具體而言,傳染率如果是 0.15,接觸的頻率是 12,感染的時間是一周,那么基本繁殖率是 1.8。三、干預政策分析:中國和歐洲對比如果有了干預政策會改變什么呢?改變有效繁殖率,即把易感的人
10、群控制住,把受感染的人群控制起來。圖 13:各國的干預政策 9 下面講一講對各國干預政策的研究。疫情爆發之后,二十大經濟體社交政策各有不同。例如中國非常嚴格,瑞典、英國寬松。所有的政策都有其道理,即如何平衡生命與生活。舉個例子,過馬路有被車撞死的風險,但不能因為這個風險把交通封鎖。因此,生命和生活平衡點的把握非常重要,如果照顧了生命死亡率和患病概率,那么人民可能在經濟和人民生活上會有巨大損失,且其他原由的死亡率就會增加。所以,這就要求我們仔細分析干預政策,然而定性分析無法得到想要的結果,最好是用定量分析,能夠“互相比較”。定量之后,那么就能夠將經濟損失納入模型,則會得到優化版本。當然,聽起來非
11、??茖W和理性,但有的時候也很殘酷,因為要考慮的因素非常多。有多少干預政策呢?大概有自我隔離、控制交往距離、禁止公共活動、關閉學校,更嚴酷的就是封城。圖 14:通過人群流動的數據來決定干預政策這二十大經濟體中,干預政策的實施,在各國的基礎是不太一樣的。例如中國的有利條件是健康碼,它可以幫助政策實施到細微處,即可以通過人與人接觸的模式和個體的運動軌跡建立整個干預政策。所以這也是我們國家恢復正常秩序后沒有出現太大疫情反彈的原因之一。畢竟,如果有一個人被確診,那么其整個交往人群都能獲知,則可以通過溯源對其進行控制,這樣就不需要采取特別嚴控的政策來進行社交距離或者封城,經濟可以更加放開一些。10 圖 1
12、5:通過了解人與人接觸的模式來優化干預這種模式也存在缺點,即犧牲了個人的隱私?,F在有很多研究都是希望通過在不影響隱私的情況下能夠完成工作,例如通過 WiFi 可以建立聯系基礎(contact base)。圖 16:全球疫情網站有了這些政策之后,便每天看上述網站,了解一下多少新增患者、新增死亡人數。最主要的是通過觀察數據反推各國的政策有效性。11 圖 17:數據反映的政策干預結果:平均翻倍時間其實,干預是有效果的。如上圖所示,干預結果通過平均翻倍時間表現出來,即從 4000 人增長到 8000 人花費了多少時間。其實,封城之前基本上三天翻一倍,封城之后大概二十天才翻倍。這大大降低了病毒的傳播率。
13、圖 18:數據反映的政策干預結果:全球病例翻倍數如上圖所示,通過大規模的觀察也可以了解這一現狀。開始的時候“翻倍”花費的時間很短,大概為十天左右。2 月 1 日武漢封城,翻倍的時間增加到了 90 天。3 月初的時候歐洲爆發,翻倍的時間又縮短了。當然,這種衡量干預的方法都比較初級,并沒有看到一個國家和一個城市的變化。12 圖 19:精確地量化干擾政策的作用因此,為了精確地量化干擾政策的作用,我們用模型進行了模擬,模擬的結果就是 R 繁殖率(幾何上表示的 R就是傳播曲線下的面積),即一定的時間內一個人能傳播多少人。當然,傳播的概率就是參數 B(Beta),下面的面積就代表傳播的人數。我們把政策的作
14、用分成兩大類:一類就是 S 到 I,只有緩和系數,就是我把 B 參數 降低下來,降低它的傳染率。怎么降低?用保持社交距離、戴口罩等干擾方法。第二類是阻斷,改變 I 到 R,即讓 Dt 縮短(如果發現感染者,立即隔離,阻斷其傳染率)。實際上任何一個政策都有兩面性,既有阻斷傳染期的效果,也有降低傳染率的效果,所以組合起來就是可以計算這個 R(繁殖率),希望能夠小于 1。圖 20:量化系統示意圖 13 其實,整個觀察以及模型結果就是報告的確診病例。其實我們不可能知道這個國家到底有多少人感染了,除非做全民的測試,否則只能預測。那么如何從確診病例預測全部感染者規模?我們的做法是把時間向后推,然后重建傳染
15、模型。隨后,就可以用貝葉斯的理論推斷三個參數,一個參數是緩解系數(Mitigation factor),另一個是有效繁殖率(instantaneous),最后一個是阻斷系數(Supperssion Factor)。有了這些以后,就可以構建前面提到的 SIR 模型,從而把它和政策進行結合分析。即回答一個政策到底影響了哪些因素這些問題。圖 21:用貝葉斯估計來計算 Rt整個模型最難的部分是用貝葉斯進行計算 Rt。畢竟,我們要求的對 RT 的估算是每天實時進行,所以由于政策具有延遲性,導致推算變得異常艱難。這里我們采用的思想是:能夠觀察到的都是發生在過去的,所以還需要往后推。具體而言,我們通過貝葉斯
16、的方法,通過順序的學習,即根據前幾天算出來的 RT 改變后驗概率,也就是期望改變參數,把后驗概率最大化。綜上,整個過程等于是進行了一個順序的貝葉斯推理。強調一下,我們并沒有使用神經網絡,而是運用貝葉斯的高斯過程。14 圖 22:揭示倫敦的 Rt 變化運用上述推理過程,就可以得到一個非常漂亮的關于各個城市的描述,如上圖所示倫敦 RT 的變化,黑線就是根據確診病例估算出的感染,可以看到倫敦到了 4 月 5 日以后的 RT 基本上在 1 以下,所以實際上傳播已經開始控制住了。圖 23:揭示武漢的 Rt 變化武漢則更明顯,封鎖之前 R 值非常高,春節的時候 R 達到了 3。23 日封城以后 R 值迅速
17、降低(因為采取的不僅是封城政策,還不讓上街)。因此,1 月 23 日到 2 月 15 日中,實際上新患病的很少,幾乎所有的病例都是前面感染的,只不過那個時候爆發了癥狀。15 如上圖所示武漢的 Rt 曲線有一個跳躍,因為武漢更換了市長,市長所采用的防疫政策是將過去的所有疑似都當成“確診病例”進行控制,這作為一個人為的動作,發揮了很大作用。隨后加上方艙醫院的使用,可以看出武漢從 2 月 3 日疫情得到控制。這里我們也可以明確了政策對于整個抗疫的影響。圖 24:歐洲政策的評價結果我們也對歐洲的所有政策進行了評估。其實,歐洲和中國采取兩種不同的政策,歐洲的政策基本上沒有強制性的封城,但也關閉了學校、工
18、作場所,控制了交通。其實,每個政策我們都對應 R 的變化。其中,Soft Response 可以降低 30%,Strong Response 可以降低 70%,所以還是非常有效果。而中國的做法截然不同,因為中國采取的是非常嚴格的政策,“一下子”就把 R0 減掉 79%-80%。因此可以看到各國政策的評價是不一樣的。當然,我們沒有分析具體“成本”,如果這個評價再加上“成本”,然后進行比較,可能就比較有意思了。圖 25:美國疫情的第二次爆發 16 RT 確實在一定程度上能代表預測性,例如上圖我們在 5 月 31 日計算的美國 RT,那個時候就看到美國毫無疑問在面臨著第二次爆發,因為其 Rt 的數值
19、在 30 個州全部超過了 1。由于當時 R 的效果在大概 10 天后才能觀察到,所以到了 6 月 12-13 日的時候,30 個州當中的 29 個州都有第二次疫情爆發,其中 5 個州是高爆發(Record High),因此預測比較準確。四、總結:模型參數改變,背后是人命代價總結一下,將人工智能、數據 科學應用在傳染病防控當中,效果非常棒。什么叫做人工智能?就是用物理來描述一個世界,把它變成變量之間的轉換,然后通過觀察得到數據,通過觀察推斷模型,這才是真正人工智能的偉大意義。圖 26:干預與否:改變的是模型參數在建模過程中,我們需要更多的是關于模型的定義和模型參數的學習,例如上圖戴口罩的模擬,通
20、過戴口罩改變 R0、RT 的數值。其實,干擾與否對于數據科學和人工智能來說,可能就是改變一些模擬的參數。但是對于社會,其背后的代價會是生命。17 圖 27:干預與否:代價是生命如上圖 4 月 20 日的數據,香港和紐約的面積差不多大,香港感染了 1000 多人,一共死了 4 個人,紐約 4 月20 日的死亡是 1.3 萬人,而整個大紐約最近的一個數字 3 萬多,如果只看紐約城(New York City)這一數字也達到了 1.8 萬。那么如何評價強烈干預的政策?其實,這個問題是可以討論的,如果是像香港這樣非常強的干預,到今天為止還是封閉狀態,與全世界不能正常交往。那么,這對香港的 GDP、經濟
21、、民生的副作用是非常大的。因此付出的代價換來了低死亡率,是不是完全合理?這個問題也是可以討論的。最好的做法是在生命和經濟當中取得平衡,即在保證生命救助同時,也能保證生活。這種平衡也是我們想要的未來社會,要讓城市有免疫力也要有抗災力,如果有一套規矩,能夠指導制定平衡政策,那么這座城市就是一個真正的智慧城市。這一次我們對智慧城市的定義和理解有了很大的進步,以前我們理解智慧城市就是交通不堵,污染更少等等。實際上這些東西都是皮毛,真正一個城市的智慧在于能夠抗災,能夠免疫,能夠保證人民的生活,能夠保護人民的健康,這才是最重要的。18 人大教授文繼榮:疫情突如其來,大數據人工智能如何沉著應對?整理:人大高
22、瓴人工智能學院在 2020 北京智源大會“AI 防疫”專題論壇中,中國人民大學文繼榮教授分享了題為大數據人工智能技術+疫情防控:經驗和反思的報告。文繼榮,中國人民大學信息學院院長,中國人民大學高瓴人工智能學院執行院長,智源首席科學家。主要研究方向是互聯網搜索與數據挖掘等,獲得過 50 多項美國專利,同時在國際著名會議和期刊上發表了一百多篇論文,也是信息檢索領域主要期刊 ACM Transactions on Information Systems(TOIS)的副主編(Associate editor)。2020 年春節期間,新型冠狀病毒疫情爆發,在智源人工智能研究院的部署下,文繼榮教授和許多研
23、發人員都參與到了北京市疫情防控的相關工作中,并研發出了新型冠狀病毒肺炎防控智能追蹤服務系統和時空足跡近距定位系統,為北京市的抗疫工作做出了一定貢獻。報告中,文繼榮教授分別介紹了兩個系統的主要原理及功能。一、新型冠狀病毒肺炎防控智能追蹤服務系統該系統主要是通過匯聚用戶散布在各個互聯網公司的片段式數據,利用用戶在移動互聯網的“數字腳印”,從而圍繞風險人員繪制軌跡信息,利用算法對高危人員進行分析、追蹤與篩查,最終確定密切接觸人員名單,達到快速定位到重點防范區域、防范人群的作用。自 1 月 28 日啟動使用到 2 月 2 日運行生成首批數據,該系統已經持續發現疑似接觸人超過 10000 名,并且能夠根
24、據人工智能算法自動生成活動報告,目前該系統仍然在持續為北京市的防控工作提供保障。圖 1:基本數據的處理流程 19 圖 2:系統首頁示意圖二、時空足跡近距定位系統該系統是解決 GPS 在室內的定位問題,可以實現精準定位到城市中每個房間的風險防控服務,通過藍牙、局域網信號、氣壓計等信號,對人員時空軌跡數據進行采集,追溯近距離接觸人員,借助大數據和人工智能技術更精準的進行疫情防控,從而降低隔離成本,為企業復工復產提供支持和保障,因此,這個系統最典型的應用場景便是人員較為密集的室內辦公場所。另一方面,文繼榮教授還提出了在此次疫情防控過程中所產生的三點思考:1.下一次公共衛生事件突發,我們能不能做的更好
25、?在應對此次新冠病毒疫情的工作之下,文繼榮教授發現了暴露在疫情下的“數據孤島”、“數據安全性”、“數據動態性”和“決策及時性”等問題,疫情雖然尚未結束,但我們已經要開始思考應對此類事件的解決方法和措施,保證數據信息的全面準確等,為未來的挑戰做好準備。2.完全的隱私保護是不可能的!文繼榮教授以蘋果谷歌聯合推出的疫情追蹤系統為例,雖然蘋果谷歌在操作系統層面上進行設計該系統,并且聲明不會泄露用戶隱私信息,但是文繼榮教授針對現實生活中人們獲取隱私數據的一種經典方法的變形,提出了“完全的隱私保護是不可能的”這一見解。3.公共利益和個人隱私的讓渡。隨著我們的世界從物理世界逐漸過渡到數字世界,在網絡世界中會
26、逐漸分化出另一個包含真實性格、記憶等的數字分身,而當用戶的數據和信息在互聯網中留下痕跡后,文繼榮教授表示我們其實已經在不知不覺中讓渡個人隱私,而對于公共利益和個人隱私的沖突問題,文繼榮教授表示需要政策和法律來界定邊界,并且需要公開進行討論該問題。20 北大教授寧毅:科學、精準的公共衛生-應對慢性病和傳染病雙重威脅整理:智源社區 賈偉、王靜在智源大會“AI 防疫”專題論壇上,北京大學寧毅教授做了主題為“科學和精準的新公共衛生應對慢性病和傳染病雙重威脅”的報告。寧毅教授是北京大學公共衛生學院教授、美年大健康首席科學家、公共衛生專家,并且在弗吉尼亞做過醫學院的助理教授、博士生導師,也曾在跨國公司 G
27、SK 任職。報告中,寧毅教授提到,全球疫情不太樂觀,如果能夠較好地防控外源性輸入的病例,中國境內疫情反復的壓力就會急劇降低。這種防控范圍較大,在斬斷傳播途徑這樣的過程中,每個個人、家庭以及單位發揮著重要的作用,甚至是主戰場的作用,國家教育、健康促進、家庭行為改進等等,這些是保證生活和防夠保持常態化的關鍵。相對來說,應當把防控做得更精準,可以局限到某些人群或地域進行防控。以下演講正文從去年一月份開始,一直到今天,疫情的變化每天都發生著戲劇性的變化,這吸引著我們每一個人。今天,我把近一段時間對于過去的一些回顧,以及我們對未來的一些思考與大家進行討論。一、疫情概況首先看一看今天(2020 年 6 月
28、 23 日)疫情的狀況,全球如今有大約 907 萬感染者,死亡 47 萬人。過去的一個月,大家可能對這個數字已經麻木了,但我們還是需要去想,這樣的數據究竟反映了什么?圖 1:6 月 23 日,世界范圍內的疫情對比(中國 vs 世界)21 比較一下中國。中國在整個疫情期間一共有 8 萬多人感染,但現在全球感染者已經是這個數字的 100 多倍了。按照這樣的發展趨勢,到本月底,感染人數將突破 1000 大關。從死亡人數上看,中國死亡人數是 4646 人,全球死亡現已超 47 萬人,是中國死亡人數的 100 多倍。從新增感染人數上來看,目前整個世界還仍以每天 15 萬人的速度增加;而中國感染人數最高的
29、一天達到 1.5 萬,之前與之后大致都在 3000-5000 人之間變化,后來穩定在 1400-1200 人變化。從這個對比中,可以看出,現在全球疫情的壓力非常大。之前我曾經講過,中國能不能消滅或者消除這個疾病,不取決于中國自己,而取決于全球的疫情控制情況,所以到目前為止我們可以很肯定地說,這個疾病會長期和我們共存。圖 2:美國和歐洲的比較:相似的基礎,不同的結果。各個國家都采取了不同的措施,歐洲和美國在基本條件相似的情況下,兩個國家的患病率和發病情況卻表現得非常不一樣。22 圖 3:各種情況下新冠流行的預測哈佛大學的研究小組進行了一個預測,即根據人們在產生病毒抗體之后能夠維持的時間來預測疫情
30、未來的發展。從現在的數據來看,真實情況更接近于左上角的數字變化,也即感染之后有 40 周的免疫力,預測結果是:到2025 年,新冠疫情仍會流行。這里提到 40 周的免疫力,也就是免疫力能夠保持 10 個月;但今天有些報道中又提到免疫力維持的時間只有 8-12 周,說明我們的抗體水平明顯下降了,未來三到五年疫情很難看到明顯的控制。23 圖 4:曾經和現在認知的基本參數:不支持中國群體免疫(國外不得已)現在國內面臨的最大爭議是,中國要不要做群體免疫。我們必須回顧一下和其它疾病的比較。圖 4 中橫軸表示R0,也就是傳播系數,過去我們認為 COVID-19 的傳播系數大約是 3-4,但現在來看,人口密
31、集的情況下可能會達到 5.7。如果做出很好地控制,R0 可以接近 0。但 0 是有前提條件的,就是需要嚴格防控。我們曾經認為這是一個大號的流感。流感在美國的病死率是 0.1%,但目前 COVID-19 在美國的病死率是 5.2%,也就是說病死率是流感的 50 倍還要多;其他國家的情況也大體相近。針對我們國家疫情,早期我曾經判斷病死率不會低于3.5%,因為當時我們國家的數據還是低于 1%,當時“知識分子”采訪我,問“為什么”,我給出的原因是“很多病重的患者還沒有死亡”,隨后統計上去之后應該能達到 3.5%?,F在看來,當時還是比較保守,但那個時候也是國內甚至國際上,認為最高的一個估計。而現在,各個
32、國家還都有大量的新發病人,相對第一波傳播是比較發達的國家,第二波非發達的國家病死率會怎么樣?我預計病死率會超過 5.2%。在這種情況下,任何一個國家思考群體免疫的時候都要想:發病階段有沒有足夠的醫療資源去應對?這樣的死亡率能不能接受?回到動態的過程中來看各個國家的變化。我們國家繼承原來蘇聯傳統的疾病控制理論,提出了三點:控制傳染源、切斷傳播途徑、保護易感者。從圖 4 中可以看到,這三點并不是相互獨立的。傳染源如果多,傳播途徑就要加力,也可以減少可能的易感者。24 圖 5:傳染病的動態中,思考各個國家的疫情變化現在來看,美國和歐洲的一些國家認為現在似乎達到了群體免疫,疾病得到了很好的控制,疾病的
33、新增感染人數也下降了。但要注意到,這只是暫時的,因為前一段時間隔離措施比較嚴格,傳播途徑上有所著力,很多易感者并沒有發病轉化為傳染源,從而使傳染源降低了。一旦未來各個國家恢復到正常生活狀況,疫情必然會再次反彈。圖 6:新冠中的脆弱人群整個疫情易感人群主要是脆弱人群。心血管病的病人,世界各個國家的報道非常吻合,死亡率達到了 10%;糖尿病、慢性病呼吸系統疾病、高血壓和癌癥晚期患者,也都達到了 5%-10%。相對來說,如果自身沒有什么固 25 有疾病,病死率一般很低。二、精準防控我們來看,在北京這種情況下如何做到精準防控;或者在未來其他地方有疫情發生時如何做到精準防控。我們國家在防疫上的一個大的策
34、略,基本上就是:外防輸入,內防反復。我們從北京、黑龍江、天津的數據可以看出,基本上黑龍江、天津的病例都是輸入的。圖 7:北京疫情的大致情況我們從北京病例的基因序列發現,它和歐洲的基因序列更接近。具體是歐洲輸入還是從吉林延展過來的,我們還不清楚。天津這邊,已經發現了和北京的疫情有關聯,因為在發病人群和北京流行的人群之間有一個無癥狀感染者。我們可以說,北京的疫情目前是處于積極的控制下,于 13-14 日達到高峰,之后就是穩定的下降了,18 日之后,CDC 專家談到北京的疫情得到了很好的防控,為什么呢?因為 18 日之后,所有病人的發病和感染都確定是和新發地市場密切相關,后來發病的人群應該是間接接觸
35、,疫情的傳染源是非常明確的。在這種情況下我們把新發地以及相關地區控制住,疫情防控就有保障了。從圖中也可以看到,18 日以后我們看到疫情是相對穩定下降的?,F在有三個意外情況可能會發生,1)出現超級傳播者;2)出現監控死角;3)有不明原因的物流傳播病毒。那么這會引起新的疫情,但這種疫情的可能性比較小。所以我個人支持已經看到希望的觀點,讓民眾感覺到我們的疫情有控制的希望,讓他們抱有樂觀而不是恐懼的心態來面對疫情。非常感謝文繼榮教授和北京的團隊,能夠把不同的區域分為低風險、中風險和高風險,甚至局限在一些街道上,在不同的區域采取不同的防控措施。大家可以看到基本上在西南城區的豐臺、大興等地區的風險比較高。
36、同時對于北京的疫情能夠做到這樣精準的防控,是非常不容易的,因為它的人流量非常大,而且短時間內流動快,流動半徑大。這個時候追蹤技術就發揮了重要、關鍵的作用。26 圖 8:確定性中尋求突破口:傳染病的動態+相互減壓什么叫科學?什么叫精準?怎樣管控這次疫情?我們還是要回到傳染源、傳播途徑和易感者來講。對于傳染源就是源頭的管控;易感者就是對重點人群,如年老、患病的人群,要進行重點保護。我們可以看到,基本上發病人群以及感染疾病未發病的人群是在一個動態的過程。在傳染源的管理方面國家是非常發力的,每個小時都有可能有新的疫情發生,因此時間的動態是非常關鍵的,如何在傳染源、傳播途徑和易感者之間減壓,這是我們的一
37、個思考。圖 9:尋找精準的靶子:基礎數據和信息目前北京正在進行大面積檢測,武漢也在進行全城檢測,那么就要講三個基本概念:Surveillance(檢測),即要了解疾病現狀;另一個 Monitor(監督)對疾病的現狀進行監督,甚至采取一些干預措施改變疫情的動態;再就是我們常說的 Testing(檢測),應該是監測和監督疫情的重要內容。但是我們從公共衛生的角度思考,如何在監測、監督這兩個方面來下功夫,找到最關鍵的高危人群、最可能的傳染源,然后有重點地實施公共衛生措施?疫情的變化基本上是每三到六天會感染一撥病人,每天的疫情分析、甚至時時刻刻的分析都非常重要。數據的收集和 分析是就是在和疫情的傳播賽跑
38、,我們的控制措施也在和疫情的傳播賽跑。今天有報道說我們的病毒株 27 在變化,對細胞的親和力增加了 10 倍。中國這種情況下,如果能有效地控制疫情的發展,病毒變異的可能性就可以大幅度降低;如果疫情還在全球這樣流行,那么變異的可能性就會增加。當然,我覺得一年以內大的變異還不會有,變異會隨著傳播力明顯增加。其致病率是降低還是增加,現在我們還不明確,比較理想的狀態就像流感這樣,但現在我們還有不可確定的因素。對于未來疾病的控制,我們一定要考慮對社會經濟的影響。毫無疑問,我們控制疫情是保障社會經濟的發展,所以現在的目標基本上是奔著“零病例”的方向發展,如果能夠加強 Surveillance 和 Moni
39、tor,能不能考慮接近零病例的情況下讓社會和生活正常運轉?同時即使有小的疫情發生,我們也能夠快速撲滅。當然,對于新發地這樣的疫情屬于難防難控,一般可防可控的情況下我們要控,同時也要防控相結合,這樣能夠減輕社會經濟發展的壓力。圖 10:公共衛生到精準公共衛生剛才提到我們通過監測以及監督來對高危人群、疫情可能的發展進行預判的時候,在公共衛生領域,對傳染源和易感人群、傳播途徑的管理是不是可以做得更好?公共衛生包括生物統計流行病和環境衛生,可以看到這一次新發地疫情與環境是密切相關的,所以個人和家庭能不能考慮社會和行為學的干預建立起健康的生活習慣?如果有健康的生活習慣,我們就不用擔心疫情的傳播與危害。因
40、此,如何讓普通民眾通過健康教育接受、強化這種健康行為?這就涉及到人口和家庭,后面再講從營養上怎么支持這次疫情的控制,接著又涉及到全球疫情的防控、海關的管理、衛生政策的管理,還有對疾病的基本了解,包括一些社會學的因素等。這次三文魚不能吃了,三文魚產業在中國有多大,魚類的產業有多大,肉食類產業有多大,這些都有很大的影響,我們應該怎么解決?同時,涉及到心理健康和健康促進等,如何防控人們的恐懼心理?每個決策者在每一次把控平衡這種精準和擴大范圍防控的時候,也在把控會不會發生可能的一些風險。這就非常需要我們在專業上甚至是Precision Public Health,涉及到什么樣的人需要檢測?在動態中如何
41、把握?哪些空間要下功夫?涉及到易感者、傳染源和病人,要運用怎樣的綜合公共衛生手段?在我看來,公共衛生就是認識到疾病面前并非人人平等,我們解決公共衛生問題就是解決不平等的問題,提高公共衛生的效率。對于高危人群、高危時間、高??臻g、脆弱人群如何解決,要把這些問題解決得好,防控效率就會相應提高。28 圖 11:外防輸入,內防反復:病毒流動和有序人口流動從源頭的管理來看,黑龍江、北京和天津都處于較難防控的狀況,我們應該在控上下功夫,對于難防的部分以及重點的區域,比如農貿市場,現在對已經確定的重點區域要進行嚴格地管理,同時加強控制。在北京,我們感覺到有些防控還有進步的空間,表現在整個防控的過程當中太緊張
42、,因為新發地是非常不一般的地方。不過整體來說是有條不紊的,民眾能夠理解和支持,并且能做到自愿去進行核酸檢測,社區對于外出的管理也非常完善。另外在精準預防上,也運用了很多新技術,例如美聯社的記者去新發地拍了張照片,結果被大數據鎖定,要求他必須做核酸檢測。三、新冠和非傳染性疾病圖 12:同時思考傳染病和非傳染病這次疫情可以分為三個階段:疫情發生的階段;疫情發生之后現在大部分省份都處在緩沖期的黃金階段;接著在秋冬季來臨時可能是疫情高發的階段?,F在我們在想如何共同解決傳染病和非傳染病的問題??梢詮倪@次疫情看到,高感染率人群以及高病死率人群基本上都是老年人、有接觸疾病的人群和相對脆弱人群(經濟收入各方面
43、比較低)。在這種情況下,我們認為傳 29 染病和慢性病共同構成了公共衛生的重要部分,尤其是中國這樣的發展中國家,對于健康資源長期投入的不足,那么有限的資源究竟是優先覆蓋慢性病還是優先覆蓋傳染病,這是公共衛生的焦點問題?;氐浇裉?,我們認為整個新冠疾病的高危人群就是慢性病的人群,這兩個疾病都不能輕視。圖 13:疫情期、間歇黃金期、防控高壓期(秋冬季節,或者提早)在未來的疫情期、間歇黃金期以及防控高壓期階段,我們可以做哪些事情?首先,疫情防控在秋冬季會有大的壓力,也就是防控的高壓期。北京目前是處在疫情期,可以看到我們要建立和修正原來的一些健康習慣,比如戴口罩、勤洗手、少去擁擠的地方,保持 1 米以上
44、的社交距離。針對防控的高壓期,需要強化健康行為習慣,包括分餐、疾病預防康復,讓一些疾病康復,從而達到理想的身體狀況。在夏季,我國一些地區發生了疫情反復,預計秋冬季的疫情防控壓力會更大,每一波疫情的影響都值得我們關注,我們要改變一些行為,從而降低患病風險。我們也要體會飲食、心理狀況、運動和社會交往對健康的影響。因為我本人是學營養的,因此我希望能夠給大家推薦一些良好的飲食習慣,即三多兩少。如下圖所示。圖 14:生活方式建議 30 四、總結對于本次演講,總結如下:1.不能過度依賴國家的組織動員,要科學精準實施防控;2.重在外防,同時在內防中動態地思考防控使用公共衛生技術手段;3.發揮個人和家庭主戰場
45、作用,生活和防疫兩個常態化;4.預防優先,思考慢性病和傳染病的防控,管控風險。31 精鼎醫藥馮勝:真實世界數據(RWD)和 AI 如何炒好臨床研究這盤“菜”?整理:智源社區 張弛在 2020 北京智源大會“AI 防疫”專題分論壇中,我們邀請到了馮勝教授進行題為COVID-19:Real-World-Data(RWD)&Advanced Learning in Clinical Studies的分享。馮勝,精鼎醫藥真實世界數據亞太區總裁。中國科技大學分子生物學學士,美國北卡州立大學生物統計和生物信息學博士。在分享中,馮勝提出了真實世界數據和臨床試驗數據的兩條相對獨立的研究處理路徑,而此次 COV
46、ID-19 疫情將兩條數據處理路徑錯綜復雜地聯系在了一起。針對 COVID-19 疫情背景,并結合自身多年企業工作經驗,馮勝對 AI 處理 RWD、RWD 進入政府和 RWD 進入藥物公司三個方向展開闡述,分析了 RWD/AI 在 COVID-19 疫情中進入臨床研究所面臨的普遍、特殊挑戰是什么,最后為 AI engineers 和 IT 行業從業人員等將真實世界數據和 AI 技術帶入臨床研究提出行之有效的建議。圖 1:真實實驗數據和臨床試驗數據的處理一、RWD/AI 在 COVID-19 疫情中進入臨床研究所面臨的普遍、特殊挑戰是什么?值得一提的是,企業生產范圍內所定義的 AI 除了包括學術
47、范圍內的神經網絡、深度學習等,還包括數據挖掘、統計分析方法等,是廣義的 AI,而在接下來的分享中也將在此基礎上進行討論。32 1.RWD/AI 所面臨的普遍性挑戰數據質量的劃分當我們從數據的應用場景橫向展開,以數據質量標準(Data Quality Standard)、數據分析性質(Analytic Styles)、臨床應用價值(Clinical Market Value)三個維度縱向進行分析時,我們會發現真實世界數據面向大眾,主要應用于社交媒體、新聞等場景,且多為探索性數據研究,對于數據質量標準的劃分并不明確,因而在臨床研究中的價值甚微。然而在臨床試驗、公共政策制定等場景中所需要的數據多為確
48、定性分析數據,要求對每一個數據都需要很強的質量控制,所以這些數據在臨床研究中價值也是最大的。圖 2:數據在不同應用場景下的分析2.RWD/AI 在 COVID-19 疫情背景下所面臨的特殊性挑戰 COVID-19 疫情來勢洶洶,在全球忙于應對疫情的情況下,收集到的數據質量參差不齊、無法控制,不同于癌癥、糖尿病等數據集,疫情數據快速產生、變化迅速,這就給數據的采集和分析造成了很大的困難。疫情初期,最好的數據分析師和最好的數據源之間存在鴻溝,存在于企業中的優秀的數據分析師無法獲取到置于政府內的公共數據集,導致數據分析的滯后。疫情突如其來,無法制定臨床數據的標準,因而也就無法評判數據分析質量。全世界
49、優秀的數據分析師和強大的資源處于分散狀態,無法集結起來進行數據分析。疫情期間的一些虛假數據、探索性模糊數據和確定性數據交融錯雜,而這些數據的不公開、不透明性導致無法辨別數據的真偽,這也就為數據處理增加了一定的困難。分析完 RWD/AI 在 COVID-19 疫情中進入臨床研究所面臨的普遍和特殊挑戰,馮勝介紹了一個數據集在臨床研究中的應用例子,利用貝葉斯方法分析包括 local policy/law 在內的多個公共數據集,使得數據分析能夠突破實時監測的限制,可以達到預測一個月后的效果。二、政府在 RWD 進入臨床研究中扮演的角色2020 年 5 月 1929 日,十天之內,FDA 對羥氯喹兩次授
50、權又取消,這次事件的背后,針對“羥氯喹對于疫情的治療是否有用”這一觀點出現了很多支持和反對的臨床證據,而這些證據大多都表現出小樣本、不嚴謹、發布于社交平臺等特點,不符合嚴格的臨床試驗的特點,那么針對這個事件,馮勝提出問題:疫情之下,一定要大樣本、隨機、雙盲、安慰劑對照的嚴格的臨床試驗嗎?監管機構能夠接受的最低力度證據(Minimal Strength Evidence)是什么?能否有指南/指導原則?真實世界數據到底行不行?33 為了回答上面的問題,馮勝通過一個 RWD 應用于臨床的例子埃博拉和棕櫚樹平臺試驗進行說明。棕櫚樹實驗是一個十分不嚴格的臨床試驗,它沒有雙盲,沒有安慰劑對照,孕婦、小孩都
51、可以入組,可以中途叫停,并將患者換入治療效果好的組內,盡管如此,棕櫚樹實驗還是大獲成功。從以往多次慘烈的教訓中,科學家、醫生和世界的領導者們逐漸意識到,疫情爆發的時候,不是進行嚴格的藥物臨床試驗的理想時機,如何快速的找到一種有效的藥 物治病救人才是首要任務。而在這次 RWD 成功應用于臨床試驗的例子中,人們意識到:RWD到底可不可以應用于臨床試驗取決于多個因素,但是其中關鍵的一點是“領袖”是否介入,通過國家或政府將有效的資源進行整合,這是 RWD 能夠成功的關鍵。三、RWD 應用于臨床研究,AI engineers 應該怎么做馮勝認為 AI engineers 和 IT 從業者們無法將 RWD
52、 應用于臨床的一個原因在于溝通不暢,AI 工程師在于臨床醫生交流時應該注重于物資分配、人員部署的討論,而不是執著于介紹算法功能的強大,同時應該更多的需要了解適應性實驗設計的要求,構筑起大數據和臨床之間的橋梁,巧妙把握好實驗性(Explanatory)和適應性(Pragmatic)是 RWD 助力臨床試驗的重要一環。四、總結RWD 要成功應用于臨床試驗,需要國家或政府的介入進行資源整合;AI engineers 要使 RWD 被臨床醫生所接受,便要將知識體系和思維架構逐漸向實用型臨床知識過渡,掌握適應性實驗設計的要求,使得科學型 AI 和實用型臨床知識達到平衡,相信 RWD/AI 的助力一定會使
53、未來臨床試驗的研究再創輝煌!34 北大副教授邊凱歸:新冠疫情下接觸者精準追蹤技術的思考:如何最大化用戶隱私的保護?整理:智源社區 季葛鵬在第二屆北京智源大會“AI 防疫”專題論壇中,來自北京大學信息科學技術學院網絡與信息系統研究所副所長、副教授邊凱歸,對團隊近期關于“流行病接觸者精準追蹤技術”的研究工作做了一個詳細的報告分享。整個報告分成四個主要部分,包括:流行病接觸者追蹤技術的基礎概念和背景簡要介紹,管控措施粒度與接觸者追蹤精度層次,產品落地過程中的三個約束條件,隨后介紹了智源研究院開發的保護隱私的流行病接觸者精準追蹤系統智源藍保(Blue Bubble)。一、流行病接觸者追蹤的技術背景圖
54、1:接觸者追蹤的定義什么是接觸者追蹤(Contact Tracking,CTC)?其包含四個內容:第一個功能是追溯與感染者密切接觸的人員;第二是所提供的結果是否支持對某些人員進行隔離;第三點是擴大對更多流調人員的支持力度;最后一點是需要使用更為高效的數字化的工具。CTC 最終的目的是將密切接觸者的近距離感染者找出來,保持一定的檢測精度,盡可能地減少非必要隔離人員帶來的損失。圖 2:智源研究院啟動流行病接觸者追蹤技術研發 35 智源研究院積極響應國家號召與社會即使需求,在二月底 3 月初便啟動了接觸者追蹤技術的研發,用于解決復工、復產、復學過程中精準追蹤感染人員的位置,快速排查與感染者有近距離接
55、觸人員,最終目的是大幅度降低隔離人員比例。邊凱歸補充道,我們的技術方案經過幾輪的迭代確定,最后決定采用藍牙近距離感知技術方案,其有兩種模式:一種是樓宇發現的模式,一種是個人發現的模式(后文會詳細地介紹)。4 月 15 日這個系統已經部署在知春路智源研究院寫字樓上,樓宇上面的邊緣存儲會有感染者以及近距離接觸的藍牙記錄,通過比對數據就可以寫字樓內部找出潛在的近距離接觸者。一旦有人感染會把自己手機的藍牙信息上報給疾控部門,部門會把包含曾經去過的地點的信息發回與上報者或相關部門,最終目的是降低隔離人員的比例。圖 3:新加坡 TraceTogether 系統3 月 20 日新加坡上線了 TraceTog
56、ether 系統,每個人手機上安裝了 App,兩個人距離較近的時候手機會自動廣播藍牙信息,比如自動隨機生成的個人 ID,這樣的好處就是可以保護個人隱私,即便他人通過搜索藍牙 ID 也無法獲取個人信息。因為該系統上線較早,所以在一定程度上是有用的。邊凱歸接著指出其缺陷所在:“由于注冊時需要個人手機號和身份信息,所以該技術在比較關注隱私的研究者的角度來看可能會有不一樣的看法,后面會有專門的章節進行相關討論?!? 月 10 日 Apple 公司和 Google 公司宣布合作,將從底層打通個人設備和藍牙的接口。由于兩家不同的公司為保護用戶隱私采用不同通訊接口的定義,終于 Google 選擇遷就 App
57、le,計劃統一接口為用于研發基于“個人設備藍牙接口”的接觸者追蹤技術。但是在沒有實現成功之時,就指出個人隱私信息存在被 iOS 和 Android 系統以及第三方應用截取濫用的風險,這也是當時無數學者批評該做法的原因。4 月 19 日,來自全世界多所大學的 300 名國際學者針對基于藍牙的近距離接觸追蹤技術發表聯合申明,明確并提出四點要求:第一,必須使用獨立的系統開發具有獨立功能的公共衛生檢測手段,避免數據被第三方 App濫用;第二,解決方案必須公開透明;第三,必須默認地最大化保護用戶隱私;第四,技術的使用必須是用戶自愿的。這些研究者一致認為,必須使用一個統一而又去中心化的計算框架,這是給出的
58、一些框架設計的原則。36 圖 4:Exposure Notifi cation 框架的發布5 月 20 日,Apple 與 Google 終于聯合發布了名為 Exposure Notifi cation 的框架,支持最新的 iOS 13.5 或Android 系統,但不支持大陸用戶。6 月 15 日,德國也出了一套名為 Corona Warn 新冠警告系統,就是使用了 Apple 和 Google 公司在 5 月 25 日發布的框架,流程大致為:生成一個隨機 ID,并且同時掃描和記錄周圍設備的 ID 也是把這個 Key 上傳到中心服務器,服務器會將感染者的 ID 發給所有安裝 App 的設備以
59、示警告。邊凱歸針對當前國內國際疫情局勢發展進行總結:每一個國家都需要一套符合國家法律法規的、高度保護用于隱私的感染 AppAPP,而且由于數據安全因素,每個國家都需要使用自己的技術力量去完成這樣一套獨立于國外的東西。所以,基于當前市面占有率最高的兩款操作系統(iOS 和 Android),我們亟待研發一套真正屬于自己的通訊協議,做出屬于自己的精準追蹤產品。二、管控措施粒度與接觸者追蹤精度圖 5:管控措施粒度分級 37 針對疫情爆發后的管控措施粒度,邊凱歸將整體分成了四個級別:城市級別、街道社區級別、樓宇級別、家庭個人級別。前兩個級別所帶來的經濟損失都非常大,但由于在疫情爆發的初期,這種方式是最
60、為簡單有效的。樓宇級別的管控,則需要更合理的技術、更精細化的管控措施,邊凱歸和北京智源聯合團隊便是基于這個層級來完成追蹤的功能(詳見后續介紹)。最后就是家庭和個人級別的追溯個人的軌跡,新加坡、Apple 與 Google都完成了個人 APP 產品的開發,但是其必須由政府發布。新加坡可以說做的十分成功,因為新加坡是由政府發布,但如果是由商業公司完成必然會引發一些社會問題,因為以商業公司的角色來完成公共衛生監測顯得比較尷尬。那么有些同學會問支付寶和微信是否能夠完成類似的任務?答案也是可以的。但是這類軟件屬于社交軟件,不能直接抓取數據拿來防疫使用,用戶條款中僅僅表述了是一個社交用途,并沒有說明能拿來
61、用作防疫使用,所以這類軟件在接觸者追蹤的過程中顯得同樣尷尬。如上所述,接觸者追蹤系統需要滿足街道社區級別、樓宇級別、個人級別,不管哪個級別的管控粒度,需要解決三個問題:第一是追溯,第二是發現,第三是決策。最難做的也就是“追溯”,這一步的核心就是采集位置信息(絕對位置與相對位置),通過位置信息即可判斷感染者和接觸者之間的距離,從而得出最后的決策是否需要為密切接觸者采取相應的措施。圖 6:追蹤絕對位置信息的常用手段(室內與室外)邊凱歸列舉了追蹤絕對位置信息的常用手段,如圖 6 所示。對于室外級別的,在之前的論述中已經略有談及,包括:旅行記錄、交通數據、個人設備的 GPS 坐標等。而對于室內級別的定
62、位,現用最多的是基于科研的方法,大規模的工業界的室內定位產品暫時還沒有。以往會做一些基于 WIFI、監控視頻的絕對位置的采集,這些有利于疫情爆發初期的信息采集,快速鎖定感染者和近距離接觸者。而對于常態化防控方式,通過汲取國內外的方法,邊凱歸團隊建議采集相對位置信息,可以理解為一種間接證明感染者和接觸者距離的信息。最終,團隊決定選擇藍牙 4.0 技術來實現,其優點就是可近距離判斷與功耗低。值得注意的是,由于所采集到的是相對位置信息,避免了絕對位置信息暴露用戶隱私的痛處,而相對位置只是判斷你是否近距離接觸,可以最大化的保護用戶的隱私。38 圖 7:集合所有技術的接觸者追蹤系統那么假設我們可以設計一
63、個“All in One”的系統,即將所有的國內外的方法都集成為一體,我們就可以實現出一個非常完美的接觸者追蹤系統。這種系統的優點肯定是大而全且實用,但是里面有很多的技術因為各種擔心卻不太推薦去使用,例如:中國還有很大一部分的人沒有智能手機,即根本沒有從傳感器獲取來的數據是無法完成上述大系統中的某一些分支功能的。三、三個約束:隱私、計算、成本超越之前討論的研究層面,在實際產品的落地應用中,還會面臨著三個約束條件:隱私:保護責任不夠清晰、數據使用和存放不安全、絕對位置信息的濫用。計算:多源數據的融合困難程度高、人工智能背景下視頻監控跟蹤計算成本巨大且延遲問題嚴重。所以推薦主要使用獨立的系統采集的
64、無線信號作為防疫數據,使用視頻監控作為輔助數據加以支撐。成本:普及安裝 App 成本高、基于 WIFI 的室內定位算法開發成本高、視頻監控系統造價高。四、保護隱私的流行病接觸者精準追蹤系統圖 8:智源藍保(Blue Bubble)39 隨著社會的需求和技術的發展,Blue Bubble 這一款最大化保護隱私的流行病接觸者追蹤系統應運而生,這是一款獨立的、非商業的系統。這種基于藍牙開發的系統支持人與人、樓宇之間互相發現,另外包含視頻測溫系統。該系統有如下特點:用戶數據分布式去中心化存儲,從而可以有效地保護隱私;獨立采集相對位置信息,不牽涉多源數據的融合;雙工作模式,可不安裝 App;低功耗、低成
65、本、快速部署;可恢復待追蹤者的行為軌跡。邊凱歸對兩種工作模式進行了展開說明:圖 9:樓宇藍牙發現模式 樓宇藍牙發現模式:樓宇藍牙發現個人藍牙,并存儲于樓宇的邊緣設備中,數據不上傳中心,可基于藍牙發現數據進行感染者軌跡生成。圖 10:個人藍牙發現模式 個人藍牙發現模式:獨立設計的一套不依賴于底層操作系統 API 的協議,包括 iOS 和 Android 系統的互相發現??赏ㄟ^藍牙互傳、數據存儲于個人設備。40 圖 11:3D 可視化監控另外,該系統提供的可視化監控可以整合到已有的視頻監控系統中,支持個體查詢、批量查詢和特殊感染者的軌跡生成,常態化防控的時候生成一張熱力圖,可以看到室內的聚集度。圖
66、 12:智源藍保樓宇模式該系統還可以用于補充樓宇級別的管控力度,最大化地保護數據不離開本人的手機,因為藍牙的近距離關系判斷可以達到米級。五、總結習近平 說過,要把人民的生命健康放在第一位,其次還要同步加快經濟恢復的速度,最終觀察的結論就是各國都推出了具有本國特色的防疫追蹤系統。正因為這是涉及國家的數據安全,不能用別的國家的,并且還要獨立于其他國家的技術框架,擁有獨立采集技術系統,這樣可以避免很多問題。最后我們需要做分布式的數據存儲,最大限度保護隱私,隱私數據不能離開樓宇或者用戶手機,甚至在不安裝 App 的情況下可以跨設備、跨操作系統地追蹤樓層級別的接觸者。最后,邊凱歸還留下一個思考題:如果沒有智能手機怎么辦?歡迎大家進入我們的討論區展開討論:。