1、一般來說,如果知道一場巨大的風暴即將襲擊某個國家/地區的東半部,人們可能會予以關注;但如果知道它會襲擊自己所在的州、縣或城鎮,或者從你身邊經過,那么會引起更大的關注。本地化的洞察可能作用很大。IBM COVID-19 Lockdown Index 數量化了每個地區當前的中斷程度。它將縱向信息與每日實時更新的疾病蔓延、病床和感染統計數據、當地社區限制以及美國整體市場波動措施結合在一起。然后預測各縣何時到達疫情曲線的高峰,以及每個地區獨特的曲線下降趨勢,之后分配風險評分并確定當地解除封鎖的速度。該指數使用公開可用的數據,包括:州醫院的流行病學措施要求;各縣疫情病例數;病床使用情況;重癥監護病房床位
2、使用情況;使用中的呼吸機數量。該系統還抓取當地新聞報道,以獲取有關學校開放/關閉日期和其他潛在的社區限制方面的更新信息。另一個類似的計劃是 The Emergent Alliance,這是 IBM、勞斯萊斯、微軟和數十家全球企業組成的非營利合作聯盟。該聯盟致力于提供關于新冠病毒病例的準確和最新的地區狀況,以幫助地方當局更有效地應對疫情爆發。本地化的風險指數結合感染率、社交媒體、新聞、Airbnb 數據等多種數據。分析內容包括疾病對健康的影響、政府的響應及公眾行為的變化及其整體經濟影響。但該項目的優點不僅限于應對疫情。關于新聞主題的情緒數據可以幫助預測新的行為模式。例如,關于戶外運動的新聞或山區
3、的 Airbnb 預訂增加,可能會引起關于徒步旅行或其他相關商品和服務的活動。自動化水平當然越高越好,有助于節省時間和資源,同時鼓勵更廣泛地采用 AI 方法 因為獲取數據不再是一項艱巨的任務。它可以幫助團隊避免花費數周甚至數月去獲得使用數據的許可。在組織文化中,沒有什么比信任更重要。雖然組織內部的信任不可或缺,但當組織共享或接受外部數據時,信任更為重要(見圖 3)。AI 團隊在收集數據和構建展示價值的解決方案方面的能力并不是很重要。如果所產生洞察的接收者不信任數據,比如不信任其來源、使用方法、被檢測到并減緩的偏見或者其透明度與合規性,那么結果就不會太理想。事實上,在這種情況下,即便是最強大、最
4、成熟的 AI 算法也不大可能對業務產生太大影響。從區塊鏈最新的概念和技術進步中汲取的經驗教訓,可能有助于建立信任。區塊鏈最重要的原則之一,便是從一開始就將相應的參與方整合在一起,也就是那些可以關乎網絡成敗并能夠回答“哪些數據可以共享?以及與誰共享?”等問題的關鍵少數。這個具備最低可行性的生態系統也可以包括監管機構,他們共同決定網絡的激勵機制、旨在實現經濟效益的框架以及治理規則。保留匯總的知識和洞察,但不保留可能具有監管影響的敏感數據,是一個重要的數據治理概念。區塊鏈原則在這里也適用于:基于許可的方法和網絡驗證有助于保持透明度、數據完整性、數據沿襲以及數據來源清晰度。這可解決 66% 的 IT
5、專業人員最關心的問題,即如何解決 AI 訓練數據來源不明確問題。12當然,有效的治理并不止步于追蹤用于訓練 AI 模型的數據。它還會檢查人類根據該數據做出的決策,這對于可解釋性至關重要,尤其是在這些決策可能存在爭議時。許多 AI 應用將原始數據轉化為信號,并在時間序列和其他大型數據集中尋找模式和洞察。為了揭示這些信號,通常必須對數據集進行數百次處理。想象一下,擁有超過 6 億庫存單位的大型零售商該如何應對。想象一下,處理數據所花的時間以及每天處理數百次所需的能力。這當然不是微不足道的問題,而是需要高級數據技能,但實現這種計算能力也會帶來財務成本(包括環境成本)。除了原始數據挑戰外,元數據挑戰可能更為嚴峻。思考一下智能車輛的一次圖像捕獲及其生成的所有背景數據,包括日期、時間、位置、圖像中的對象和相對速度以及圖像外的世界(環境背景),等等。標準數據方法和工具無法不經修改地應用于 AI。組織需要部署適當的工具,為 AI 準備、優化、清理、組合與復用數據(請參閱“觀點:IBM 首席數據辦公室 用于實現數據治理自動化的工具”)。