《智源研究院:2021年十大人工智能技術趨勢(26頁).pdf》由會員分享,可在線閱讀,更多相關《智源研究院:2021年十大人工智能技術趨勢(26頁).pdf(26頁珍藏版)》請在三個皮匠報告上搜索。
1、2020 年初, Google 與 Facebook 分別提出 SimCLR 與 MoCo 兩個算法, 均能夠在無標注數據上學習圖像數據表征。兩個算法背后的框架都是對比學習(contrastive learning)。對比學習的核心訓練信號是圖片的 “可區分性”。模型需要區分兩個輸入是來自于同一圖片的不同視角, 還是來自完全不同的兩張圖片。這個任務不需要人類標注, 因此可以使用大量無標簽數據進行訓練。盡管 Google 和 Facebook 的兩個工作對很多訓練的細節問題進行了不同的處理,但它們都表明,無監督學習模型可以接近甚至達到有監督模型的效果??祪葼柎髮W提出可緩解檢索排序馬太效應問題的無
2、偏公平排序模型:近年來, 檢索的公平性和基于反事實學習的檢索和推薦模型已經成為信息檢索領域重要的研究方向,相關的研究成果已經被廣泛應用于點擊數據糾偏、模型離線評價等,部分技術已經落地于阿里巴巴和華為等公司的推薦及搜索產品中。2020 年 7 月, 康奈爾大學 Thorsten Joachims 教授團隊發表了公平無偏的排序學習模型FairCo,一舉奪得了國際信息檢索領域頂會 SIGIR 2020 最佳論文獎。該研究分析了當前排序模型普遍存在的位置偏差、 排序公平性以及物品曝光的馬太效應問題等, 基于反事實學習技術提出了具有公平性約束的相關度無偏估計方法, 并實現了排序性能的提升, 受到了業界的
3、廣泛關注和好評。機器學習與科學計算的結合, 即數據和機理的融合計算, 為科學研究提供了新的手段和范式, 成為了前沿計算的典型代表。從機理出發的建模以基本物理規律為出發點進行演繹,追求簡潔與美的表達 ; 從數據出發的建模從數據中總結規律,追求在實踐中的應用效果。這兩方面的建模方法都在科學史中發揮了重要作用。近年來, 科學計算發展的一個重要趨勢是由單純基于機理或數據的范式向數據與機理的融合建模與計算發展。眾多前沿科學領域中的許多重要問題常常涉及多個發生在不同時空尺度上相互耦合的物理過程, 具有高度的各向異性、奇異性、非均勻性以及不確定性等特征。人類只能知道部分原理和數據,此時機理與數據結合的方式將成為研究這些問題的有力手段。隨著大數據、人工智能、量子計算等新技術的快速發展,人類社會已經步入了第四次工業革命時代。計算作為第四次工業革命的核心, 其前沿算法和基礎理論正在發生巨大變化, 呈現出基于數據的機器學習與基于機理的科學計算兩大領域接近與融合、 算力突破性發展由量變引發質變、計算在社會生活中無處不在引發深刻社會影響等趨勢。