《賽迪譯叢:2024年人工智能全景報告(24頁).pdf》由會員分享,可在線閱讀,更多相關《賽迪譯叢:2024年人工智能全景報告(24頁).pdf(24頁珍藏版)》請在三個皮匠報告上搜索。
1、-1-2024 年年 12 月月 16 日第日第42期總第期總第 668 期期2024年人工智能全景報告年人工智能全景報告【譯者按】【譯者按】今年 10 月,英國風投公司 Air Street Capital 發布第七版 人工智能全景報告。人工智能正迅速成為全球經濟發展的關鍵驅動力,系統評估人工智能行業現狀和未來趨勢尤為重要。報告全面審視了人工智能在研究、產業、政治和安全四方面的最新進展,揭示了包括多模態基礎模型突破學科局限、龍頭企業與初創企業并行加速發展、人工智能監管立法持續提速、企業關注點從安全主義轉向加速發展等重大趨勢。同時,報告對未來 12 個月全球人工智能發展作出了前瞻性預測。賽迪智
2、庫未來產業研究中心對該報告進行了編譯,期望對我國有關部門有所幫助?!娟P鍵詞】人工智能研究產業政治安全預測【關鍵詞】人工智能研究產業政治安全預測-2-人工智能是一個涉及多學科的科學與工程領域。本報告認為,在這個日益數字化、由數據驅動的社會,人工智能將成為推動技術進步的倍增器。本報告圍繞以下幾方面進行討論:研究:研究:技術突破及其能力。產業:產業:人工智能的商業應用領域及其商業影響。政治:政治:人工智能的監管、經濟影響以及不斷演變的人工智能地緣政治。安全:安全:確定并減輕未來高性能人工智能系統可能帶來的災難性風險。預測:預測:未來 12 個月可能會發生的事。一、概述(一)研究一、概述(一)研究前沿
3、實驗室的表現趨于一致,但因為規劃和推理已成為主要前沿領域,因此 OpenAI 公司在推出 o1 大型語言模型后仍保持領先優勢。隨著多模態研究深入到數學、生物學、基因組學、物理科學和神經科學領域,基礎模型展現出了突破語言局限的能力。美國的制裁未能阻止中國的大型語言模型在社會各界排行榜上的飆升。(二)產業(二)產業-3-英偉達(NVIDIA)仍是全球最具實力的公司,躋身市值 3萬億美元企業之列。監管機構正在對生成式人工智能領域的權力集中問題展開調查。更為成熟的生成式人工智能企業已實現數十億美元的營收,初創企業也開始在視頻和音頻生成等領域嶄露頭角。盡管這些企業的發展已開始從模型研發邁向產品落地,但有
4、關定價和可持續性的長期問題仍未解決。在公共市場牛市的推動下,人工智能企業的市值達到 9 萬億美元,同時私營企業的投資也在健康增長。(三)政治(三)政治在全球治理停滯不前背景下,國家和地區層級的人工智能監管卻在不斷推進,美國和歐盟都通過了相關立法,但這些立法頗具爭議。計算需求的實際情況迫使大型科技企業不得不考慮在規模擴張方面面臨的現實物理限制以及它們自身的排放目標。與此同時,各國政府在能力建設方面的嘗試仍然滯后。人工智能對選舉、就業以及一系列其他敏感領域可能產生的影響目前還尚未顯現。(四)安全(四)安全企業的關注點正在從安全向加速發展轉變,之前還在警告人類即將滅絕的企業,現在卻在大力提高銷售額,
5、推廣消費類應用程序。世界各國政府紛紛效仿英國,構建提升人工智能安全的國-4-家能力,成立相關機構,研究關鍵國家基礎設施在人工智能方面存在的潛在漏洞。每一項人工智能發起的攻擊都以失敗告終,但讓研究人員更加擔憂的卻是更為復雜、長期的攻擊。二、研究(一)二、研究(一)OpenAI 獨霸一方的局面宣告結束,獨霸一方的局面宣告結束,“草莓草莓”(Strawberry)的問世,將在擴展推理計算方面加倍發力)的問世,將在擴展推理計算方面加倍發力這一年的大部分時間,各項基準測試和社會各界排行榜都顯示 GPT-4 與“其他最優模型”之間存在巨大差距。然而,Claude 3.5Sonnet、Gemini 1.5
6、和 Grok 2 等模型幾乎消除了這一差距,如今各模型的表現開始趨于一致。OpenAI 團隊顯然很早就察覺到了推理計算的潛力,在其他實驗室發表有關該技術的論文幾周后,OpenAI 的 o1 就問世了。(二)盡管屢受制裁,中國的大型語言模型仍榜上有名(二)盡管屢受制裁,中國的大型語言模型仍榜上有名深度求索、零一萬物、智譜和阿里巴巴所研發的模型在大型模型系統機構排行榜上取得了優異名次,尤其在數學和編程方面展現出了令人矚目的成果。例如,深度求索率先采用多頭潛在注意力1等技術,降低推理過程中的內存需求,并且還研發了一種增1多頭潛在注意力(Multi-head Latent Attention,MLA)
7、是一種在自然語言處理和其他序列數據處理任務中使用的注意力機制。它是多頭注意力(Multi-head Attention,MHA)的一種變體,通過低秩壓縮鍵(Key)和值(Value)來減少 KV 緩存的大小,從而提高推理效率。-5-強型混合專家(MoE)2架構。零一萬物對架構創新關注較少,致力于構建強大的中文數據集,以彌補其在常用數據存儲庫中相關數據相對匱乏的不足。(三)中國的開源項目贏得了全球粉絲(三)中國的開源項目贏得了全球粉絲為推動國際上的采用和評估,中國的實驗室已成為熱情的開源貢獻者。有幾款模型已在個別子領域中嶄露頭角,成為強有力的競爭者。例如,深度求索的 Deepseek-Coder
8、-V2 已成為編程任務中最受歡迎的工具之一,具有速度、輕便、準確等優點。阿里巴巴發布 Qwen-2 系列芯片,其出色的視覺識別技術震撼業界,不僅在極具考驗的光學字符識別(OCR)任務中展現出非凡實力,還能深度解析紛繁精妙的藝術作品。(四)人工智能亦可獲得諾貝爾獎(四)人工智能亦可獲得諾貝爾獎瑞典皇家科學院將諾貝爾獎授予深度學習領域的先驅者,表明人工智能作為一門學科以及加速科學發展的工具,已經發展成熟。(五)(五)AlphaFold 3:超越蛋白質及其與其他生物分子的相互作用:超越蛋白質及其與其他生物分子的相互作用DeepMind 和同構實驗室發布了 AlphaFold 3 模型,它是2增強型混
9、合專家(MoE)是一種深度學習模型,它通過將多個專業化的子模型(即“專家”)組合起來,形成一個整體模型。每個“專家”都在其擅長的領域內做出貢獻,而決定哪個“專家”參與解答特定問題的,是一個稱為“門控網絡”的機制。-6-AlphaFold 2 的后續版,如今已能夠模擬小分子藥物、脫氧核糖核酸(DNA)、核糖核酸(RNA)以及抗體與蛋白質靶點的相互作用機制。(六)(六)AlphaProteo:DeepMind 公司展示了新的實驗生物學能力公司展示了新的實驗生物學能力DeepMind 公司的神秘蛋白質設計團隊終于憑借其首個模型AlphaProteo“走出幕后”。這是一個生成式模型,能夠設計出親和力提
10、高 3 到 300 倍的亞納摩爾級蛋白質結合劑。(七)學習設計人類基因組編輯器的語言模型(七)學習設計人類基因組編輯器的語言模型之前介紹了如何使用在大量多樣的天然蛋白質序列數據集上預先訓練的大型語言模型(如 ProGen2)來設計與天然蛋白質序列完全不同的功能蛋白質?,F在,Profluent 在 CRISPR-Cas 圖譜上對 ProGen2 進行了微調,以生成具有新序列的功能基因組編輯器,且這些編輯器首次被證明可在體外對人類細胞的 DNA 進行編輯。(八)人工智能基礎模型:通過功能性磁共振成像了解大腦活動(八)人工智能基礎模型:通過功能性磁共振成像了解大腦活動深度學習最初受到神經科學的啟發,
11、如今正應用于對大腦本身進行建模?!按竽X語言模型”(BrainLM)是一個基于 6700 小時-7-人類大腦活動記錄構建的基礎模型,這些記錄是通過功能性磁共振成像生成的,該技術可檢測血氧含量的變化。該模型學會了重建被掩蓋的時空大腦活動序列,且能夠泛化到未見過的數據分布??赏ㄟ^微調該模型來預測臨床變量,例如年齡、神經質程度、創傷后應激障礙(PTSD)以及焦慮癥評分等,其效果要優于圖卷積模型或長短期記憶網絡(LSTM)模型。(九)各科學領域的基礎模型:大氣領域(九)各科學領域的基礎模型:大氣領域傳統的大氣模擬方法,如數值天氣預報,成本高昂,且無法利用各種稀缺的大氣數據模態。但基礎模型在這些方面的表現
12、卻很好。微軟的研究人員創建了基礎模型 Aurora,能夠針對諸多大氣預報問題進行預測,比如全球空氣污染和高分辨率中期天氣模式等問題。它還能通過利用通用的已習得大氣動力學表征來適應新任務。(十)心智的基礎模型:重建看到的事物(十)心智的基礎模型:重建看到的事物MindEye2 是一種生成式模型,能夠將功能性磁共振成像活動映射到豐富的對比語言-圖像預訓練(CLIP)空間,然后利用經過微調的 Stable Diffusion XL 模型從該空間重建個體所看到的圖像。該模型在自然場景數據集上進行訓練,這是一個基于 8 名受試者構建的功能性磁共振成像數據集,在這些受試者觀看來自COCO 數據集掃描會話的
13、數百種豐富的自然場景刺激物時(每次-8-掃描觀看時長為 3 秒),對其大腦反應進行 30 至 40 小時的捕捉。(十一)程序搜索在數學領域獲得新發現(十一)程序搜索在數學領域獲得新發現結合大型語言模型和進化算法,“趣味搜索”(FunSearch)利用大型語言模型生成和修改程序,并能通過對求解質量打分實現功能進化。趣味搜索通過搜索程序而非直接的解決方案,發現復雜對象或策略的簡潔且可解釋的表述形式。肖萊認為,這種形式的程序搜索是最有可能解決抽象和推理挑戰的途徑之一。谷歌DeepMind 團隊將其應用于極值組合學中的帽集問題以及在線裝箱問題。在這兩個案例中,趣味搜索都發現了超越人類設計方法的新穎解決
14、方案。(十二)基礎模型能否讓大規模訓練強化學習智能體變得更容易?(十二)基礎模型能否讓大規模訓練強化學習智能體變得更容易?訓練強化學習智能體的一大瓶頸是訓練數據的短缺。諸如轉換已有環境或手動構建環境這類標準方法都需要耗費大量人力,且無法實現規?;?。帝國理工學院和英屬哥倫比亞大學的OMNI-EPIC 項目利用大型語言模型創建了理論上無窮無盡的強化學習任務和環境流,以幫助智能體基于先前學到的技能進一步發展。該系統會生成可執行的 Python 代碼,這些代碼能夠為每個任務實現模擬環境和獎勵函數,且會利用模型評估新任務是否足夠新穎和復雜。-9-(十三)人工智能研究領域的全球力量平衡并未改變,但學術界有
15、所獲益(十三)人工智能研究領域的全球力量平衡并未改變,但學術界有所獲益隨著人工智能成為新競爭戰場,大型科技企業開始對研發工作的更多細節秘而不宣。自本報告開始發布以來,前沿實驗室首次大幅削減成果發表數量,而學術界也參與其中(見圖 1)。元宇宙人工智能出版物數量的同比變化人工智能出版物數量的同比變化微軟阿里巴巴騰訊谷歌華為IBM麻省理工學院米迪亞研究清華大學牛津大學加利福尼亞大學伯克利分校圖 1:人工智能出版物數量的同比變化三、產業(一)英偉達成為全球最具實力的公司,不斷提出更具雄心的目標三、產業(一)英偉達成為全球最具實力的公司,不斷提出更具雄心的目標隨著用于支持對算力要求極高的生成式人工智能工
16、作負載的硬件需求不斷增長,各大實驗室都需要依靠英偉達提供的硬件。-10-其市值在 6 月達到 3 萬億美元,成為繼微軟和蘋果之后第三家達到這一里程碑的美國公司。其第二季度財報業績依然亮眼,地位依然堅不可摧。英偉達已經在其新款 Blackwell 系列圖形處理器上獲得了大量預訂單,并且正在積極爭取政府方面的訂單。(二)老牌競爭對手未能縮小差距(二)老牌競爭對手未能縮小差距超威半導體和英特爾已經開始投資建設軟件生態系統,超威半導體公司已經利用 ROCm 平臺大力向開源各界推廣。然而,他們尚未開發出能與英偉達網絡解決方案產品組合相媲美的有競爭力的替代方案。超威半導體希望其 49 億美元收購服務器制造
17、商 ZT 系統公司(ZT Systems)的計劃能改變這一局面。與此同時,英特爾的硬件銷售額出現了下滑。除非出現監管干預、研究范式轉變或供應受限等情況,否則英偉達的地位似乎堅不可摧。(三)購買英偉達的股票要比投資那些與英偉達競爭的初創企業好得多(三)購買英偉達的股票要比投資那些與英偉達競爭的初創企業好得多對自 2016 年以來對人工智能芯片領域競爭對手投資的 60 億美元進行分析和設想,如果投資者當時按當日股價購入等值的英偉達股票,情況會怎樣?答案是:若買入英偉達股票,那 60 億美元如今價值將是 1200 億美元(漲 20 倍),而投入初創企業如今的價值僅 310 億美元(僅漲 5 倍)。-
18、11-(四)并非所有人都認為英偉達只會越來越好(四)并非所有人都認為英偉達只會越來越好有一小部分直言不諱的分析師和評論員并不信服。他們指出圖形處理器稀缺狀況已有所緩解,目前只有少數幾家公司能從人工智能產品中獲得可靠營收,而且大型科技企業的基礎設施建設規模也不太可能大到足以支撐英偉達目前的估值。市場目前對這些聲音置若罔聞,似乎更傾向于認同特斯拉早期投資者詹姆斯安德森的觀點,即英偉達在十年內市值可能達到“數萬億美元”。(五)但初創企業的收入在哪里?利潤又在哪里?(五)但初創企業的收入在哪里?利潤又在哪里?許多從事生成式人工智能的熱門初創企業正在以創紀錄的、通常是三位數的營收倍數進行融資。雖然這可能
19、表明投資者對未來回報有信心,但這也設定了一個很高的門檻,因為這些企業中的很多目前還沒有明確的盈利途徑。然而,并非所有的企業都是如此,最大模型提供商的營收已開始增長。OpenAI 有望在一年內實現營收增長兩倍,但訓練、推理及人員成本意味著虧損仍在持續增加。他們并非唯一一家在尋求實現良性經濟運作的領軍企業。(六)或許收入和利潤兩者都不重要:要恢復股價只需要一種氛圍(六)或許收入和利潤兩者都不重要:要恢復股價只需要一種氛圍元宇宙公司通過放棄在元宇宙領域的大量投資,憑借“羊駝”模型大力轉向開源人工智能領域,在公共市場引發了令人難以置信的氛圍轉變??梢哉f,馬克扎克伯格實際上已成為開源人工智-12-能救世
20、主,與 OpenAI、Anthropic 和谷歌 DeepMind 形成對抗之勢。(七)頂級質量的模型,即(七)頂級質量的模型,即 OpenAI 的的 o1 模型,在價格和延遲方面都有明顯溢價模型,在價格和延遲方面都有明顯溢價隨著模型種類日益豐富,開發者們正在根據工作需求(以及自身預算)選擇合適工具。(八)模型費用持續下降(八)模型費用持續下降服務成本曾經一度被認為高得令人望而卻步,但如今強大模型的推理服務成本正在下降(見圖 2)。下降下降100倍倍下降下降60倍倍圖 2:OpenAI 和 Anthropic 的模型費用(九)谷歌(九)谷歌 Gemini 推出了一個強大的模型系列,定價極具競爭
21、力推出了一個強大的模型系列,定價極具競爭力Gemini 1.5 Pro 和 1.5 Flash 的價格在推出幾個月后就下降了-13-64%至 86%,但性能依然強勁,例如 Flash-8B 比 1.5 Flash 便宜50%,但在許多基準測試中的表現卻不相上下。(十)人工智能實驗室從構建模型轉向設計產品(十)人工智能實驗室從構建模型轉向設計產品像蘋果、谷歌或抖音等成功的科技公司都是以產品為先,而不是簡單地構建基礎技術和 API。隨著基礎模型性能趨于接近,OpenAI、Anthropic 和元宇宙公司顯然都在更深入地思考其“產品”應該呈現出怎樣的外觀和使用體驗,不管是 Anthropic 公司“
22、Claude”的相關成果、OpenAI 的高級語音功能,還是元宇宙公司的硬件合作項目以及對口型工具。僅構建出優秀的模型是不夠的。(十一)監管機構對關鍵的生成式人工智能參與者之間的關系進行詳盡審查,導致偽收購作為一種退出策略興起(十一)監管機構對關鍵的生成式人工智能參與者之間的關系進行詳盡審查,導致偽收購作為一種退出策略興起鑒于高昂的計算成本,模型構建者越來越依賴與老牌大型科技企業合作。反壟斷監管機構擔心這會讓現有企業的地位更加不可動搖。監管行動在塑造市場方面作用有限,經濟因素更具決定性。鑒于眾多“其他企業”的性能趨于相近,且這些企業高昂的資本性支出需求,整合也就不足為奇了。鑒于存在監管障礙,偽
23、收購開始興起,即大型科技企業:聘用初創企業的創始人和大部分團隊成員;該初創企業退出模型構建領域,轉而專注于其企業服務業務;通過許可協議向投資者支付款項。監管機構已經發現了這一問題,大西洋兩岸的監管機構都已在這方面開始詳盡審查。-14-(十二)文本轉語音正在蓬勃發展(十二)文本轉語音正在蓬勃發展文本轉語音領域市場領導者ElevenLabs在今年年初達到獨角獸級別,估值達 11 億美元。由于各大實驗室對該領域涉足有限,因此 ElevenLabs 得以獨占鰲頭。(十三)語音識別在商業領域站穩了腳跟(十三)語音識別在商業領域站穩了腳跟雖然文本轉語音因“效果驚艷”而備受關注,但語音識別卻可能被用于實現日
24、常任務的自動化規模處理。投資者開始看到語音識別在規?;l展方面的潛力。(十四)視頻生成領域的競爭正趨于白熱化(十四)視頻生成領域的競爭正趨于白熱化Runway、Pika、Luma 和 OpenAI 等眾多參與者正在大規模擴大其數據收集和模型訓練實驗的規模,以期在文本到視頻生成方面提高生成質量和穩定性,此外還致力于生成更長的視頻片段。(十五)人工智能投資在各個地區都大幅增長(十五)人工智能投資在各個地區都大幅增長在 xAI 和 OpenAI(60 億美元融資)等通用人工智能巨額融資的推動下,美國私募市場繼續保持領先地位,對人工智能企業的總投資已接近 1000 億美元(見圖 3)。-15-歐盟27
25、國+挪威、瑞士英國美國中國圖 3:人工智能投資情況(十六)在上市公司的推動下,人工智能企業的市值達到近(十六)在上市公司的推動下,人工智能企業的市值達到近9 萬億美元萬億美元雖然私營公司的估值一直在穩步攀升,但少數幾家上市公司卻像 Atlas 一樣撐起了整個市場。僅上市公司目前的價值就超過了 2023 年的整個市場價值(見圖 4)。私營公司上市公司圖 4:上市公司和私營公司市值-16-四、政治(一)美國通過行政命令引入有限的前沿模型規則,各州則推行各自更具爭議性的規則四、政治(一)美國通過行政命令引入有限的前沿模型規則,各州則推行各自更具爭議性的規則在2023年7月獲得大型實驗室自愿遵守相關模
26、型發展規定的承諾之后,白宮決定將之前這些實驗室自愿表示要遵守的內容變成具有強制約束力的規定,當年 10 月,拜登簽署了一項關于前沿模型監管的行政命令。由于在更廣泛的聯邦人工智能監管方面達成兩黨共識的可能性微乎其微,各州都在推行各自的人工智能法規,其中最引人注目的是加利福尼亞州的 SB 1047。(二)經過最后一刻的瘋狂游說,歐盟人工智能法案最終正式成為法律(二)經過最后一刻的瘋狂游說,歐盟人工智能法案最終正式成為法律今年 3 月,在法國和德國開展了一場集中的影響活動以弱化某些條款之后,歐洲議會通過了人工智能法案。然而,關于該法案的實施問題仍未得到解釋。(三)英國正緩慢朝著制定前沿模型相關立法的
27、方向推進(三)英國正緩慢朝著制定前沿模型相關立法的方向推進英國新工黨政府已發出信號,表示打算摒棄其前任僅通過現有立法來監管人工智能的做法,不過這種轉變較為微妙。(四)中國的人工智能監管進入執法時代(四)中國的人工智能監管進入執法時代中國是首個開始制定生成式人工智能監管措施的國家,從-17-2022 年起就出臺了全面的(最初是相關企業自愿遵循的)指導方針。如今,中國的審查機構也開始介入。(五)日本對人工智能的態度很熱衷嗎?(五)日本對人工智能的態度很熱衷嗎?出于政治和文化等多種原因,從歷史上看,日本對于風險投資和人工智能初創企業一直是一個不溫不火的市場。而如今,日本政府突然熱衷于在這方面分得一杯
28、羹。(六)公共計算方面的努力與私人計算方面的努力相比相形見絀(六)公共計算方面的努力與私人計算方面的努力相比相形見絀英國、美國和歐盟都開始加大其公共計算服務的力度,為研究人員和初創企業提供補貼,使其能夠使用昂貴的硬件設備。但相關舉措仍處于試驗性階段。(七)不斷增長的計算能耗危及大型科技企業的凈零排放承諾,能源基礎設施也開始不堪重負(七)不斷增長的計算能耗危及大型科技企業的凈零排放承諾,能源基礎設施也開始不堪重負大型科技企業已簽署了一系列到 2030 年的氣候承諾,微軟甚至承諾實現碳負排放。但人工智能的能耗卻意味著他們目前正朝著錯誤的方向發展。人工智能面臨的環境挑戰與一個在規?;^程中常常被遺忘
29、的阻礙因素密切相關,那就是現實世界的物理制約。-18-(八)以人工智能為先的國防領域競爭對手實現了規模擴張,是例外嗎?(八)以人工智能為先的國防領域競爭對手實現了規模擴張,是例外嗎?自去年的報告發布以來,已經開始有一些重大合同被授予國防領域的挑戰企業,但由于中標數量仍然較少,現在就說一個新的生態系統正在形成為時尚早。(九)關于人工智能經濟影響的爭論更加激烈(九)關于人工智能經濟影響的爭論更加激烈2023 年,人們就不同行業在多大程度上受到人工智能的影響展開了討論。雖然一些機構(如國際貨幣基金組織)仍在發布相關研究成果,但相關爭論已開始轉向人工智能更廣泛的經濟影響方面。(十)虛假信息研究發展迅速
30、,但有關人工智能有效性的證據依然匱乏(十)虛假信息研究發展迅速,但有關人工智能有效性的證據依然匱乏由于今日俄羅斯電視臺與西方受眾直接溝通的能力受到限制,被發現通過一款名 Meliorator 的工具運營著一個由 1000個虛假X賬號組成的網絡。另外也有跡象表明,與俄羅斯政府有關聯的人員在以色列-哈馬斯沖突期間使用虛假圖片挑起爭議。但幾乎沒有證據表明這類材料被少數人以外的更多人瀏覽或相信。五、安全五、安全-19-(一)從安全主義到加速主義:一種重大的氛圍轉變已經發生(一)從安全主義到加速主義:一種重大的氛圍轉變已經發生從美國國會舉行聽證會以及為推動(關乎人類存亡的)人工智能安全議程而進行全球巡回
31、宣傳的時期開始,領先的前沿模型企業正在加速向消費者推廣人工智能產品。(二)英國創建了世界上首家人工智能安全研究所,美國隨即效仿(二)英國創建了世界上首家人工智能安全研究所,美國隨即效仿在“布萊切利峰會”召開之際,英國宣布其前沿人工智能特別工作組將由人工智能安全研究所(AISI)取代,這是世界上首家人工智能安全研究所。美國、日本和加拿大也紛紛跟進,但工作力度有限。(三)各國政府急于填補關鍵國家基礎設施中的漏洞(三)各國政府急于填補關鍵國家基礎設施中的漏洞除內部加深對模型能力的理解外,英國也正在成為增強防御能力方面的主要引領者。通過其高級研究與發明局(ARIA),投入 5900 萬英鎊研發一種“把
32、關系統”,旨在了解并降低能源、醫療保健和電信等關鍵領域人工智能帶來的風險。據報道,政府還計劃設立“人工智能安全研究實驗室”,旨在匯集政府各部門關于英國對手利用人工智能進行攻擊方面的知識。美國能源部一直在利用其內部測試平臺來評估人工智能可能對關鍵基礎設施和能源-20-安全構成的風險。國防部和國土安全部也一直專注于解決國家安全及民用目的的政府網絡中的漏洞問題。(四)隨著攻擊面的擴大,開發人員加大了對破解限制的研究力度,但仍跟不上攻擊者的步伐(四)隨著攻擊面的擴大,開發人員加大了對破解限制的研究力度,但仍跟不上攻擊者的步伐新的功能帶來新的漏洞?,F有機構和專業實驗室已加大了對破解限制的研究力度,設計潛
33、在的修復方案,并創建了首批攻擊者測試基準。(五)如果無法阻止攻擊,就正視這一現實(五)如果無法阻止攻擊,就正視這一現實設想各種潛在攻擊手段對模型進行攻擊者測試頗具挑戰性。各實驗室越來越多地使用大型語言模型來擴大查找和修復漏洞的流程,包括元宇宙公司的兩個團隊也是如此。(六)面臨對抗性攻擊的不僅僅是基礎模型(六)面臨對抗性攻擊的不僅僅是基礎模型為提高圖像分類器對對抗性攻擊的穩健性,谷歌 DeepMind的一個團隊從生物視覺系統中汲取了靈感,特別是微掃視(微小、無意識的眼球運動)概念。(七)除破解限制外,還應關注更隱蔽的攻擊(七)除破解限制外,還應關注更隱蔽的攻擊破解限制往往是安全挑戰呈現給公眾的一
34、面,但潛在的攻擊面要廣泛得多,涵蓋了從訓練到偏好數據,再到微調的方方面面。六、預測六、預測-21-對未來 12 個月全球人工智能發展作出十大預測:一是某主權國家對美國一家大型人工智能實驗室投資超過100 億美元,引發國家安全審查;二是一個完全由毫無編程能力的人創建的應用程序或網站將走紅,例如進入蘋果應用商店前 100 名;三是在相關案件開始進入審判階段后,前沿實驗室對數據收集工作進行了重要變革;四是在立法者擔心監管過度時,歐盟人工智能法案的早期實施結果比預期的要寬松;五是 OpenAI 公司 o1 的一個開源替代方案在一系列推理基準測試中超越了 OpenAI 公司的 o1;六是競爭對手未能對英
35、偉達的市場地位造成任何實質性的沖擊;七是由于各企業難以實現產品與市場的契合,人形機器人領域的投資水平將會逐漸下降;八是蘋果公司在設備端研究取得的出色成果加速了個人設備端人工智能化的發展勢頭;九是一篇由人工智能科學家生成的研究論文在一個重要的機器學習會議或研討會上被接受;十是一款與基于生成式人工智能元素進行互動的電子游戲將-22-取得突破性進展。譯自:State of AI Report 2024,October 2024 by Air Street Capital譯文作者:工業和信息化部賽迪研究院胡靖陽聯系方式:18611600730電子郵件:-24-編 輯 部:工業和信息化部賽迪研究院通訊地址:北京市海淀區紫竹院路 66 號賽迪大廈 15 層國際合作處郵政編碼:100048聯 系 人:袁素雅聯系電話:(010)8855968413263204219傳真:(010)88558833網址:電子郵件:報:部領導送:部機關各司局,各地方工業和信息化主管部門,相關部門及研究單位,相關行業協會報:部領導送:部機關各司局,各地方工業和信息化主管部門,相關部門及研究單位,相關行業協會