《甲子光年:2025具身智能行業發展研究報告:具身智能技術發展與行業應用簡析(40頁).pdf》由會員分享,可在線閱讀,更多相關《甲子光年:2025具身智能行業發展研究報告:具身智能技術發展與行業應用簡析(40頁).pdf(40頁珍藏版)》請在三個皮匠報告上搜索。
1、出品機構:甲子光年智庫智庫院長:宋濤報告撰寫:翟惠宇發布時間:2025年1月目 錄Part 01具身智能的發展背景P02Part 02具身智能的發展現狀P11Part 03應用場景和代表廠商P20Part 04發展挑戰與技術趨勢P36具身智能指具備物理載體的智能體,強調智能體與物理環境的交互。Source:公開資料,甲子光年智庫整理。p“具身智能(Embodied AI)”指有物理載體的智能體,在與物理世界的交互過程中,通過感知、控制和自主學習來積累知識和技能,形成智能并影響物理世界的能力。p 其關鍵在于“具身認知”,即該智能是通過身體和環境的交互過程中產生的,不能脫離實體,這是具身智能與離身
2、智能的關鍵區別。p 具身智能主要以各種智能機器人的形態出現,融合了機器人領域與計算機領域下的多個學科,是所有學科發展到相當成熟度之后才涌現出的能力。具身智能物理載體影響思維和判斷等心智過程,認知不能脫離身體單獨存在通過強化學習、模仿學習等方法,產生對于客觀世界的理解和改造能力L0L0L1L1L2L2L3L3L4L4L5L5人類智能拖拽錄制回放運動控制控制算法行為設計任務設計觀察者監督者非結構化環境自主決策行動執行復雜任務任務推理知識圖譜語義地圖感控一體環境感知定位導航算法驅動執行規劃關節驅動結構驅動結構層關節層運動層感知層認知層全自主自動自主以人類為主導以機器為主導多因素驅動我國成為具身智能技
3、術發展與應用的沃土。Source:公開資料,甲子光年智庫整理。p 具身智能機器人是我國發展新質生產力的未來產業新賽道,集成了AI、先進制造、新材料等先進技術,將對社會產業變革和全球競爭格局產生顛覆性影響。p 無處不在的應用潛力預示著龐大的市場需求、國家與地方長期的政策規劃支持、核心零部件供應鏈完善形成集群效應、以及健康良好的人才和創業生態,多方面因素推動我國成為具身智能技術發展的沃土。p 當前,國內的高校院所、科技大廠、初創企業均在布局以AI大模型和人形機器人為代表的前沿領域,我國在具身智能領域已經走在國際前列。國際競爭能力進口替代能力豐富的應用場景行業解決方案圖:我國在具身智能技術與應用已經
4、走在國際前列市場需求極為龐大全球范圍內工業機器人與服務機器人市場規模十分巨大。當前,人口老齡化問題日益突出,老年人口數量不斷攀升,同時人口出現了負增長態勢。年輕一代不再愿意在惡劣的環境中工作,枯燥、重復、低價值的勞動可交由機器人作業。高盛預測,2035年全球人形機器人的總體可用市場(TAM)將達到380億美元,預計出貨量為140萬臺。人才和創業生態良好超過400所高校高效開設機器人工程專業。機器人企業注冊數量迅猛增長。過去十年投資總額超千億元。多地設立機器人產業基金,如北京機器人產業發展投資基金(規模達100億元)、上海人形機器人產業基金(20億元)、吳中區機器人產業基金等。產業集群效應顯著制
5、造業集群產業鏈完善,可大幅縮短研發周期,從1.5年降至0.7年??拷溑c客戶,能節省物流及定制時間成本,提升購買舒適度。地方在土地、信貸、財政等方面大力支持。得益于本地供應鏈規模量產,關鍵零部件成本快速降低。在北京、上海、廣東等地設立人形機器人創新中心。長期國地政策支持國家和地方政策穩定推出并施行。從頂層優化機器人產業結構,促進產業鏈協同。聚焦底層技術、應用及創新驅動。國家設立中期(2025 年完成關鍵技術攻關)和遠期(2027 年創新能力顯著提升,建成安全可靠本土產業鏈供應鏈體系)目標。國際競爭能力:在技術和產品上可達到國際一流水平,未來能與國際一流廠商進行直接競爭進口替代能力:基本做到
6、關鍵產品和技術的自主可控,在封鎖時可以提供可用的技術和產品豐富的應用場景:具身智能產品和技術在國內有廣泛且長期的應用場景,未來將生成海量需求市場行業解決方案:該行業有完整的產業鏈條,可為實體經濟中各下游產業的需求與發展提供對應的具身智能機器人解決方案政策持續加碼,具身智能與人形機器人正走進科技發展的舞臺中央。Source:各政府網站,甲子光年智庫。p 各國均將以人形機器人為代表的具身智能上升到國家戰略,通過跟進完善制度建設、提供資金補貼等方式推動技術發展。p 國內相關政策主要圍繞加快具身智能機器人重點場景應用、加強行業標準規范建設、設立專項財政與基金支持、加速人才引進與技術培育等方面,通過政策
7、推動,在短期實現核心零部件的技術突破,在長期建設豐富產業應用和生態。日期部門名稱主要內容2023.1.8工信部等17部門“機器人+”應用行動實施方案基金支持、試驗中心、加速研發與推廣2023.5.31深圳市委辦公廳深圳市加快推動人工智能高質量發展高水平應用行動方案(2023-2024年)人才供給、加速研發、提升產業集聚水平2023.6.15上海市人民政府辦公廳上海市推動制造業高質量發展三年行動計劃(2023-2025年)核心部件攻關、加速應用推廣、人才梯隊2023.6.28北京市人民政府辦公廳北京市機器人產業創新發展行動方案(2023-2025年)培育新產品、加緊布局、校企合作2023.8.3
8、工信部等4部門新產業標準化領航工程實施方案(2023-2035年)研制人形機器人相關標準,包括術語、核心零部件、智能感知決策、運動控制、安全和應用等方面2023.10.26工業和信息化部人形機器人創新發展指導意見技術突破、重點產品、應用場景、人才引育2024.1.18工信部等七部門關于推動未來產業創新發展的實施意見加速創新和產業化、基金支持、應用場景、人才引進2024.7.6上海上海市人形機器人治理導則促進AI產業健康發展、確保人形機器人合乎人類道德和倫理價值圖:具身智能/人形機器人相關政策不斷出臺,多維度支持新技術落地具身智能具備新質生產力的關鍵內涵,是推動新質生產力建設的重要引擎。Sour
9、ce:央視,甲子光年智庫。p 新質生產力強調在科技創新的基礎上大幅提升生產效率和創新能力,而具身智能技術作為人工智能和機器人技術的融合發展前沿,天然具備形成新質生產力的關鍵內涵,是推動新質生產力發展的重要引擎。p 具身智能技術契合著解決未來社會矛盾的剛性需求,有望解決如工場勞動力短缺、社會老齡化等問題,把人類勞工不愿從事的枯燥、高危勞動中解放出來,并進一步推動全社會生產關系的改變與重塑。關注具身智能技術的發展對于我國實體經濟高質量增長和國際產業競爭格局有著重大意義。推動產業鏈供應鏈優化升級積極培育新型產業和未來產業深入推進數字經濟創新發展新質生產力全要素生產率大幅提升創新質優先進生產力傳統經濟
10、增長方式傳統生產力發展路徑擺脫更高素質的勞動者更高技術含量的勞動資料更廣范圍的勞動對象核心標志特點質優先進生產力技術革命性突破生產要素創新性配置產業深度轉型升級高科技高效能高質量催生特征促進具身智能是信息科學、智能科學、機械科學和電子科學等多學科交叉的領域具身智能將AI Agent和機器人兩者結合,極大推動了智能大腦、機器人及智能終端的進化與泛化具身智能具備通過物理載體直接影響世界的能力,有望改變和重塑生產關系,極大提高生產效率圖:具身智能技術是推動新質生產力發展的重要引擎智能化技術將進一步放大機器人對工業領域人類勞動力的替代作用。Source:IFR,World Robotics 2024,
11、甲子光年智庫。p 全球工業機器人整體仍然保持增長態勢,其中中國工業機器人安裝量一枝獨秀,2023年安裝量高達27.6萬臺,占全球安裝總量的51%。p 與此同時,來自國產品牌的工業機器人供應商也得到了快速發展,本土供應商已經近乎占領一半的國內市場。p 人工智能與機器學習技術的進步,將進一步放大機器人對人類勞動力的替代作用,在靈活、柔性、非標的層面展現更大的應用價值。42338739052655354115514517627529027636.6%37.5%45.1%52.3%52.4%51.0%201820192020202120222023全球工業機器人安裝量中國工業機器人安裝量中國工業機器人
12、安裝量占比圖:全球vs中國工業機器人安裝量(單位:千臺)海外供應商53%本土供應商47%中國工業機器人市場占比中國是工業機器人領域的全球最大市場本土制造商在國內市場份額快速提升供給側改革穩步推進,高端制造業快速發展,國內制造業仍然有較大發展潛力,國內工業機器人市場規模有望持續提升隨著具身智能技術的加持,機器人的自主決策能力將快速提升,能夠適應更復雜、更多變的任務人工智能發展線:從理性主義到深度學習Source:公開資料,甲子光年智庫。p 在機器人領域的應用上,生成式AI技術正在兌現提升機器人關鍵能力的潛力,在環境感知、自主決策、學習與適應等多個方面均有表現。p 基于網絡數據訓練的大模型似乎正在
13、觸及AI認知的邊界,Scaling Law下的預訓練大模型性能似乎快要達到極限,參數量和數據量的擴充已經難以給模型帶來質的突破。AI想要進一步發展,必須與物理世界建立更加緊密的聯系,具身智能將是AI繼續向AGI進步的關鍵途徑。符號主義與專家系統(1950s-1980s)Newell&Simon:通用問題求解器(GPS)Eliza聊天機器人專家系統開始興起,人工智能在特定領域成功模擬人類專家的知識和推理能力連接主義復興與機器學習(1980s-2010s)Rumelhart&Hinton:反向傳播算法IBM“深藍”擊敗國際象棋世界冠軍機器學習方法開始流行,關注從數據中學習模式,在圖像識別、文本分類
14、等領域得到重要進展深度學習突破與AGI展望(2010s-至今)AlexNet和ImageNet在CV領域取得成功BERT等預訓練語言模型出現,自然語言處理能力大幅提升GPT系列等大規模預訓練模型出現與進化,展現出強大的理解、推理和創造能力接下來如何繼續學習以提升智能水平?怎么與真實世界交互?萌芽:圖靈測試圖:人工智能技術發展線圍繞“離身智能”具身智能機器人發展線:從自動化工具到直接影響物理世界的智能體Source:公開資料,甲子光年智庫。p 從歷史的角度來看,工業機器人的硬件進化不斷發展,從自動化設備到移動機器人,從協作機器人到人形機器人,每一步都代表著技術的進步和創新。當下,已經進入了AI大
15、模型與機器人在底層技術創新和應用融合的交叉時代。p 技術的每一次進步都會帶來機器人應用場景的突破,且一般會在精準、重復的工業場景作業流程中率先得到應用。未來,如何提升智能機器人在開放場景的可用性,是具身智能正在解決的問題。自動化設備與工業機器人(1950s-1980s)Unimate:第一個可編程機器人,標志著現代機器人開端,并在汽車工廠投入使用六軸關節機器人開始普及,運動能力和靈活性不斷增強傳感技術與移動機器人(1980s-2000s)視覺、力覺傳感技術開始應用于機器人,機器人開始能夠感知外部環境掃地機器人、倉儲物流AMR開始應用,能在一定程度上自主規劃路徑和執行任務智能機器人與協作機器人(
16、2010s-至今)協作機械臂(cobot)興起應用場景從工業領域不斷拓寬,出現服務機器人、特種機器人等機器人類型人形機器人起步圖:機器人技術發展線接下來如何提升機器人在開放場景的可用性?以及更多的任務執行?機器人如何更好地理解和適應動態、復雜的世界?具身智能從自動化到智能化,從單一任務到通用泛化具身智能:兩條發展線的匯聚點,“AI的下一個浪潮是物理AI”Source:甲子光年智庫整理。p 人工智能和機器人技術的發展并非孤立進行,而是相互促進、共同演進的。人工智能為機器人賦予了“大腦”,使其具備感知、思考和決策能力;而機器人則為人工智能提供了“身體”,使其能夠與真實世界進行交互,獲取經驗和知識。
17、p 具身智能的興起是人工智能和機器人技術各自發展到一定階段的必然結果,是兩者深度融合的體現。人工智能的持續進步需要與物理世界的交互能力,而機器人的未來發展也離不開更高級別的智能化水平。人工智能發展線機器人發展線符號主義&專家系統機器學習&深度學習瓶頸AI需要“身體”去感知自動化&工業機器人移動與協作機械臂瓶頸機器人需要更強“大腦”19601980200020102020圖:具身智能是AI與機器人兩條線的交匯感知與交互融合學習與適應結合決策與執行統一軟硬件協同進化Time機器人的“大腦”AI的“身體”認知智能的初步探索 試圖模擬人類思考,但缺乏與環境互動 數據驅動的智能提升 需要真實世界數據突破
18、瓶頸 如何在復雜動態環境中有效運行?執行預設任務的工具 高效重復操作 缺乏自主性和靈活性 嘗試感知環境 理解和決策能力受限 難以適應非結構化環境、可執行任務單一 如何在復雜、未知環境中自主行動?目 錄Part 01具身智能的發展背景P02Part 02具身智能的發展現狀P11Part 03應用場景和代表廠商P20Part 04發展挑戰與技術趨勢P36大模型與GenAI飛速發展,開啟具身智能技術萌芽。Source:Gartner,公開資料,甲子光年智庫整理。p 隨著人工智能算法的發展,尤其是多模態大模型技術的突破性進展,將顯著加速機器人產業的發展,提升機器人的智能水平,使得機器人能夠自主進行判斷
19、和識別,執行復雜的多階段語義推理任務。不僅提高了機器人的泛化能力,也快速推動了人形機器人通往量產的進程。p 根據Gartner技術成熟度曲線,當前的具身智能仍處于技術萌芽期,雖然受大模型技術的推動成為科技產業的熱點,但是初創公司技術和商業化路徑還沒有找到有效方案,在成本、技術等層面仍然需要攻堅克難。發展階段智能化目前所處階段AI大模型是突破契機產線自動化機器智能人工智能替代重復勞動(從低精度到高精度)根據環境變化調整自身行為任務導向,自主處理復雜問題自動化生產設備機械臂、輪式機器人四足機器人、雙足人形機器人標準化工業生產線單一任務應用場景智能制造協作、公共服務多任務處理通用機器人全場景更多功能
20、和靈活性產品形態主要功能技術特點事先程序設定控制傳感器感知環境信息深度學習技術具備類人特征,有自主思維能力協作化靈活化人性化機器人智能化圖1:大模型與Agent技術是機器人產業突破臨界點的關鍵圖2:具身智能尚處于技術發展的萌芽期智能機器人表現的提升依賴于軟硬件多種技術的快速進步與降本。Source:網絡公開資料,圖片由AI生成,甲子光年智庫。p 以人形機器人為代表的具身智能機器人是鏈接虛擬數字世界和現實物理世界的最佳載體,是虛實融合的理想產物,其性能表現也高度依賴于軟件與硬件的全方位進化。p 從基礎材料科學到人機交互技術,從多模態感知大模型到高精度機器人運動控制算法,軟硬件多個層面的技術積累與
21、快速進步,讓具身智能在2023年后迅速讓世界看到其應用潛力與應用可行性。多模態感知&傳感器多模態感知&傳感器多模態感知&傳感器感知結果&任務理解感知信息從低精度到高精度,從單模態到多模態具身智能的實現需要做到視覺、聽覺、溫度、力度等多種模態的感知融合,方能全面地感知動態環境大語言模型等單一模態模型,或圖文大模型等雙模態模型,并不能實際解決具身智能機器人需要實現的作業任務多模態的感知數據需要多模態大模型進行深度融合,方能為后續的決策、規劃和控制模塊提供實時的精準時空融合感知大模型與行業know-how、業務系統也需要實現深度融合,以更好地讓機器人理解作業任務多模態感知&傳感器自主決策與規劃基于全
22、面的環境感知與精準任務理解做出決策最優解類似multi-agent技術發展趨勢,智能機器人也需要實現單體智能到群體智能的進化多模態感知&傳感器機器肢體&運動控制一方面基于材料科學的進化,推動核心零部件的性能與成本表現另一方面利用模仿學習、強化學習等方法,通過大數據集、合成數據等手段加速機器人控制算法的迭代仿真技術的進步也為運動控制算法與機器人應用開發提供了一種有效手段具身智能產業鏈:軟硬件深度融合,復雜且充滿活力的生態系統Source:甲子光年智庫整理。硬件硬件軟件軟件軟件軟硬件集成分層模型or一體化端到端,機器人面臨與自動駕駛一樣的選擇題。Source:云啟資本,Google DeepMin
23、d,甲子光年智庫整理。p 從“大腦-小腦-肢體”的架構來看,分層模型通過不同層次模型協作,利用底層硬件層和中間響應快的小模型彌補上層大語言模型的不足,推動機器人在實際場景的應用,并越來越多地采用基于學習的控制方法。p VLA等端到端模型能夠直接實現從人類指令到機械臂執行,即輸入圖像及文本指令,輸出夾爪末端動作。p 分層式路線一度是主流選擇,因為端到端路線受數據制約難以達到性能要求;機器人數據正在逐步積累,端到端路線在未來可能成為主流。路線1:分層模型路線,不同層級由多個神經網絡分別訓練優化再聯合高層級:感知&規劃低層級:動作控制策略代碼規劃自然語言處理基于規則的控制模型預測控制基于學習的控制預
24、訓練模型 通過感知系統獲取環境狀態信息 基于預先設定的策略將其轉化為可執行的代碼指令 利用自然語言進行理解和推理,生成執行步驟,ViLA:使用GPT-4V進行機器人上層規劃 傳統控制方法,根據預定義規劃指導機器人行為,即預編程 在每個控制步驟中進行滾動優化,再在新的步驟中進行再次優化 通過大規模數據的強化學習&模仿學習 特定任務或場景下的機器人控制提供基礎和初始化路線2:端到端模型路線,從目標輸入到指令輸出以RT-2為例的VLA模型,大規模數據下能夠實現泛化能力Input:圖像及文本指令Output:輸出是夾爪末端動作直接端到端地實現從人類指令到機械臂執行端到端模型的難點在于數據采集難:類似于
25、過往自動駕駛技術的發展,在沒有足夠的車輛上路之前,極難實現數據的飛輪效應現行資源下的計算效率低下通往One-Model端到端大模型是個循序漸進的過程。Source:智元機器人,甲子光年智庫整理。p 數據規模、模型泛化性、響應速率等問題是當前端到端具身大模型需要逐步攻克的弊端,需要在數據采集和模型訓練上尋求新的突破方法。p 根據智元機器人定義的路線圖,當前具身智能大腦已經具備認知、推理、規劃的能力,且而小腦層面機器人技能任務的訓練也是通過深度學習以驅動的。隨著場景、數據的增多,多個特定小模型會逐漸泛化為通用操作大模型,并最終實現與上層模型的融合。G1基礎自動化G2通用原子技能G3端到端操作技能G
26、4端到端操作大模型G5AGI人工編排任務編排認知推理規劃大模型認知推理規劃大模型感知決策執行端到端大模型通用操作大模型感知執行抓取位姿估計機械臂控制夾爪控制抓放遞基礎模型數據驅動海量數據長程數據APIAPIPrompt具身智能階段當前行業前沿所處的階段圖:具身智能的發展階段,從模塊化走向One Model端到端采集方式不斷進化,仿真數據有望驅動機器人實現智能躍遷。Source:甲子光年智庫整理。p 當前的具身智能是通過深度學習技術(模仿學習、強化學習等)從大量數據中學習并實現的,巨量的、優質的、多樣的數據,是具身智能機器人能夠實現各種各樣自主操作的基礎。p 數據采集方式呈現多元化,人工示教(遙
27、操、動捕)、機器人自主探索、仿真合成數據等方式各有優劣,為具身智能訓練數據集添磚加瓦。p 自動駕駛的數據采集方式具備借鑒意義:在規?;渴鹨院?,機器人在影子模式下自主探索,通過與環境互動收集多元數據,在云端形成數據閉環,再反哺模型的調整與訓練,這也是具身感知、學習的具體表現。方法優勢劣勢人工示教與軌跡記錄操作人員直接通過遙控器、手柄、力反饋設備或其他界面控制機器人執行任務同時記錄機器人的關節角度、末端執行器位姿、傳感器數據直觀易懂、快速采集捕捉人類經驗成本高、耗時長場景難以全覆蓋機器人自主探索與交互允許機器人在環境中自由探索,通過與環境互動來收集數據。真具身感知:觀察其對環境和自身狀態的影響。
28、無需人工過多干預能夠覆蓋更多場景經過不斷試錯學習數據質量難題需要優秀的獎勵函數設計需要很多實體在現實層面部署仿真環境生成數據在虛擬環境中(如世界模型)模擬機器人的工作狀態,生成大量的感知數據和動作數據可以控制環境的各種參數,利用大模型的泛化性,生成各種各樣的數據低成本、高效率可控性強生成的數據自帶標注Sim-to-real gap仿真環境本身難以構建物理現象難以模擬開源數據集&預訓練模型利用已有的、公開可用的數據集進行訓練或使用在其他任務上預訓練好的模型作為基礎,進行遷移學習或微調降低采集成本解決自身采集的數據稀疏問題缺乏標準,數據不一定適配標注質量參差不齊預訓練模型遷移學習表現不佳起步階段(
29、過去幾年)發展階段(當前主攻方向)規?;A段(未來規?;渴鸷螅┯柧毦呱碇悄艿某R姅祿杉椒皟灹觿?024年迎來具身智能投資熱潮,本體與具身模型受到資本青睞。Source:IT桔子(統計口徑或另有出入,僅選取公開融資信息),公開資料,甲子光年智庫整理。p 如果說OpenAI的ChatGPT引爆了2023年對大語言模型的投資熱潮,那么Tesla入局人形機器人和黃仁勛的那句“AI的下一個浪潮是具身智能”,則徹底帶火了具身智能與人形機器人領域的投資熱潮,成為2024年科技產業投資的最大熱點。p 當前具身智能機器人可用性不足的原因還是“智能化”水平不足,算法環節無法達到要求。從投資角度看,頭部人形
30、機器人的本體研發集成廠商已經經歷多輪融資,估值較高,行業整體投資熱點正從人形機器人本體向具身智能模型和其他上游零部件遷移。圖1:國內人形機器人投資事件數量與金額變化(2020-2024)20202021202220232024投資事件數量(起)投資金額(億元)圖2:從本體制造到具身大模型,投資熱點有所遷移公司名稱融資時間融資金額投后估值1X Technologies2024 年 1 月1 億美元未提及Figure AI2024 年 2 月6.75 億美元26 億美元Skild AI2024 年 7 月3 億美元15 億美元Physical Intelligence2024 年 11 月4 億美
31、元24 億美元國外市場率先轉向公司名稱融資時間融資金額千尋智能2024 年 8 月近 2 億元穹徹智能2024 年 9 月累計數億元星云智慧2024 年 10 月2000 萬元星海圖2024 年 11 月超 2 億元自變量機器人2024 年 11 月億元級國內資本于2024年下半年跟上*僅選取部分初創公司,大廠未包含在內。技術發展一脈相承,車企加速部署人形機器人。Source:網絡公開資料,甲子光年智庫整理。p 自動駕駛是具身智能的一個重要場景,都具備“感知-決策-規劃-控制”的算法架構,具身智能和自動駕駛在技術實現路徑上是一脈相承的,且算法與零部件可實現高度復用,這是Tesla給業界帶來的啟
32、示。p 當下,智能輔助駕駛已經跑通商業化路徑,進入卷交付、卷規模、卷性價比的階段,這為具身智能未來的技術打磨路徑和商業化提供了一些參考。p 同時,汽車行業從主機廠到供應商,從投資人到創業者,都在從自動駕駛轉向追求更多場景的具身智能:主機廠或自研或投資具身智能公司,而人形機器人企業也在尋求機器人“進場打工”的機會。圖1:自研或投資,國內車企與頭部供應商加速人居具身智能產業圖2:是供給也是需求,車企與humanoid的雙向選擇機器人進廠多為戰略合作的試點開展,主要目的仍然是數據采集與訓練車企制造流程高度標準化和流程化,能夠為機器人提供高度確定性的封閉場景人形機器人可以在該場景內通過重復性高的動作學
33、習與泛化,豐富制造場景任務庫車企基因產品或業務布局廣汽集團傳統主機廠第三代輪組人形機器人GoMate奇瑞汽車傳統主機廠聯合Aimoga研發Mornine比亞迪傳統主機廠自研、投資、合作上汽集團傳統主機廠對外投資北汽集團傳統主機廠對外投資長安汽車傳統主機廠預計2027年前發布人形機器人小鵬造車新勢力AI人形機器人Iron小米造車新勢力自研Cyberone華為智駕供應商成立具身智能產業創新中心寧德時代動力電池供應商自研、投資,機器人電池地平線智駕供應商計算芯片與開發者套件機器人廠商車企當前應用場景自研自用TeslaTesla分揀電池、搬運等其他任務小鵬小鵬抓取、組裝、推車車企提供場景Figure
34、AI寶馬搬運拿取零部件,放置與組裝優必選比亞迪、吉利、東風、一汽、蔚來等搬運、質檢、分揀、組裝宇樹科技吉利、蔚來搬運傅里葉上汽零部件組裝與操作Apptronic奔馳取物、搬運、裝備目 錄Part 01具身智能的發展背景P02Part 02具身智能的發展現狀P11Part 03應用場景和代表廠商P20Part 04發展挑戰與技術趨勢P36具身智能行業廠商圖譜Source:公開資料,僅例舉了行業內部分代表性企業且不分先后,甲子光年智庫整理。p 源于不同技術背景的科技企業聚焦具身智能,其技術基因、產品形態、性能表現及應用場景的差異性正在幫助它們融入工業、服務、特種應用等各類型應用場景。在AI、機器人
35、及多元領域參與者的共同作用下,我國具身智能機器人行業正經歷快速成長與擴張。汽車企業&Tier 1智駕技術架構離散制造場景人形機器人企業同源技術積累軟硬件研發能力人形/四足仿生機器人、服務機器人,以及上游零部件等跨界玩家工業具身智能企業設計、運控技術同源工業場景需求洞察機械臂、協作機器人具身智能創新中心地方性產業鏈企業共建地方性機構、基金支持科技大廠&AI企業AI算法技術優勢資金和生態優勢互聯網/科技企業載體形態多樣,場景需求決定具身智能的落地形態。Source:基于公開資料整理,甲子光年智庫。p 具身智能的物理載體形態呈現多樣性,根據其移動特性或方式,可以分為固定底座機器人、輪式(履帶式)機器
36、人、足式機器人、仿生機器人等,其中近期火爆的人形機器人屬雙足人形。p 具身智能具體形態的選擇上需要洞察場景實際的需求,并不存在“最佳形態”的單一解,但人形機器人具備多場景的“泛用性”,在具身智能的驗證、以及特定場景中的最終應用有既定優勢。p 在實際應用場景中,不同形態的機器人可以進行有機地組合以滿足具體的場景需求,如在輪式機器人上配備機械臂或靈巧手,配備輪式底座的機械臂既具備了輪式機器人移動迅速、能效高的特點,也兼備機械臂和靈巧手精細操作的優勢。具身智能固定底座機器人輪式機器人足式機器人仿生機器人如:固定底座機械臂如:AGV、自動駕駛汽車如:四足機器人、雙足人形機器人如:軟體機器人、特種形態機
37、器人精度高、適用于重復性勞動工業自動化、實驗室自動化等領域平坦路面移動迅速,能效高物流、倉儲、交通領域適應復雜地形地形探測、救援,部分服務場景人形機器人是復合型,具備人類的外形和動作,融入人類環境中與人類協作、互動模仿自然生物的運動方式,在特定的環境中執行特定任務圖:具身智能的形態分類AI助力機器人泛化性能提升,突破能力三角制約,進入更多場景。Source:專家訪談,配天機器人,甲子光年智庫。p 基于人工預先編程的自動化設備,機器人已經被廣泛用于工業制造領域并且已經相當成熟,但受限于預編程(或反復示教)的時間成本、機器人的智能化水平等原因的限制,機器人的應用仍然受限于“任務自主性”“任務復雜度
38、”“變化適應性”組成的能力三角形。p 大模型技術的快速發展,為具身智能技術的進步與應用提供了歷史性的突破機遇,在提升機器人智能化水平的過程中,機器人將更全面、精準、敏捷的進行環境感知、任務理解和準確執行,不斷提升機器人在復雜環境中處理復雜任務的能力,泛化水平將不斷提升。任務自主性任務復雜度變化適應性模型性能泛化能力樣本數量環境泛化任務泛化目標泛化本體泛化工業機械人/機械臂廣泛用于工業制造領域,如裝配、噴涂、打磨、焊接、擦洗等作業主要用于限定環境中的某一項或幾項作業任務,高效率、高精度重復工作但普遍不具備柔性作業、靈活換線的能力,AI技術的加持有望突破這一桎梏AGV搬運車、掃地機器人等在倉庫搬運
39、、商用與家用清潔等環境已經實現SLAM導航、自動駕駛功能與簡單功能作業的能力能夠在適度開放環境中試線但高精度任務和高復雜度任務作業無法勝任,需要未來AI技術的加持遙控操作機器人用于醫療手術、特種應用、排爆破拆等多種復雜任務的作業需要專業人士全程遙控操作,缺乏精準任務的自主決策能力,AI技術的加持有望加強這方面的能力圖:具身智能技術的發展與應用,增強機器人泛化能力從專用到通用,從ToB到ToC,具身智能機器人應用場景持續拓寬。Source:公開資料,甲子光年智庫。p 作為人工智能與機器人技術的最前沿,具身智能的應用場景會極度多元化,極具想象空間。p 在工業制造場景,機器人的任務執行和流程和任務本
40、身有高度規則性(可通過編程和訓練來高效完成重復性高和強度大的任務)。其中,人類不愿意做的臟活、累活、危險任務,機器人具備極高的勞動力替代性。而服務場景更加開放,相關任務更加多樣化,更加不可預測,需要機器人具備更強的自主決策能力與泛化適應性。應用場景從制造業導入,向商業和家庭服務場景逐步滲透,遠期有望應用于航天航空等極限環境。趨勢1:從ToB到ToC隨著人形機器人在媒體和日常生活中的曝光度增加,消費者對人形機器人的接受度和期待值也在提高。核心零部件的技術進步使得生產成本降低,使得產品價格更加親民,從而推動人形機器人進入家庭和個人消費市場。消費者對于智能化服務的需求將日益增長,如家庭服務機器人、教
41、育機器人、陪伴機器人等。趨勢2:從專用到通用核心零部件的技術和人工智能、機器學習和自適應控制算法的發展使得機器人能夠更好地理解和適應多變的環境。隨著社會對機器人應用的需求增加,單一功能的機器人已無法滿足市場的多樣化需求,需要機器人具備更廣泛的應用能力。極限環境制造業商業家庭服務自動化生產線安防巡檢物流配送精密操作物流與倉儲質量檢驗.零售與客戶服務酒店旅游會場展覽演示引導醫療保健教育培訓娛樂表演.家政服務陪伴互動娛樂伙伴家庭助手安全監控.宇宙探索深海探索軍事應用極地科考高輻射環境.2025年2030年2035年2040年專用通用具身智能率先落地的場景:工業制造Source:公開資料,甲子光年智庫
42、。p 工業制造流程的特點使得該場景在具身智能技術落地應用方面占據先發優勢,如柔性生產需求迫切、工作環境結構化程度高、成本效益優勢突出等需求特點,刺激著工業制造場景客戶對工業具身智能的應用更加期待。p 工業具身智能機器人能夠有效提升工廠生產任務的靈活性與適應性,并在作業過程中實現自主學習,不斷增強其復雜任務執行能力與操作精度。p 具身智能的訓練需要數據,而質量更高的數據需要從真實場景中來,機器人落地最快的場景仍然是場景相對封閉的工業制造場景,越早實現規?;涞?,就有望越早實現模型的能力提升。工業制造場景率先應用具身智能的原因具身智能機器人率先在工業制造場景創造價值對靈活生產需求性高傳統機械臂交付
43、周期長、靈活性差、維護成本高環境結構化程度高生產環境固定且相對結構化:產線布局、作業流程更規律機器人更容易感知與作業,落地性更強積累數據結構化場景下,在安全底線上,更易采集機器人感知與操作數據,方便后續能力持續提升成本效益優勢突出降本增效提高生產效率與標準化減少人力成本,縮短生產周期商業化動力強對核心零部件的要求不高,滿足工況使用即可工廠客戶成本可控,效益可見,更愿意投入生產排單靈活性 適應性快速響應生產線切換和參數調整適應當下多品類、小批次的生產增強執行能力與精度具備更精準的感知、更強的認知與規劃能力提升效率的同時,處理復雜任務的能力不斷提升智能決策&自主學習多模態大模型驅動,能夠自主拆解復
44、雜任務并決策實施持續收集和分析數據,并優化自身性能,不斷提升智能化水平 以“眼-手-腦-云”為基礎,深挖需求場景,打造一系列行業通用化、智能化產品及解決方案具身智能工業場景應用代表廠商:微億智造Source:微億智造。核心技術架構具身智能工業機器人產品矩陣視覺AI+機器人智能控制全棧技術手工業機器人智能控制眼超精細圖像感知&特殊材質成像技術腦“人機交互式”模型工廠云超級虛擬工廠云平臺 機器人3D+2D融合的復雜場景感知算法 全自研機器人仿真環境 AI運動控制算法、自動點位生成與路徑規劃 突破高透光、高反光、漫反射等復雜表面檢測瓶頸 打破國際壟斷,實現國產進口替代 工業場景多模態和多任務學習的開
45、發時間減少30%+突破小樣本、非標場景下機器視覺無法落地的限制 云端模型工廠,工業大數據平臺 打造區域工業云,為“腦”打造模型,提供算力p 微億智造致力于以工業人工智能及大數據技術,助力工業企業快速實現數智化轉型升級。p 長期布局“工業AI算法+超精細視覺感知模組+工業機器人智能控制”的全棧技術,以“眼-手-腦-云”的實施架構為基礎,打造一系列將感知算法與驅控算法相結合的“軟硬一體”智能化產品,廣泛適用于質檢、打磨、抓取、搬運及焊接等各類工作,實時感知并適應復雜變化的工業環境。p 已組建面向3C、汽車、新能源等行業大客戶的銷售及解決方案團隊,建立完善的服務體系,并與京東科技、中國移動、浪潮、中
46、國聯通等合作,共同推出服務于全國中小型制造企業的平臺化解決方案。具身智能工業機器人AI搬運及上下料AI質檢AI焊接物料搬運機器人碼垛拆垛機器人機床上下料機器人飛拍機器人(工小匠)靈鏡PMD靈眸OCT激光焊接機器人弧焊機器人點焊機器人汽車制造、消費電子、新能源領域透明材質:鏡片、薄膜等反光材質:電池殼體、車身漆面等AI裝配與拆卸拆卸機器人裝配機器人其他焊接應用案例:具身智能工業機器人“創Tron”Source:微億智造。案例解析:“創TRON”助力打造離散制造智能化柔性適配生產線客戶痛點更適合工業體質的具身智能機器人:“創TRON”依賴人工操作:人工精度低,速度慢,一致性無法保障產線換型頻繁:物
47、料品種多,傳統機械臂無法自主學習,調試成本過高應用效果提效:取代人工作業流程,提升線體生產效率,提升裝配工作精度降本:大幅降低產線調試時間,降低換型調試成本安全:實時監測周圍環境,人機協作更加安全迭代:持續積累操作數據,適應不斷變化的生產環境與任務解決思路引入具身智能工業機器人解決方案,降低人工依賴,提升機械臂柔性作業能力快速學習接插件和操作對象,可生成復雜的接插任務使用視覺伺服引導機械臂完成高速、高精度裝配工作更好地理解復雜的工業環境快速調整動態變化的生產任務提升產線的靈活性和適應性復雜環境感知:具身視覺模塊,實時捕捉環境變化強任務理解:無需示教與編程,快速理解和拆分任務實時動態規劃:動態識
48、別跟蹤與避障,實時生成最優軌跡高速精準執行:實時控制頻率1KHZ,快速響應規劃軌跡像素級3D定位、復雜任務多模態感知大模型驅動的機器人生成式翻譯器基于三階約束軌跡規劃、高維度實時路徑規劃超閉環控制、高速高精度觸發、“驅控感一體”視覺伺服技術自然交互柔性作業持續迭代降本提效安全穩定p 客戶為保定市某電氣公司,專注于電力系統用大型配電柜、儲能柜及其配套設備的供應。該公司擁有SMT線、涂敷線和機箱裝配線等生產線,其中手插件裝配每片PCB板耗時180至300秒,其他產品生產節拍各異且常需更換型號。p SMT產線單日處理超過100種產品,全年超2000種,且每年新增500多種新品類,導致產線頻繁換型。引
49、入具身智能工業機器人后,顯著降低了調試成本,提升了生產線的靈活性與適應性,成為離散制造業新質生產力的最佳實踐。具身智能工業場景應用代表廠商:配天機器人Source:配天機器人。p 配天機器人是一家專注于工業機器人、核心零部件及行業自動化解決方案的提供商,是京城機電旗下的國家級高新技術企業。p 公司始終致力于機器人技術的自主研發及高端裝備技術瓶頸的突破,同時前瞻性布局打造以具身智能、機器人行為大模型為核心的“AI+機器人”。p 植根于工業制造場景,配天在“AI+機器人”已經成功研發免示教焊接軟件模塊,基于繹零機器人運動控制引擎,通過視覺檢測和感知技術實現對焊接任務的快速識別和自主調整,無需人工示
50、教即可投入使用,適應工廠靈活的排產需求。配天機器人:工業機器人全家福配天專注工業機器人及自動化領域13年;控制器、伺服系統等智能核心部件自主研發;工業機器人產品44款,負載范圍3-280kg。其中:六軸工業機器人負載范圍:3-280KgSCARA工業機器人負載范圍:3-20Kg產線應用行業范圍典型案例機器人焊接工作站&產線搬運上下料工作站&產線智能倉儲物流AOI產品缺陷檢測拆碼垛、成品處理、包裝產線定制化非標產線醫藥行業粉針劑類全自動混粉投料系統無源濾波器自動化智能柔性裝配生產線金融行業智能分揀碼垛工作站裝配式建筑智能化產線植物纖維餐具檢品機配天機器人:工業自動化解決方案AI加持:以免示教焊接
51、任務為例,從專機專用到單機多任務并行,并在低制造、部署、運營成本下,大規模部署在結構化、半結構化、非結構化環境中,并逐步向多樣化任務延伸。船舶行業制藥化工包裝行業新能源材料建筑行業半導體行業3C汽車新能源化工玻璃制造食品加工金屬加工橡膠和塑料工程機械覆蓋行業:焊接打磨搬運碼垛噴涂上下料場景應用:分揀切割裝配應用案例:船廠BK板免示教焊接Source:配天機器人。p 某船舶制造廠商專注于碳鋼船體結構的生產,其生產線包含焊接工序。該工序中,需人工焊接BK立板與BK基板,且生產模式呈現小批量、多品種的特點。傳統焊接機器人因其柔性不足,難以適應此類生產需求。p 配天免示教焊接軟件模塊通過集成3D視覺系
52、統,能夠自主識別工件信息,無需預先進行人工標記。該模塊可自動提取焊縫特征,并基于此選擇合適的焊接路徑規劃和工藝參數,最終驅動機器人完成焊接作業,有效滿足該產線的柔性化生產需求。案例解析:AI賦能船廠BK板免示教焊接場景需求基于繹零控制引擎的免示教焊接:滿足非結構化場景下的非標產品生產應用效果解決思路主要生產碳鋼板,常規厚度12-25mm,需人工將BK板按照劃線標識進行裝配與焊接依靠人工上下料、裝配與手工焊槍焊接多品種小批量,且產品間均存在差異工件放置(非結構化)任務配置設備連接速度設定點云掃描焊縫提取路徑規劃ARL生成一鍵空運行一鍵實焊一鍵運行:免模型專家算法驅動的離線編程:通過3D相機自主識
53、別工件類型、板厚和焊縫類型,自動提取焊縫,結合免模型專家算法自適應路徑規劃和工藝匹配;焊縫跟蹤與實施修正系統:極高的視覺定位精度,實時的電弧跟蹤修正;面向多種工藝場景的解決方案:船舶制造、軌道交通、航空航天、建筑鋼構、電力制造等板材焊接、管材焊接,覆蓋多種接頭類型與多種焊縫類型。全自動流程從工業制造的確定性走向家庭服務的靈活性,具身智能價值極具想象力。Source:藍馳創投,公開資料,甲子光年智庫。p 機器人在C端的應用最具想象力,但短期來看,任務相對聚焦,對泛化能力要求不高工業制造場景下的任務正在更快進入商業化階段。p 在工業制造場景實現商業化落地之后,海量機器人的具身數據疊加算力技術的進步
54、,機器人的能力將循序漸進逐步解鎖,并向商用服務、家庭服務等更開放的場景進行延伸。C端應用家庭服務場景,包括養老、看護、家政服務、情感陪伴等商用服務住宿、餐飲、商超、批發零售柔性生產任務組裝搬運分揀科研交互巡檢模型能力足式機器人復雜空間輪式機器人平坦路面百億級萬億級千億級五百億級五百億級千億級十億級百億級五億級圖:具身智能機器人在各類應用領域的市場空間分布工業場景服務場景具身智能代表廠商:英偉達Source:NVIDIA,公開資料,甲子光年智庫整理。p 大模型訓練與推理的需求背景下,英偉達憑借AI訓練芯片成功坐上了人工智能算力領域的鐵王座,是AI計算領域的絕對領導者。p 黃仁勛曾表示,AI的下一
55、個浪潮是具身智能。當前,英偉達已經從多個方面部署具身智能,包括計算平臺的升級、多模態大模型的研發、軟件開發工具包的發布和對外具身智能機器人公司的投資,正在形成一個完整的具身智能底層技術生態體系。p 在具身智能領域,英偉達維持了其“底層算力驅動者與研發生態構建者”的生態定位,專注于提供基礎設施、算力支持和工具框架,同時通過硬件與軟件的緊密結合,為開發者和企業賦能。圖:Nvidia在具身智能領域的布局廣泛,并于2025年發布了用于合成數據生成的Isaac GR00T Blueprint以加速智能機器人研發功能模塊模擬&仿真芯片&算力Jetson Orin/ThorH200/B200 GPUIsaa
56、c SimProject GR00TIsaac LabIsaac ROS機器人操作系統Isaac NIMIsaac ManipulatorIsaac Perceptor實時計算和硬件控制,支持仿真結果的部署,為仿真和功能模塊提供運行環境與優化高性能邊緣計算平臺、高效運行AI大模型高性能AI訓練和推理芯片,適用于數據中心提供虛擬訓練環境,用于設計、驗證和優化機器人行為大規模并行仿真,支持多模態大模型的開發,可生成高質量數據集將模型部署到現實世界,可協調多機協同工作多模態大模型,為人形機器人提供感知和操作能力感知能力模塊,支持視覺、聽覺等感知人物專注機械臂的操作與控制,實現精確操作NVIDlA I
57、saac GR00T Blueprint For Synthetic Motion GenerationGR00T-Teleop工作流,借助Apple Vision Pro捕捉人類動作GR00T-Mimic工作流,將捕捉到的人類示范擴展成更大的合成運動數據集GR00T-Gen工作流,基于Omniverse和Cosmos世界模型會通過域隨機化和3D升維,指數級擴增這個數據集*物理AI模型的開發成本很高并且需要大量真實數據和測試。Cosmos世界基礎模型可以讓開發者能夠輕松生成大量基于物理學的合成數據以用于訓練和評估其現有的物理AI模型與14家人形機器人廠商達成合作其中6家為中國企業具身智能代表廠
58、商:Google DeepMindSource:RT-2:Vision-Language-Action Models Transfer Web Knowledge to Robotic Control,Google Deepmindp 來自Google DeepMind團隊的RT-2模型能夠從機器人數據和網絡數據中學習,在保留web-scale能力的同時,將知識轉化為機器人控制的通用指令,實現了從視覺語言模型到機器人動作輸出的直接轉化,提升了機器人控制的泛化能力和語義推理能力。p Deepmind基于PaLI-X和PaLM-E作為RT-2的等預訓練視覺語言模型,將其調整為VLA(視覺語言動作模
59、型)。p 采用RT-2類似的訓練方式,使用Open X-Embodiment數據集進行訓練,得到了RT-2-X模型,相對于RT-2有了更好的泛化表現。對一個預訓練的VLM模型在機器人和網絡數據上進行共同微調生成的模型接收機器人攝像頭圖像并直接預測機器人要執行的動作結合VLM預訓練模型和機器人數據,RT-2實現了強大的機器人控制策略泛化性能顯著提升大型預訓練模型在多種任務中展現強大能力,但機器人獲取類似能力面臨數據規模和模型應用的挑戰自然語言和視覺語言模型難以有效整合到機器人控制中局限一:雖然加入預訓練VLM可提升對語義和視覺概念的泛化能力,但機器人并不能產生對新動作的創造能力RT-2的物理技能
60、局限于機器人數據中所見的技能分布數據集在技能維度上的多樣性是未來機器人執行更多動作的關鍵突破點局限二:模型的計算成本很高,隨著高頻控制的場景的增多,實時推理會成為主要瓶頸目前可用于RT-2的視覺語言模型數量較少對模型量化和蒸餾技術的探索顯得尤為重要,需要讓此類模型以更高的速率運行,或在更低成本的硬件上運行圖:RT-2的架構和訓練具身智能代表廠商:Physical IntelligenceSource:Physical Intelligence,0:A Vision-Language-Action Flow Model for General Robot Control.p Physical I
61、ntelligence是一家2024年3月成立于美國舊金山的具身智能機器人初創公司,致力于將通用人工智能引入物理世界,開發大規模的人工智能模型和算法,為機器人提供動力,目前估值已達24億美元。p PI于2024年10月發布了通用機器人基礎模型0,先在高度多樣化的機器人數據上進行預訓練,調整為更強大的VLA,然后針對復雜任務進行微調。p 基于強大的預訓練模型與多源數據集,0能夠實現零樣本學習的任務處理能力,以及經過高質量后訓練數據微調之后誕生的復雜任務執行能力。PI-0通用機器人策略模型:采用了結合大規模網絡數據的預訓練視覺語言模型(VLM)主干包含各種靈巧操作任務的多樣化跨具身數據集,以及Op
62、en X-Embodiment數據集添加一個獨立的動作專家該動作專家通過流匹配生成連續動作,從而實現精確且流暢的操作技能該模型可直接基于提示執行任務,或在高質量數據上進行微調,以完成復雜的多階段任務,比如折疊多件衣物或組裝一個盒子。圖:Physical Intelligence 0 通用機器人策略的模型架構具身智能代表廠商:Figure AISource:Figure官網,公開資料,甲子光年智庫整理。p“Figure is giving artificial intelligence a body.”公司專注于研發和生產 AI 人形機器人,希望通過先進的AI擴展人類的能力。p OpenAI大模
63、型賦能的人形機器人,GPT系列多模態模型賦予了Figure 02對多種類信息輸入的感知與理解能力,并使機器人通過語言與動作實現與周圍環境、個體的交互。p 當前的Figure 02已經能完成疊衣服、餐桌清理、購物袋包裝等相對復雜任務,并在汽車工廠中執行零件裝配等勞動密集型任務。OpenAI ModelCommon sense reasoning fromimagesNeural Network PoliciesFast,dexterous manipulationWhole Body ControllerSafe,stable dynamicsSpeech-to-text“Can I have
64、sth.to eat?”Text-to-speech“Sure thing,here is an apple.”Behavior selection200hz actions1khz joint torquesOn-board robot images語音數據文本數據OpenAI多模態大模型文本數據語音數據強化學習動作模型全身控制器全身關節扭矩控制圖像/視頻等感知數據語音轉文本文本轉語音機器人移動后的外界反饋數據圖像數據圖像數據任務推理,行為選擇機器人控制信息圖:GPT-4o多模態大模型賦能Figure 02更強的常識推理與復雜任務的自主執行能力具身智能代表廠商:特斯拉Source:Tesla
65、,公開資料,甲子光年智庫。p 特斯拉通過自身的品牌影響力與對“低成本量產”的目標,催化了人形機器人行業的發展,將這個原本專業且小眾的領域快速走入大眾視野。p 得益于自動駕駛領域的數據和算法優勢,特斯拉順理成章地率先轉向具身智能人形機器人是順利成章的。p 同時,特斯拉通過工藝技術創新和極致產品設計,成功地自研了電動汽車的核心零部件并極好地控制了成本,而這些電動汽車的核心零部件也可以大量地復用在人形機器人之上,例如視覺傳感器、關節、電機、電池、熱管理系統等。首次宣布開發Tesla Bot,代號Optimus,標志著特斯拉人形機器人項目開始正式推出原型機OptimusGen-1Optimus實現獨立
66、行走功能Optimus開始能夠執行相對復雜的任務,如物品分類、簡單裝配等Optimus Gen2發布,行走動作更加流暢,左右手作業更加精細化Elon Musk表示Tesla Bot將在2025年開啟量產交付新一代靈巧手發布,擁有22個自由度(相對此前翻倍)2021.082022.092023.032023.052023.122024.012024.11軟件層面:Optimus在軟件層面與特斯拉自動駕駛領域有高度重合的環節,自動駕駛技術、數據和模型可以平滑遷移硬件層面:作為全球領先的電動汽車廠商,汽車身上的傳感器與視覺系統、電池與能源技術、電機控制技術都能夠作用于Optimus上,并且得益于大規
67、模的生產,各類硬件成本高度可控,直接影響人形機器人的成本價格資源層面:強大的資金優勢、數據與算力儲備、以及特斯拉的品牌影響力,為后續機器人量產與銷售提供保障特斯拉Optimus發展歷程及企業研發優勢目 錄Part 01具身智能的發展背景P02Part 02具身智能的發展現狀P11Part 03應用場景和代表廠商P20Part 04發展挑戰與技術趨勢P36Source:公開資料,甲子光年智庫整理。具身智能作為新興技術,仍然面臨訓練數據與模型能力等多重挑戰。p通過多學科的融合發展,具身智能已經展現出了賦能人類經濟生活各方面的能力與潛力,但產業鏈各環節的發展與應用水平不一,仍然給具身智能的整體發展帶
68、來了多維度的挑戰。p機器人的智能化水平仍受到現有方法與能力的制約,其感知能力、執行能力、學習能力、自適應能力、硬件性能、驗證方法等受限于技術水平與產業鏈現狀,雖然展現出了潛力,但距離實際落地應用仍有較遠的距離。2弱解釋性問題3模型能力待提升1數據獲取難題現有數據驅動的具身智能體暫時無法真正地理解知識、行為與環境之間的因果關系,難以在真實環境中可靠、穩健的運行在商用/家用服務場景下,機器人的“失效成本”很高,強調安全底線,一旦發生事故將可能造成嚴重后果,因此相對封閉的工業場景更適合率先落地當前的多模態大模型仍然處于快速發展中,語言、視覺、觸覺等多模態融合感知能力尚淺,無法支撐機器人在開放場景的運
69、行在復雜環境與長周期的任務執行能力不足,現有的智能體與計算能力無法實現知識的有效轉移與泛化,任務規劃器無法實現通用場景的適應性高質量機器人數據集缺失:收集真實世界的機器人數據耗時且昂貴,但仿真數據暫未解決sim-to-real gap,3D數據集建設也仍舊緩慢行業中已經出現不少開源的機器人數據集,但數據質量參差不齊,且缺乏數據采集基準,無法實現跨場景、跨任務應用的通用機器人訓練4技術路線不確定5缺乏驗證方法6算力水平制約7倫理與安全問題數據賦能,聯盟與開源數據集驅動具身智能機器人產業增長Source:公開資料,甲子光年智庫整理。p 高質量的數據是訓練高性能具身智能機器人的基礎,聯盟與開源數據集
70、的建設將有力推動相關技術的進步和應用落地,加速整個行業的增長。p 通過行業聯盟、跨界合作等方式,共同構建高質量、大規模的具身智能數據集,解決數據稀疏和碎片化的問題。p 開源數據集能夠降低研發成本,加速技術迭代,吸引更多開發者參與,促進創新生態的繁榮。全球:數據生態蓄勢待發全球范圍內已涌現出多種類型的具身智能數據集行為模仿數據集:記錄人類或其他智能體完成任務的過程,如來自Google的Open X-Embodiment(跨平臺、大規模機器人軌跡數據,加速通用策略研究)、RoboNet、DROID等強化學習環境與數據集:提供機器人與環境交互的數據,例如Habitat、RoboSuite等多模態感知
71、數據集:包含視覺、觸覺、聽覺等多種傳感器信息,用于提升機器人的感知能力,如Saycan跨界合作,多方積極構建具身智能數據集科研機構與高校:如Stanford、Carnegie Mellon、MIT等科技巨頭企業:如Google、Meta、NVIDIA等初創AI與機器人企業開源數據集的價值正在顯現開源數據集對于加速具身智能機器人研發進程、降低開發門檻、促進技術普及X-Embodiment的開源,促進了通用機器人策略的研究,降低了跨平臺開發的門檻中國:本土數據需求亟待突破國內在數據集建設方面仍面臨嚴峻挑戰數據量相對不足:與全球領先的數據集規模相比仍有差距,如Open X-Embodiment數據質
72、量參差不齊:缺乏統一的標準和規范數據孤島現象:數據分散在不同機構和企業,難以互聯互通,開源的項目相對較少數據安全與隱私問題依托廣大市場與應用場景,中國開源數據集有極大的發展潛力開源數據集打破行業數據瓶頸,提升數據質量在先進制造及其他有中國特色應用場景積累數據集有部分企業與機構開始著手開放數據集建設,攻克數據卡點智元機器人AgiBot World:基于全域真實場景、全能硬件平臺、全程質量把控的百萬真機數據集國地共建具身智能機器人創新中心RoboMIND:首個通用的具身智能機器人訓練開源數據集UNITREE G1人形機器人操作數據集鵬程實驗室ARIO世界模型正在打造具身智能技術進步的“演武場”與“
73、彈藥庫”。Source:公開資料,甲子光年智庫整理。p 世界模型能夠輔助具身大模型進行訓練,提供的訓練型的仿真:其生成的視頻交給具身大模型,具身大模型通過它的規劃執行接下來的動作,接下來的動作交互產生新的場景、新的視角,再通過世界模型繼續生成新的數據,進行閉環仿真的測試,成為具身智能機器人的“演武場”。p 另一方面,以NVIDIA新發布的Cosmos世界基礎模型為例,WFMs能夠為自動駕駛、具身智能機器人等多種AI模型提供符合物理規律的逼真數據,大幅度降低數據采集與標注的成本,充足的“彈藥”有望在未來極大地加速具身智能的學習速度。p 在世界基礎模型技術的發展推動下,具身智能的浪潮似乎有望來得更
74、快一些。特點World LabsDeepmind-Genie 2Nvidia-Cosmos側重點從單張圖像生成 3D 世界,強調空間智能生成可交互、可玩的 3D 環境,用于訓練智能體構建物理感知 AI 模型,生成合成數據,強調物理準確性技術方法深度學習模型,3D 重建自回歸潛在擴散模型,Transformer,CFG世界基礎模型平臺,不同規格模型核心能力2D 到 3D 的轉換,遵循幾何物理規則生成可控的互動環境,模擬物理效果,長時間記憶生成物理上準確的合成數據,理解物理因果關系應用領域3D 內容生成、VR/AR、機器人導航游戲開發、AI 智能體訓練、虛擬環境模擬自動駕駛、機器人、物理模擬未來的
75、應用場景機器人導航:提供環境地圖和物體識別;建筑設計、室內設計:從平面圖生成 3D 模型;游戲開發:生成游戲場景、角色和道具;虛擬現實/增強現實:創建沉浸式體驗;在線廣告:生成商品 3D 模型,用于展示和虛擬試用;文化遺產保護:對古代建筑和文物進行 3D 重建。機器人訓練:在虛擬環境中訓練機器人執行各種任務;游戲AI:訓練更智能、更逼真的游戲角色;虛擬社交:創建虛擬社交環境,用于虛擬會議、虛擬活動等;教育和培訓:創建交互式學習環境,例如虛擬實驗室、虛擬手術室等;電影和動畫制作:生成虛擬場景和特效。合成數據生成:為各種 AI 模型提供訓練數據,降低數據采集和標注的成本;自動駕駛:訓練自動駕駛系統
76、,提高其在復雜交通環境中的適應性和安全性;機器人:訓練機器人在復雜環境中執行各種任務,例如工業自動化、物流配送等;物理模擬:用于科學研究和工程設計,例如模擬流體流動、材料形變等;災難預測和模擬:模擬自然災害或人為事故,用于應急預案制定和救援演練。智庫院長宋濤微信stgg_6406分析師翟惠宇微信zhaihy1203北京甲子光年科技服務有限公司是一家科技智庫,包含智庫、媒體、社群、企業服務版塊,立足于中國科技創新前沿陣地,動態跟蹤頭部科技企業發展和傳統產業技術升級案例,致力于推動人工智能、大數據、物聯網、云計算、AR/VR交互技術、信息安全、金融科技、大健康等科技創新在產業之中的應用與落地掃碼聯系商務合作關注甲子光年公眾號