
路徑一:模態豐富+具身智能+多 Agent 協同 Agent 具有五個層級,信息維度不斷豐富有望推動能力提升。Yonatan Bisk 在《Experience Grounds Language》中提出 World Scope (WS),來描述自然語言處理到通用人工智能(AGI)的研究進展,包括語料庫-互聯網-感知(多模態 NLP)-具身-社會 5 個層級。當前多數 LLM建立在互聯網層級,具有互聯網規模的文本輸入和輸出。而隨著 LLM 進一步配備擴展的感知空間和行動空間,有望進一步通向感知、具身層級,未來多個 Agent 共同工作,有望產生涌現的社會現象,達到第五層級。