《2024 洪思睿-MetaGPT-0425.pdf》由會員分享,可在線閱讀,更多相關《2024 洪思睿-MetaGPT-0425.pdf(19頁珍藏版)》請在三個皮匠報告上搜索。
1、D Da at ta aF Fu un nC Co on n#2 20 02 24 4MMe et ta aG GP PT T:重重塑塑自自然然語語言言編編程程Sirui Hong DeepWisdom MetaGPT一作-多多智智能能體體引引領領代代碼碼生生成成與與協協同同的的革革新新探探索索DeepWisdomC Co on nt te en nt ts s目目錄錄MetaGPT 的發展與影響多智能體協作與自我提升探索智能體能力增強DeepWisdom0 01 1 MMe et ta aG GP PT T 的的發發展展與與影影響響DeepWisdomMMe et ta aG GP PT T
2、:或或許許是是中中國國歷歷史史上上漲漲速速最最快快的的開開源源工工程程S St ta ar r H Hi is st to or ry y:3 33 34 49 91 1(2 20 02 24 4/1 1/1 18 8)G Gi it tH Hu ub b T Tr re en nd di in ng g MMo on nt th hl ly y 2 20 02 23 3/0 08 8 -MMe et ta aG GP PT T 1 17 7次次第第一一,l ll la amma a 6 6次次第第一一MetaGPTMetaGPT 是一個先進的多智能體開源框架,專注于解決多智能體落地應用的實際
3、問題。它通過模擬軟件公司多角色,能輸出產品設計、架構圖、代碼repo(社區總人數:8k+)MMe et ta aG GP PT T樣樣例例MMe et ta aG GP PT T喜喜提提I IC CL LR R 2 20 02 24 4 o or ra al l(t to op p 1 1.2 2%),L LL LMM-b ba as se ed d A Ag ge en nt t#1 1a a1 16 6z z L LL LMM方方向向投投資資人人DeepWisdomMMe et ta aG GP PT T:多多智智能能體體協協同同的的新新范范式式研研究究背背景景近年來,自動化任務解決方面取
4、得了顯著進展,但現有的工作主要集中在簡單任務上,如客服對話問答、簡單代碼補全、基礎信息抽取等問題。MMe et ta aG GP PT T的的引引入入為了解決更為復雜的任務,如項目級別的代碼生成、數據分析/機器學習建模過程中LLM的幻覺問題,研究者引入了MetaGPT。核核心心思思想想將有效的人類工作流程作為元編程方法融入到LLM驅動的多代理協作中。實實現現方方向向MetaGPT首先將標準化操作程序(SOPs)編碼為提示,從而促進結構化的協調。DeepWisdomMMe et ta aG GP PT T:實實際際應應用用與與優優勢勢實實際際應應用用:通過對Python游戲生成、CRUD代碼生成
5、和簡單數據分析任務進行的綜合實驗。人人機機協協同同:自動生成的文檔允許人類開發者快速獲取和增強領域知識,進一步細化他們自己的需求、設計和代碼。與與其其他他模模型型的的比比較較:結果顯示MetaGPT在代碼質量和預期工作流程的一致性方面都明顯優于其對手。前前景景:MetaGPT的角色基于專家代理協作范式為未來的人機協同開辟了新的途徑。The percentage of pass rates on the MBPP and HumanEval with a single attempt.DeepWisdom0 02 2 多多智智能能體體協協作作與與自自我我提提升升DeepWisdom軟軟件件公公司
6、司:mme et ta ag gp pt t C Cr re ea at te e a a 2 20 04 48 8 g ga amme e.DeepWisdomMMG G 虛虛擬擬小小鎮鎮:記記憶憶的的重重要要性性,近近因因性性,和和相相關關性性背景技術方案記記憶憶節節點點關關鍵鍵因因素素 重要性(Importance):使用Prompt評估記憶的重要程度 近因性(Recency):采用時間依賴的衰減流程,利用時間步差距評估。相關性(Relevance):事件描述的向量化&余弦相似度計算挑戰長期記憶的連貫性,記憶管理能力,LLM窗口限制Generative Agents1 /MemGPT多智
7、能體社會仿真,多輪稀疏交互,內容更新和時序相關性Generative Agents:Interactive Simulacra of Human BehaviorMemGPT:Towards LLMs as Operating SystemsUser Behavior Simulation with Large Language Model based AgentsLARP:Language-Agent Role Play for Open-World GamesDeepWisdomMMG G 狼狼人人殺殺智智能能體體:經經驗驗獲獲取取增加智能體對局經驗,學會游戲對局判斷,自我優化,獲取更高勝
8、率智能體在游戲過程加入反思,形成經驗進行存儲,增加游戲-角色經驗池?;诜此嫉恼Z義相似度進行經驗檢索和經驗應用。相關對局經驗重放,優化當前對局輸出:根據失敗的經驗進行修改,根據成功的經驗增加輸出表達的信心。背景技術方案Past as a Guide:Leveraging Retrospective Learning for Python Code CompletionRAP:Retrieval-Augmented Planning with Contextual Memory for Multimodal LLM AgentsExpeL:LLM Agents Are Experiential
9、LearnersReflexion:Language Agents with Verbal Reinforcement Learning挑戰經驗沉淀/表征,勝負經驗內容理解,經驗應用有效性Past as a Guide1 /RAPDeepWisdomMMG G MMi in ne ec cr ra af ft t:程程序序記記憶憶&終終身身學學習習在Minecraft 游戲內持續進行技能學習、開發和利用背景技術方案挑戰任務規劃/程序記憶以及終身學習范式Voyager1 /GhostVoyager:An Open-Ended Embodied Agent with Large Language
10、ModelsGhost in the Minecraft:Generally Capable Agents for Open-World Environments via Large Language Models with Text-based Knowledge and Memory Describe,Explain,Plan and Select:Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents 任務規劃&課程學習:基于目標進行任務拆解和知識嵌入,基于相關任務進行課程學
11、習,動態上下文嵌入 協作分工設計&流程優化:課程設計、技能檢索、代碼生成、執行反饋評估、程序記憶存儲DeepWisdom0 03 3 探探索索智智能能體體能能力力增增強強DeepWisdom技技術術挑挑戰戰:H Hu umma an nE Ev va al l下下一一個個階階段段:R Re ep po o級級別別代代碼碼能能力力突突破破突突破破代代碼碼能能力力的的極極限限 目標:我們的首要目標是在最短時間刷新 HumanEval 分數,提升LLM在代碼能力上的進一步提升DeepWisdomD Da at ta a I In nt te er rp pr re et te er r:重重塑塑數數
12、據據科科學學領領域域https:/arxiv.org/abs/2402.18679DeepWisdom基基于于代代碼碼解解釋釋器器的的能能力力補補充充 基于分層圖結構的動態計劃 基于驗證與經驗驅動的推理 工具集成與進化DeepWisdom動動態態規規劃劃與與層層次次圖圖結結構構 基于分層的圖結構進行任務和代碼規劃,有效管理任務間的復雜依賴,靈活應對數據科學任務的實時數據變化 任務粒度的動態管理:動態圖更新及數據上下文管理DeepWisdom工工具具集集成成&應應用用場場景景 工具注冊&工具選擇 工具組合&工具調用 工具進化&工具生成DeepWisdom能能力力效效果果提提升升探探索索機機器器學學習習建建模模能能力力DeepWisdom感感謝謝觀觀看看DeepWisdom