《陳鑫-AI 研發產品進化論:從 AI 編碼助手到 AI 程序員.pdf》由會員分享,可在線閱讀,更多相關《陳鑫-AI 研發產品進化論:從 AI 編碼助手到 AI 程序員.pdf(26頁珍藏版)》請在三個皮匠報告上搜索。
1、陳鑫 阿里云通義靈碼技術負責人致力于企業研發效率、產品質量、DevOps方向研究和探索。2011年加入阿里,帶領過大數據測試團隊、測試工具研發團隊、研發平臺團隊。對研發協同、測試、交付、運維領域都有很深的見解。目前正在帶領團隊向云原生、極致效率、智能化等領域進行持續演進。演講主題:AI研發產品進化論:從AI編碼助手到AI程序員AI 研研發發產產品品進進化化論論:從從 AI 編編碼碼助助手手到到 AI 程程序序員員陳鑫 通義靈碼技術負責人過過去去一一年年 AI 輔輔助助編編程程工工具具的的發發展展AI 輔助編程工具爆發式增長,呈百家爭鳴態GitHub CopilotTabnineAmazon Q
2、CodeiumCursorCody AITONGYI LingmaComateDevinMarsCodeCodeGeexGenieRaccoonBableAI 輔助編程在 Gartner 報告中處于期望頂峰通通義義靈靈碼碼受受到到廣廣泛泛開開發發者者的的喜喜愛愛通義靈碼的插件下載量超過 500 萬為開發者編寫超過 10 億行代碼202408202407202311202312202401202402202403202404202405202406202408202407202311202312202401202402202403202404202405202406數據來源:VS Code、Je
3、tBrains 插件市場下載量數據通通義義靈靈碼碼,你你的的智智能能編編碼碼助助手手IDE 客戶端代碼智能生成行級、函數級自動續寫自然語言生成代碼單元測試生成代碼注釋生成代碼解釋生成優化建議生成研發智能問答研發領域自由問答本地工程問答企業知識庫問答Terminal 問答異常報錯智能排查代碼問題排查企業級管理和個性化賬號集成和授權管理企業知識管理企業自定義擴展專用網絡和推理集群沉浸式編碼全工程環境感知生成粒度控制貼合開發者習慣毫秒級生成速度國內唯一入選 Gartner AI 代碼助手魔力象限挑戰者象限Gartner入選 2024 世界人工智能大會最高榮譽鎮館之寶WAIC首批通過信通院智能化軟件工
4、程技術和應用要求CAICT開開發發者者使使用用代代碼碼助助手手產產品品的的痛痛點點代碼生成能不能更準代碼補全、智能問答推薦不準反而造成了開開發發者者閱閱讀讀成成本本,效率更低?能不能理解更更多多代代碼碼上上下下文文,做出更準確的預測?如何能讓寫出的代碼更符合企企業業的的個個性性化化規規范范?不會寫復雜的提示詞如何進行膠膠水水層層代代碼碼批批量量生生成成?如何根據企業內數據庫再結合自自然然語語言言生生成成 SQL 語語句句?如何批批量量生生成成測測試試用用例例的的數數據據?按照固定格式要求進行注注釋釋批批量量生生成成怎么做?不知如何與AI高效對話如何讓大模型在已已有有工工程程中完成一個小需求?能
5、不能讓AI在原有代碼庫中自自動動完完成成代代碼碼修修改改,無需復制粘貼?前端頁面有一個缺陷,如何告訴模型,讓他來完完成成修修復復?AI一次性生成代碼不符合要求,如何讓他完成多多輪輪迭迭代代?AI能不能更智能AI能不能自自動動定定位位缺缺陷陷,并完成修復?能不能根據設設計計圖圖生生成成前前端端可用代碼?能不能生成可可用用的的單單元元測測試試代代碼碼,無需修改?能不能進行批批量量代代碼碼重重構構、轉轉換換和和基基礎礎軟軟件件升升級級?滿滿足足開開發發者者訴訴求求的的關關鍵鍵技技術術方方向向擴展自定義指令自定義上下文端側執行引擎數據本地工程數據企業精選數據內部系統數據模型代碼基礎模型代碼Agent任
6、務模型代碼補全專用模型智能體單智能體多智能體協同自定義智能體擴展Qwen-Coder 2.5,超過 5.5T tokens 訓練,支持 128K 上下文Qwen2.5,超過 18T tokens 訓練,支持 128K 上下文通義靈碼補全模型通義靈碼問答模型持續訓練持續訓練Qwen-Coder 2.5模型與業界其他代碼模型性能對比基基于于Qwen2.5模模型型家家族族構構建建靈靈碼碼專專用用模模型型全全面面完完整整的的代代碼碼分分析析實實現現全全工工程程理理解解為為模模型型輸輸入入準準確確上上下下文文本地服務代碼分析會話管理上下文感知代碼后處理向量檢索執行引擎服務端提示詞工程模型路由檢索增強知識
7、管理擴展管理安全審計模型代碼補全模型專項任務模型研發問答模型IDE 客戶端通義大模型排序精選排序篩選本 地 工 程企 業 示 例 工 程相關代碼相似代碼當前代碼上下文工程信息BadCase 解決推理性能優化模型微調訓練/擴展指令#擴展上下文擴展智能體/api gen自定義指令/command提示詞封裝模型服務內部系統/name expert/#diff#issues#自定義上下文/command提示詞封裝模型服務內部系統#context組合agentPlan模型服務#context/command內部工具code reviewersql optimizer自自定定義義擴擴展展:解解決決代代碼碼
8、助助手手能能力力寬寬度度問問題題#files#DB有有哪哪些些擴擴展展的的場場景景(示示例例)SQL 語句生成XML2JSON中間件使用說明框架代碼生成/指令#上下文智能體企業知識庫指定的配置或文件其他工具的輸出指定需求清單代碼掃描安全掃描問題修復測試工具集成WhenActLet“#”“/”“”智智能能體體擴擴展展產產品品架架構構通義靈碼智能體定義:一個可以獨立理解、執行行為的智能體,擁有自己的身份定義,具有調用模型、引入上下文、調用工具的能力,可以組合#上下文,通過 在插件端喚起。智智能能體體:突突破破代代碼碼助助手手能能力力上上限限Developer&CopilotDeveloper&Ag
9、entDeveloper&Multi-Agent人類AI人類AI人類AI人類完成絕大部分工作人類和 AI 協作工作AI 完成絕大部分工作階段一階段二階段三人效提升 10%15%人效提升 15%50%人效提升 50%80%給出有效建議給出經驗證的代碼給出完整交付物海海外外智智能能代代碼碼助助手手產產品品的的最最新新發發展展推推出出更更強強大大的的基基礎礎模模型型Claude 3.5 Sonnet 贏得了眾多開發者的喜愛,Github Copilot也開始支持多模型選擇,同時接入OpenAI、Anthropic、Google三家基礎模型。11月12日,通義推出最新 Qwen-Coder 2.5 3
10、2B模型,基準測試性能可對標 Claude 和 GPT 等最先進模型。多多文文件件編編輯輯能能力力IDE 產品側均開始提供多文件編輯交互體驗。目標是允許開發者自由的進行上下文和提示詞組合,在多個代碼文件中完成一個較復雜的代碼任務。并且可以由AI自動修改代碼,開發者僅需做代碼評審以及簡單修正即可。垂垂直直編編碼碼場場景景多多智智能能體體協協同同系系統統垂直編碼場景的 Multi-Agent 系統開始加速發展,例如在前端、測試、運維領域等。多個產品推出基于多智能體協同系統的無代碼開發平臺,僅需對話就可以生成應用。這些發展都建立在基礎模型代碼能力增強和 Agent 技術成熟的基礎之上。更更多多的的產
11、產品品組組合合完完成成開開發發全全鏈鏈路路更多開發者開始使用多個產品組合完成日常開發,例如先使用前端生成工具產出頁面,再使用 IDE 代碼助手進行代碼完善和細節調整,最后使用運維智能體擴展進行代碼部署、運行調試等。AI編編碼碼能能力力從從片片段段級級到到多多文文件件級級代碼助手的能力已經從單文件簡單的片段級別注釋生成、單測生成、代碼優化等,進化到多文件級別的編碼任務,例如需求實現、批量測試用例生成、多文件代碼評審、批量代碼重構、三方依賴升級等。編編碼碼智智能能體體智智能能體體為為開開發發者者帶帶來來新新的的體體驗驗端端到到端端的的完完成成一一個個完完整整編編碼碼任任務務開發者只需要輸入準確的需
12、求和上下文,AI可自主完成從需求理解、任務規劃、代碼生成、DIFF生成全過程。開發者無需從零開始編碼,而是基于AI生成結果完成任務。更更多多的的復復雜雜步步驟驟實實現現自自動動化化AI可以進一步實現上下文自動感知、編程工具自動使用、自動功能驗證、自我反思迭代等自動化能力,進一步釋放開發者的生產力。成成為為可可以以信信任任的的編編程程伙伙伴伴隨著模型能力、Agent能力的成熟,開發者可以更加信任AI,并傾向于盡可能多的編碼任務交給AI完成。我們稱之為信任拐點,此時已經到來。AI更加擬人,從一個輔助生成功能,變成了可以交流溝通的編程伙伴。通通義義靈靈碼碼 AI程程序序員員 智智能能體體的的人人機機
13、交交互互流流程程與與場場景景需求理解任務拆解編碼實現自主測試提交代碼輸入需求確認計劃確認結果場景二:測試生成針對整庫或者單文件進行單元測試批量生成,并具備運行錯誤自動修復以及測試報告生成能力??梢源蠓档烷_發者編寫單元測試用例的成本。場景一:缺陷修復自主進行缺陷分析、制定修復計劃,開發者只需一鍵確認,即可快速完成缺陷修復代碼和代碼提交,幫助開發者高效修復缺陷,輕松解決繁雜的修復任務。場景三:需求實現自然語言描述需求,AI 程序員即可開始實現。從需求理解、拆解開發任務,到編碼實現、自主測試和修復等,端到端實現需求。提示詞輸入自自由由的的上上下下文文與與提提示示詞詞組組合合提供文件、知識庫、圖片、
14、全工程檢索等上下文,以及自定義指令(預設提示詞)和用戶輸入提示詞自由組裝能力。端端到到端端的的需需求求實實現現工工作作流流實現從需求理解、任務拆解、計劃生成、代碼生成、Diff 生成完整工作流,開發者可以自由修改和迭代代碼。Dev Agents 輔輔助助需需求求實實現現知識問答上下文選擇提示詞組裝歷史會話庫內檢索增強工程向量檢索召回檢索結果合并及重排工作流執行企業知識庫檢索召回解決方案生成代碼 Diff 生成開發者確認本地工作流編排架構本地檢索引擎遠程 embedding 服務Dev Agents 任務模型Bugfix Agents 全全自自動動缺缺陷陷修修復復根據缺陷上下文,生成可用的經過驗
15、證的缺陷修復代碼,成為每個開發者 Bugfix 小助手解決方案代碼生成Search EngineRepoCode EmbeddingCompilerTest ToolsActionsFeedback問題修復單測生成項目感知缺陷定位環境交付執行反饋EnvironmentAgentsSearch Agent缺陷定位&信息收集Generation Agent代碼&解決方案Test Agent庫級別可編譯,UT 執行正確Diff Agent代碼 Patch 生成,提交 MRDebug Agent缺陷復現,可編譯可執行優化策略生成數量控制規范性風格統一單元測試框架支持運行/編譯失敗信息收集執行編譯和運行
16、自主學習工程檢索能力微調訓練優化UnitTest AgentUnitTest Agents 全全自自動動單單測測生生成成生成單元測試編譯構建和運行搜索工程信息自主修復報告生成用例采納放入工程隱藏目錄內收集編譯或運行信息收集編譯運行失敗相關源碼定義模型推理嘗試多輪修復提供編譯運行覆蓋率等信息根據報告結果手動/自動采納研發流程中觸發編碼助手中觸發代碼評審階段持續集成階段代碼編寫階段相相關關技技術術難難點點與與突突破破https:/ 通義靈碼 SWE-GPT:從 靜態代碼建模 邁向 軟件開發過程長鏈推理https:/qwenlm.github.io/zh/blog/qwen2.5-coder-family/Qwen2.5-Coder 全系列:強大、多樣、實用基基礎礎代代碼碼模模型型Qwen推出Coder系列7B、32B模型,為編碼Agent實現提供了豐富的選擇。故故障障定定位位Lingma SWE-GPT 系列模型,通過學習和模擬真實的代碼提交活動,實現了對軟件改進流程的更全面理解。測測試試修修復復基于Qwen模型,訓練應對測試用例修復場景的專用模型,實現了相較于通用大模型更高的修復成功率。Diff 生生成成通過 Diff 生成專用模型實現針對大模型生成的解決方案,快速 Apply 生成最終代碼文件的能力。通通義義靈靈碼碼 AI 程程序序員員謝謝