《楊經緯-百度智能研發提效落地實踐.pdf》由會員分享,可在線閱讀,更多相關《楊經緯-百度智能研發提效落地實踐.pdf(32頁珍藏版)》請在三個皮匠報告上搜索。
1、百度工程效能部 楊經緯百度智能研發提效落地實踐CATALOGUE目錄目錄 百度百度研發研發提效提效的不同的不同階段階段 智能研發的機遇和挑戰智能研發的機遇和挑戰 AI for SE:Comate+Devops智能化 SE for AI:Comate Stack 落地措施與效果落地措施與效果 思考與展望思考與展望 百度研發提效的不同階段:在線化-自動化-智能化在線化:打造Devops工具鏈,完成全流程在線化需求研發測試運維需求PRD撰寫需求評審澄清需求的迭代跟蹤項目的價值review需求管理-iCafe研發流程、分支規范開發框架、語言、組件開發環境維護代碼托管-iCode測試CASE撰寫測試框架
2、測試環境維護流水線建設上線方案、分級發布預案、混沌工程告警&預警流水線-iPipe發布上線-CNAP用例管理-GitCase發布上線-FCNAP項目管理-iCafe云IDE-iCoding工程能力地圖:研發管理數字化,解決工程能力地圖:研發管理數字化,解決從無到有從無到有的問題的問題自動化:構建極致的自動化研發環境工程效能數據:通過量化的工程效能數據:通過量化的結果指標結果指標衡量好壞,通過衡量好壞,通過過程指標過程指標定位發現問題、指導改進定位發現問題、指導改進需求研發測試運維狀態流轉自動化流水線自動化研發知識高效流動自動擴縮容監控配置自動化項目風險自動監控典型案例:狀態流轉自動化 智能研發
3、的機遇和挑戰探索AI原生新范式AI4SE-人機協同人機協同SE4AI-換道交付換道交付更多研發階段更多研發階段擴展擴展LLMLLM能力能力Devops全流程智能化擴大跨階段的能力多角色、全場景協同多角色、全場景協同人機協同重構整體過程人機協同重構整體過程全面AI Agent加持重構研發過程關鍵編碼提效工具:文心快碼關鍵編碼提效工具:文心快碼ComateComate自動化編碼、個性化開發人員輔助豐富、精準、極速、流暢、安全、開放AIAI原生應用開發平臺原生應用開發平臺AI原生應用托管 AI原生應用測試 AI原生應用監控與TracePromptPrompt工程工程數據工程數據工程效果評估效果評估P
4、rompt生成、調試、發布數據采集、加工、構建人工評估自動評估 AI for SE:Comate與Devops智能化Comate提效效果明顯,賦能千行百業202223-Q123-Q223-Q3當 前0.270.27%1.821.82%7.537.53%15.2715.27%百度內部Comate代碼生成占比30%+已在金融、汽車、機械制造、軟件服務、互金、音視頻、消費、工業互聯網等領域建立標桿客戶注冊企業數10000+賦能千行百業,加速科技創新人機協同:核心編碼環節工具-Comate模型與工程相模型與工程相結合結合精準極 致 的 推 薦 速 度極 致 的 推 薦 速 度極速流暢的使用體驗流暢的使
5、用體驗體驗守護企業代碼守護企業代碼安全安全安全打造更適合用打造更適合用戶的研發助手戶的研發助手開放具備豐富的產具備豐富的產品能力品能力豐富豐富的能力矩陣幫你想、幫你寫、幫你改,覆蓋研發全周期幫你改測試代碼代碼Debug缺陷自動修復生成測試用例代碼優化智能評審CI 錯誤診斷安全檢查與修復 智能CLI幫你寫編寫代碼實時續寫注釋生成代碼描述生成代碼生成注釋接口生成代碼生成單元測試幫你想調研&設計需求澄清任務分解代碼解釋技術問答IDEWeb文心一言Agent準確的推薦效果:采納率46%,喜馬拉雅44%發起請求發起請求 動態延遲觸發 用戶行為預測預處理預處理 基于編程現場的知識增強 精細化上下文提取模型
6、推理模型推理 智能判斷推理粒度后處理后處理 語法正確性校驗 低質內容過濾 重復性、安全性檢測專屬代碼大模型專屬代碼大模型模型訓練 監督學習 強化學習數據工程 豐富的數據來源 預處理 數據清洗與精標訓練專屬代碼大模型,結合工程化解決方案,在多個環節提升推薦準確性。性能:行業領先,超越Copilot編碼過程是一個連續連續、專注專注的過程,打斷、等待對持續編碼的工程師是負面反饋。推理速度每慢100ms,采納率降低5%。代碼續寫的性能訴求性能訴求相比普通文本生成更高,在保證質量的前提下,需要關注響應速度。響應速度。服務端端模型全流程全流程提升提升響應速度響應速度 多級緩存 非阻塞性任務并行執行 流式請
7、求處理 執行狀態顯化 代理服務轉直連 硬件與網絡資源優化 異步計算 高性能推理加速 高效模型壓縮 模型選擇用戶體驗:用戶滿意度90%+03體驗優化閉環體驗優化閉環持續觀測與優化用戶反饋閉環:用戶反饋閉環率85%+01建立標準建立標準用戶滿意度體系:定期調研,及時更新評測體系單場景用量:by場景關注功能觸達、點贊點踩、采納率等業務效果體驗委員會:建立體驗委員會與嚴格的評審標準,保證能力流暢易用02場景化落地場景化落地易用性易用性:易觸達易觸達、好理解好理解、易上手易上手確定性:生成時機穩定,中間狀態顯化準確性:生成效果穩定,融合業務特性與個人習慣感知層:易觸達認知層:好理解行為層:易上手Just
8、 in timeJust in time貼近用戶習慣貼近用戶習慣避免造成打擾避免造成打擾厘清概念厘清概念信息布局優化信息布局優化增強引導增強引導使用流暢,使用流暢,Step by StepStep by Step交互打磨交互打磨輸出內容清晰易懂輸出內容清晰易懂如何增強場景易用性如何增強場景易用性安全:安全增強+安全掃描雙重保障訓練數據安全過濾模型模型現場現場推理推理網絡網絡推理內容風險監測中間人防挾持敏感數據脫敏上傳代碼代碼安全安全供應鏈供應鏈漏洞漏洞通用漏洞通用漏洞機密掃描機密掃描安全掃描安全掃描 SQL、SSRF、命令注入等漏洞Log4j2、Fastjson等漏洞AK/SK、密碼、Toke
9、n硬編碼等問題開放性:連接企業私域與能力,典型標桿提效75%+。知識增強知識增強能力增強能力增強+研發環節集成至編程現場,保持”心流”模式模型增強模型增強基于私域知識的效果增強問答助手、業務特性代碼生成等大模型能力業務調優業務 Comate內置能力 編程現場信息 研發流程集成 定制化需求知識中心 私密性Code文檔API 實時性 定制性數據大模型prompt效果效果:20+業務合作共建,準確率平均提升20%獲得獎項2023 AIIA人工智能十大先鋒應用案例2023年AI4SE”銀彈”優秀案例2024年度優秀軟件產品(中國軟件行業協會頒發)信通院首批AI智能編碼工具4+最高級評級“人工智能+”產
10、品標桿(2024機器之心“人工智能+”標桿示范評選)軟件著作權證書Comate 智能編碼助手軟件已授權專利10+個大模型為Devops智能化帶來新的機會生成式大模型到來后,解決了復雜場景難以落地的問題生成式大模型讓產研同學使用Prompt配合熟悉的工程化方案,就可以快速完成復雜的任務,完成智能化的落地。語義理解能力弱缺少優質數據模型訓練成本高對復雜任務信心不足強大的語言理解能力模型通用性強微調等落地成本低更準確的自然語言交互產品形態:IDE+WEB多端適配具體到場景,分場景:具體到場景,分場景:1.和原有功能場景化整合。2.引導到對話區完成任務。統一的智能化認知:ComateWebIDE視覺上
11、:視覺上:原則原則:一個能力,多處透出。代碼解釋表單自動填充智能評審智能配置智能綁卡智能工作總結DevopsDevops平臺集成平臺集成智能搜索WEBWEBIDEIDE人機協同:全流程智能化對一個新事物的接受程度是在不斷地接觸之下提高的,不要害怕將能力展現在開發者面前Devops相關的平臺是開發者從需求到發布必經之路,在他的工作上必不可少,因此也是很好地呈現能力的空間需求編寫需求查詢需求文檔查閱代碼評審代碼理解開發測試生成用例裁剪測試錯誤修復風險檢測構建發布配置日志分析部署在Devops全鏈路上透出智能化的能力,打造驚喜感、助力效率提升,增強接受度覆蓋40+研發場景,非續寫場景覆蓋率70%+人
12、機協同:進一步探索AI人機協同新模式Agent模式:開發者僅需要把需求文檔寫好,剩下的由 Agent自主思考、拆解需求并執行任務,完成代碼的生成。文心大模型思維鏈能力以智能體方式來思考和執行任務聽懂人的需求,順序執行需求拆解、制定計劃、生成代碼、調試運行等步驟非續寫研發模式:NL2Code、注釋生成代碼、單測非續寫代碼生成占比:35%80%+80%+工程師使用30%30%代碼生成占比46%46%采納率35%35%非續寫代碼占比ComateComate65%+65%+工程師使用40+40+覆蓋場景數75%75%點贊率90%90%用戶滿意度Comate-webComate-web百度全局提效121
13、2%原度量體系結合AI度量體系度量標準與提效效果 SE for AI:Comate StackComate Stack:AI基礎設施建設Prompt 開發和使用指南AI 原生應用效果評估指南AI 原生應用數據集使用規范AI 應用模型管理與使用規范研發規范指南Baidu Comate StackAI 原生研發需求管理流程Prompt 研發流程GenAI 數據研發流程AI 應用開發iPlaygroundAI 應用托管CNAPAI 應用測試TestMate大模型及 AI 應用評估iEValuePrompt 工程iEValue數據工程iDataSet研發流程機制研發工具千帆大模型服務平臺文心一言基礎A
14、I平臺50%50%工程師工程師開發過開發過 PromptPromptAI 原生應用數據顯著增加原生應用數據顯著增加75%業務數據上車效率顯著增加業務數據上車效率顯著增加47%百度的百度的AIAI原生重構是全面且徹底的,背后有成熟的規范、流程和工具體系支撐原生重構是全面且徹底的,背后有成熟的規范、流程和工具體系支撐換道交付:AI研發新元素帶來軟件研發流程變化數據集數據集(DataSetDataSet)、提示詞提示詞(PromptPrompt)新元素的研發流程建設是核心新元素的研發流程建設是核心 評估就是大模型研發的重要組成部分,評估能力的在線化、自動化 數據驅動AI原生應用的迭代升級,飛輪反饋的
15、效率建設大模型帶來軟件研發角色邊界變化,由此產生協同提效的變化大模型帶來軟件研發角色邊界變化,由此產生協同提效的變化新的協作方式:大模型技術普惠帶來角色間協同邊界的變化,對應工具平臺使用群體、交互方式的變化新的能力要求:大模型在軟件中帶來的變化,比如latency/cost等帶來的新工具訴求提示詞開發提示詞評審MVP 開發數據工程模型微調代碼開發代碼評審測試/效果評估發布/上線運維需求設計需求調研需求工程需求工程在線監控在線監控/反饋反饋價值回顧價值回顧 如何在企業內有效落地百度技術戰略委員會組織+項目化機制+統一牽引指標技術委員會技術委員會事業群事業群 執行單元執行單元1 1落地負責人項目化
16、機制項目化機制運營培訓運營培訓執行單元執行單元N N落地負責人組組織織結結構構業業務務落落地地支支撐撐公司權威的技術組織公司權威的技術組織自上而下的執行網絡自上而下的執行網絡分項目推進治理橫向部門支持橫向部門支持評優評優牽引指標:牽引指標:AIAI代碼生成占比代碼生成占比推動工程師與企業AI原生思維演變內容建設內容建設基于工程能力要求,開發系列課程,整合內外資源基礎層專項層 AI工具使用 Prompt工程 數據工程 Comate使用 大模型基礎 文心一言 百度千帆 工程意識講師機制豐富內容課程運營學習運營學習多樣化的運營形式,覆蓋公司90%以上目標人群工程規范工具指南最佳實踐不同角色不同運營思
17、路機制建設機制建設推動完善規范建設,建立相應培訓機制AI原生必修課培訓認證CMCCMC代碼委員會代碼委員會規范機制100%覆蓋緊跟業界動態,宣傳AI原生、低代碼AI原生案例理念運營宣傳效能圓桌會百度工程效能大會百度工程效能大會先進理念先進理念&實踐實踐 總結與展望總結 百度提效的不同階段:在線化-自動化-智能化 智能研發的機遇和挑戰:AI4SE:人機協同 智能編碼助手Comate:豐富、精準、極速、體驗、安全、開放 Devops全流程智能化 人機協同新范式的進一步探索 SE4AI:Comate Stack,換道交付 落地措施與效果:組織、機制、牽引指標、思維演變展望:人機協同關系將迎來變革時代未來也必定由人向人機協同向無人職守前進,時代未來也必定由人向人機協同向無人職守前進,Be ReadyBe ReadyComateComate官網官網個人聯系方式個人聯系方式微信公眾號微信公眾號Baidu Comate不只是工具 更是企業擁抱AI原生研發范式的強大伙伴