《張立理-智能化研發在百度的落地.pdf》由會員分享,可在線閱讀,更多相關《張立理-智能化研發在百度的落地.pdf(44頁珍藏版)》請在三個皮匠報告上搜索。
1、智能化研發在百度的落地張立理 百度演講嘉賓張立理百度前端架構師百度前端架構師,百度前端CMC主席,技術組織委員會Web方向負責人。2023年起參與百度智能開發工具Comate的IDE端架構、模型提升等方面工作,對續寫、生成、問答等軟件開發環節的大模型應用有豐富經驗目 錄CONTENTS1.背景與效果2.構造優秀的智能研發助手3.智能化的進一步發展與應用4.思考、總結及展望背景與效果PART 01AI 就像 100 年前的電命,正在改變各各業 吳恩達以往的研發提效工作環境跨OS開發困難辦公電腦配置低,開發體驗差開發環境復雜,配置成本高環境不一致,異常難復現工作涉及多平臺,切換打斷嚴重上下游溝通頻
2、繁溝通反饋周期長,不易記憶協作相似代碼編寫效率低重構潛在風險高可復用片段不易發現編碼過程缺少流暢感編碼環境在線化IDE功能集成?大模型橫穿出世,各生態迅速發展節點事件2020年6月GPT3發布2021年7月GitHub Copilot發布2022年9月Whisper發布,LLM正式引入語音轉文本2022年11月ChatGPT發布2023年3月GPT 3.5 Turbo發布,成本降低90%2023年3月GPT4發布,極大提升置信度能力2023年3月Auto-GPT發布,提示詞工程的一次偉大演示2023年4月GitHub Copilot產品矩陣豐富,包括Docs、PR、CLI基于大模型的研發助手幫
3、你想幫你寫幫你改調用、設計編碼、實現檢測、優化需求澄清任務分解代碼解釋技術問答實時續寫,注釋生成代碼描述生成代碼,生成注釋接口生成代碼生成單元測試代碼Debug,缺陷自動修復生成測試用例,代碼優化智能評審,CI錯誤診斷安全檢查與修復,智能CLI落地效果 內部80%用戶滲透46%采納率27%代碼占比落地效果 外部1W+注冊企業數49%采納率10+私有化部署合作構造優秀的智能研發助手PART 02多環節打造優秀效果模型模型訓練推理框架產品研發覆蓋效果強化反饋用戶至上數據閉環構建強力的代碼模型 模型效果依賴于訓練數據質量 編碼與傳統文本生成形態存在差異 研發工作對生成質量以外因素有要求問題1 代碼
4、高質量代碼確認原始數據 GitHub、私域數據數據源清洗 Star數、維護度、活躍度內容清洗 片段長度、復雜度、外部依賴分布平衡 語言分布、知識覆蓋多源數據抓取自動清洗邏輯專家評估優化問題2 編碼 尾部生成尾部續寫邏輯中間插(FIM)問題3 質量好 愿意等編碼過程是一個連續、專注的過程,打斷、等待對持續編碼的工程師是負面反饋代碼補全(續寫)的性能訴求相比普通文本生成更高在保證質量的前提下,需要關注響應速度 端到端響應 81.5百度小程度開發 70-90某內部函數計算框架 40-80某內部GO服務端框架 0-62.5獨有多層加固,確保代碼數據安全 敏感數據脫敏上傳 中間人劫持防護 推理內容風險檢
5、測 訓練數據安全過濾模型推理現場網絡基于反饋、用戶優先的產品飛輪安裝推薦采納留存LLM基到漏斗模型的數據分析數據反饋至模型訓練與產品設計智能化的進一步發展與應用PART 01繼續深入智能化研發更智能 規模代碼成 跨研發階段影響更易用 連接三方能力 適配團隊基建AutoWork 從需求到代碼開發者僅需要把需求文檔寫好,剩下的由 AutoWork 自主思考、拆解需求并執行任務,完成代碼的生成基于文心大模型思維鏈能力,像智能體一樣思考和執行任務,聽懂人的需求,順序執行多個步驟利用RAG代碼智能檢索技術,將知識庫信息補充到大語言模型中,大語言模型在用戶提問時,檢索這些知識庫信息來增強其生成的回答專門為
6、編程領域設計研發了 RAG 智能代碼檢索技術,能夠讓用戶從代碼庫中檢索可能回答問題的最相關內容,從而解決 LLM的幻覺等問題AutoWork案例全庫分析結構關聯私域知識生成代碼助理模式陪伴編程AutoWork 效果4W索引代碼庫1.2W周代碼采納40%+采納率開放平臺 讓產品適應組織個人通過開放性,可以更好的讓 Comate 來適應不同組織和個人,取得更好的智能化效果通過 Comate 插件這一使用形態,讓平臺能力直接觸達開發人員第一工作現場無需重復建設即可快速大模型能力,無限擴充平臺場景讓 Comate 更適配團隊的業務知識,適配團隊規范、固化團隊流程連接三方能力-Git通過分析代碼更新生成
7、提交信息學習歷史提交信息規則,生成符合規范的信息匹配三方Git平臺現有Issue,讓代碼與需求關聯按需生成Issue標題與內容調用三方平臺API快速創建,無需開發者切換平臺開放平臺 讓團隊知識直達一線開放平臺 每一個人的專屬助手開放平臺 效果6.5W注冊知識10+擴展插件6W+周代碼生成總結、思考與展望PART 01構造優秀的研發助手 優秀的模型、推理框架與產品的協同讓我們得以交付優秀的智能研發工具 基于大規模的落地使用,用戶優先、反饋驅動使產品和模型不斷改進,形成良性閉環 通過RAG強化、大模型思維鏈、平臺開放等形式,智能研發將更貼近組織與團隊,勝任更大規模的需求實現人與機器的協同關系將迎來變革THANKS