《8-謝飛-AI技術演進與商業化落地---謝飛_副本.pdf》由會員分享,可在線閱讀,更多相關《8-謝飛-AI技術演進與商業化落地---謝飛_副本.pdf(26頁珍藏版)》請在三個皮匠報告上搜索。
1、目錄01020304此處標題:微軟雅黑字體此處標題:微軟雅黑字體此處標題:微軟雅黑字體此處標題:微軟雅黑字體深度學習實戰進階講師信息副標題信息:字號24AI技術演進與商業化落地:從學術探索到創業實踐的全景觀察謝飛謝飛目錄01020304此處標題:微軟雅黑字體此處標題:微軟雅黑字體此處標題:微軟雅黑字體此處標題:微軟雅黑字體目錄01AI在鐵譜圖像識別方面的學術研究AI在智能條款庫和火災識別方面的產品落地總結與展望020304AI技術變遷的商業驅動背景AI技術的推廣需要強大的商業驅動反修昔底德陷阱和AIGC的成功圖像、文字生成娛樂、工作自然語言處理智能翻譯、智能同傳、聊天機器人等推薦系統購物、娛樂
2、的推薦強化學習阿爾法狗、智能駕駛、智能工廠、智能控制等計算機視覺人臉識別、智能視覺、表面缺陷檢測、智能風控、OCR等0102CV強化學習推薦系統NLP生成類030405AI技術的普適性使她在推廣過程中必然帶來巨大的爭議和難度,但也正是她的普適性帶來了其偉大性。2C必須事關“衣食住行吃喝玩樂”,其盈利性通常不在技術本身,但是其影響人類認知,直接促進2B的技術變現強調簡單化與易知性,不要把業務場景預設為人人皆是prompt工程師2B必然涉及“降本增效帶業務”,其盈利性往往就在技術本身,是AI企業賴以生存的基礎強調復雜化與技術壁壘思維慣性和傳統觀念束縛既得利益者的阻礙技術壁壘和資源限制市場不確定性和
3、風險文化和社會環境的制約缺乏敏銳的商業嗅覺和把握入局節奏的能力數學問題可控性模型結構AI核心范式跨學科融合計算優化黑箱權重通信梯度可控“”AI學術本質上是數學和跨學科融合問題大塊剝落顆粒圖像重疊剝落顆粒與細小顆粒存在重疊的問題切削顆粒同類圖像差異較大同為切削顆粒,人眼需要從形態、質地來綜合判斷認定粒子層流疲勞與大塊剝落顆粒較為相似從形態上與大塊剝落顆粒相似,但質地上會顯示出差別有色金屬顆粒依賴于對顏色的判斷圖像增強中調整顏色和對比度將導致預測出錯AI的學術研究和商業落地存在很大的差別。LLM+prompt和pretrain+FineTuning說明技術復用的重要性2B方面,好的“釘子”遠比“錘
4、子”重要問題轉化相對正確選取范式、模型和解決方案(經驗)問題聚焦聚焦關鍵問題,避免陷入“AI無所不能、AI完全無能”的泥潭快速落地快速落地是向上管理、獲取資源和取數的關鍵項目評估評估項目落地的四大要素注意依托部署環境選模型部署環境決定了模型選取的上限提issue和問詢paddle相關套件的更新會帶來不兼容的問題補充圖片數據補充數據通常是一個提升精度的有效方法換個模型試一試沒有特別扎實的基礎,不建議調模型本身,建議換模型或者多模型融合一下。當然基本功永遠不會白練如果希望快速的、有效的、魯棒的。的處理問題,在同等條件下,基本功和經驗依然是十分重要的。2B端的LLM落地的情況基于保密焦慮的效率提升需
5、求離線狀態下,本地化部署的AI模型所帶來的效率提升和預期成本下降。非通用行業性模型的自主研發特有的數據、特有的模型結構、特有的訓練優化方法。在使用EB-SDK的時候,可以采用function-calling或者langchain或者直接先運行自定義函數的方法,實現對LLM的chain運行,注意盡可能實現格式化的輸出。調用PaddleHub的OCR功能對OCR結果進行結構化輸出 01 數據對數據進行清洗,并構建訓練集、驗證集和測試集02模型選擇經典模型、預訓練模型0304框架對模型進行搭建,對超參進行設置算力根據圖像的大小,模型的復雜程度選擇相應的算力AAA機器學習四要素訓練集選擇60%的被標注
6、圖片構建訓練集驗證集選擇20%的被標注圖片做驗證,檢測模型訓練的效果(注意:這里是不做反向傳導的)測試集選擇20%的未標注圖片做最終測試,檢測模型的預測效果(1)準備數據集其底層邏輯是遷移學習,即要將相類的源域遷移到目標域中,共用網絡結構或者權重參數的方法。模型選擇與訓練(2)模型選擇與訓練將模型、優化器等結合成一個主體(3)框架搭建GPU服務器的采購(4)算力供給RecallFPS(5)模型準確率及預測速度(6)直觀效果Transformer模型神經網絡模型GLM010203042C和2B都很重要2C決定寬度,2B決定深度,也是企業生存的本源AI的學術研究很多元,但并不代表商業的成功AI學術還有很大的研究空間LLM不是AI的全部CVNLP多模態TransformerViT仍有很多垂直領域AI的商業落地經驗分享好的產品規劃十分重要謝謝觀看謝謝觀看THANKSTHANKS二維碼