《王良-大模型金融支付類企業ToC應用探索與落地.pdf》由會員分享,可在線閱讀,更多相關《王良-大模型金融支付類企業ToC應用探索與落地.pdf(64頁珍藏版)》請在三個皮匠報告上搜索。
1、模型融付類企業ToC應探索與落地平安壹錢包 王良OPEN AI chatGPTWhats APPinstagramTikTok電話機TwitterChat GPT2個9個2.5年3.5年5.5年16年75 年100000000+2個戶破億80%到 2026 年,接成式 AI 或模型的企業前期調研確定未來AI模型未來的前景是明確的AI必然會重構世界確定現在要想不掉隊就必須現在進不確定落地選擇什么場景?解決什么需求?降本增效還是擴收益?什么技術?開源閉源?。找落地場景找落地場景的思路從最熟悉的領域讓AI學習最優秀員的能,再讓它輔助其他員,實現降本增效“本”進 “本”出不要求全,將任務拆解,先解決任
2、務,場景制定落地案理解模型原理,不懂原理就不會舉反三,不了太遠定要有實踐經驗,沒有 實 踐 就 只 能 紙 上 談兵,做事不落地認知要,認知不就法做出最優決策,天花板太低理解模型原理,不懂原理就不會舉反三,不了太遠定要有實踐經驗,沒有 實 踐 就 只 能 紙 上 談兵,做事不落地認知要,認知不就法做出最優決策,天花板太低選擇模型在線模型開源模型在線模型普遍性能更強,調時技術檻和硬件檻更低,配套模型態和服務更加完善,不需要維護模型件、項件、還有模型權重、等等在本地部署,因此可以更好的確保數據安全性API 調私有化部署需求國外模型國內模型開源模型國內 2C國內 2G國內 2B出海數據安全合規要求國
3、徽成式智能服務安全基本要求提供者在向相關主管部提出成式智能服務上線的備案申請前應按照本件中各項要求逐條進安全性評估,并將評估結果以及證明材料在備案時提交成式智能服務管理暫辦法已經 2023 年523 國家互聯信息辦公室 2023 年第 12 次室務會會議審議通過,并經國家發展和改委員會、教育部、科學技術部.業和信息化部、公安部、國家播電視總局同意,2023年8 15 起施成式智能服務管理暫辦法明確,提供者違反本辦法規定的,由有關主管部依照中華共和國絡安全法、中華共和國數據安全法、中華共和國個信息保護法、中華共和國科學技術進步法等法律政法規的規定予以處罰;法律、政法規沒有規定的,由有關主管部依據
4、職責予以警告、通報批評,責令限期改正;拒不改正或者情節嚴重的,責令暫停提供相關服務。構成違反治安管理為的,依法給予治安管理處罰;構成犯罪的,依法追究刑事責任報備經驗分享應具有充分的證明材料應說明不符合的原因,采其他技術或管理措施能達到同樣安全效果的,應詳細說明并提供措施有效性的證明應說明不適理由評估結論為符合的評估結論為不符合的評估結論為不適的落地場景介紹視頻展示知識庫(資料庫、官、業規范、操作冊)提取本本分割劃分段落區塊本區塊 chunk本嵌0.7-0.10.40.3-0.4-0.1-0.3問題本的嵌向量匹配K 段和問題相關知識庫原提示詞Prompt(包含原和問題)平安 GPT成答案反饋相似
5、匹配戶輸個問題本嵌向量庫什么是向量化serpentine sidekicks0.0040.0030.0020.014TextText as vectoranatine amigos0.0270.0010.0200.023TextText as vector將本轉化為固定度的稠密向量,實現本在向量空司的映射Embedding的本質是串數字代表本,從讓計算機認識本Embedding在戶意圖認別以及私有知識庫搭建發揮著關重要的作這是種將每個詞表示為唯的向量的法。向量的維度等于本中不同詞的數量,對于給定的詞,它在向量中的值為1,其余位置均為0。這種表示法簡單直觀,但法表示詞與詞之間的語義關系。獨熱編碼
6、(One-hot Encoding)狗貓狗10000000貓01000010Word2Vec和GloVe等,它們利深度學習法,通過訓練規模語料庫學習詞的向量表示。這些模型能夠捕捉詞的語義和語法信息,使得語義上相似的詞在向量空間中的位置相近詞嵌模型(Word Embedding)是將整個句轉換為個數值向量的過程,以便計算機和機器學習模型能夠理解和處理句級別的本信息句向量化檔向量化模型的局限RAG能提供什么模型訓練數據 cut-off真實信息為什么 RAG私有數據、保密數據、新數據更新可解釋性、幻覺問題私有信息及時與動態信息投產不可控改變模型權重不改變模型的權重Fine-tuning(微調)和 R
7、AG技術實不會有副作技術難度RAG 落地過程中需要關注的事項挑戰 01挑戰 02挑戰 03挑戰 04挑戰 05挑戰 06挑戰 07挑戰 08數據源加載與處理數據切分難檢索效果不好檢索結果過多或過可解釋性與魯棒性復雜 query 的處理動化的問題反饋、評估與迭代01:數據源加載與處理數據源多樣復雜數據結構解析問題1.txt2.chm3.csv4.markdown5.6.PDF7.excel8.Doc1.標題2.列表3.表格4.眉5.腳6.閱讀順序7.圖表1.掃描件2.動態3.數據同步02:數據切分難indexing TimeRetrival TimeGeneration Timeembeddin
8、g輸度限制影響 embedding效果法定位到關鍵區域context_size 有限chunk_size選擇?TextSplitter試驗Chunking解耦:IndexingTime和Generation Time常五種技術的實現式系統消息內輸外部本效但受限的損信息傳遞動切分與Embedding匹配動切分與Embedding匹配靈活效的短本傳遞策略靈活效的短本傳遞策略利LangChain等具固定化的本讀取模型微調與知識灌注檻的期知識注利OpenAI Assistant API進本讀取損的規模檔處理010203040503:檢索效果法檢索到有的信息語義相似度問題切分問題元數據檢索包含效信息郵件
9、、聊天記錄等使摘要相關性過濾04:檢索結果過多或過01.切分階段02.檢索階段03.后處理階段04.答案合成階段更的chunk_size按 sentence 切分提取原chunk摘要成元數據過濾成top_k關鍵字過濾相關性過濾業務邏輯過濾不相關句移除重排Compact/stufflterative Refine單獨回答+總結對 chunk做摘要定義合成策略05:可解釋性與魯棒性數據引在必要的時候引在準確的位置引舉query generationself-consistencyself-correcting06:復雜 query簡單 query去年東航空財報基本情況?李的主要經歷?復雜 quer
10、y對1923年東航空財報稅前利潤總額對今年 東航、南航的營收情況對李在當官之前、和之后的態變化07:動化AgentALL ToolsReActFunction callingData Agent反饋評估迭代收集反饋數據tracing.IR評估端到端評估整理數據嘗試 Fine-tuning08:反饋、評估與迭代RAG feedback收集多維度反饋回答質量e2e metrics檢索質量IR metrics引質量引不完全引了不想關的檔問題成質量diversity上實踐RAG是個復雜的系統,使low-levelAPI拆解成的步驟給LLM 寫 prompt,幫助我們解決各步驟中的問題讓 LLM 成數據
11、來幫助我們訓練或評估讓 LLM 來做規劃使熟悉的數據跑通 RAG 流程評估真實場景下的表現從數據源加載、索引構建、檢索、答案合成等分步驟進 case study標注平臺導數據選擇標注類型數據清洗智能預標注分配標注任務機器學習輸出數據審查智能質檢標注Function calling&Agent基礎類Al Agent項Function calling+OpenWeatherFunction calling+郵箱API智能查詢天信息應智能收發郵件應進階類Al Agent項Function calling+搜索API+爬Function calling+pymysql+MySQL智能搜索問答機器定制化SQL代碼解釋器Function calling+PythonFunction calling+Python+算法庫代碼解釋器機器學習&深度學習 Agent模型浪潮下的未來趨勢脫離“信息繭房”給出客觀全的建議將每個業最頂尖的能賦予給每個普通個體程序員之間的差距會縮,程序員和程序員的差距會拉每個業都值得模型重做遍“美”創業團隊的重機遇模型應架構師的職責是什么怎樣更省錢系統好維護怎么更準確Thanks平安壹錢包 王良