《智譜AI_GLM大模型:場景落地的探索與實踐.pdf》由會員分享,可在線閱讀,更多相關《智譜AI_GLM大模型:場景落地的探索與實踐.pdf(17頁珍藏版)》請在三個皮匠報告上搜索。
1、GLM大模型:場景落地的探索與實踐智譜AI 解決方案架構師 孫萬禮關于 智譜AI愿 景讓機器像人一樣思考市場理念Model as a Service經營情況研發人員占比70%全自研模型架構-GLM(自回歸填空訓練架構)x0 x1x2x3x4x5x6x7x8Transformerx3x4x7x8預測標:Cat輸本:VQVAE離散化圖像 Tokenizer平鋪輸圖像:Text TokenBOIImage Token Image TokenImage Token z|本 Tokenizer20*20=400 Image tokens采樣掩碼區域 MMLU、LAMBADA 等國際測評超過GPT-3,O
2、PT,PaLMCOCO、VQA等14項國際多模態測評10項第一、4項第二10B的參數量的WebGLM性能逼近175BWeb GPT獲得十倍的效率優勢WebGPT(13B)WebGPT(175B)Preplexity.aiWebGLM(10B)02030405010本項目方法60Human-Level自回歸填空預訓練架構多模態預訓練框架智譜 AI全自研模型架構-GLM智譜 AI 已建立全自主、多模態、高可用的千億級大模型完整技術體系全面對標 Open AI 產品線GLMGPTVSChatGPT對話DALL.E文生圖Codex代碼WebGPT搜索增強GPT-4V圖片理解GPT-4 ALL Tool
3、s GPTsSoraChatGLM 對話CogView 文生圖CodeGeeX 代碼WebGLM 搜索增強CogVLM 圖片理解GLM-4All Tools GLMsCogVideoX智譜AI大模型產品矩陣語言大模型ChatGLM系列模型,支持相對復雜的自然語言指令,并且能夠解決困難的推理類問題。CodeGeeX系列多編程語言代碼生成大模型。CodeGeeX-4-proCodeGeeX-4-std代碼大模型多模態大模型多模態系列模型都經過大規模預訓練,能理解圖片屬性、場景和畫面風格,可生成真實、獨特的高質量圖片和視頻。CogVLM-VideoCogViewGLM-1.5B端側模型GLM-3B端
4、側模型GLM-4-9B開源GLM-4-flashGLM-4-airGLM-4-airxGLM-4-0520Character GLM超擬人對話模型CogVLM圖生文CogVideoX文生視頻文生圖視頻生文最經濟最具性價比高性能最新旗艦CogView效果展示CogVLM效果展示CogVideoX效果展示文生視頻圖生視頻GLM大模型多場景賦能能源制造工業知識問答工業質檢報告生成智能工單處理智能產線故障檢測流程合規助手智能交互終端市場分析報告生成智能汽車智能駕駛座艙客戶標簽提取銷售金牌話術分析銷售話術陪練營銷話術質檢智能客服售后坐席輔助醫療健康AI 營養師智能導診、在線問診報告解讀、病歷錄入醫學信息
5、解鎖康復計劃生成醫囑質量監控AI 回訪金融證券金融數智營銷助手員工金融數智知識助手財務早報生成、研報咨詢總結信貸風控報告審核定期財務報告生成智能投研報告消費零售廣告文案生成消費者數據分析新品研發調研報告智能購物推薦助手消費者評論摘要智能客服銷售學習助手文化旅游旅行日程編排租車推薦助手景區客服、酒店客服隨身導游 APP景區智能導覽游記輔助寫作、照片生成游記旅行社宣傳文案撰寫游戲娛樂自動生成劇情、任務、角色自動生成場景圖片更真實自然的互動 NPC 構建對話類游戲如狼人殺 AI 對戰網友互動問答游戲社區運營宣傳文案生成通用辦公會議紀要生成周報生成、報告生成新聞資訊收集整理多語言智能翻譯企業內部知識問
6、答簡歷信息抽取智能人崗匹配通用大模型場景落地的技術路線LM+PromptLM+RAGLM+SFT/LoraLM+Function借助大模型通用能力+提示詞要求,即可達到很好效果的場景通過RAG,將大模型和私域知識庫結合,實現私域知識問答通用大模型不能滿足特定場景需求,需要微調訓練才能滿足要求通過大模型function call,實現與現有系統API打通大模型+prompt案例大模型+RAG案例技術人員本地私有化部署ChatGLM企業內容知識問答系統通用搜索引擎無法滿足在顯示面板制造等專業領域知識收集查找相關需求。挑戰需要一套領域專家知識庫和智能問答系統,實現企業知識資產沉淀和價值變現?!袄蠋?/p>
7、”的人才培養模式培養周期長、成本高?;A知識定義、原理、特點、性能等理解分析區別、優缺點等零樣本與訓練集中知識無關的問題設計預測指導完整設計方案、解決方案Q:LCD顯示技術原理是什么?行業知識庫、領域相關論文、生產工藝說明垂直領域內主觀題得分答題質量接近從業 5 年以上的行業專家水平GLM(75分)某頭部模型(69分)Vs垂直領域內客觀題得分Q:LCD 和 OLED 哪種技術更節能?Q:請問如何提高AS LCD TFT 的強光穩定性?Q:全息顯示的原理是什么?樣例問句問題大模型+SFT案例部署模型:ChatGLM-130B部署方案:本地化部署+微調服務微調數據:5000條數據,如:品牌、產品、
8、廣告文案所有廣告編寫都需要由專業廣告編輯編寫,人力成本高,效率低輸入品牌、產品等信息,自動生成產品廣告文案銷售在收集、整理廣告主體的產品信息工作量大,信息不全面自動整理產品基本信息,提高工作效率廣告文案生成產品信息收集一次性輸出符合品牌調性的文案10+篇50解放文案工作15降低成本%大模型+Function案例菜品推薦:大模型根據5輪對話,抽取關鍵詞并調用搜推引擎,最終由搜推引擎給出菜品推薦文案閑聊:當用戶意圖不是菜品推薦時,可與用戶進行聊天解決方案Q:家常炒菜晚餐 A:好的,我為您推薦幾個家常炒菜晚餐的店鋪和菜品。1.首先是楊銘宇黃燜雞米飯(公益西橋店),他們的黃燜雞米飯和木須肉既下飯又美味
9、。2.其次是麻辣燙火鍋超市(芍藥居店),他們的熱炒茄子和四季豆炒肉也很受歡迎。3.最后推薦您一家高評分的家常菜館大餅炒菜(望京店),他們的京醬肉絲炒餅和家常豆腐都是人氣商品。Q:第二家的評價如何?A:麻辣燙火鍋超市4.5 分輸入業務場景大模型功能用戶 query系統1歷史對話拼接Agent閑聊function 1function 2系統2客戶菜品搜索系統l Function call:調用客戶菜品搜推引擎,輸入菜品推薦關鍵詞l 閑聊:用戶的意圖不是尋求菜品推薦時,可以基于大模型能力與用戶聊天2000+家生態合作伙伴 1000+家規?;瘧?200+家深度共創客戶產業化落地國家機構合作戰略合作企業合作國際合作智譜 A I讓機器像人一樣思考 Teaching Machines to Think Like Humans