浙江大學:2025大模型:從單詞接龍到行業落地報告(56頁).pdf

編號:626768 PDF  PPTX 56頁 8.91MB 下載積分:VIP專享
下載報告請您先登錄!

浙江大學:2025大模型:從單詞接龍到行業落地報告(56頁).pdf

1、1大模型:從單詞接龍到行業落地楊洋,浙江大學?教學用途聲明:本PPT包含部分來源于網絡的素材,僅供教學使用,非商業用途,版權歸原作者所有2人工智能前夜:圖靈測試o 圖靈測試會在測試人在與被測試者(一個人和一臺機器)隔開的情況下,通過一些裝置(如鍵盤)向被測試者隨意提問。o 問過一些問題后,如果超過 30%的答復不能使測試人認出哪個是人、哪個是機器的回答,那么這臺機器就通過了測試,并被認為具有人類智能。3人工智能前夜:圖靈測試o 在提出圖靈測試的計算機器與智能一文里,圖靈描述了想象中未來的智能計算機測試可能的樣子(人提出問題,計算機回答):Q:請給我寫一首有關福思橋(Forth Bridge)主

2、題的十四行詩。A:這種事情別找我。我從來都不會寫詩。Q:34957+70764 等于多少?A:(停頓了約 30 秒后再給出答案)105621。Q:在國際象棋中,我在K1處有一個王,除此之外沒有棋子了。你在K6處有一個王且在R1處有一個車?,F在你會怎么走?A:(15 秒停頓后)將車移動到R8,然后將死。文學文學數學數學邏輯邏輯4大模型與圖靈測試文學數學邏輯5大語言模型:單詞接龍楊老師周一晚講 0.6旅 0.3吃 0.16大語言模型:單詞接龍楊老師周一晚講課 0.4大 0.4話 0.27大語言模型:單詞接龍楊老師周一晚講大話 0.1人 0.1模 0.88大語言模型:單詞接龍楊老師周一晚講大模型 0

3、.7態 0.2塊 0.19大語言模型:單詞接龍楊老師周一晚講大模型,0.4EOS 0.5呀 0.110單詞接龍:通過條件概率計算實現P(token_i|context )下一個單詞下一個單詞上下文(用戶提問上下文(用戶提問+已生成的句子)已生成的句子)o 給定上下文(Context),計算下一個生成詞(Token)的概率o 根據所計算的條件概率進行采樣獲得生成詞,拼接至上下文末尾,并預測下一個生成詞,直至生成一個結束符(End-of-Sequence,EOS)o 利用Transformer計算條件概率Ashish Vaswani,Noam Shazeer,Niki Parmar,Jakob U

4、szkoreit,Llion Jones,Aidan N.Gomez,ukasz Kaiser,and Lllia Polosukhin.“Attention is All You Need.”In NeurIPS,2017.11將各類下游任務轉化為單詞接龍輸入:景點(如斷橋殘雪)輸出:該景點所在城市斷橋殘雪在哪?模型杭州傳統機器學習模型拆分成一連串的單詞接龍斷橋殘雪在哪?LLM杭斷橋殘雪在哪?杭LLM州斷橋殘雪在哪?杭州LLMEOS12為什么單詞接龍?針對特定任務的端到端學習斷橋殘雪在哪?模型北京杭州模型,訓練數據:需要標注,成本高標注輸入數據13預訓練-微調:機器學習新范式預訓練杭州是中國

5、浙江省的省會城市,是一座歷史悠久且富有文化的城市,被譽為“人間天堂”。它位于中國東南沿海的長江三角洲經濟區,擁有豐富的自然景觀和人文遺產。杭州以西湖著稱,西湖是中國著名的風景名勝,也被列入了世界文化遺產。除了西湖,杭州還有其他許多著名的景點,如京杭大運河、錢塘江、靈隱寺、斷橋等。采樣很多句子做單詞接龍杭州是中國它位于中國杭州以LLM列入了世界浙江省東南沿海西湖著稱文化遺產杭州是中國浙江省LLM江蘇省浙江省14如何培育小火龍,成為寶可夢世界冠軍?15如何培育小火龍,成為寶可夢世界冠軍?端到端學習(應試教育)1、只會打架2、打不過沒見過的寶可夢16如何培育小火龍,成為寶可夢世界冠軍?預訓練(素質教

6、育)1、多功能火恐龍2、靈活運用技能17預訓練數據:網頁、書籍、新聞、對話等多種類型的無標注數據杭州是中國浙江省的省會城市,是一座歷史悠久且富有文化的城市,被譽為“人間天堂”。它位于中國東南沿海的長江三角洲經濟區,擁有豐富的自然景觀和人文遺產。杭州以西湖著稱,西湖是中國著名的風景名勝,也被列入了世界文化遺產。除了西湖,杭州還有其他許多著名的景點,如京杭大運河、錢塘江、靈隱寺、斷橋等。10月下旬,這則消息引發廣泛關注?,斏倌腹舅固┨m蒂斯集團15億歐元入股浙江零跑科技股份有限公司,10月下旬,這則消息引發廣泛關注。擁有自研智能動力、智能網聯、智能駕駛三大核心技術,工廠預計年產可達70萬輛在零

7、跑科技創始人朱江明看來,這次強強聯合,將是企業歐洲布局的重要一步。預訓練的優勢:從訓練的角度傳統NLP任務鮮有超過1GB的標注數據用于模型訓練GPT3使用45TB數據進行預訓練大模型從海量無標注數據中學習了物理世界的知識以及人類遣詞造句的模式18預訓練的優勢:從應用的角度功能單一斷橋殘雪傳統機器學習模型杭州多種功能斷橋殘雪LLM杭州在哪座城市?什么季節好看?冬季(窄)(通用)19大模型的訓練預訓練微調監督微調(SFT):通過經標注的輸入-輸出對數據調整模型部分參數,優化特定任務性能指令微調(Instruction Tuning):通過指令-輸出對使模型泛化到未見過的指令20%-30%答案Pr(

8、答案|問題,思考)問題-思考-答案“慢思考”模型答案生成方式:思維鏈背后的啟示請背誦靜夜思。請你直接說出9999*999的答案??焖伎伎焖伎悸伎悸伎伎焖伎迹ㄖ庇X):依賴直覺的、(天生或長期訓練后)無意識的思考,如常識問答、情感分類、意圖識別。慢思考(理性):主動控制的、有意識進行的思考,如復雜數學計算、邏輯推理。31推理時擴展(Test-time Scaling)o 擴展大規模自監督預訓練階段的計算量 擴展推理時的計算資源以獲得更好的結果Niklas Muennighoff,Zitong Yang,Weijia Shi,Xiang Lisa Li,Fei-Fei Li,Hannaneh H

9、ajishirzi,Luke Zettlemoyer,Percy Liang,Emmanuel Cands,and Tatsunori Hashimoto.s1:Simple Test-Time Scaling.arXiv:2501.19393v3,2025.S1-32B(SFT+budget forcing):通過接龍”wait”引導模型進行自我反思模型準確率隨著推理時token數的增加而提升32如何訓練大模型自主生成思維鏈思維鏈答案我是數學家嗎?標注!33監督學習 Vs.強化學習小火龍,躲開后用噴射火焰!噴射火焰我會,躲開是啥?監督學習:通過標注數據學習輸入到輸出的映射,本質上是在模仿人類

10、標注者的決策行為挑戰:o 長思維鏈過程標注難度大、成本高;o 能夠正確解題的思維鏈并不唯一,人工標注的COT甚至不一定是最優解34監督學習 Vs.強化學習強化學習:通過與環境的交互學習最優策略,是一種基于獎勵/懲罰信號的反饋學習35(,)強化學習智能體(Agent)環境(Environment)狀態(State)動作(Action)獎勵(Reward)(,)Reward=1(贏)or-1(輸)or 0(未分勝負)策略函數(Policy function)目標:學習能夠最大化獎勵的策略函數36強化學習下圍棋解數學題動作(Action)合法落子 位置生成的下一個Token狀態(State)19*1

11、9的矩陣,表示當前棋盤中黑白子的分布當前生成的上下文獎勵(Reward)輸/贏/平局解題正確/錯誤大部分動作的獎勵為0,太稀疏!37如何學習策略策略網絡(Policy)價值網絡(Value)獎勵根據策略網絡所計算的概率做出下一步動作評估將策略網絡得到的獎勵結果反饋給價值網絡通過價值網絡優化策略網絡根據特定狀態和動作評估未來能獲得的累積獎勵期望值下這里!神之一手!講得不錯,下次別講了38DeepSeek R1o 基于規則的獎勵模型o 準確性獎勵(Accuracy rewards):用于評估回答是否正確。例如,在數學題中驗證模型解答的正確性;在LeetCode編程題中,使用編譯器執行生成的代碼,并

12、基于測試用例生成反饋。o 格式獎勵(Format rewards):強制模型將推理過程置于 和 標簽之間,以確保輸出結構符合要求。用于訓練R1的模板DeepSeek-AI.DeepSeek-R1:Incentivizing Reasoning Capability in LLMs via Reinforcement Learning.2025.39評審叮當:大模型賦能智慧評審n基于LLM的智慧評審項目評審智能查重合規審查知識問答知識倉庫n評審叮當平臺基于大語言模型技術,提供多專業、多類別項目與多環節的智能評審助力,有效提升項目質量管理,緩解專家壓力。n提供:領域規范知識倉庫問答、專業項目合規性

13、預審、申報材料智慧評審、項目智能查重等多項技術支持。平臺功能平臺界面與功能示例平臺功能平臺界面與功能示例40時間序列數據 能源消耗 交通流量 經濟變化 天氣變化 疾病傳播過去未來預測分類41癲癇波顱內腦電數據(SEEG)應用場景:癲癇預測42突出AI識別的癲癇波應用場景:癲癇預測列出可疑波形43A1A3A2A1A2A3A1A3A2歷史預測癲癇癲癇正常問題構建44傳統的端到端學習數據標注時間序列分類模型輔助診斷成本高昂巨大差距45個體層面的泛化兩位患者的比較 Vs.Vs.Vs.46任務層面的泛化情緒識別神經系統疾病認知科學 目標:解碼腦信號多種應用47領域層面的泛化EEGSEEG頭皮表層粗泛記錄

14、240Hz豐富的立體顱內記錄1024Hz1 S.Mamli and H.Kalbkhani,“Gray-level co-occurrence matrix of Fourier synchro-squeezed transform for epileptic seizure detection,”Biocybernetics and Biomedical Engineering,vol.39,no.1,pp.8799.2 P.Bizopoulos,G.I.Lambrou,and D.Koutsouris,“Signal2Image Modules in Deep Neural Network

15、s for EEG Classification,”2019 41st Annual International Conference of the IEEE Engineering in Medicine and Biology Society(EMBC),pp.702705.3 I.Daubechies,J.Lu,and H.-T.Wu,“Synchrosqueezed wavelet transforms:An empirical mode decomposition-like tool,”Applied and Computational Harmonic Analysis,vol.3

16、0,no.2,pp.243261.4 S.Madhavan,R.K.Tripathy,and R.B.Pachori,“Time-Frequency Domain Deep Convolutional Neural Network for the Classification of Focal and Non-Focal EEG Signals,”IEEE Sensors Journal,vol.20,no.6,pp.30783086.5 Q.Lian,Y.Qi,G.Pan,and Y.Wang,“Learning graph in graph convolutional neural net

17、works for robust seizure prediction,”J Neural Eng,vol.17,no.3,p.035004.6 D.Kostas,S.Aroca-Ouellette,and F.Rudzicz,“BENDR:Using Transformers and a Contrastive Self-Supervised Learning Task to Learn From Massive Amounts of EEG Data,”Frontiers in Human Neuroscience,vol.15.7 H.Banville,O.Chehab,A.Hyvrin

18、en,D.-A.Engemann,and A.Gramfort,“Uncovering the structure of clinical EEG signals with self-supervised learning,”J.Neural Eng.,vol.18,no.4,p.046020.1 Z.Zhang and K.K.Parhi,“Low-Complexity Seizure Prediction From iEEG/sEEG Using Spectral Power and Ratios of Spectral Power,”IEEE Transactions on Biomed

19、ical Circuits and Systems,vol.10,no.3,pp.693706.2 Y.Wang et al.,“SEEG-Net:An explainable and deep learning-based cross-subject pathological activity detection method for drug-resistant epilepsy,”Computers in Biology and Medicine,p.105703.廣泛的現有工作有待深入研究更豐富的信息更龐大的記錄48Muller,L.,Chavane,F.,Reynolds,J.et

20、al.Cortical travelling waves:mechanisms and computational principles.Nat Rev Neurosci 19,255268(2018).腦信號的擴散:腦信號被認為在不同腦區之間傳播。腦波活動的傳播路徑是統一建模腦信號的關鍵因素。腦信號的擴散49 Brant 1.0 在一個1.01TB的顱內數據集上進行了預訓練 能夠捕捉長期時間依賴性和空間相關性 在個體水平和任務水平上都具有泛化能力Brant:面相顱內腦信號的基礎模型Daoze Zhang*,Zhizhang Yuan*,Yang Yang,Junru Chen,and Yaf

21、eng Li.Brant:Foundation Model for Intracranial Neural Signal.In NeurIPS,2023.50模型規模 與現有腦信號模型的比較Daoze Zhang*,Zhizhang Yuan*,Yang Yang,Junru Chen,and Yafeng Li.Brant:Foundation Model for Intracranial Neural Signal.In NeurIPS,2023.51實驗結果Daoze Zhang*,Zhizhang Yuan*,Yang Yang,Junru Chen,and Yafeng Li.Bra

22、nt:Foundation Model for Intracranial Neural Signal.In NeurIPS,2023.下游任務:預測、插補、癲癇檢測 基線:對腦信號/一般時間序列進行預訓練對腦信號進行預訓練Brant對時間序列進行預訓練52電力系統中的挑戰電力負荷電力消耗竊電檢測線損預測電力數據預測家庭結構檢測數據下游任務53不同行業之間的差異紡織業農業建筑業房地產2022.05.012023.05.312022.11.202022.05.012023.05.312022.11.202022.05.012023.05.312022.11.202022.05.012023.05.

23、312022.11.20(a)(b)(c)(d)不同行業用戶的用電行為有顯著差異54Shihao Tu,Yupeng Zhang,Jing Zhang,Zhendong Fu,Yin Zhang,and Yang Yang.PowerPM:Foundation Model for Power Systems.In NeurIPS,2024.PowerPM:電力系統基礎模型建模層次依賴 建模時間依賴 構建層次圖自監督預訓練任務通過捕捉行業之間的上下游關系,基于海量電力數據(電量、負荷、線損),訓練電力領域的時序基礎模型PowerPM,模型參數量為10億。55實驗結果 實驗驗證了統一模型在44個不同任務上的有效性,這些任務可以分為16個主要類別。-面相(獨占用戶/不同地區/城市的公共用戶)的電力負荷、電力消耗和太陽能發電進行預測/填補-竊電檢測-獨居老人檢測-高功率電器檢測-用戶性別分類-用戶年齡分類-家庭結構分類56Thanks&Take-Home Message 剖析大語言模型 預訓練:大模型在海量無標注數據中暢玩單詞接龍 強化學習:激活大模型主動生成有效思維鏈的能力 行業落地:基于LLM的智慧評審 利用預訓練-微調范式打造時序大模型 實現個體、任務和領域可泛化 腦電大模型、電力大模型Email:Homepage:http:/yangy.org個人主頁

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(浙江大學:2025大模型:從單詞接龍到行業落地報告(56頁).pdf)為本站 (三生有幸) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站