《2024國內外通用大模型在金融領域應用表現及金融垂類模型發展進程分析報告(19頁).pdf》由會員分享,可在線閱讀,更多相關《2024國內外通用大模型在金融領域應用表現及金融垂類模型發展進程分析報告(19頁).pdf(19頁珍藏版)》請在三個皮匠報告上搜索。
1、2 0 2 3 年深度行業分析研究報告目錄3.國內外金融垂類模型發展進程2.國內外通用大模型在金融領域應用表現1.通用+金融VS金融垂類哪方更強通用+金融VS金融垂類哪方更強1.1.通用+金融VS金融垂類:優劣勢對比數據來源:東吳證券研究所整理當前AI與金融的結合主要有兩條技術路徑:通用模型+金融語料訓練金融大模型,金融垂類大模型。由于設計和訓練目的不同,通用語言大模型與金融垂類模型在優劣上具有相對性。通用語言大模型在泛用性、靈活性、數據利用率、遷移性上相比金融垂類更有優勢,而在專業性、針對性、高精度和合規性上,金融垂類模型更勝一籌;在復雜度問題上,通用語言大模型在結構上更加復雜,影響模型效率
2、,而金融垂類模型則是在更新維護上具有復雜性。5圖表:通用與金融垂類大模型優劣對比泛用性強由于在多樣化的數據集上進行了訓練,通用模型能夠處理各種話題和領域的問題領域專業性在金融領域具有專業的理解能力,更精熟于金融術語和概念靈活性和利用率高大量數據訓練提高了模型的準確率,并可以應用于多種任務中針對性的解決方案更適合解決金融行業的具體問題,與行業需求和合規性要求相匹配可遷移性強在數據量較少的特定任務上,通用模型也可以通過微調進行有效的遷移學習,大大減少模型的訓練時間和計算資源高精度和合規性提供更精確、可信賴的金融信息和建議,同時符合行業規定特定領域深度較淺可能不具備特定領域(如金融)的深入理解和專業
3、知識適應性限制由于主要針對金融領域,因此在其他領域的適用性可能有限模型復雜通用大模型的結構非常復雜,使得模型的解釋性變得困難,導致模型的計算量增加,影響模型的效率更新和維護復雜度金融政策和法規的變化可能要求模型頻繁更新以保持準確性和合規性訓練時間長通用大模型的訓練需要大量的計算資源和時間,這對于一些小型企業來說是一個挑戰數據利用率低垂直領域模型的訓練數據相對較少,模型的準確率可能會受影響通用語言大模型金融垂類大模型優勢劣勢1.2.通用+金融VS金融垂類:通用金融訓練超越金融垂類可能較小數據來源:度小滿,東吳證券研究所“通用模型難以勝任金融領域任務,金融大模型是大模型落地金融行業的必由之路?!倍?/p>
4、小滿CEO 許東亮使用金融數據對通用大模型進行訓練,數據欠缺,成本過高。金融領域的語料應該充分覆蓋各種金融產品、市場情況和業務流程等。但金融領域的數據分散在各個金融機構,通用大模型缺少金融數據進行訓練,金融專業知識不足;另外一方面,如果從底層開始訓練大模型,所需要投入的算力成本非常高,比如千億級別的通用大模型,訓練一次需要付出幾千萬的成本在特定任務上,精確性與適用性欠缺,需要更多優化與定制。金融垂類大模型通常會投入大量的時間和資源來收集和整理金融領域的專業知識。這些專業知識包括金融術語、金融工具和金融法規等。通用語言模型雖然可以通過金融語料的訓練來提高在這方面的理解能力,但是否能達到金融垂類大
5、模型的專業性仍有待驗證。金融領域要求實時性和高效的推理速度。金融領域的決策和分析通常要求實時的響應和快速的推理速度。金融垂類大模型可能會針對這一需求進行了優化,以提供更快的響應時間。通用語言大模型在處理金融領域的實時應用時可能需要進一步的優化。金融領域對合規性和風險控制要求極高。金融領域對于數據保護、隱私和風險控制具有嚴格的要求,專門訓練的金融垂類大模型可能會更好地滿足這些合規性需求。6國內外通用大模型在金融領域應用表現2.1.國內外通用AI大模型發展歷程:國外領先,國內緊追數據來源:中文語言理解測評基準CLUE、東吳證券研究所國內外頭部模型差距依然明顯GPT4-Turbo總分89.79分遙遙
6、領先2023年6月國內AI大模型迎來爆發式增長,技術和應用不斷發展,但與國外頂尖AI大模型尚有差距。自2022年OpenAI發布ChatGPT以來,國內迅速形成大模型共識,開始追趕國外。目前各行各業開閉源大模型不斷出新,競爭形勢越發激烈。綜合表現上,頭部模型國外領先,平均水平國內外差距較小。在所有模型中,GPT4-Turbo遙遙領先,國內最好的大模型為百度文心一言,但仍有15.77分的差距。國內方面,雖仍有差距,但在過去一年內發展迅速,平均水平上與國外差距并不明顯。此外,國內開源大模型在中文上的表現要優于國外開源大模型。圖表:AI大模型2023年關鍵進展8圖表:國內外大模型綜合表現(2023年
7、11月28日)2.2.國外AI通用大模型案例,OpenAI&微軟引領業界數據來源:公司官方網站,東吳證券研究所OpenAI&微軟ChatGPTOpenAI攜手微軟ChatGPT4-Turbo業界領先微軟和OpenAI是目前大模型技術水平、產品化落地最為前沿的領軍者。2023年3月,OpenAI 發布工程化的多模態GPT-4,并與各個領域的軟件開展合作。2023年11月7日,OpenAI開發者大會重磅發布GPT-4Turbo,這項新模型帶來了六大升級,包括更長的上下文長度、更強的控制、模型的知識升級、多模態、模型微調定制以及更高的速率限制。谷歌谷歌框架領先模型豐富,應用偏弱谷歌于2023年2月宣
8、布將在谷歌云上部署ChatGPT的有力競品Claude,并于同月推出自研的基于1270億參數大模型LaMDA 的聊天機器人Bard。應用方面,谷歌在過去更注重發表論文,未能及時將成果產品化。同時,旗下DeepMind 研發的基礎語言模型Gopher、Chinchilla和對話模型Sparrow 也尚未產品化。AWSAWS領跑AIGC推出Titan大語言模型2023 年4 月,AWS 正式入局 AIGC,推出自有基礎模型 Titan 和 AIGC 服務 Bedrock,以及AI編程助手 AmazonCodeWhisperer。Titan系列模型分為用于內容生成的文本模型Titan text和可創
9、建矢量 嵌 入 的 嵌入 模 型Ti t a n Embeddings。此外,基于自研推理和訓練 AI 芯片的最新實例AmazonEC2Trn1n和 Amazon EC2 Inf2 正式可用。AnthropicAnthropic推出Claude最接近ChatGPT的商業競品2023年7月,Anthropic宣布Claude2正式開始上架。Claude是基于transformer架構的大語言模型,被認為是最接近ChatGPT的商業產品。相比V1.3,Claude2編碼能力提升巨大,具備更強大的邏輯能力,同時對訓練數據進行更新。此外,Claude2聊天工具完全免費。9xAIxAI推出GrokGro
10、kV1.5或于2024年3月發布2023年11月5日,馬斯克旗下xAI團隊發布其首個AI大模型產品Grok。Grok通過X平臺實時了解世界,還能回答被大多數其他AI系統拒絕的辛辣問題。馬斯克表示,Grok 使用來自公開數據的數十億個數據點進行訓練。2024年2月22日消息,馬斯克在社交媒體平臺“X”上表示,xAI的Grok V1.5于2周后發布。2.3.國內AI通用大模型案例,多家企業推出相關產品數據來源:中文語言理解測評基準CLUE,東吳證券研究所阿里發布通義千問2.0,專業維度能力較強通義千問,是阿里云推出的大語言模型,于2 0 2 3年4月1 1日在阿里云峰會上正式發布1.0。9月13日
11、,阿里云宣布通義千問大模型已首批通過備案。10月31日,阿里云正式發布千億級參數大模型通義千問2.0,8大行業模型同步上線。通義千問2.0專業維度上的能力較強,可應用于相對專業復雜場景,例如金融、醫療、汽車等垂直專業場景。百度具備先發優勢,文心大模型國內領先文心一言是百度全新一代知識增強大語言模型,于2023年3月16日正式發布,已進行多個版本迭代,10月17日發布V4.0版本。據百度官方介紹,文心一言目前已有7000萬用戶。文心一言4.0的能力棧較為廣泛,可應用的場景較多。其在查詢搜索知識應用、任務拆解規劃Agent、文案寫作以及代碼編寫及糾錯等方面的應用表現不俗。vivo發布BlueLM大
12、模型,應用的場景相對廣泛BlueLM是vivo自主訓練的大語言模型,出自于vivo AI全球研究院。vivo于11月1日開發者大會上正式發布自研AI大模型矩陣,包括十億、百億、千億三個不同參數量級的5個自研大模型。BlueLM主要可以應用在手機智能應用中,進行基礎手機指令操作、實時語音助手、查詢信息以及一些基于手機端的辦公應用。月之暗面發布Moonshot大模型,位于第一梯隊Moonshot是月之暗面自主訓練的大語言模型,于10月9日正式發布。該模型具備多語言能力,支持約20萬漢字上下文,通過創新的網絡結構和工程優化,實現了無損的長程注意力機制,有較強的文檔理解、歸納和處理能力。長程對話、長文
13、本閱讀、AI智能體等方面的應用表現強勁。另外,在數學運算、內容創作、虛擬數字人等場景也有不錯的表現。10userid:93117,docid:154719,date:2024-02-29,2.4.通用大模型在金融領域應用表現各有差異數據來源:文心一言,通義千問,東吳證券研究所11國外GPT系列在金融領域表現較好。GPT系列能較好理解金融術語,解答金融相關問題,且具備一定的實時性,在金融領域能夠自動生成金融報告、做市場研究、客服機器人等。國內百度文心、阿里通義千問、騰訊混元以及科大訊飛在金融領域表現較好。百度文心一言具備較高的實時性,且金融術語的理解較好,準確度高,能夠在金融新聞分類、問答系統和
14、智能寫作中發揮作用。阿里通義千問能夠較好的解釋金融概念、提供一般性的金融投資分析指導,但存在時效性限制。騰訊混元可以優化金融服務的個性化體驗、市場情緒的追蹤等??拼笥嶏w火星則將語音識別和處理技術用于交易系統、智能財經助手等。國內外金融垂類模型發展進程3.1.國內外金融垂類模型發展歷程:國外發展先行,國內成品問世金融大模型始于2023年3月BloombergGPT,通過應用金融大模型,金融效率將得到大幅提升。彭博推出了為金融領域量身定BloombergGPT模型,吸引了行業關注,大模型有了新的發展方向。金融行業沉淀了大量高質量數據。各金融平臺的用戶數以億計,各種用戶畫像數據、交易數據浩如煙海。利
15、用大模型對上述數據的分析處理,可大幅提高金融效率。比如,金融機構可以預測用戶行為偏好,更高效、準確評估客戶風險;AI還可以實時監測交易和市場波動,及時制定策略。當前國內外金融行業都在主動擁抱大模型。IDC(國際數據公司)一項調研顯示,超半數的金融機構計劃在2023年投資生成式人工智能技術,只有10%的金融機構表示沒有試驗計劃。國外自BloombergGPT后,也出現了如FinGPT等一系列金融大模型。而國產金融大模型也已分出了明顯的兩個“流派”。一派來自于傳統金融機構,另一派來自于金融系科技企業或互聯網企業。數據來源:發布機構官方微信公眾號,發布機構官方網站,東吳證券研究所13圖表:國內外金融
16、垂類AI模型發布時間&發布機構時間發布機構金融垂類模型2023年3月彭博BloombergGPTAI4Finance FoundationFinGPT奇富科技奇富GPT度小滿軒轅大模型恒生電子LightGPT螞蟻集團螞蟻金融大模型AntFinGLM騰訊云騰訊云金融行業大模型2023年10月恒生電子LightGPT(升級)+WarrenQ+光子2024年1月同花順HithinkGPT+AI iFinD2024年1月東方財富妙想大模型2023年6月2023年9月3.2.1.國外金融垂類模型案例:彭博BloombergGPT彭博BloombergGPT率先登場,金融任務表現遠超通用模型。2023年3
17、月底,彭博構建了迄今為止最大的特定領域數據集,并訓練了專門用于金融領域的LLM,開發了擁有500億參數的語言模型BloombergGPT。該模型依托彭博社的大量金融數據源,構建了擁有3630億個標簽的數據集,支持金融行業內的各類任務,彭博近40年來在金融領域積累的數據占比為51.3%,剩余的48.7%則來自于公開數據。訓練結果表明,BloombergGPT的混合訓練方法使其模型在金融任務上的表現大大超過了現有的大語言模型,而在通用場景上的表現則與之相當,甚至優于現有模型。數據來源:論文BloombergGPT:A Large Language Model for Finance,東吳證券研究所
18、圖表:BloombergGPT執行金融任務表現顯著優于通用大模型,通用NLP基準上表現相當或更好14彭博BloombergGPT相比于通用大模型有諸多優勢。BloombergGPT模型對金融領域理解更為深刻,并借助其針對性強、來源可靠的金融數據,提供了深度專業的分析能力,同時通過協助優化金融NLP任務,助力提升彭博終端數據的應用價值,開辟金融行業分析和決策的新可能性。3.2.2.國外金融垂類模型案例:FinGPTFinGPT是由AI4Finance Foundation開發的一種專門為金融領域設計的語言模型。它的目標是為金融大型語言模型(FinLLMs)提供互聯網規模的數據,以此推動金融領域的
19、開源發展。FinGPT采用以數據為中心的方法,強調了數據采集、清理和預處理在開發開源FinLLM中的關鍵作用。通過支持數據可訪問性,FinGPT渴望加強金融領域的研究、合作和創新,為開放金融實踐鋪平道路。FinGPT由四個基本組件組成:數據源、數據工程、LLMs和應用程序。數據來源:FinGPT,東吳證券研究所【應用層】:FinGPT的最后一個組成部分是應用層,旨在展示FinGPT的實際適用性。它為金融任務提供實踐教程和演示應用程序,包括機器人咨詢服務、量化交易和低代碼開發?!緮祿磳印浚篎inGPT管道的起點是數據源層,它協調從各種在線資源中獲取大量財務數據?!緮祿幚韺印浚涸搶訉W⒂贜LP
20、數據的實時處理,以應對金融數據固有的高時間敏感性和低信噪比的挑戰?!綥LMs層】:處于核心位置,它包含各種微調方法,優先考慮輕量級適應,以保持模型的更新和相關性。15圖表:FinGPT功能模塊3.3.1.國內金融垂類模型案例:騰訊云金融行業大模型數據來源:騰訊云金融行業大模型,東吳證券研究所騰訊云混元大模型,為客戶提供一站式MaaS服務2023年9月7日,騰訊混元大模型正式亮相,10月26日正式對外開放“文生圖”功能,同時模型的中文能力整體超過GPT3.5,代碼能力大幅提升20%,達到業界領先水平。算力層面,推出高性能的計算集群HCC,作為大模型的算力底座。平臺層面,提供一站式機器學習平臺TI
21、,以及 QGPU 容器調度平臺以及向量數據庫。模型 MaaS 層面,提供 L0 層面混元大模型,L1 層面金融行業大模型,以及各類針對下游場景任務的 L2 的模型,如智能客服、智能咨詢、輔助分析和決策服務。騰訊云TI-OCR大模型幫助銀行解決日常業務問題騰訊云推出的TI-OCR大模型提供多種識別模式,包括智能結構化、固定版式結構化、檢測/識別、智能分揀。TI-OCR大模型具備原生大模型支持、通過prompt設計支持復雜任務、多模態技術提高召回率的特點。通過應用TI-OCR大模型,可實現自動化的數據處理和高度結構化,將數據識別準確率提高至95%以上。這一應用降低了高重復手工勞動,減少了運營成本,
22、實現了多元業務數據處理的標準化、線上化和自動化。163.3.2.國內金融垂類模型案例:恒生電子LightGPT+WarrenQ數據來源:恒生電子,WarrenQ,恒生電子LightGPT,東吳證券研究所恒生電子LightGPT重磅升級,各項能力均超國內通用大模型2023年10月19日,恒生電子發布金融大模型LightGPT最新的能力升級成果,以及基于LightGPT打造的多款光子系列大模型應用產品,并宣布正式開放產品公測。目前相較于6月發布的版本,LightGPT在整體模型效果上提升15%,安全合規性上提升13%,推理速度上提升50%,并面向金融機構實現LightGPT-7B的開源,推理和訓練
23、全面適配華為昇騰系列。在投顧場景中,LightGPT在各個方面平均超出國內通用大模型13%。在投研場景中,LightGPT平均超出國內通用大模型12%?!癢arrenQ+光子”持續加強金融垂域“搜讀算寫”繼6月底恒生電子推出WarrenQ-Chat和ChatMiner兩款大模型工具后,WarrenQ上新了 AI寫作、語音速記、小程序、招股書/公告深度問答四款新功能,并持續深入私有知識庫問答、智能投顧/投研chat助手等金融業務場景。目前,WanrrenQ服務于數家證券公司,覆蓋券商投研、財富、投行、固收等業務系統,為業務人員提供智能化的數據分析和交互技術,提升業務人員工作效率,持續加強大模型加
24、持下的金融垂域“搜讀算寫”能力。此外,恒生推出了金融智能助手光子,光子可以為金融機構的投顧、客服、運營、合規、投研、交易等業務系統注入AI能力,成為金融從業人員的AI助手?!?73.3.3.國內金融垂類模型案例:螞蟻金融大模型數據來源:螞蟻金融大模型,東吳證券研究所螞蟻金融大模型現世,多場景達行業專家水平2023年9月8日外灘大會上,螞蟻集團正式公布螞蟻金融大模型。螞蟻金融大模型聚焦真實的金融場景需求,在“認知、生成、專業知識、專業邏輯、合規性”五大維度28類金融專屬任務中表現突出,在“研判觀點提取”、“金融意圖理解”等眾多領域達到行業專家水平。專業力方面,平臺上有完備的數字化金融工具矩陣,螞
25、蟻金融大模型可通過理解用戶語言,精準調用螞蟻體系內的這些專業工具,給用戶提供相應專業服務。支小寶2.0+支小助1.0促進金融領域服務革新得益于金融大模型帶來的知識力、專業力提升,支小寶2.0的智商和財商提升到了新水平,能幫助用戶深度解讀市場信息、并結合用戶的財務目標、投資偏好等,提供個性化的配置策略。知識力方面,做到了有問必答。專業力方面,提供一系列的專業化服務,300多款專業化工具,通過自然語言能夠打理,能夠操控以上所有服務。語言力方面,支小寶2.0的金融意圖識別準確率高達95%。智能業務助手“支小助”的1.0版本,則包含了“服務專家版”、“投研專家版”等六個版本,全方位服務不同金融場景的從
26、業人員,可在投研分析、信息提取、商機洞察、金融工具使用等環節提供深度智能服務。183.3.4.國內金融垂類模型案例:東方財富奇思妙想金融大模型數據來源:東方財富妙想,東吳證券研究所東方財富深入AIGC、交互式AI等領域的研究,進一步鞏固流量優勢。公司已經陸續研發了東方財富金融數據AI智能化生產平臺、多媒體智能資訊及互動平臺系統等多個人工智能相關項目,并在公司部分產品及服務中進行了具體應用。公司將繼續緊跟AI技術發展前沿,不斷加強AI能力建設,進一步強化自然語言處理、圖像處理、語音識別和多模態融合技術能力,并繼續深入AIGC、交互式AI等領域的研究,完善內容生態構建,AI賦能提升用戶各場景使用體
27、驗和服務能力,未來或創造新的場景以挖掘客戶全生命周期需求,進一步鞏固流量優勢并提高客戶轉化率。東方財富加大AI研發技術投入,籌建人工智能事業部,重點推進金融垂直大模型研發應用。8月11日,東方財富公告稱公司將整合業務及研發力量,組建人工智能事業部。公司具備廣泛的AI應用場景,且沉淀了大量有效金融數據,有望通過此次組織架構調整提升AI技術能力,未來將在AI+金融領域實現更大突破。19問財升級,HithinkGPT大模型開啟內測。2023年12 月6 日,同花順開啟了問財升級版的內測,底層已經升級為Hithink GPT 大語言模型,結合海量金融領域數據和知識,通過自然語言對話,協助投資者進行標的
28、選擇、標的診斷、資訊解讀、投資教學等全方位投顧服務??紤]到同花順坐擁3000 萬+月活流量,以及B 端產品iFind 業務的快速增長,同花順大模型有豐富的落地場景。B端iFinD產品逐漸完善AI功能,AI開放平臺提供多種AI服務。公司的iFinD產品實現了基于語音交互與智能搜索服務、機器閱讀研報、研報知識圖譜自動生成等一整套智能化解決方案,技術實力和功能處于業內領先,預計iFinD+大模型結合基礎功能補齊、性價比優勢有望引領中期份額突破;同花順AI開放平臺目前可面向客戶提供短視頻生成、文章生成、數字虛擬人、智能金融問答、智能語音、智能客服機器人、智能質檢機器人、會議轉寫系統、智能醫療輔助系統等多項AI產品及服務。數據來源:同花順,東吳證券研究所3.3.5.國內金融垂類模型案例:同花順HithinkGPT大模型20