《電子行業端側AI深度跟蹤報告:2024 · AI“下凡”-231107(34頁).pdf》由會員分享,可在線閱讀,更多相關《電子行業端側AI深度跟蹤報告:2024 · AI“下凡”-231107(34頁).pdf(34頁珍藏版)》請在三個皮匠報告上搜索。
1、2023年11月7日2024 AI“下凡”行業評級:看好證券研究報告端側AI深度跟蹤報告分析師蔣高振研究助理安子超研究助理苗霄寒研究助理陳詩含郵箱郵箱郵箱郵箱證書編號S12305200500021目錄C O N T E N T S軟硬融合,端側AI技術蓄勢待發010203龍頭先行,科技企業已競相布局204相關標的及投資建議05風險提示提質增效,論端側AI滲透之必然1WzXNAbYdUkWrNqM7NbP9PtRmMtRsRiNnMpOfQpPwObRmNpMuOpOqQuOmPqR端側AI:軟硬融合,技術爆發01Partone3ChatGPT帶動云側AI產業鏈史詩級爆發ChatGPT熱潮席卷全
2、球,云側AI產業鏈史詩級爆發。ChatGPT(Chat Generative Pre-trained Transformer)是由OpenAI于2022年12月推出的對話AI模型,一經面世便受到廣泛關注。獲得千億、萬億級別參數的大語言模型需要超大規模AI服務器集群進行訓練,且隨著模型不斷迭代,對云端算力的需求增加。2023年以來,以英偉達為代表的AI芯片、通信網絡和服務器產業鏈相關企業股價漲幅明顯。1資料來源:Wind,智能機器人研究,浙商證券研究所01002003004005006002022-03-112022-04-112022-05-112022-06-112022-07-112022
3、-08-112022-09-112022-10-112022-11-112022-12-112023-01-112023-02-112023-03-112023-04-112023-05-112023-06-112023-07-112023-08-112023-09-112023-10-112018.062018.11OpenAI發布GPT-1模型OpenAI發布GPT-2模型2019.06OpenAI發布GPT-3模型2020.05OpenAI發布GPT-3模型的beta版本2022.11ChatGPT發布2023.032023.02OpenAI發布GPT-4OpenAI正式推出ChatGP
4、T收費版訂閱服務2023.01ChatGPT第三次更新2023.01ChatGPT第二次更新2022.12ChatGPT第一次更新4ChatGPT發展歷程美股AI芯片龍頭英偉達年初至今漲幅較大美元AI不止于云:端側是模型應用不容忽視的重要場景(1)云側AI:數據云端匯集訓練,模型通用性強。從終端采集和感知到的聲音、視頻等數據都通過網絡傳輸到云中心側進行后續處理,云側的資源高度集中,存儲和計算能力強,并且具有很高的通用性;(2)端側AI:終端設備上進行的輕型模型運用。越來越多的 AI計算和推理工作負載在手機、筆記本電腦、XR 頭顯、汽車和其他邊緣終端上運行,端側硬件具備一定的計算能力,以及低延遲
5、、個性化、隱私安全的特征。在設備本地進行如圖像/語音識別等小模型、低功耗的AI任務 結合用戶個人數據實現個性化AI AI數據本地化,隱私信息更安全1資料來源:CSDN,浙商證券研究所中度 AI RTX GPU更大的模型|按需使用|更高性能表現重度 AI CLOUD非常大的模型|按需使用|最高性能隨時可用 低延遲 數據本地化/保護隱私 無服務器成本云計算范疇輕度 AI NPU小模型|隨時可用|低能耗端側AI使用場景手機/PC等終端設備5混合AI大勢所趨,AI處理重心向邊緣轉移 云端推理成本極高,生成式AI規?;卣闺y以持續。AI推理規模遠高于訓練,盡管訓練單個模型會消耗大量資源,但大型生成式AI
6、模型預計每年僅需訓練幾次;推理成本將隨著日活用戶數量及其使用頻率的增加而增加。終端側AI能力是賦能混合AI并讓生成式AI實現全球規?;瘮U展的關鍵。在生成式AI出現之前,AI處理的重心正向邊緣轉移,越來越多的AI推理工作負載在手機、PC、XR 頭顯、汽車和其他邊緣終端上運行?;旌鲜紸I(云端協同)成為規?;瘧梦磥淼慕鉀Q路徑。在一些場景下,計算將主要以終端為中心,在必要時向云端分流任務。而在以云為中心的場景下,終端將根據自身能力,在可能的情況下從云端分擔一些AI工作負載。1資料來源:高通混合AI是AI的未來,浙商證券研究所生成式AI生態鏈使應用數量激增邊緣終端AI處理的重心正在向邊緣轉移6場景豐
7、富而深化,端側AI無遠弗屆 端側AI場景廣泛,包括智能手機、PC、汽車、XR以及物聯網等終端品類。不同產品類型也對芯片性能與成本提出更多的要求。1資料來源:億歐智庫,浙商證券研究所AI終端場景智能駕駛 功能需求:圖像識別、數據融合、SLAM定位等、路徑規劃功能 算力要求:20-4000 TOPS(L3-L5)功耗需求:中等,不過分追求低功耗 可靠性需求:高 成本敏感性:低智慧安防 功能需求:圖像/視頻識別、圖像/視頻檢測 算力要求:4-20 TOPS 功耗需求:追求較低低功耗 可靠性需求:偏高,尤其在識別的準確性方面 成本敏感性:較高智能家具 功能需求:圖像識別、語義識別與理解、語音助手等功能
8、 算力要求:1 TOPS 功耗需求:較高,家用小型產品多追求更低功耗 可靠性需求:較高 成本敏感性:較高消費電子 功能需求:圖像/場景識別、拍照美化、語音助手等功能 算力要求:1-8 TOPS 功耗需求:追求低功耗來保證設備續航時間 可靠性需求:高 成本敏感性:高7端側AI落地的軟硬件基礎逐步夯實軟件層面:已實現對大模型進行量化、剪枝、蒸餾,輕量化、小型化以適應移動端場景,并結合稀疏計算等方式降低對邊緣端側算力需求。高通表示,當前生成式AI模型所支持的參數日益增加,Stable Diffusion等參數超過10億的模型已能夠在手機上運行,且性能和精確度達到與云端處理類似的水平;未來擁有100億
9、或更多參數的生成式AI模型將能夠在終端上運行。1資料來源:高通,吳建明NPU架構和算力分析,浙商證券研究所數量可觀的生成式AI模型可分流到終端上運行端側模型通過降低精度以實現相對更快的運算生成式AI模型通過多種“瘦身”方式正在變小,同時終端側硬件處理能力持續提升,二者共同助力端側AI落地。AI大模型的壓縮和端側推理框架的輕量化,加上邊緣算力的躍升,實現大模型在邊緣-端側部署、加速AI與智能終端融合的核心技術條件目前已基本就緒。以對象監測算法YOLO為例,FP32與INT8的圖片精度相差甚小,但是INT8八位整型僅占用一個字節,數據量小、能耗低、計算速度相對更快,更符合端側運算特點。8硬件層面:
10、端側AI芯片性能快速提升1硬件層面:近年來端側AI芯片算力性能快速提升,為端側大模型落地做好準備。以手機為例,全球主流手機廠NPU性能近兩年顯著提升。根據AI-Benchmark榜單,不同手機SoC在INT8、FP16精度下NLP模型的計算能力在2021-2023年提升較快。AI能增強手機處理圖像、語音、自然語言處理等任務的能力,顯著增強手機性能,更靈活響應用戶需求,提升用戶體驗。主流手機SoC芯片AI性能迭代資料來源:AI-Benchmark,Synopsys,浙商證券研究所從幾GOPS到數千TOPS的芯片算力能夠支持的AI應用注:AI-Benchmark對各手機型號的AI性能綜合評價,此處
11、選取 縱坐標為INT8 NLP測試結果(單位 Tops)搭載同一主芯片的不同機型取其均值手機SoC的AI性能快速提升100 GOPSAoN(面部檢測、語音觸發),可聽戴設備,引擎控制,雷達后端處理100 GOPS-1 TOPS中端視覺(面容識別),圖像,動力調校,機器人控制1-10 TOPS視覺(檢測、識別),圖像(術中光學成像),雷達,激光雷達,無人機10-100 TOPS自動駕駛視覺和圖像處理,觀測系統,AR/VR等100-1000+TOPS視覺(目標探測、全景分割),傳感器融合,服務器推理9TOPSNPU為芯片性能支撐,廣泛用于端側AI加速NPU實現存算一體化,矩陣乘法功能提升芯片運行效
12、率。1)對于CPU和GPU的馮 諾伊曼結構中,存儲和處理是分離的,分別由存儲器和運算器來實現,跑神經網絡應用時受到存儲和處理分離式結構的制約,因而影響效率。NPU通過突觸權重實現存儲和計算一體化,從而提高運行效率。2)NPU可以比傳統CPU或GPU更高效地執行復雜的矩陣/向量/張量計算和并行處理,它們廣泛應用于計算機視覺、自然語言處理和語音識別等各種應用中。1資料來源:英特爾官網,浙商證券研究所NPU在測試展示出高效低耗的性能 高效性能 低功耗 專門化設計 硬件加速 彈性及可擴展性NPU特點#用Meteor Lake跑Stable DiffusionCPU:43秒,功耗40WGPU:14.5秒
13、,功耗37WNPU:20.7秒,功耗10WGPU+NPU:11.3秒,功耗30W高效低耗特性的NPU是一種專門用于進行人工神經網絡計算的芯片,被廣泛用于加速AI任務。其克服了CPU、GPU等通用處理器在深度學習等領域數據吞吐量、算力的限制。目前NPU集中在推理芯片領域,NPU的出現代表芯片從通用化逐漸開始走向專用芯片的異構混合計算。高通Hexagon NPU架構圖10提質增效,論端側AI滲透之必然02Partone11技術角度:端側AI相比云側優勢明顯 端側AI的四大優勢:隱私和安全、低延時、可靠性、低成本。隱私和安全:端側AI從本質上有助于保護用戶隱私,因為查詢和個人信息完全保留在終端上。數
14、據的存儲計算等都在本地,避免了傳到云端可能帶來的數據安全問題。對于企業和工作場所等場景中使用端側AI,這有助于解決保護公司保密信息的難題。例如,用于代碼生成的編程助手應用可以在終端上運行,不向云端暴露保密信息。低延時:當生成式AI查詢對于云的需求達到高峰期時,會產生大量排隊等待和高時延,甚至可能出現拒絕服務的情況數據的存儲計算在本地處理、本地響應方面時間更短速度更快。2資料來源:高通官網,KINARAOPTIMIZING LATENCY FOR EDGE AI DEPLOYMENTS,浙商證券研究所邊緣AI處理器延遲-ResNet50 v1.5(以毫秒為單位)12端側AI具有隱私、可靠、低延時
15、、高效、個性化等特點 可靠性:與云端互聯的網絡可能不穩定、甚至斷線。決策在本地大幅降低了數據經過更長的通路產生錯誤的幾率。終端側AI處理能夠在云服務器和網絡連接擁堵時,提供媲美云端甚至更佳的性能。根據Cloud vs On-device AI?Maybe something in between!的測算,如果所有的推理案例都在云服務器上進行,準確率是79.31%;如果49.88%的推理案例在移動端進行,其余在云端進行,仍可達到79.31%的云級準確率。低成本:隨著生成式AI模型使用量和復雜性的不斷增長,僅在云端進行推理并不劃算。將一些處理從云端轉移到邊緣終端可減輕云基礎設施的壓力并減少開支。此
16、外與云端相比,端側AI能夠以很低的能耗運行生成式AI模型。2資料來源:Erfan EshratifarCloud vs On-device AI?Maybe something in between!,路透社,浙商證券研究所分類精度與決定在移動設備上推斷的測試輸入的百分比之間的關系生成式人工智能搜索的成本技術角度:端側AI相比云側優勢明顯13用戶角度:成本增加有限,端側硬件先行2資料來源:Wind,Counterpoint,浙商證券研究所5G手機先于基站快速滲透5G手機發布后,價格不斷向高端機均價回歸0%10%20%30%40%50%60%70%80%90%050100150200250300
17、3502020-032020-052020-072020-092020-112021-012021-032021-052021-072021-092021-112022-012022-032022-052022-072022-092022-112023-012023-032023-052023-072023-095G基站累計(萬個)5G手機出貨量滲透率(右)5G用戶數滲透率(右)0200400600800100012002Q193Q194Q191Q202Q203Q204Q201Q21全球高端智能機均價北美5G手機均價1)硬件先行:5G手機商用后,滲透率快速提升。2020年國內5G基站批量建設剛
18、剛起步,但5G手機出貨量在20年底就已接近70%。2)成本分析:相比早期5G手機,AI手機/PC成本增加并不明顯。5G手機的增量成本包括射頻、AP&BP、閃存和專利費等,而AI手機/PC在BOM層面基本只增加了主芯片和DRAM。據高通預測,SoC價格提升幅度在10%左右。從購買行為和增量成本兩個角度與早期的5G手機對比,AI手機/PC具備快速滲透的邏輯基礎。相比19年5G手機高達萬元的售價,目前AI手機/PC的BOM成本增加集中在主芯片和內存等環節,售價十分接近現有高端型號。消費者為了享受未來可通過OTA迭代的AI操作系統和應用軟件,可遵循先購機再升級的通用模式。14龍頭先行,科技企業已競相布
19、局03Partone15AI PC:產業落地轉折點漸行漸近3AI PC為各領域提供創新解決方案:1)高速AI處理:AI PC能快速處理圖像識別、語音識別、自然語言處理等AI任務,提高生產力和娛樂體驗;2)增加AI應用:ISV有望提供NPU應用程序,將AI功能整合到現有應用程序中;3)新用例開發:AI PC推動新的業務用例和服務,包括醫療診斷、自動駕駛等多領域;4)提升用戶體驗:通過語音、手勢互動、AI個性化支持和高級安全功能改善用戶體驗。AI PC已接近產業落地的轉折點。支持人工智能的PC市場有望在2025年和2026年大幅擴張。根據Canalys預測,到2027年60%的PC將具備人工智能功
20、能。AI PC的功能300 款AI賦能的游戲 超高分辨率 幀數生成 智能角色替身AI賦能創意產業100款AI創造力&設計應用 視頻和圖片編輯 數字資產生成 降噪 超高分辨率AI賦能視頻OffOn 視頻超高分辨率 自動字幕 自動翻譯AI賦能生產力 視頻會議 文檔&演示文稿起草 數據分析和見解AI賦能程序開發 自動編程 代碼調試 訓練AI模型AI FOR EVERYDAY 提煉網頁內容 制定旅行計劃 數字個人助理資料來源:Canalys,群智咨詢,浙商證券研究所AI PC的發展預測16AI 手機:產業爆發前夜3AI手機有望成為個人智能助理,為手機行業帶來創新:1)智能化和便利的服務體驗:手機作為使
21、用頻率最高,使用時間最長的電子產品,也是鏈接智能汽車、PC、耳機以及其他智能終端的中樞,植入AI大模型后能成為真正的個人智能助理。例如語音助手能提供更自然的交互與更精準的意圖識別服務,圖像識別和處理功能可以為手機帶來更出色的拍照和圖像處理能力,文本生成能力可用于快速撰寫購物評價、生成發言稿等場景。2)數據更加安全精確:AI手機需要的數據保存在端側更安全,較云有隱私優勢,手機用戶自己生成的數據對于智能助理的訓練更加精確。3)從單個AI應用到統一AI生態:融入手機系統中的大模型,可以打破各APP之間的壁壘,比如郵件、備忘錄、日歷的互相調用,在某一工作節點發送特定郵件。對比蘋果2011年推出的手機助
22、手Siri:Siri采用一問一答的形式,而AI手機具有人格化、記憶、感知和管理能力,觸發主動服務。資料來源:小米發布會,ePrice,騰訊,浙商證券研究所17AI手機功能語音助理實現交互圖像填充相冊檢索文本生成圖像生成AI PC進展:英特爾首次引入了針對人工智能加速的NPU:NPU能與所有計算引擎的內置AI功能結合實現更高能效的AI計算,通過NPU降低CPU和GPU的AI工作負載,帶來高能低耗的表現。通過GPU、NPU、CPU不同層級的AI算力網絡,Meteor Lake能很好的將AI從云端引入到客戶端PC和企業邊緣PC?!癆I PC加速計劃”,旨在為軟件合作伙伴提供工程軟件和資源??犷lt
23、ra處理器“Meteor Lake”將于12月14日正式發售。3資料來源:英特爾官方發布會,浙商證券研究所10月19日“英特爾on技術創新大會2023”官宣將在今年12月14日正式發布面向下一代的AI PC的英特爾酷睿Ultra處理器Meteor Lake,以加速“AI PC”時代的到來。此外,英特爾提出“AI PC加速計劃”,宣布將為軟件合作伙伴提供工程軟件和資源,以在2025年前實現為超過1億臺PC實現人工智能特性。Meteor Lake的 NPU 能 在確 保 安 全 性同 時,支 持微 軟 加 速 驅動程序模型。Meteor Lake首次引入AI加速的NPU模塊CPU+GPU+NPU形
24、成不同層級算力網絡18AI PC進展:聯想個性化優勢凸顯:相比云端公用大模型,聯想PC級大模型Lenovo AI Now在面對“去斯德哥爾摩的音樂節的行程規劃”問題時表現出更加個性化,能夠將家庭地址、酒店偏好等考慮進去。AI PC預計2024年9月后上市,未來還將進入車端。楊元慶會后表示,搭載端側大模型的PC要明年9月以后才上市,按照規律前期將占有10%的市場份額,日后會成為主流。此外,聯想表示未來端側大模型還將進入車端。推出針對企業用戶的混合人工智能計劃,旨在保護數據安全。通用訓練后大模型可通過企業的特定數據進行額外的訓練和微調;在端側再加入企業知識矢量數據庫中的特定知識,最后鏈接舊有ERP
25、系統、CRM系統、MES系統等供應商數據庫,得到混合AI系統。3資料來源:聯想官方發布會,極客公園,浙商證券研究所10月24日,聯想舉行了主題為“AI for All”的“2023聯想Tech World創新科技大會”,重點展示了聯想在端側大模型方面的能力,以及聯想的首款AI PC產品。出席嘉賓包括聯想集團董事長兼CEO楊元慶、英偉達CEO黃仁勛、AMD CEO蘇姿豐博士等。聯想PC大模型在時效上略有延遲,但更具個性化聯想混合人工智能計劃-混合AI系統19AI手機進展:高通2023年成功將AI布局在安卓手機3手機端Stable Diffusion根據文本提示生成的圖片高通AI發展復盤資料來源:
26、高通混合AI是AI的未來,DeepTech深科技,浙商證券研究所由于模型龐大、算力需求高、能耗高企,此前主要局限在云端運行。高通布局在手機上,并在15秒內完成終端側運行的全棧研究和優化,表現出流暢的性能。它的里程碑意義正在于瞄準了市場需求,同時針對成本、能耗、可靠性、時延、隱私等問題,為各個參與方提供了一個整體解決方案。2023年2月23日,高通技術公司成功在搭載了驍龍芯片的安卓手機上運行了Stable Diffusion,這在全球還是首次。作為一款現象級應用,Stable Diffusion可以基于大模型從文本生成圖片,神奇的背后是復雜的模型和巨大的運算量,其模型參數超過10億個。20AI手
27、機進展:谷歌Pixel8自主研發芯片Tensor G3:能夠在手機攝像頭等領域利用其人工智能和機器學習資源。Tensor G3芯片包括最新一代ARM架構CPU、升級的GPU、新的ISP和成像DSP以及TPU(專為運行Google的AI模型而定制設計)。與Pixel 6上的第一代Tensor相比,Tensor G3運行更復雜的ML(機器學習)模型,在設備上運行的機器學習模型數量是前者的兩倍多。生成式AI谷歌助手Assistant with Bard:可與Gmail和Docs等Google應用程序集成,并讓它幫助執行照片創建標題、創建購物清單以及在電子郵件收件箱中查找信息等一系列操作。AI編輯工具
28、:1)Magic Editor:將物體移動到別處后Magic Editor還會精準填充原本的空間位置。2)Best Take:可以將多張集體照片組合在一起,從不同的圖片中選擇不同人物的表情來創建完美合影。3)Video Boost視頻增強:它將讓Tensor G3芯片利用谷歌的數據中心,為用戶提供最先進的視頻處理。310月4日,Made by Google 2023硬件發布會發布全新Pixel 8系列手機,搭載谷歌自研Tensor G3處理器和Titan M2安全芯片,在手機上首次應用AI智能大模型。谷歌還發布了新版安卓系統Android 14,以及生成式AI加持的谷歌助手Assistant
29、with Bard。Tensor G3新一代ARM架構CPU+GPU+TPUBest Take工具可以從不同照片選擇不同表情進行照片拼合資料來源:Google官方發布會,浙商證券研究所21AI手機進展:華為/小米/OPPO/VIVO3資料來源:華為官網,小米官網,雷科技,聯發科官方微博,浙商證券研究所小米澎湃OS自研端側大模型MiLM,輕量 化 語 言 模 型(13 億 參數),手機端側大模型部分場景效果媲美云端,進一步實現“人/車/家全生態”智能化。小愛輸入助手(生成式AI)AI妙畫、AI搜圖、AI寫真和AI擴圖實時字幕及總結WPS隨手拍&理解文意VIVOOriginOS 4聯發科與VIVO
30、在AI領域展開深度合作,率先實現了10億和70億參數AI大語言模型、10億參數AI視覺大模型在手機端側的落地。11月1日舉辦開發者大會,發布VIVO自研AI大模型,引領手機智慧體驗變革。10月更新的中文大模型測評C-Eval榜單中,VIVO大模型排名第一。OPPOAndes GPT模型Andes GPT作為OPPO自主訓練的生成式專屬大模型,以端云協同為基礎架構設計思路,推出從10億至千億多種不同參數規模的模型規格。10月11日,聯發科宣布攜手OPPO、ColorOS,合作共建輕量化大模型端側部署方案,共同推動大模型能力在端側逐步落地。華為鴻蒙OS 48月4日華為開發者大會,華為發布Harmo
31、nyOS 4:通過盤古大模型的底層能力加持,華為將為用戶帶來智慧終端交互、高階生產力效率、個性化服務的全新AI體驗變革。22AI手機進展:榮耀/蘋果/三星3資料來源:高通2023峰會,蘋果發布會,Sammobile,浙商證券研究所蘋果iPhone 15直觀人工智能:iPhone 15系列中,Pro和Pro Max搭載了蘋果最新一代自研芯片A17 Pro,包含六核CPU和六核GPU。A17 Pro是整個手機行業中首款應用3納米制程的芯片,它的性能核心速度提高10%,能效核心速度也提升,神經引擎速度加快兩倍。A17 Pro可以幫助支持更準確的預測輸入等功能。介入AI大模型:2023財年第三財季財報
32、發布會上,蘋果CEO庫克表示未來幾個月內,蘋果公司用于生成式AI的研發支出將進一步增加。三星Galaxy S24據Sammobile 報道,三星計劃在其下一代旗艦手機GalaxyS24系列上全面投入人工智能技術。三星希望Galaxy S24、Galaxy S24+和Galaxy S24 Ultra成為有史以來最智能的AI手機,甚至超越谷歌在Pixel系列上提供的功能。榮耀Magic 610月26日高通峰會上,榮耀正式官宣,榮耀Magic6系列將搭載高通驍龍8 Gen 3移動平臺,支持榮耀自研70億參數的端側AI大模型?;趥€人化理解和感知來完成場景化任務閉環可生成孩子從小到大跳舞的視頻23AI
33、汽車極越3百度Apollo賦能大模型上車極越01智能駕駛技術全球領先資料來源:極越汽車官方發布會,浙商證券研究所2023年10月27日,吉利控股旗下品牌極越推出全球首臺AI汽車機器人極越01,共推出極越01 Max和極越01 Max Performance兩款配置車型,售價為24.99萬33.99萬元,是全球首個大模型“上車”的智能汽車。百度Apollo賦能軟件算法:極越01高階智駕由百度Apollo高階自動駕駛全套能力和安全體系賦能,Apollo的L4級自動駕駛安全測試里程已超過7000萬公里。依靠BEV+Transformer的純視覺感知算法,實現點到點領航輔助PPA+代客泊車。此外,極越
34、01融入文心一言的大模型能力,是全球首個大模型“上車”的智能汽車,擁有邏輯推理、策略規劃和內容生成等諸多能力。英偉達和高通供應自動駕駛和智能座艙芯片:自動駕駛方面,極越01基于雙NVIDIA DRIVE Orin芯片,AI算力508 TOPS;智能座艙方面,極越01是國內首發搭載高通第4代驍龍汽車數字座艙平臺8295芯片,并首次完全啟用雙NPU(60TOPS),是當下市面上主流芯片算力的8倍左右。端側AI需要強大芯片硬件支持31、明確云側和端側的特點和功能,各取所長,協同工作。云側大模型訓練;端側推理。2、需要對手機SoC芯片做一定的升級,增加大模型所需的GPU、NPU、APU等單元。3、精簡
35、參數,降低內存占用,以適配手機硬件。減小參數量、量化技術調整、有爭對的精調模型等,使模型能夠在端側流暢應用。e.g.高通使用AI模型增效工具包(AIMET)將模型從FP32縮小到INT8。模型訓練需要巨大的算力,一定都會在云端進行,與云端大模型不同,手機無法支撐通用大模型百萬億甚至千億級別的參數,在此類消費級終端需要做適配處理,提升用戶體驗??紤]到硬件配套、隱私安全、用戶體驗等,“云側+端側”的協同設計思路成為手機行業共識。高通驍龍8Gen3芯片高通首個專為生成式AI而精心打造的移動平臺 NPU:性能提升98%,能效提升40%支持100億參數的模型聯發科天璣9300旗艦芯片(未發布)天璣930
36、0平臺將采用Arm最新的Cortex-X4超大核和Cortex-A720大核,基于相同工藝的全新高能效微架構可降低功耗達40%天璣9300將進一步提升CPU及GPU性能,并配備為運行生成式AI的大型語言模型而優化的強大AI處理單元(APU)。首款AI手機將會于今年年底前上市。資料來源:高通官網,混合AI是AI的未來(高通),聯發科官網,聯發科官方微博,浙商證券研究所25持續關注各大廠商端側AI產品進展3資料來源:各公司公告,浙商證券研究所11月6日 聯發科:天璣旗艦芯片天璣9300等新品發布會12月14日 英特爾發布首款AI PC產品Meteor Lake2024年1月 三星計劃在其下一代旗艦
37、手機Galaxy S24系列全面投入人工智能技術。2024年9月聯想 計劃推出第一款真正意義上AI PC。2024年底 蘋果計劃最早于2024年底在iPhone和iPad中加入生成式AI技術。26相關標的及投資建議04Partone27重點標的AI+PC英特爾(美):全球最大的CPU龍頭之一,數據中心及AI業務占比約30%,深度受益PC需求復蘇及AI PC放量。AMD(美):全球最大半導體廠商之一,產品覆蓋CPU、GPU,RyzenAI引擎支持7040系列PC,是AI PC領域強大參與者。聯想集團(H):PC龍頭廠商之一,預計將于2024年9月推出AI PC整機產品,有望隨AI PC市場擴大打
38、開增量新空間。華勤技術:筆記本、手機、平板、服務器等品類核心ODM廠商,深度綁定部分客戶,有望充分受益端側AI產業應用及放量。春秋電子:長期聚焦于消費電子精密結構件業務,PC結構件供應商,深度受益AIPC未來放量趨勢及傳統PC復蘇。光大同創:筆記本碳纖維背板龍頭,主要客戶包括聯想集團、立訊精密等,有望隨著AI PC產業推廣,業務彈性提升。428股票代碼公司簡稱22營收(億元或億美元)23營收一致預期24營收一致預期22歸母凈利潤23歸母一致預期24歸母一致預期INTC.O英特爾(INTEL)631 54061780.1-4.94.2AMD.O超威半導體(AMD)236 23128713.2 1
39、5.337.50992.HK聯想集團716 61958520.3 16.113.1603296.SH華勤技術926 873 983 25.6 26.228.8603890.SH春秋電子38 32 44 1.6 0.72.1301387.SZ光大同創10 11 15 1.1 1.52.2注1:預測值均使用wind一致預期(180天),美股和港股數據均使用報表原始數據單位(美元)。注2:聯想集團已披露2023財年年報,故其23年經營數據為實際數據,非預測值。資料來源:Wind,浙商證券研究所重點標的AI+手機谷歌:全球互聯網龍頭公司,在深度學習框架、大模型等方面技術領先,Pixel 8系列AI手機
40、正式發布,有望充分受益AI手機需求崛起。高通:全球知名芯片設計廠商,無線通信3G4G5G技術領導者,手機SoC龍頭廠商,有望充分受益混合式AI趨勢。聯發科:全球知名SoC芯片設計廠商,與國內手機廠商OPPO、VIVO等聯合推動手機側AI落地,有望獲得較大市場需求。韋爾股份:國內手機CIS龍頭,深度受益AI手機+空間計算對攝像頭在內的傳感器及算法的廣闊需求。卓勝微/唯捷創芯:國內射頻芯片雙子星,AI端側算力提升背景下5.5G等通信新技術需求迅速攀升。維信諾:國內頭部品牌直板及折疊屏面板核心供應商,AI手機+折疊屏雙賽道有望助力公司面板業務進一步放量。創耀科技:具備較為深厚星閃通訊技術布局,伴隨A
41、I端側對通信端要求的進一步提升,有望迅速受益。429股票代碼公司簡稱22營收(億元或億美元)23營收一致預期24營收一致預期22歸母凈利潤23歸母一致預期24歸母一致預期GOOG.O谷歌(ALPHABET)-C2,828 3,051 3,398 599.7 722.8845.2QCOM.O高通(QUALCOMM)442 358378129.4 72.387.62454.TW聯發科5,533 1,181.4 603501.SH韋爾股份201 215 257 9.9 11.927.9300782.SZ卓勝微37 43 54 10.7 11.816.1688153.SH唯捷創芯23 28 36 0.
42、5 1.94.5002387.SZ維信諾75 91114-20.7-12.5-3.6688259.SH創耀科技9 10 12 0.9 0.91.3資料來源:Wind,浙商證券研究所注1:預測值均使用wind一致預期(180天),美股數據均使用報表原始數據單位(美元),聯發科使用新臺幣為計量貨幣。風險提示05Partone30風險提示產業進展不及預期:端側AI市場仍處于培育期,軟件/硬件都還在持續探索,無論是大模型的持續優化還是AI芯片算力提升及能效控制都是較大的挑戰,若產業研發進展不及預期,有可能會影響產業鏈上各公司經營預期。下游需求不及預期:當前全球經濟尚未完全復蘇,若下游端側AI設備需求不
43、及預期,可能影響產業鏈各公司的訂單、備貨、銷售等環節。地緣政治關系惡化:若中美貿易環境持續惡化,可能影響關鍵技術及關鍵原材料在國內外的流通,進而影響端側AI產品的采購、研發、制造、銷售環節。531點擊此處添加標題添加標題點擊此處添加標題點擊此處添加標題點擊此處添加標題點擊此處添加標題點擊此處添加標題添加標題點擊此處添加標題點擊此處添加標題添加標題點擊此處添加標題添加標題95%行業評級與免責聲明32行業的投資評級以報告日后的6個月內,行業指數相對于滬深300指數的漲跌幅為標準,定義如下:1、看好:行業指數相對于滬深300指數表現10%以上;2、中性:行業指數相對于滬深300指數表現10%10%以
44、上;3、看淡:行業指數相對于滬深300指數表現10%以下。我們在此提醒您,不同證券研究機構采用不同的評級術語及評級標準。我們采用的是相對評級體系,表示投資的相對比重。建議:投資者買入或者賣出證券的決定取決于個人的實際情況,比如當前的持倉結構以及其他需要考慮的因素。投資者不應僅僅依靠投資評級來推斷結論 行業評級與免責聲明33法律聲明及風險提示本報告由浙商證券股份有限公司(已具備中國證監會批復的證券投資咨詢業務資格,經營許可證編號為:Z39833000)制作。本報告中的信息均來源于我們認為可靠的已公開資料,但浙商證券股份有限公司及其關聯機構(以下統稱“本公司”)對這些信息的真實性、準確性及完整性不
45、作任何保證,也不保證所包含的信息和建議不發生任何變更。本公司沒有將變更的信息和建議向報告所有接收者進行更新的義務。本報告僅供本公司的客戶作參考之用。本公司不會因接收人收到本報告而視其為本公司的當然客戶。本報告僅反映報告作者的出具日的觀點和判斷,在任何情況下,本報告中的信息或所表述的意見均不構成對任何人的投資建議,投資者應當對本報告中的信息和意見進行獨立評估,并應同時考量各自的投資目的、財務狀況和特定需求。對依據或者使用本報告所造成的一切后果,本公司及/或其關聯人員均不承擔任何法律責任。本公司的交易人員以及其他專業人士可能會依據不同假設和標準、采用不同的分析方法而口頭或書面發表與本報告意見及建議
46、不一致的市場評論和/或交易觀點。本公司沒有將此意見及建議向報告所有接收者進行更新的義務。本公司的資產管理公司、自營部門以及其他投資業務部門可能獨立做出與本報告中的意見或建議不一致的投資決策。本報告版權均歸本公司所有,未經本公司事先書面授權,任何機構或個人不得以任何形式復制、發布、傳播本報告的全部或部分內容。經授權刊載、轉發本報告或者摘要的,應當注明本報告發布人和發布日期,并提示使用本報告的風險。未經授權或未按要求刊載、轉發本報告的,應當承擔相應的法律責任。本公司將保留向其追究法律責任的權利。聯系方式34浙商證券研究所 上??偛康刂罚簵罡吣下?29號陸家嘴世紀金融廣場1號樓25層北京地址:北京市東城區朝陽門北大街8號富華大廈E座4層深圳地址:廣東省深圳市福田區廣電金融中心33層郵政編碼:200127 電話:(8621)80108518 傳真:(8621)80106010