《計算機行業:CPU Intel研究框架-220909(155頁).pdf》由會員分享,可在線閱讀,更多相關《計算機行業:CPU Intel研究框架-220909(155頁).pdf(155頁珍藏版)》請在三個皮匠報告上搜索。
1、請務必閱讀末頁的免責條款和聲明2022年年9月月9日日計算機行業“構筑中國科技基石”系列報告計算機行業“構筑中國科技基石”系列報告21CPU Intel:研究框架:研究框架中信證券研究部中信證券研究部 計算機計算機&電子電子楊澤原楊澤原 徐濤徐濤 丁奇丁奇 馬慶劉馬慶劉 王子源王子源2核心觀點核心觀點核心結論:核心結論:CPU的關鍵在于性能和生態的關鍵在于性能和生態,其二者是其二者是Intel不斷壯大的基石不斷壯大的基石。一方面一方面,CPU整個生命周期圍繞生態進行建整個生命周期圍繞生態進行建設設,Intel長期保持生態的兼容和開放長期保持生態的兼容和開放,進而構建起龐大穩固的生態體系進而構建
2、起龐大穩固的生態體系。另一方面另一方面,性能決定是否性能決定是否“好用好用”,“架構架構+制程制程+先進封裝先進封裝+總線結構總線結構”為四大技術基石為四大技術基石,Intel長期圍繞其進行技術迭代長期圍繞其進行技術迭代,構筑性能優勢構筑性能優勢。借鑒借鑒Intel發展經驗發展經驗,擁擁抱開放生態抱開放生態、縮小性能縮小性能差距料是差距料是國產廠商崛起的必經之路國產廠商崛起的必經之路,自主可控為國產廠商提供發展良機自主可控為國產廠商提供發展良機。建議關注國產建議關注國產CPU龍頭龍頭。Intel:成立五十余年的:成立五十余年的CPU龍頭龍頭,x86架構的開創者架構的開創者公司概述:公司概述:成
3、立于1968年,是全球最大的PC零件與CPU制造商,x86架構開創者,產品包括處理器、FPGA、系統與設備、內存與存儲等。創始人Robert Noyce是硅基集成電路發明人,Gordon Moore是摩爾定律提出者,技術背景強大。財務情況:財務情況:公司2021年營收達到790億美元,創下歷史峰值,其中PC端業務占比51.26%,數據中心業務占比32.67%,數據中心業務增速高于PC。當年公司整體毛利率55.45%,凈利率25.14%,截至2021年擁有員工人數超過12萬,盈利能力較強。發展歷程:從存儲器轉向發展歷程:從存儲器轉向CPU,從桌面端向數據中心從桌面端向數據中心/智能駕駛等領域拓展
4、智能駕駛等領域拓展早期:放棄存儲器早期:放棄存儲器,發明第一個發明第一個CPU。公司早期團隊是集成電路技術的開創者,發明4位/8位處理器使得公司在CPU行業建立領先優勢。在面臨日本對手的競爭時,公司果斷放棄存儲器業務,在早期確立專注微處理器的發展戰略。中期:奔騰中期:奔騰、Core在桌面端持續勝利在桌面端持續勝利,Xscale換換Atom未能站穩移動端未能站穩移動端。奔騰系列是PC領域經典產品,Core系列延續至今,但在移動浪潮出現時先是出售了Xscale,隨后拒絕了蘋果的訂單,未抓住移動端機遇,推出Atom也未能補救。后期:從移動端轉向自動駕駛后期:從移動端轉向自動駕駛/FPGA/數據中心數
5、據中心,IDM2.0重建工藝優勢重建工藝優勢。2016年兩款Atom的暫停發布標志著公司逐漸放棄移動市場,接連收購Mobileye、Altera,進行自動駕駛、FPGA領域的布局,建立第二成長曲線。以IDM 2.0與收購高塔半導體為標志,Intel調整自身代工策略,嘗試重建工藝領先。3核心觀點核心觀點微架構微架構/ISA:單核架構基本成熟單核架構基本成熟,異構異構、集成加速發展集成加速發展初期:格局未定初期:格局未定,先發者占據優勢先發者占據優勢。在行業發展初期,生態尚未形成,微架構尚未固化,先發者具備一定優勢,如Intel從4004到8080,產品節奏持續領先于Motorola和MOS等對手
6、,更早爭取到用戶,為生態規模優勢打下基礎。中期:生態初成中期:生態初成,兼容性強者為王兼容性強者為王。生態初步形成后,兼容性成核心關鍵,良好的兼容性持續推動生態發展。如Motorola的MC68010芯片性能不弱于80286,只是與前代的兼容性略差;RISC流派的MIPS R10000曾經在浮點效能方面達到Pentium Pro的3 倍以上,但明顯的性能優勢也無法抵消用戶的切換成本,Intel對Motorola、RISC流派的競爭勝利已經證明商業市場中生態優勢的強大邏輯。后期:架構成熟后期:架構成熟,性能引領前進性能引領前進。在同一生態內部主要比拼性能,奔騰和酷睿時代,Intel與AMD的競爭
7、中,性能強者贏得主要市場,K7/K8、Core、Zen等幾大關鍵架構極大改變了性能,對市場格局帶來了巨大改變。另一方面,處理器架構已經相對成熟,核心架構理念已經接近十余年沒有變化,性能增長放緩,異構集成或將成為未來發展方向?;夹g:基石技術:工藝升級推進性能提升工藝升級推進性能提升,封裝封裝+片內總線發力后摩爾時代片內總線發力后摩爾時代制程工藝:制程是架構的基礎制程工藝:制程是架構的基礎,1010nmnm受阻拖慢研發節奏受阻拖慢研發節奏。工藝制程壁壘高,目前先進制程玩家僅剩三家。由于過高的目標與保守的DUV技術路線,英特爾在10nm遭遇困難,失去制程領先地位,產品性能與量產節奏也大受影響。先
8、進封裝:先進封裝:FoverosFoveros、EMIBEMIB性能優良性能優良,IDMIDM模式下發展領先模式下發展領先。先進封裝是后摩爾時代必經之路,Intel在此領域推出的Foveros、EMIB等技術性能良好。相對Foundry與封測廠,公司的IDM模式能更好協同前后段工藝。片內總線:總線發達片內總線:總線發達有利堆核有利堆核,MeshbusMeshbus與與AMDAMD MCMMCM方案各有優勢方案各有優勢。片內總線結構對于堆核十分重要,公司從環形總線轉為網狀總線,走出了一條與AMD多芯片堆疊不同的道路,延遲更低,單片性能更好,但AMD的路線更有利于堆核。4核心觀點核心觀點產品體系:
9、至強產品體系:至強、酷??犷?、奔騰奔騰、賽揚賽揚、凌動五大類凌動五大類,覆蓋廣泛使用場景覆蓋廣泛使用場景1111類產品與服務類產品與服務,核心是核心是5 5類類CPUCPU(至強至強、酷??犷?、奔騰奔騰、賽揚賽揚、凌動凌動)。1 1)至強至強(服務器服務器):多核心低主頻無核顯,崛起于互聯網帶來的“PC服務器”浪潮,因低成本與擴展性勝過小型機。2 2)酷??犷#ㄖ懈叨酥懈叨薖C):重視能效,取代奔騰成PC高端產品線,12代酷睿異構趨勢初現。3 3)奔騰奔騰(中低端中低端PC):早期唯一產品,曾衍生出賽揚和至強,現用于教育/辦公。4 4)賽揚賽揚(低端低端PC):性能較奔騰低一級,用于入門級電腦
10、和嵌入式,幫助實現市場下沉。5 5)凌動凌動(低低功耗功耗、物聯網物聯網):瞄準移動市場,低功耗高能效,現用于異構芯片小核心。行業演變:從行業演變:從Intel引領行業到兩家激烈競爭引領行業到兩家激烈競爭,奔騰奔騰、K7/K8、Core、Zen是行業重要轉折點是行業重要轉折點1)奔騰及以前:奔騰及以前:Intel與AMD同根同源,早期為滿足IBM第二供應商要求而共存,直到奔騰系列誕生之前一直處于Intel引領,AMD仿制的局面;2)K7/K8時期:時期:后期兩家由合作轉向競爭,AMD自主研發能力逐漸增強,曾經在K7/K8架構時代對Intel奔騰4構成嚴峻挑戰,并憑借AMD64指令集與Intel
11、平起平坐;3)Core時期:時期:Intel憑借Core架構進行反擊,重新擴大領先優勢;4)Zen時期:時期:如今AMD憑借Zen系列展現趕超之勢,多核性能有優勢。目前兩公司整體差距較小。行業啟示:下游需求引領行業變革行業啟示:下游需求引領行業變革,商業模式需適配產業趨勢商業模式需適配產業趨勢架構先行:架構先行:架構領先是Intel和AMD競爭獲勝的核心法寶,目前CPU核心架構理念相對成熟,國產廠商正加速追趕。生態為王:生態為王:x86依靠早期的生態合作與兼容適配取得絕對優勢,吸引合作伙伴、培養用戶生態是CPU企業壯大的關鍵。需求引擎:需求引擎:PC、移動市場等不同需求造就行業巨頭,重塑行業格
12、局。PC浪潮帶動Intel(x86),移動市場帶動ARM。產業開放:產業開放:英特爾推出IDM2.0戰略,提升自身開放程度,向Fabless+Foundry模式靠攏,對擴大市場有重要成本優勢。5核心觀點核心觀點投資建議:投資建議:從從Intel歷史可見的第一核心要素:生態歷史可見的第一核心要素:生態-從Intel的發展歷程中可以看到,生態扮演著核心的角色,生態的兼容性保障了x86陣營在與摩托羅拉等CISC對手以及諸多RISC流派對手的競爭中勝出。Intel憑借大生態優勢,低成本拓展市場,進而增加研發資源,形成正循環。從從Intel歷史可見的第二核心要素:性能歷史可見的第二核心要素:性能-在生態
13、大局已定后,性能接棒成為核心,架構與工藝制程都是影響性能的關鍵。Intel憑借領先的集成電路工藝,積極引入大型機、小型機以及RISC流派的先進技術,在相當長的時間內一直是x86派別的性能領先者,而AMD也數次依靠新技術在產品端取得優勢,在市場上對Intel構成嚴峻挑戰。建議關注生態建議關注生態、性能端具備競爭力的國產龍頭企業性能端具備競爭力的國產龍頭企業。借鑒借鑒Intel發展經驗發展經驗,擁抱開放生態擁抱開放生態、縮小性能縮小性能差距預計是差距預計是國產國產廠商崛起的必經之路廠商崛起的必經之路,自主可控為國產廠商提供發展良機自主可控為國產廠商提供發展良機。建議關注建議關注國產國產x86架構架
14、構CPU龍頭和自研架構領軍者龍頭和自研架構領軍者。風險提示:需求減弱風險風險提示:需求減弱風險、市場競爭加劇市場競爭加劇、技術研發失敗風險技術研發失敗風險、全球供應鏈波動風險全球供應鏈波動風險、宏觀經濟增速下行宏觀經濟增速下行風險風險。6報告亮點與創新之處報告亮點與創新之處本報告對本報告對Intel發展歷程中的成敗得失與啟示進行了全面梳理發展歷程中的成敗得失與啟示進行了全面梳理,從產品從產品、技術方面進行深入分析技術方面進行深入分析,對于認知國產對于認知國產CPU廠商廠商有所幫助有所幫助。一一、技術層面技術層面,架構架構、工藝制程工藝制程、先進封裝先進封裝、片內總線架構為片內總線架構為CPU的
15、四大基石技術的四大基石技術,決定決定CPU產品力產品力,影響市場競爭力影響市場競爭力。架構方面架構方面,我們認為我們認為,初期講速度初期講速度,中期講兼容中期講兼容,后期講性能后期講性能,當前架構已經基本成熟當前架構已經基本成熟,有利于國產廠商追趕有利于國產廠商追趕。工藝方面,我們認為工藝是CPU企業的核心競爭力,是引領架構發展的動力。此外英特爾的先進封裝與片內總線架構保持領先,兩者的重要程度在“后摩爾時代”顯著提升。二二、產品層面產品層面,Intel走向細分化走向細分化、廣覆蓋廣覆蓋,PC市場攤成本市場攤成本,服務器市場獲利潤服務器市場獲利潤。市場需求導致Intel產品線不斷分化,AMD性價
16、比戰略促使Intel推出賽揚,追求利潤促使Intel、AMD先后進軍服務器。服務器場景“至強”憑借性能與成本從早期競爭中脫穎而出;制程研發放緩影響“酷?!毕盗懈偁幜μ嵘?;“賽揚”成功幫助公司實現市場下沉;“凌動”系列對標移動端,各代產品設計均體現面積與性能的權衡。三三、競對分析競對分析,初始稟賦初始稟賦、體量決定英特爾與體量決定英特爾與AMD不同的發展戰略不同的發展戰略。英特爾科技出身的創始人團隊使得公司早期引領技術變革,AMD銷售出身的團隊與較小的公司體量更適合“模仿跟進”策略。而兩家公司的同根同源創始人團隊也為日后合作埋下伏筆。同時公司規模、資本充足性差異也使兩家公司在IDM、Fables
17、s的選擇上出現分化。四四、行業啟示行業啟示。1)架構:架構:架構領先是Intel和AMD競爭獲勝的核心法寶,目前CPU核心架構理念相對成熟,國產廠商正加速追趕。2)生態:生態:具有很強的正反饋效應,強者恒強,盡量擁抱大生態。3)需求:需求:新進者的“發展窗口期”,催生增量市場,重塑產業格局。4)開放:開放:Fabless模式更符合CPU與先進制程的產業特點,更符合當今的分工格局,更符合方興未艾的國產CPU廠商。目錄目錄CONTENTS7一一公司概況:全球公司概況:全球CPUCPU龍頭,開創龍頭,開創X86X86架構架構二二發展歷程:早期專注發展歷程:早期專注CPUCPU,中期錯失移動端機遇,現
18、全方位發力,中期錯失移動端機遇,現全方位發力三三處理器架構:單核架構基本成熟,異構、集成繼續進步處理器架構:單核架構基本成熟,異構、集成繼續進步四四基石技術:工藝推進核心性能,封裝基石技術:工藝推進核心性能,封裝+片內總線發力后摩爾時代片內總線發力后摩爾時代五五產品體系:產品體系:1111項產品線多維布局,處理器為基本盤項產品線多維布局,處理器為基本盤六六行業演變:多年積累,競合不斷,成就行業兩大龍頭行業演變:多年積累,競合不斷,成就行業兩大龍頭七七行業啟示:下游需求引領行業變革,商業模式需適配產業趨勢行業啟示:下游需求引領行業變革,商業模式需適配產業趨勢八八投資建議投資建議九九風險因素風險因
19、素8目錄目錄一、公司概況:全球一、公司概況:全球CPUCPU龍頭,開創龍頭,開創X86X86架構架構1 1、公司概覽:持續創新,領航全球、公司概覽:持續創新,領航全球CPUCPU市場市場2 2、行業地位:實力強大,、行業地位:實力強大,CPUCPU行業龍頭地位穩固行業龍頭地位穩固3 3、財務情況:業務廣泛布局,營收增長穩健、財務情況:業務廣泛布局,營收增長穩健二、發展歷程:早期專注二、發展歷程:早期專注CPUCPU,中期未把握移動端機遇,現全方位發力,中期未把握移動端機遇,現全方位發力1 1、早期:持續迭代產品,產品與理念領先時代、早期:持續迭代產品,產品與理念領先時代2 2、中期:錘煉技術稟
20、賦,未把握移動端機遇、中期:錘煉技術稟賦,未把握移動端機遇3 3、后期:舍棄已去的過去,把握即來的未來、后期:舍棄已去的過去,把握即來的未來三、微架構三、微架構/ISA/ISA:單核架構基本成熟,異構、集成繼續進步:單核架構基本成熟,異構、集成繼續進步1 1、架構發展概況:基礎架構十余年來無大改,已接近數學物理極限、架構發展概況:基礎架構十余年來無大改,已接近數學物理極限2 2、早期時代:每一代性能提升、早期時代:每一代性能提升1010倍,跑馬圈地占據先發優勢倍,跑馬圈地占據先發優勢3 3、x86x86時代:持續兼容保持戰略定力,兼容前提下自我革命提升性能時代:持續兼容保持戰略定力,兼容前提下
21、自我革命提升性能4 4、奔騰時代:持續創新吸收技術,性能與生態綜合領先、奔騰時代:持續創新吸收技術,性能與生態綜合領先5 5、多核時代:性能轉向能效,市場持續正反饋、多核時代:性能轉向能效,市場持續正反饋6 6、減速時代:架構改進取決于工藝,集成與異構成為新趨勢、減速時代:架構改進取決于工藝,集成與異構成為新趨勢7 7、異構時代:架核心微架構基本成熟,場景優化成為關鍵、異構時代:架核心微架構基本成熟,場景優化成為關鍵四、基石技術:工藝推進核心性能,封裝四、基石技術:工藝推進核心性能,封裝+片內總線發力后摩爾時代片內總線發力后摩爾時代1 1、制程工藝:、制程工藝:10nm10nm受阻拖慢研發節奏
22、,受阻拖慢研發節奏,5 5年年4 4節點公司望王者歸來節點公司望王者歸來2 2、先進封裝:后摩爾時代下的縱向延伸,、先進封裝:后摩爾時代下的縱向延伸,IDMIDM模式下發展領先模式下發展領先3 3、片內總線結構:信息傳輸的通道,多核堆疊的掣肘、片內總線結構:信息傳輸的通道,多核堆疊的掣肘五、產品體系:產品分化,同步實現廣覆蓋與高適應性五、產品體系:產品分化,同步實現廣覆蓋與高適應性1 1、產品總覽:、產品總覽:CPUCPU為業務基本盤,產品分化為適應細分市場關鍵為業務基本盤,產品分化為適應細分市場關鍵2 2、至強(服務器):商業化應用場景,性能與成本為首要考量、至強(服務器):商業化應用場景,
23、性能與成本為首要考量3 3、酷睿(中高端、酷睿(中高端PCPC):取代奔騰成):取代奔騰成PCPC高端產品線,異構趨勢初現高端產品線,異構趨勢初現4 4、奔騰(中低端、奔騰(中低端PCPC):引領):引領CPUCPU歷史變革,現用于教育歷史變革,現用于教育/辦公場景辦公場景5 5、賽揚(低價低端、賽揚(低價低端PCPC):性能較奔騰低一級,幫助實現市場下沉):性能較奔騰低一級,幫助實現市場下沉6 6、凌動(低功耗、物聯網):瞄準移動市場,集成化為迭代主線、凌動(低功耗、物聯網):瞄準移動市場,集成化為迭代主線7 7、MovidiusMovidius視覺處理器:前瞻布局,針對邊緣與視覺處理器:前
24、瞻布局,針對邊緣與AIAI設備設備六、行業演變:多年積累,競合不斷,成就行業兩大龍頭六、行業演變:多年積累,競合不斷,成就行業兩大龍頭1 1、發展演變:相互競合,初始稟賦與體量決定不同發展戰略、發展演變:相互競合,初始稟賦與體量決定不同發展戰略2 2、競爭格局:差距逐漸縮小,筆記本服務器市場公司優勢顯著、競爭格局:差距逐漸縮小,筆記本服務器市場公司優勢顯著七:行業啟示:下游需求引領行業變革,商業模式需適配產業趨勢七:行業啟示:下游需求引領行業變革,商業模式需適配產業趨勢1 1、架構先行:、架構先行:CPUCPU競爭的法寶,技術相對成熟,國產廠商加速追趕競爭的法寶,技術相對成熟,國產廠商加速追趕
25、2 2、生態為王:生態是第一競爭力,強者愈強難以顛覆、生態為王:生態是第一競爭力,強者愈強難以顛覆3 3、需求引領:需求迭代催生后浪巨頭,把握下游鑄就穩固地位、需求引領:需求迭代催生后浪巨頭,把握下游鑄就穩固地位4 4、商業模式:、商業模式:FablessFabless展現優勢,分工合作利用生態規模展現優勢,分工合作利用生態規模八、投資建議八、投資建議九、風險因素九、風險因素9一、公司概況:全球一、公司概況:全球CPU龍頭,開創龍頭,開創X86架構架構1.1 1.1 公司概覽:持續創新,領航全球公司概覽:持續創新,領航全球CPUCPU市場市場1.2 1.2 行業地位:實力強大,行業地位:實力強
26、大,CPUCPU行業龍頭地位穩固行業龍頭地位穩固1.3 1.3 財務情況:業務廣泛布局,營收增長穩健財務情況:業務廣泛布局,營收增長穩健10英特爾是全球最大的英特爾是全球最大的PC零件與零件與CPU制造商制造商。自創立以來自創立以來,公司開創公司開創X86結構結構,并通過多個具有時代意義的產品引領計算并通過多個具有時代意義的產品引領計算機行業與機行業與CPU行業的創新變革行業的創新變革公司成立:公司成立:公司成立于1968年,總部位于美國加利福尼亞州圣克拉拉,由羅伯特 諾伊斯(CEO)與戈登 摩爾(COO)共同創立,后安迪 格魯夫加入,創始人實力強大創始人實力強大,其中羅伯特 諾伊斯為仙童半導
27、體創始人,被稱為“硅谷之父”,“集成電路之父”;戈登 摩爾為“摩爾定律”的提出者;安迪 格魯夫被譽為“硅谷最偉大的管理者”公司規模:公司規模:目前公司擁有12.1萬名員工,產品包括處理器、服務器、FPGA、系統與設備、內存與存儲等。2021年公司營收790億美元,同比+1.5%,創下歷史峰值股權結構:股權結構:公司股權結構分散,截至2021年年底公司持股5%以上的股東只有The Vanguard Group(先鋒領航集團)與BlackRock,Inc.(貝萊德集團),分別持股8.46%、8.14%1.1公司概覽:持續創新,領航全球公司概覽:持續創新,領航全球CPU市場市場英特爾股權結構英特爾股
28、權結構資料來源:Wind,中信證券研究部8.46%8.14%83.40%The Vanguard GroupBlackRock,Inc其它英特爾產品組合英特爾產品組合資料來源:公司官網11根據根據IC Insights麥克林報告麥克林報告,英特爾在全球半導體供應商英特爾在全球半導體供應商(不包括純代工廠不包括純代工廠)銷售額榜單中位居榜首多年銷售額榜單中位居榜首多年1993年年,英特爾以9.2%的全球半導體市場份額成為排名第一的供應商,一直到2016年,公司始終為全球半導體市場公司始終為全球半導體市場份額排名第一的廠商份額排名第一的廠商2017年年,公司市場份額為13.9%,略低于三星的14.
29、8%,而后在2019年再次回歸榜首再次回歸榜首同時,英特爾的主要競爭對手AMD也在快速增長,于2021年成功晉升成為第十名1.2行業地位:實力強大,行業地位:實力強大,CPU行業龍頭地位穩固行業龍頭地位穩固資料來源:IC insights,中信證券研究部19932000200820192021公司公司營收營收份額份額公司公司營收營收份額份額公司公司營收營收份額份額公司公司營收營收份額份額公司公司營收營收份額份額1英特爾英特爾769.2%英特爾英特爾29713.6%英特爾英特爾34513.0%英特爾英特爾70815.9%三星三星82013.3%2NEC 718.6%東芝東芝1195.4%三星三星
30、2037.7%三星三星55712.5%英特爾英特爾76712.5%3東芝東芝637.6%NEC1095.0%德州儀器德州儀器1164.4%SK海力士海力士2325.2%SK海力士海力士3746.1%4摩托羅拉摩托羅拉587.0%三星三星1064.8%東芝東芝1043.9%微芯微芯2024.5%微芯微芯3004.9%5日立日立526.3%TI 964.4%意法半導體意法半導體1033.9%博通博通1723.9%高通高通2934.8%6德州儀器德州儀器404.8%摩托羅拉摩托羅拉793.6%瑞薩電子瑞薩電子702.6%高通高通1443.2%英偉達英偉達2323.8%7三星三星313.8%意法半導體
31、意法半導體793.6%高通高通652.5%德州儀器德州儀器1373.1%博通博通2103.4%8三菱三菱303.6%日立日立743.4%索尼索尼642.4%英飛利英飛利1132.5%聯發科聯發科1772.9%9富士通富士通293.5%英飛凌英飛凌683.1%海力士海力士622.3%英偉達英偉達1082.4%德州儀器德州儀器1732.8%10松下松下232.8%飛利浦飛利浦632.9%英飛凌英飛凌592.2%意法半導體意法半導體952.1%AMD1642.7%前十大合計前十大合計47157.0%前十大合計前十大合計108149.4%前十大合計前十大合計119144.9%前十大合計前十大合計246
32、955.5%前十大合計前十大合計351257.1%行業合計行業合計826100.0%行業合計行業合計2190100.0%行業合計行業合計2652100.0%行業合計行業合計4445100.0%行業合計行業合計6146100.0%歷年半導體行業銷售額及其排名(億美元)歷年半導體行業銷售額及其排名(億美元)12營業收入:營業收入:2012-2021年年,公司營收由公司營收由533.4億美元增長至億美元增長至790.2億美元億美元,CAGR為為4.5%,增長趨勢明顯增長趨勢明顯,22Q2同比下滑同比下滑2018年,受數據中心和客戶端SSD的強勁需求以及Optane技術產品增長的推動2020年,新冠疫
33、情導致居家辦公、在線學習需求提升,PC與服務器市場增長明顯2021年,筆記本需求持續強勁、臺式需求復蘇,抵消數據中心由于競爭加劇帶來的ASP下降22年Q2,根據英特爾法說會,由于經濟活動快速放緩,DCAI 和 AXG 產品系列存在執行問題,公司營收增長疲軟。二季度營收153億美元,同比下降22%,創1999年以來最大降幅分地區營收:中國市場占據主要營收來源且增長迅速分地區營收:中國市場占據主要營收來源且增長迅速,為為CPU廠商重要戰略領域廠商重要戰略領域中國市場(中國大陸+中國香港+中國臺灣),公司營收由15年的224億美元增長至21年的346億美元,營收占比由40%增至44%“中國大陸及中國
34、香港”增長迅速,由15年的117億美元增至21年的211億美元,CAGR為10.3%1.3財務分析:營收穩健增長,中國地區需求強勁,財務分析:營收穩健增長,中國地區需求強勁,Q2同比下滑同比下滑資料來源:Wind,中信證券研究部英特爾英特爾2012-2022H1營收情況營收情況英特爾分地區營收情況(億美元)英特爾分地區營收情況(億美元)資料來源:公司年報,中信證券研究部050100150200250中國大陸及中國香港中國臺灣美洲新加坡其他國家2015201620172018201920202021-10%-5%0%5%10%15%01002003004005006007008009002012
35、2013201420152016201720182019202020212022H1營業收入(億美元)YoY(%)131.3財務分析:財務分析:PC客戶端與數據中心為主要營收來源客戶端與數據中心為主要營收來源資料來源:公司年報,中信證券研究部資料來源:公司季報,中信證券研究部050100150200250300350400450PC客戶端數據中心非易失性存儲器物聯網編程部門其他業務201620172018201920202021-60.0%-40.0%-20.0%0.0%20.0%40.0%60.0%020406080100120PC客戶端數據中心與AI網絡與邊緣加速計算與圖像處理Mobile
36、ye代工服務21Q222Q2YoY(%)分業務營收:主要來自分業務營收:主要來自CCG(PC客戶端客戶端)與與DCG(數據中心數據中心)CCG(PC客戶端):21年營收為405億美元,CAGR為4.2%,占比51%DCG(數據中心):21年營收為258億美元,CAGR為8.4%,占比33%22Q1業務調整:自業務調整:自22Q1起起,公司結合自身業務變革公司結合自身業務變革,將營收重新劃分為將營收重新劃分為CCG(PC客戶端客戶端)、DCAI(數據中心與數據中心與AI)、NEX(網絡與邊緣網絡與邊緣)、AXG(加速計算與圖像處理加速計算與圖像處理)、Mobileye、IFS(代工服務代工服務)
37、幾大類幾大類其中,PC客戶端依舊占比最大,但受需求沖擊同比下滑Mobileye業務發展迅速,22Q2營收為4.60億美元,同比+38.3%;代工業務體量小,增速有較大下滑英特爾分業務營收情況(億美元)英特爾分業務營收情況(億美元)2022Q2英特爾營收結構(億美元)英特爾營收結構(億美元)14從庫存端看從庫存端看,英特爾整體庫存規模較大英特爾整體庫存規模較大,存貨周轉較慢存貨周轉較慢;AMD存貨周轉天數近年來保持穩定存貨周轉天數近年來保持穩定2006年以來,伴隨經營規模的增長,英特爾的存貨呈現增長趨勢,存貨金額由2006年的43.13億美元增至2020的84.27億美元2021年,行業“缺芯”
38、態勢嚴重,包括英特爾在內的半導體公司均積極備貨,庫存明顯上升,英特爾21年存貨金額為107.76億美元,同期AMD存貨金額也有明顯增長英特爾存貨周轉天數也呈現上升趨勢,由2006年的78天增至2021年的98天。但AMD的庫存管理較好,除個別年份外,周轉天數普遍在80天以下。1.3財務分析:財務分析:Intel存貨周轉較慢,庫存呈上升趨勢存貨周轉較慢,庫存呈上升趨勢資料來源:Wind,中信證券研究部英特爾庫存及其周轉天數(百萬美元)英特爾庫存及其周轉天數(百萬美元)AMD庫存及其周轉天數(百萬美元)庫存及其周轉天數(百萬美元)資料來源:Wind,中信證券研究部20304050607080901
39、00110050010001500200025002006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021存貨存貨周轉天數203040506070809010011002,0004,0006,0008,00010,00012,0002006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021存貨存貨周轉天數15銷售銷售、行政及一般費用:費用端管控成效顯著行政及一般費用:費用端管控成效顯著,22H1
40、營收占比提升營收占比提升公司費用端管控成效顯著,“銷售、行政及一般費用”由2015年的82億美元降至2021年的65.4億美元,占營收比重由14.8%降至8.3%22H1費用占營收比重有所提升,主要為企業支出、激勵性現金薪酬增加導致研發費用:研發加碼研發費用:研發加碼,精進大業務精進大業務,建設小業務建設小業務2021年,公司研發費用提升明顯,主要用于對CCG(PC客戶端)與DCG(數據中心)兩大業務的支出同時,公司積極打造Mobileye與代工工藝技術,加大對兩者的研發支出1.3財務分析:費用管控成效顯著,研發投入持續加碼財務分析:費用管控成效顯著,研發投入持續加碼資料來源:Wind,中信證
41、券研究部英特爾銷售、行政及一般費用情況(億美元)英特爾銷售、行政及一般費用情況(億美元)英特爾研發費用情況英特爾研發費用情況資料來源:Wind,中信證券研究部0%2%4%6%8%10%12%14%16%0102030405060708090100201520162017201820192020202122H1銷售、行政及一般費用占營收比重(%)0%10%20%30%40%50%60%020406080100120140160180201520162017201820192020202122H1研發費用R&D(億美元)研發費用率(%)16盈利能力:盈利能力:毛利率呈下降趨勢:毛利率呈下降趨勢:2
42、016-2018年,因產品定價壓力與先進制程不斷上升的開發成本,公司毛利率呈現下降趨勢,但營收規??焖僭鲩L,公司盈利能力大幅加強美國稅改大幅影響美國稅改大幅影響17年凈利潤:年凈利潤:2017年美國實施企業稅改,導致公司該年所得稅支出為108億美元(16、18年分別為26、23億美元),使得該年公司凈利潤表現不佳22H1,公司盈利表現不佳:公司盈利表現不佳:22H1公司凈利潤為76.6億美元,同比-9%,營收下滑為主要影響;凈利率為23%,同比-12pcts1.3財務分析:毛凈利率呈下降趨勢,盈利能力有所減弱財務分析:毛凈利率呈下降趨勢,盈利能力有所減弱資料來源:公司財報,中信證券研究部英特爾
43、凈利潤及其增速情況英特爾凈利潤及其增速情況英特爾毛利率、凈利率情況英特爾毛利率、凈利率情況資料來源:公司財報,中信證券研究部0%10%20%30%40%50%60%70%20122013201420152016201720182019202020212022H1毛利率(%)凈利率(%)-20%0%20%40%60%80%100%120%140%05010015020025020122013201420152016201720182019202020212022H1凈利潤(億美元)YoY(%)17二、發展歷程:早期專注二、發展歷程:早期專注CPU,中期未把握移動端機遇,現全方位發力,中期未把握移
44、動端機遇,現全方位發力2.1 2.1 早期:持續迭代產品,產品與理念領先時代早期:持續迭代產品,產品與理念領先時代2.2 2.2 中期:錘煉技術稟賦,未把握歷史機遇中期:錘煉技術稟賦,未把握歷史機遇2.3 2.3 后期:舍棄已去的過去,把握即來的未來后期:舍棄已去的過去,把握即來的未來182.1發展早期:產品與理念領先時代,專注化戰略化解危機發展早期:產品與理念領先時代,專注化戰略化解危機資料來源:Intel官網,IBM官網,中信證券研究部1965年、年、1968年年 1965年:英特爾創始人戈登年:英特爾創始人戈登 摩摩爾提出“摩爾定律”爾提出“摩爾定律”1968年:戈登年:戈登 摩爾、羅伯
45、特摩爾、羅伯特 諾諾伊斯在硅谷創立英特爾伊斯在硅谷創立英特爾1971年年英特爾開發出第一個商用處理器英特爾開發出第一個商用處理器Intel 4004,集成,集成2250個晶體管,晶個晶體管,晶體管之間的距離是體管之間的距離是10微米微米1978年年英特爾生產出英特爾生產出16位位8086處理器,處理器,集成集成29000個個3微米技術的晶體微米技術的晶體管,開啟了管,開啟了x86時代時代1981年年IBM首款首款PC 5150使用英特爾的使用英特爾的8088芯片。英特爾芯片。英特爾CPU一舉成名一舉成名1985年年第一次戰略轉移第一次戰略轉移:壯士斷腕,放棄壯士斷腕,放棄存儲器市場存儲器市場,
46、專心開發微處理器專心開發微處理器 日本資金雄厚的大電子公司日本資金雄厚的大電子公司的沖擊的沖擊 英特爾英特爾D-RAM產品質量低、產品質量低、成本高成本高,市場份額不斷下降市場份額不斷下降,1984年公司年公司40%的營收和的營收和100%的利潤來自于微處理的利潤來自于微處理器,但器,但80%以上的研發投入以上的研發投入于在存儲器上。于在存儲器上。1972年年發布世界首款八位處理器發布世界首款八位處理器8008,其指令集成為今日英特爾公司其指令集成為今日英特爾公司X86系列微處理器指令集的基礎系列微處理器指令集的基礎技術基因強大,引領技術基因強大,引領CPU發展,放棄存儲器專注微處理器發展,放
47、棄存儲器專注微處理器192.2發展中期:發力服務器與移動互聯網,鑄就技術稟賦發展中期:發力服務器與移動互聯網,鑄就技術稟賦1991年年第二次戰略轉移第二次戰略轉移:格羅夫將工作的格羅夫將工作的重點從芯片轉移到信息網絡通信重點從芯片轉移到信息網絡通信方面上方面上1993年年首次推出奔騰芯片,制程工藝首次首次推出奔騰芯片,制程工藝首次降低到降低到1微米以下,實現微米以下,實現0.8微米水微米水平,晶體管數量超過平,晶體管數量超過300萬。萬。1998年年首次針對數據中心推出英特爾至強首次針對數據中心推出英特爾至強處理器品牌處理器品牌區分服務器市場和普通區分服務器市場和普通PC市場市場2001年年英
48、特爾的英特爾的64位服務器處理器位服務器處理器Itanium安騰問世,在服務器市場超越安騰問世,在服務器市場超越RISC處處理器的代表理器的代表Sun公司公司2003年、年、2005年年 2003年:英特爾發布迅馳移動年:英特爾發布迅馳移動計算技術,促進無線上網的迅計算技術,促進無線上網的迅猛發展,開啟移動計算時代猛發展,開啟移動計算時代 2005年:英特爾處理器導入蘋年:英特爾處理器導入蘋果果Mac,而此前蘋果使用的一直,而此前蘋果使用的一直是是IBM的的PowerPC架構芯片架構芯片1997年年收購收購StrongARM,并推出,并推出Xscale架架構,強于同時期的主流構,強于同時期的主
49、流ARM處理器處理器逐漸擴展處理器產品系列,技術革新鞏固行業地位逐漸擴展處理器產品系列,技術革新鞏固行業地位 線上通訊服務業務需求興起線上通訊服務業務需求興起 英特爾能夠憑依個人電腦的英特爾能夠憑依個人電腦的優勢,開拓新興的通訊與多優勢,開拓新興的通訊與多媒體領域。媒體領域。往后,蘋果往后,蘋果Mac也開始走向自也開始走向自研芯片的道路,有意擺脫對英研芯片的道路,有意擺脫對英特爾的依賴特爾的依賴資料來源:Intel官網,中信證券研究部202.2發展中期:未布局移動端發展中期:未布局移動端CPU,未把握移動端機遇未把握移動端機遇2005、2006年年2005年:蘋果希望使用英特爾年:蘋果希望使用
50、英特爾內置的內置的Xscale芯片為芯片為iPhone提提供算力,但遭英特爾供算力,但遭英特爾CEO拒絕拒絕2006年:由于財務危機,英特年:由于財務危機,英特爾將爾將Xscale專利與技術賣給專利與技術賣給Marvell,徹底失去移動互聯網,徹底失去移動互聯網的入場券的入場券2006年年英特爾酷睿處理器誕生,制程工藝英特爾酷睿處理器誕生,制程工藝65納米,集成晶體管數量實現納米,集成晶體管數量實現2億,億,面向家用和商用面向家用和商用PC2012、2013年年 2012年:英特爾宣布重返移動年:英特爾宣布重返移動終端市場,但是效果不佳終端市場,但是效果不佳 2013年:英特爾推出低功耗、年:
51、英特爾推出低功耗、小尺寸的小尺寸的Quark微處理器,在微處理器,在物聯網領域邁出大步物聯網領域邁出大步2014年年 英特爾推出酷睿英特爾推出酷睿M處理器,處理處理器,處理器功耗進入個位數(器功耗進入個位數(4.5W)的新)的新紀元紀元2015年年 完成公司史上最大一筆收購交完成公司史上最大一筆收購交易。斥資易。斥資167億美元收購可編程億美元收購可編程芯片廠商芯片廠商Altera公司公司 強化在數字中心市場和物聯網強化在數字中心市場和物聯網的地位,擺脫對的地位,擺脫對PC業務的依賴業務的依賴 在在PC市場不斷萎縮且移動市場市場不斷萎縮且移動市場遲遲難以打開的背景下,英特遲遲難以打開的背景下,
52、英特爾希望實現爾希望實現CPU和和FPGA硬件規硬件規格深層次結合,布局物聯網市格深層次結合,布局物聯網市場場2008年、年、2009年年 2008年:推出給予年:推出給予X86架構的架構的低功耗處理器,低功耗處理器,Atom凌動處理凌動處理器器 2009年:四核處理器問世。英年:四核處理器問世。英特爾繼續在服務器處理器市場特爾繼續在服務器處理器市場占優勢占優勢公司在移動市場發力較少,沒有充分把握歷史級別發展機遇公司在移動市場發力較少,沒有充分把握歷史級別發展機遇資料來源:Intel官網,中信證券研究部212.3發展后期:舍棄已去的過去,把握即來的未來發展后期:舍棄已去的過去,把握即來的未來2
53、016年年由于能耗與軟件生態問題,原定由于能耗與軟件生態問題,原定在在2016年推出的移動處理器凌動年推出的移動處理器凌動產品線的兩個新版本將會取消發產品線的兩個新版本將會取消發布,英特爾退出智能手機芯片市布,英特爾退出智能手機芯片市場場2016年年收購計算機視覺公司收購計算機視覺公司Itseez,進一步,進一步加強在汽車和視頻等物聯網細分市加強在汽車和視頻等物聯網細分市場的努力場的努力2017年年2017年:收購年:收購Mobileye。英特爾。英特爾宣布將以宣布將以153億美元收購億美元收購Mobileye,進一步成為自動駕駛,進一步成為自動駕駛領域的領先技術供應商領域的領先技術供應商20
54、17年:英特爾確立以數據為中年:英特爾確立以數據為中心的轉型戰略,開拓心的轉型戰略,開拓3000億美元億美元的廣闊市場機遇的廣闊市場機遇2018年年 英特爾宣布英特爾宣布2019年大規模交付年大規模交付10nm芯片芯片 英特爾宣布收購芯片制造商英特爾宣布收購芯片制造商eASIC,加速,加速FPGA,降低對,降低對CPU的的依賴依賴2021、2022年年 2021年:宣布英特爾年:宣布英特爾IDM2.0戰戰略,成立代工服務事業部略,成立代工服務事業部(IFS),重返芯片代工領域),重返芯片代工領域 2022年:旗下年:旗下Mobileye 宣布,宣布,計劃與合作伙伴在計劃與合作伙伴在 2024
55、年推出年推出自動駕駛電動班車自動駕駛電動班車 2022年:以年:以54億美元收購模擬億美元收購模擬半導體代工廠高塔半導體;為半導體代工廠高塔半導體;為聯發科提供芯片代工服務,采聯發科提供芯片代工服務,采用用 16 納米制程納米制程2016年年成立名為“自動駕駛集成立名為“自動駕駛集團”團”(ADG)的部門,該部門主要的部門,該部門主要任務是研發無人駕駛解決技術方任務是研發無人駕駛解決技術方案案多維收購拓寬業務邊際,著眼新興領域的嘗試多維收購拓寬業務邊際,著眼新興領域的嘗試資料來源:Intel官網,中信證券研究部22三、處理器架構:單核架構早已成熟,異構、集成繼續進步3.1 3.1 架構發展概況
56、:基礎架構十余年來無大改,已接近數學物理極限架構發展概況:基礎架構十余年來無大改,已接近數學物理極限3.23.2早期時代:每一代性能提升早期時代:每一代性能提升1010倍,跑馬圈地占據先發優勢倍,跑馬圈地占據先發優勢3.33.3x86x86時代:持續兼容保持戰略定力,兼容前提下自我革命提升性能時代:持續兼容保持戰略定力,兼容前提下自我革命提升性能3.4 3.4 奔騰時代:持續創新吸收技術,性能與生態綜合領先奔騰時代:持續創新吸收技術,性能與生態綜合領先3.5 3.5 多核時代:性能轉向能效,市場持續正反饋多核時代:性能轉向能效,市場持續正反饋3.6 3.6 減速時代:架構改進取決于工藝,集成與
57、異構成為新趨勢減速時代:架構改進取決于工藝,集成與異構成為新趨勢3.7 3.7 異構時代:架核心微架構基本成熟,場景優化成為關鍵異構時代:架核心微架構基本成熟,場景優化成為關鍵233.1.什么是架構:如何讓計算機少花錢多干活什么是架構:如何讓計算機少花錢多干活核心概念指令:告訴計算機該干什么/怎么干核心概念程序:一系列指令,告訴計算機先干什么后干什么用戶的目標:花最少的錢,最少的時間,讓計算機干最多的活(低功耗、速度快)主人:用戶/程序員仆從:計算機計算機是如何按人的需求工作的?計算機是如何按人的需求工作的?指令指令/程程序序、數據結果結果如何達成用戶的目標?:計算機提升工作能力,在同樣的時間
58、內在同樣的時間內執行更多的指令執行更多的指令如何更快執行指令?:架構架構?。ㄓ嬎銠C物理資源的優化配置計算機物理資源的優化配置)資料來源:中信證券研究部整理243.1.什么是架構:如何在同樣物理條件下執行更多任務?并行什么是架構:如何在同樣物理條件下執行更多任務?并行/調度調度/緩存緩存如何更快執行指令?:架構架構?。ㄓ嬎銠C物理資源的優化配置計算機物理資源的優化配置)具體如何配置資源,做何種“架構”?并行并行充分利用,同時做很多任務充分利用,同時做很多任務可否同時執行很多程序?多核多核可否把一個程序拆成幾部分同時做?多多線程線程在單個程序內部,可否同時執行一大批指令?超標量超標量可否讓指令緊密銜
59、接起來以免閑置資源浪費時間?流水線流水線可否一條指令同時處理一大批數據?單單指令多數據指令多數據(SIMD)調度調度避免卡殼,先做會做的任務避免卡殼,先做會做的任務當前任務卡住了,可否在等待期間做其他任務?亂序執行亂序執行任務產生了分支,可否預判該走哪條路?分支預測分支預測緩存緩存備好材料,免得用時找不到備好材料,免得用時找不到內存中有大量需要用到的數據資料,但內存很慢(由于采用電容存儲數據,所以比CPU慢數百倍),相當于資料齊全的圖書館可否在CPU內部放置一個小書架臨時儲存資料,以免經常往返圖書館浪費時間?高速緩存高速緩存資料來源:中信證券研究部整理253.1.Intel與架構的關系:與架構
60、的關系:微架構并非微架構并非Intel開創,比開創,比CPU誕生更早誕生更早資料來源:TechNews科技新報回顧歷史夢幻處理器:計算機結構、商業大型主機與超級計算機的誕生,IBM Archives:IBM Mainframe,中信證券研究部處理器單核微架構的誕生早在處理器單核微架構的誕生早在1960年代年代,此時正是計算機從晶體管轉向集成電路的時期此時正是計算機從晶體管轉向集成電路的時期,流水線流水線(指令并行指令并行)、亂序執亂序執行行(指令調度指令調度)、高速緩存三大核心技術乃至于微架構和指令集的持續兼容性均在這一時期奠定了基礎高速緩存三大核心技術乃至于微架構和指令集的持續兼容性均在這一
61、時期奠定了基礎,形成了現代計算形成了現代計算機的基本架構機的基本架構,甚至早于甚至早于Intel公司的誕生公司的誕生,其中其中IBM在此過程中起到核心作用在此過程中起到核心作用。幫助AMD取得市場成功的K7架構,其使用的總線來自DEC Alpha EV6(21264,1998年);2008年初代Core i的Nehalem架構,其中新引入的QPI總線來自于DEC Alpha EV7(21364,2001年)Intel本質是集成電路公司本質是集成電路公司,用集成電路重做微架構用集成電路重做微架構,所以搭載何種微架構更多取決于工藝水平和市場情況所以搭載何種微架構更多取決于工藝水平和市場情況第一臺通
62、用型計算機(繼電器)第一臺電子計算機(電子管)IBM第一個全電子計算機1950年代最受歡迎的計算機,生產了近2000臺首次使用硬盤,實現隨機讀寫而非以往的順序讀寫引入固態電子技術,晶體管開始取代真空管實現全晶體全晶體管化管化,小型化世界第一臺世界第一臺引入流水線引入流水線的通用計算的通用計算機機自1952年開發701以來首次基本重組,開啟集成電路計算機序幕,首創兼容首創兼容指令集概念指令集概念,發布后一個月就售出1000余臺首次引入了指令動首次引入了指令動態調度技術(亂序態調度技術(亂序執行),包括寄存執行),包括寄存器重命名、器重命名、Tomasulo算法等算法等核心技術,指令性核心技術,指
63、令性能達到能達到16.6MIPS,相當于相當于1991年的年的Intel 486SX首次搭載首次搭載高速緩存高速緩存IBM-Harvard Mark IENIACIBM 701IBM 650IBM RAMAC 305IBM 7070/7090IBM 1401IBM 7030 StretchIBM System 360IBM 360/91IBM 360/85194419461952195419561958196019601964196719681969198219841995IntelAMD8028680386奔騰Pro引入流水線主板高速緩存亂序執行大型機與大型機與PC處理器部分關鍵節點處理器部
64、分關鍵節點263.1.CPU架構演進:古老學科,主要的架構演進:古老學科,主要的CPU架構革新發生在二十年前架構革新發生在二十年前資料來源:各產品手冊,wikichip40048008808080868028680386i486P5-PentiumP6-P ProP5-P MMXP6-P2P6-P3Netburst-WillametteNetburst-NorthwoodNetburst-Prescott年份年份197119721974197819821984198919931995199719971999200020022004工藝工藝10m10m6m3m1.5m1.5m1m0.8m350n
65、m250nm250nm180nm180nm130nm90nm位數位數488161632323232323232323264主頻主頻108kHz500kHz2.08MHz5MHz6MHz16MHz25MHz66MHz150MHz133MHz300MHz500MHz1.5GHz3.8GHz流水線流水線BIU/EU分離首次引入流水線,3級3級5級5級12級6級14級10-13級20級20級31級超標量超標量首次支持超標量,雙流水線(整型)3流水線(2整1浮點)緩存緩存L1首次引入主板高速緩存首次集成8KB L18KB L1I,8KB L1DL2支持外部L2集成L2L3服務器端集成L3桌面端支持L3T
66、LB首次引入TLBopLoadStore指令隊列指令隊列首次引入指令隊列,6B6B指令分配隊列指令分配隊列IDQ解碼器解碼器INT ALU/執行引擎執行引擎亂序執行亂序執行RSROB首次引入亂序執行SIMDMMXSSESSE2SSE3超線程超線程桌面端首次引入超線程Hyper-Threading(分時多線程)P4E支持HT,奔騰D不支持HT多核心多核心奔騰D“膠水雙核”異構異構其他集成其他集成集成FPU技術突破持續發展技術退潮CPU架構的發展黃金期在架構的發展黃金期在80-90年代年代,引入了諸多技術革新引入了諸多技術革新(盡管有些是來自盡管有些是來自IBM大型機的老技術大型機的老技術,但也屬
67、于首次用在但也屬于首次用在CPU上上)273.1.CPU架構演進:最近十余年進展緩慢,以集成和堆核為主架構演進:最近十余年進展緩慢,以集成和堆核為主資料來源:各產品手冊,wikichipCoreNehalemSandy BridgeHaswellSkylakeKaby LakeCoffee LakeCoffee Lake RComet LakeIce Lake/Sunny CoveTiger Lake/Willow CoveAlder Lake/Golden Cove年份年份200620082010201320152016201720182019201920202021工藝工藝65nm45nm
68、32nm22nm14nm14nm14nm14nm14nm10nm10nmintel 7位數位數646464646464646464646464主頻主頻睿頻1.0睿頻2.0流水線流水線14級14級14級14級超標量超標量4流水線,6發射6發射8發射8發射8發射8發射8發射8發射10發射10發射12發射緩存緩存L132KB L1I,32KB L1D32KB L1I,32KB L1D32KB L1I,32KB L1D32KB L1I,32KB L1D32KB L1I,32KB L1D32KB L1I,32KB L1D32KB L1I,32KB L1D32KB L1I,32KB L1D32KB L1I
69、,32KB L1D32KB L1I,48KB L1D32KB L1I,48KB L1D32KB L1I,48KB L1DL2雙核共享6MB 24way256KB 8way256KB 8way256KB 8way256KB 4way(client);1MB 16way(server)256KB 4way(client);1MB 16way(server)256KB 4way(client);1MB 16way(server)256KB 4way(client);1MB 16way(server)256KB 4way(client);1MB 16way(server)512KB 8way(clie
70、nt);1280KB 20way(server)1.25MB 20way1.25MB(client);2MB(server)L3桌面端集成L3,2MB/c2MB/c2MB/c2MB/c2MB/c2MB/c2MB/c2MB/c2MB/c3MB/c3MB/cTLBop1.5K1.5K1.5K1.5K1.5K1.5K1.5K2.25K2.25K4KLoad64727272727272128Store3642565656565672指令隊列指令隊列4040505050505050指令分配隊列指令分配隊列IDQ5656128128128128128140解碼器解碼器444444444446INT ALU
71、/執行引擎執行引擎333444444445亂序執行亂序執行RS3254609797979797160ROB96128168192224224224224224352352512SIMDSSE4.1SSE4.2AVXAVX2服務器端AVX512消費端AVX512消費端禁用AVX512超線程超線程不支持超線程支持超線程SMT(同時多線程)SMTSMTSMTSMTSMTSMTSMTSMTSMTP核支持SMT,E核不支持多核心多核心真雙核4c4c4c4c4c6c8c10c4c8c16c異構異構首次異構集成其他集成其他集成QPI總線集成核顯,ringbus取代QPI集成ISP(IPU),SP 版本Mes
72、hbus集成雷電3(TB3)接口、神經網絡加速器(GNA)集成TB4,GNA2,IPU6技術突破持續發展技術退潮從酷睿時代后,單核微架構的發展逐漸減速,鮮有新技術,主要是進行堆料產生性能上的量變,更多的發展體現在核心數的增加和集成283.1.CPU架構發展現狀:面臨限制提升放緩,堆料邊際效用遞減架構發展現狀:面臨限制提升放緩,堆料邊際效用遞減超標量超標量/超寬架構:超寬架構:蘋果M1 8解碼8發射;AMD zen3 4解碼6發射;Intel Golden Cove 6解碼5發射(僅ALU),對于變長指令已經足夠高指令融合:指令融合:Intel Macro Fusion已經發展成熟多年,FMA等
73、組合指令只能用在特定場景流水線:流水線:早在4004之前就已用于大型機,目前流水線級數相對穩定,過深流水線在分支預測失敗、外部中斷等場景下代價高,且指令切分更細就必須采用高主頻才能達到相同效果,Netburst已經被證明失敗指令級并行指令級并行數據級并行數據級并行SIMD指令集:指令集:Intel/AMD從MMX到SSE再到AVX,最新版本為AVX512,僅有少量應用可用,性價比不佳,后在Golden Cove官方禁用多核心:多核心:目前64/128核心已不罕見,更多核心的并行計算應用較少,通常采用GPU效率更佳超線程:超線程:SMT2已經多年未變,SMT4雖然可用但始終不是主流,因為使用SM
74、T本身也帶來功耗和控制復雜度方面的弊端進程進程/線程級并行線程級并行存儲器層次體系存儲器層次體系高速緩存:高速緩存:SRAM體系無根本變化,高速高成本大面積,L1已經能解決80%-95%需求,AMD 3D V-Cache已經夠大,過大反而導致高延遲內存內存/外部存儲:外部存儲:DRAM/NAND Flash性能不會出現質變,Optane叫好不叫座,需等待基礎材料層面技術革新動態執行動態執行亂序執行:亂序執行:不相關指令在程序中的比例不會無限提高,亂序執行的效果是有上限的,經過多年優化基本穩定分支預測:分支預測:目前分支預測準確率已能達到90%以上,部分場景下更高,提高空間已經不大物理限制:物理
75、限制:沒有工藝的進展,先進架構想要應用就需要更大面積和更多功耗,降低良率,付出超高成本。硅集成電路微縮有極限,當前工藝制程進展已經明顯放緩,成本快速提升,留給架構利用的物理空間增長有限留給架構利用的物理空間增長有限。工藝/架構已成熟后往往采用DSA(專用架構)數學限制:可以并行數學限制:可以并行/亂序執行的指令是有上限的亂序執行的指令是有上限的,有一定比例的指令一定需要按照時間先后執行順序,這一點永遠無法隨著架構發展而改變,所以各類并行各類并行/動態調度技術都是有上限的動態調度技術都是有上限的,在這方面堆料的效果將逐漸減弱在這方面堆料的效果將逐漸減弱。資料來源:intel官網,中信證券研究部2
76、9Zen 4 IPC提升平均達到提升平均達到13%3.1.CPU架構發展現狀:邊際效用遞減十分明顯,以架構發展現狀:邊際效用遞減十分明顯,以zen4為例為例1%3%4%5%5%9%10%11%12%12%12%13%13%14%15%17%17%19%19%24%32%39%CPU-Z 1TFortniteGTA VAdobe Lightroom(Puget Bench)Passmark 1TCinebench R23 1TKrakenAdobe Premier(Puget Bench)Shadow of the Tomb RaiderPOV-RayFar Cry 6CS:GO7-zipGee
77、kbench 5.4 1TV-Ray CPUAssassins Creed:ValhallaMetro ExodusDeus Ex:Mankind DividendF1 2022Watchdogs LegionDolphin BenchwPrime(1024M)資料來源:Puget Systems,中信證券研究部PugetBench Lightroom跑分跑分資料來源:AMD Ryzen 7000發布會2022年8月AMD Ryzen 7000系列發布會上,AMD官方表示其綜合IPC提升達到13%。每一代產品IPC測試所用程序中,包含各類不同負載,所用負載不盡相同,并不直接可比。另外此處計算得
78、到的IPC也受內存等外部器件條件的影響。因此,綜合來看實際綜合來看實際IPC提升應當提升應當小于小于13%同樣是Intel Core i9 12900K,選用DDR5內存后,其得分有明顯上升30資料來源:AMD 2022財務分析師大會,中信證券研究部Zen 4 IPC提升提升資料來源:AMD Ryzen 7000發布會,中信證券研究部Zen 4 IPC貢獻分解貢獻分解3.1.CPU架構發展現狀:邊際效用遞減十分明顯,以架構發展現狀:邊際效用遞減十分明顯,以zen4為例為例Zen 4微架構相比前代變化微架構相比前代變化資料來源:Twitterchiakokhua,中信證券研究部采用AMD在202
79、2財務分析師大會的數據,Zen4有8%-10%的IPC提升為達到如此IPC提升,AMD利用TSMC N5工藝帶來的充足物理空間進行了大量硬件配置提升。根據退休工程師Twitterchiakokhua的數據,AMD在微指令緩存、二級緩存、ROB、BTB等方面都有大幅增加根據AMD的數據,L2翻倍帶來的提升約1%,BTB增大50%帶來IPC提升不到2%,ROB增大25%帶來提升1%,微指令緩存增加近70%帶來提升約3%,可見效應已效應已經明顯下降經明顯下降,已經逐步接近數學極限已經逐步接近數學極限。AMD在財務分析師大會上提供的數據為8%-10%IPC提升,可能更接近真實情況31早期早期,由于由于
80、CPU行業剛剛出現行業剛剛出現,生態尚未形成生態尚未形成,決定成敗的還是快速推出高性能新產品決定成敗的還是快速推出高性能新產品,爭取更多用戶爭取更多用戶,獲得更多市場獲得更多市場。早期CPU并無復雜的微架構,大多架構技術還屬于大型機專屬,此時主要比較主頻、位數、晶體管數量等因素。在早期產品中在早期產品中,Intel幾乎一直是最領先的幾乎一直是最領先的對于發展早期的芯片類型對于發展早期的芯片類型,關注速度是很重要的關注速度是很重要的,“快魚吃慢魚快魚吃慢魚”3.2.早期時代:每一代性能提升早期時代:每一代性能提升10倍,跑馬圈地占據先發優勢倍,跑馬圈地占據先發優勢公司公司產品產品推出時間推出時間
81、晶體管數量晶體管數量主頻主頻位數位數引腳數量引腳數量Intel400419712.3k108kHz416Intel800819723.5k500kHz818Intel808019744.5k2.08MHz840Intel808519776.5k3MHz840Intel8086197829k5MHz1640MOS Technology65011975840MOS Technology650219753.51k1MHz840ZilogZ8019768.5k2.5MHz840MotorolaMC680019744.1k1MHz840MotorolaMC68000197968k4MHz1664部分典型
82、早期部分典型早期CPU資料來源:wikichip,中信證券研究部323.2.1.早期時代:早期時代:4004,開創,開創CPU行業,奠定行業,奠定Intel領先地位領先地位4004 1971/11工藝:10m制程,pMOS晶體管,12mm2晶體管數量:2.25k主頻:108kHz/750kHzMCS-4芯片組構成芯片組構成資料來源:wikichip 4004,中信證券研究部MCS-4系列的一組系列的一組4種芯片種芯片4004是世界首個微處理器是世界首個微處理器,開創了開創了CPU行業行業,第一次將計算機完全用集成電第一次將計算機完全用集成電路的形式實現路的形式實現,奠定了未來一段時間的奠定了未
83、來一段時間的CPU架構基礎以及架構基礎以及Intel的領先地位的領先地位。為響應客戶需求,Intel設計了一套4個芯片,稱為MCS-4,包括CPU 4004,以及存儲程序的ROM 4001,存放數據的RAM 4002,用于I/O擴展的移位寄存器(SR)4003;單處理器可支持4KB ROM和640字節RAM。資料來源:wikichip 4004硬盤內存對外接口資料來源:wikichip 4004,中信證券研究部333.2.1.早期時代:早期時代:4004,開創,開創CPU行業,奠定行業,奠定Intel領先地位領先地位4004 1971/114004僅包含基本的狀態控制、指令控制、寄存器、ALU
84、等單元,只有1個4位ALU執行數字/邏輯運算,支持46條指令,包含分支、跳轉、條件判斷、子程序等基礎指令資料來源:Intel 4004 datasheet,SciHi,中信證券研究部4004架構框圖架構框圖ALU:執行加減乘除運算的核心單元時序與控制單元:包含時鐘同步單元,以及與內存和“硬盤”的接口等專用寄存器:用來跟蹤程序執行進度等,控制程序執行通用寄存器:通常用來存放程序所需的各類數據指令寄存器:存放將要執行的指令Flag:包含CPU的各種狀態信息指令解碼器:“閱讀”指令的單元,可以在“閱讀”后知道指令需要做什么、需要幾個數據等信息343.2.2.早期時代:早期時代:8008,從計算器到計
85、算機的跨越,從計算器到計算機的跨越8008 1972/4工藝制程:10m,pMOS晶體管數量:3.5k主頻:500(8008)/800(8008-1)kHz技術突破:世界首個世界首個8位可編程微處理器,位可編程微處理器,主頻提升主頻提升8倍,可進行數據倍,可進行數據/字符處理,支持字符處理,支持中斷中斷資料來源:wikichip,intel 8008 datasheet(1978)8008架構框圖架構框圖-與與4004變化不大變化不大8008與4004很相似,但4位升級成8位,主頻提升8倍,性能極大提升性能極大提升,首次支持算術之外的指令首次支持算術之外的指令,完成了從計算器到計算完成了從計算
86、器到計算機的跨越機的跨越。8008在4004之后5個月推出,架構與4004相似性高,只有1個8位ALU。對比4004,晶體管增加了50%,時鐘速度是其8倍,支持16KB RAM/ROM(4倍),支持48條指令以及中斷功能,并能夠進行數據/字符操作,而4004只能處理算術。與4004相似的數據寄存器組,數據寬度變成8位與4004相似的時序與控制單元,增加了外部中斷功能,可以暫時放下當前任務去響應突發事件與4004相似的ALU,只是從4位數據寬度變成8位數據寬度與4004相似的FLAG、指令寄存器、指令解碼器與4004相似的地址寄存器組,數量增加,地址寬度變成14位353.2.3.早期時代:早期時
87、代:8080,再強,再強10倍,從理論上的計算機到商業上的計算機倍,從理論上的計算機到商業上的計算機8080 1974/4工藝制程/面積:6m,nMOS,20.1mm2晶體管數量:4.5k主頻:2.08MHz技術突破:主頻提升4倍,性能比上一代提性能比上一代提升升10倍倍,每秒可執行29萬條指令;多種輔助芯片,如8257 DMA控制器、8259中斷中斷控制器控制器等;支持;支持244條指令條指令資料來源:Intel MCS-80 User Manual(1977),中信證券研究部8080架構框圖架構框圖-集成多種控制功能集成多種控制功能8080支持的指令數從48提升到244,工藝改善帶來主頻4
88、倍提升,性能提升性能提升10倍倍,解決了8008時鐘頻率低、引腳少等問題,實用性大大提高實用性大大提高,用于第一款用于第一款PC Altair 8800,造成電腦銷售歷史上第一次缺貨造成電腦銷售歷史上第一次缺貨增加了更多控制功能,計算機系統更為復雜,走向實用化新增10進制轉換電路,可直接用10進制編程基本架構與4004/8008高度相似多種電源電壓,比8008更復雜363.2.4.早期時代:早期時代:8085,工藝提升持續集成,從復雜回歸簡單的計算機,工藝提升持續集成,從復雜回歸簡單的計算機資料來源:Intel MCS-85 User Manual(1983)8085 1977工藝制程:3m晶
89、體管數量:6.5k主頻:3/5/6MHz技術突破:8080后續歷經8080A、8085、8085A等改進版,8085進行了大規模集成進行了大規模集成(包括時鐘、系統控制、串行通信等芯片),簡化了供電,大幅減少了外圍元器件數,大幅減少了外圍元器件數量;支持量;支持246條指令條指令8085大幅減少外圍器件數量大幅減少外圍器件數量8080 微處理器微處理器8085 微處理器微處理器8 個專用引腳作為數據總線(D0到 D7)多路復用 8 位數據引腳(AD0到 AD7)存在 16 個地址引腳(A0到A15)8 引腳高位地址總線(A8到A15)和 8 個多路復用地址總線(AD0到 AD7),并存在地址鎖
90、存使能(ALE)引腳。電源電壓為+5、-5 和+12 伏電源僅為+5 伏。存在單中斷引腳(INT)使用INT,還有四個中斷引腳(TRAP,RST7.5,RST6.5,RST5.5)串行通信設備不存在串行通信功能提供 SID、SOD 引腳和 RIM、SIM 指令需要用于時鐘和系統控制的附加芯片時鐘和系統控制任務不需要額外的芯片。資料來源:Comparison of Intel 8080 with Intel 8085,中信證券研究部8080與與8085的主要區別的主要區別8085是8080的改進版,集成大量外部功能集成大量外部功能,減少外部元件減少外部元件,整個計算機系統大幅簡化整個計算機系統大
91、幅簡化,降低了組成計算機的門檻降低了組成計算機的門檻。373.3x86時代:持續兼容保持戰略定力,兼容前提下自我革命提升性能時代:持續兼容保持戰略定力,兼容前提下自我革命提升性能資料來源:wind,中信證券研究部1982-1993 Intel與與AMD股價股價8080以后以后,Intel最大的競爭對手是最大的競爭對手是Motorola,其次還有其次還有Zilog、MOS等公司等公司,對手產品性能并不比對手產品性能并不比Intel差差。根據快科技大偉的信息,MC6800接近8080,MC6809/MOS6502接近8085,MC68000接近8086,MC68010接近80286,MC68020
92、接近80386,MC68040接近i486。但后期Zilog的Z280、Z28000,MOS的6500系列等已經無法與Intel和Motorola競爭。讓讓Intel在與在與Motorola的競爭中取得勝利的關鍵就在于兼容性的競爭中取得勝利的關鍵就在于兼容性,而而Motorola因為沒有保證兼容性導致客戶升級換代成本太因為沒有保證兼容性導致客戶升級換代成本太高高。架構設計是決定兼容性的主要因素架構設計是決定兼容性的主要因素。051015202500.511.522.531982-111983-011983-031983-051983-071983-091983-111984-011984-03
93、1984-051984-071984-091984-111985-011985-031985-051985-071985-091985-111986-011986-031986-051986-071986-091986-111987-011987-031987-051987-071987-091987-111988-011988-031988-051988-071988-091988-111989-011989-031989-051989-071989-091989-111990-011990-031990-051990-071990-091990-111991-011991-031991-0
94、51991-071991-091991-111992-011992-031992-051992-071992-091992-111993-011993-031993-051993-071993-091993-11英特爾復權收盤價(左軸)AMD復權收盤價(右軸)8028680386i486383.3x86時代:持續兼容保持戰略定力,兼容前提下自我革命提升性能時代:持續兼容保持戰略定力,兼容前提下自我革命提升性能資料來源:wind,中信證券研究部1982-1993 Intel與與AMD股價股價在在80286以后以后,Intel逐漸在逐漸在PC處理器市場擊敗處理器市場擊敗Motorola,但新的競爭
95、對手接踵而來但新的競爭對手接踵而來,Intel面臨面臨RISC陣營的嚴峻挑戰陣營的嚴峻挑戰。Intel也意識到RISC的優勢十分明顯,x86的歷史包袱十分沉重,因此多次嘗試轉型到x86以外的架構,以重新奪取性能制高點,但最終讓最終讓Intel取勝的取勝的,還是還是x86,兼容性兼容性、生態優勢大于技術優勢這一邏輯得到反復驗證生態優勢大于技術優勢這一邏輯得到反復驗證。根據Technews信息,以1993年上市的IBM PowerPC 601為例,晶體管數目僅280萬,采用0.6um制程,面積僅121mm2,卻有比310萬晶體管的Pentium更高的80MHz主頻、更大一倍的32kB指令/數據共用
96、L1,與1.5倍的指令執行能力,而采用0.8um(800nm)制程的初代Pentium是一顆16.717.6mm、294mm2的大芯片,相較于同等級相較于同等級RISC處理器處理器,Pentium有約有約30%晶體管都是為了晶體管都是為了x86指令集的相容性指令集的相容性。同期同期MIPS R10000 的的SPEC fp92 浮點性能還是浮點性能還是Pentium Pro 的的3倍以上倍以上。051015202500.511.522.531982-111983-011983-031983-051983-071983-091983-111984-011984-031984-051984-071
97、984-091984-111985-011985-031985-051985-071985-091985-111986-011986-031986-051986-071986-091986-111987-011987-031987-051987-071987-091987-111988-011988-031988-051988-071988-091988-111989-011989-031989-051989-071989-091989-111990-011990-031990-051990-071990-091990-111991-011991-031991-051991-071991-09
98、1991-111992-011992-031992-051992-071992-091992-111993-011993-031993-051993-071993-091993-11英特爾復權收盤價(左軸)AMD復權收盤價(右軸)8028680386i486393.3.1.x86時代:時代:8086/8088,引入指令隊列和多處理器,掀起,引入指令隊列和多處理器,掀起PC浪潮浪潮80861978/8088-1979工藝:3m晶體管數量:29k主頻:5MHz1980推出8087浮點協處理器(FPU);支持多路支持多路處理器系統處理器系統;8086的簡配版8088被IBM用于model 5150
99、PC8086比比8080性能提高性能提高10倍倍資料來源:Intel 8086 Family User Manual(1979),中信證券研究部8086支持多處理器支持多處理器8086為起點為起點,開創了著名的開創了著名的x86指令集指令集8088是是8086的減配版的減配版,首次應用于首次應用于IBM PC,開啟開啟PC時代時代8086為多路處理器系統進行了優化適配相對性能表現403.3.1.x86時代:時代:8086/8088,引入指令隊列,微架構初步發展,引入指令隊列,微架構初步發展8086 1978/8088-1979技術突破:將單個處理器分為將單個處理器分為BIU(總線接口單元)和(
100、總線接口單元)和EU(執行單元)兩部分并獨立運行(執行單元)兩部分并獨立運行,形成當今CPU前后端的雛形;具備具備6字節指令隊字節指令隊列列提高EU和總線利用率8086將處理器分為將處理器分為BIU和和EU并出現了指令隊列并出現了指令隊列資料來源:Intel 8086 Family User Manual(1979),中信證券研究部8086的的EU和和BIU獨立運行,提高利用率獨立運行,提高利用率資料來源:Intel 8086 Family User Manual(1979),中信證券研究部8086首次引入6字節指令隊列8086首次將CPU分成總線單元和執行單元,形成前后端分工以往處理器只能順
101、序執行各個工序,導致資源浪費,每個單元都有大量時間閑置8086/8088實現前后端分離后可以分別獨立工作,閑置時間大大減少,總線單元基本實現滿負荷工作413.3.2.x86時代:時代:80286,引入流水線并持續兼容,在,引入流水線并持續兼容,在PC行業獨步天下行業獨步天下80286-1982工藝:1.5m晶體管數量:134k主頻:6MHz技術突破:Intel首次采用流水線技術(首次采用流水線技術(3級);在級);在8086基礎上,基礎上,BIU進一步分為進一步分為AU(地址單元)、(地址單元)、BU(總線單元)、(總線單元)、IU(指令(指令單元)單元),更接近如今處理器前端;6字節預取指令
102、隊列,字節預取指令隊列,3解碼后解碼后指令隊列指令隊列;IPC達到0.21;推出地址保護模式保護模式以同時保持兼容性和大容量內存(24位地址)訪問功能;1984年用于IBM PC/AT80286微架構框圖微架構框圖80286支持流水線技術支持流水線技術資料來源:Intel 80286 Family Hardware Reference Manual(1987),中信證券研究部資料來源:Intel 80286 Family Hardware Reference Manual(1987),中信證券研究部80286是擊敗主要競爭對手摩托羅拉的關鍵一代是擊敗主要競爭對手摩托羅拉的關鍵一代,最主要因最主
103、要因素在于素在于80286對于前代產品保持兼容對于前代產品保持兼容。80286通過推出實和保護兩種模式來實現了與以前處理器的兼容。而摩托羅拉的MC68000系列則對前代并非完全兼容,比如68010(從性能來看與80286相當)雖然與68000(性能相當于8086)引腳兼容,但指令并非全部兼容。前端引入指令預取隊列和解碼后指令隊列,可顯著提高性能流水線可以大大增加指令吞吐量(同樣時間內執行的指令數量,可用同樣寬度內的方塊數量代表)資料來源:Intel 80286 Family Hardware Reference Manual(1987),中信證券研究部42自自80年代年代RISC處理器興起后處
104、理器興起后,尤其是尤其是80286后的幾代產品后的幾代產品,CISC陣營的劣勢愈發凸顯陣營的劣勢愈發凸顯,其最大的劣勢在于其使用長度不定其最大的劣勢在于其使用長度不定的指令的指令,且且x86還需要為了保持兼容付出性能代價還需要為了保持兼容付出性能代價,因此因此Intel、AMD、DEC等公司都在做等公司都在做RISC方面的嘗試方面的嘗試資料來源:AMD64 Architecture Programmers Manual Volume 3,中信證券研究部典型典型x86指令使用的位數示意指令使用的位數示意3.3.3.x86時代的異響:時代的異響:RISC對對CISC展現優勢展現優勢X86指令構成指
105、令構成資料來源:AMD64 Architecture Programmers Manual Volume 3,中信證券研究部X86等CISC指令集由于歷史原因,普遍采用長度不一致的指令,比如x86指令最長可以達到15字節,而最短的指令只有1字節433.3.3.x86時代的異響:時代的異響:i960/i860,CISC的自我懷疑的自我懷疑i960-1985Intel的首個RISC處理器,32位超標量i860-198964位位RISC,比,比AMD64早十余年早十余年i860 die shot資料來源:IEEE Micro:Introducing the i860 Microprocessor(1
106、989)資料來源:TechNews科技新報從Pentium回顧x86處理器到底哪里難做,中信證券研究部初代初代Pentium die shot從初代奔騰結構圖可以看出,x86 CPU為了處理長短不一的指令,并保持對前代CPU的兼容性,將巨大面積貢獻給取指令、指令解碼、控制邏輯、復雜指令支持等單元。(由于指令長度可變且較為復雜,CPU很難在瞬間判斷出這一串01數字該到哪里結束才是一條完整指令)從Intel自研的i860處理器可見,采用RISC后,指令長度固定,且不需要背負兼容性包袱,前述各類單元大各類單元大大簡化大簡化,幾乎不占據主要面積,在圖中已經無需單獨劃分區域進行標注,性能和成本優勢十分明
107、顯。性能和成本優勢十分明顯。資料來源:i860用戶手冊和i960用戶手冊,中信證券研究部443.3.3.x86時代的異響:時代的異響:i960/i860,Intel嘗試自我革命嘗試自我革命i860寄存器配置寄存器配置i860支持的匯編指令支持的匯編指令資料來源:intel i860 Programmers Reference(1989),中信證券研究部資料來源:IEEE Micro:Introducing the i860 Microprocessor(1989),中信證券研究部Intel設計的RISC處理器向主流RISC理念靠攏,采用了大量的寄存器,其中i860具備32個整數寄存器,32個浮
108、點寄存器,以及若干專用寄存器,數量遠超x86架構。數據只有讀取到寄存器中才能操作,有利于大幅簡化指令體系。i860采取全新的匯編指令體系,與x86的匯編指令完全不同。453.3.4.x86時代:時代:80386,引入高速緩存與虛擬地址,步入多任務時代,引入高速緩存與虛擬地址,步入多任務時代80386-1984工藝:1.5m晶體管數量:275k主頻:16MHz技術突破:取代1981年推出的失敗的iAPX432,成為Intel首個量產的首個量產的32位位CPU;為克服內存墻,引入高高速緩存系統速緩存系統(位于主板上);引入引入TLB,支持頁表、內存虛擬地址,支持頁表、內存虛擬地址,對每個程序支持對
109、每個程序支持flat內存模型,即內存模型,即支持多任務支持多任務/虛擬機,對微軟操作系虛擬機,對微軟操作系統發展有重要影響統發展有重要影響;設計團隊后來在i386基礎上設計P6;開啟Compaq的PC克隆時代,大批“IBM兼容機”誕生80386首次引入高速緩存系統首次引入高速緩存系統80386引入引入TLB和頁表,開啟多任務時代和頁表,開啟多任務時代資料來源:Intel 80386 Hardware Reference Manual(1986),中信證券研究部資料來源:Intel 80386 Hardware Reference Manual(1986),中信證券研究部80386再次體現兼容性
110、的重要性再次體現兼容性的重要性。Intel此前曾推出過試圖領先時代的此前曾推出過試圖領先時代的32位處理器位處理器iAPX432,但由于指令集不相容但由于指令集不相容,且性能不足且性能不足,產品未能成功產品未能成功。iAPX(Intel Advanced Processor Architecture)屬于CISC,開始于1975年,當時8080剛量產,1981年面世,不僅不與x86共享指令集,且性能只有80286的四分之一。80386作為兼容作為兼容x86的的32位處理器位處理器,在保證兼容前代的產品下在保證兼容前代的產品下,性能優秀性能優秀,獲得市場成功獲得市場成功。頁表(Page Tran
111、slator)和TLB(頁表的高速緩存,加快頁表運行速度)的引入對于同時運行多個程序十分重要。加入這一機制后,每個程序都認為自己獨享內存,而操作系統可以給不同程序靈活分配內存高速緩存Cache采用純晶體管制作,而內存DRAM采用晶體管和電容,速度很慢,將常用信息存儲在Cache中能夠顯著提高運行速度資料來源:Intel 80386 Hardware Reference Manual(1986),中信證券研究部463.3.5.x86時代:時代:i486,集成緩存與,集成緩存與FPU,解決,解決90%內存讀取需求內存讀取需求80486-1989工藝:1m晶體管數量:1.2m主頻:25MHz技術突破
112、:集成集成8KB片上片上緩存緩存(L1),解決了,解決了90-95%的內存讀取需求,減少內的內存讀取需求,減少內存訪問以緩解內存墻問存訪問以緩解內存墻問題題;可使用外部二級緩存,進一步減少內存讀??;集成集成FPU,支持浮點,支持浮點運算指令運算指令,無需浮點協處理器;IPC超過超過1;超過100萬晶體管資料來源:Intel i486 Hardware Reference Manual(1990),中信證券研究部i486內部微架構內部微架構i486 5級流水線時空圖級流水線時空圖資料來源:Intel Pentium Processor Users Manual Volume 1(1993)i48
113、6和的流水線技術真正進入較為成熟的階段,包含5級,PF為指令預取,D1階段指令解碼,D2階段計算內存操作數地址,EX執行,WB寫回。X86的的i486與與RISC的的i860同樣同樣在在1989推出推出,但但486大獲成功大獲成功而而i860系列沒有延續下來系列沒有延續下來,體體現出生態的重要性大于性能現出生態的重要性大于性能。根據Intel在硬件參考手冊中的信息,片上一級緩存能夠解決90%的讀取需求,極大減少內存讀寫次數,提高系統性能i486集成浮點處理器,更加便于使用,從8087到80387的一系列浮點協處理器退出主流市場資料來源:Intel i486 Hardware Reference
114、 Manual(1990),中信證券研究部473.4 奔騰時代:持續創新吸收技術,性能與生態綜合領先奔騰時代:持續創新吸收技術,性能與生態綜合領先資料來源:wind,中信證券研究部1993-2006 Intel與與AMD股價股價奔騰時代奔騰時代Intel最大的特點是最大的特點是“高端高端PC芯片芯片”,擊敗擊敗Motorola后低端又面臨后低端又面臨AMD和和Cyrix等公司的競爭等公司的競爭,憑借持續的架構憑借持續的架構技術引進以及工藝領先維持與技術引進以及工藝領先維持與AMD、Cyrix等公司的性能等公司的性能、產品檔次差距產品檔次差距。Intel在高端在高端PC芯片基礎上衍生出低端芯片基
115、礎上衍生出低端PC芯片和芯片和PC服務器芯片服務器芯片,與各界競爭對手全面競爭與各界競爭對手全面競爭,并憑借大生態優勢在服務器并憑借大生態優勢在服務器市場取得勝利市場取得勝利,憑借技術性能優勢在憑借技術性能優勢在PC市場維持領先地位市場維持領先地位。0510152025303540455005101520253035404550英特爾復權收盤價(左軸)AMD復權收盤價(右軸)初代奔騰4-Willamette,Netburst架構第二代奔騰4-Northwood,Netburst架構第三代奔騰4-Prescott,Netburst架構末代奔騰4-Cedar Mill,Netburst架構奔騰Pr
116、o,P6架構奔騰MMX,P5架構奔騰,P5架構奔騰2,P6架構奔騰3,P6架構483.4.奔騰時代:從搖擺不定到專注奔騰時代:從搖擺不定到專注x86,造就,造就PC時代經典時代經典資料來源:Ofri Wechsler:Inside Intel Core Microarchitecture,Intel IDF 2006:Stephen L.Smith&Bob Valentine:Intel Core Microarchitecture,wikichip,中信證券研究部奔騰移動端微架構命名為Banias,基于基于P6架構而來架構而來,其中產生了 Pentium III M 的Tualatin等經典
117、核心,成為后來成為后來Core Duo的的核心架構基礎核心架構基礎Pentium時代時代Intel的四大架構的四大架構Pentium時代,x86指令集暴露的出多種問題仍然存在,因此繼繼i960/i860后后,Intel也也在在x86之外進行探索之外進行探索,產出了不與此前兼容產出了不與此前兼容的的64位位Itanium系列系列處 理 器處 理 器,并 收 購 了并 收 購 了ARM架構的架構的Xscale處處理器理器,但反而都不如但反而都不如x86 的的 Pentium 系 列系 列成功成功493.4.1.奔騰時代:奔騰時代:P5,雙流水線實現超標量,雙流水線實現超標量,SIMD強化多媒體強化
118、多媒體P5-1993工藝:0.8/0.6/0.35m晶體管數量:3.1m,4.5m(Pentium MMX)主頻:66MHzPentium采用U、V雙流水線(雙流水線(5級,僅支持整型),實現了多指令發射級,僅支持整型),實現了多指令發射/超標量,其中超標量,其中U流水線可執行任意整型指令,流水線可執行任意整型指令,V流水線只能執行簡單指流水線只能執行簡單指令;令;L1增大為增大為16KB,并且分成,并且分成L1I和和L1D;引入分支預測,;引入分支預測,1997推出Pentium MMX,其流水線可處理浮點數,級數從,其流水線可處理浮點數,級數從5增加到增加到6(F階段進行前綴解碼等);19
119、98 AMD 3D Now!可處理單精度FPPentium處理器內部架構,雙流水線、雙處理器內部架構,雙流水線、雙L1緩存、分支預測緩存、分支預測Pentium與與Pentium MMX超標量流水線時空圖超標量流水線時空圖資料來源:Intel Pentium Processor Family Developers Manual(1997)資料來源:Intel Pentium Processor Users Manual Volume 1(1993),中信證券研究部503.4.2.奔騰時代:奔騰時代:P6,采用亂序執行,流水線支持浮點,采用亂序執行,流水線支持浮點資料來源:Pentium Pro
120、 Family Developers Manual Volume 2(1996),中信證券研究部P6-1995工藝:350nm(Pentium Pro/P2 Klamath),250nm(P2M Tonga,P2 Deschutes),180nm(P3)晶體管數量:5.5m(Pentium Pro),7.5m(P2 Klamath),9.5m(P3)主頻:150MHz(P Pro),300MHz(P2 Klamath),500MHz(P3)1995 Pentium Pro使用12級流水線,每一級比級流水線,每一級比Pentium快快33%;采用超標量設計,共超標量設計,共3條流水線條流水線,其
121、中2條支持整型,1條支持浮點;支持亂序執行亂序執行;集成二級片上緩存集成二級片上緩存1998推出Celeron,在Pentium的基礎上去掉片上L2緩存1998年推出Xeon1999年Pentium III增加SSE指令集指令集,支持浮點向量運算Pentium Pro架構框圖架構框圖P6堪稱堪稱Intel歷史上最重要的架構之一歷史上最重要的架構之一,覆蓋了奔騰覆蓋了奔騰Pro、奔騰奔騰2、奔騰奔騰3三代產品三代產品,并且在并且在P6架構上衍生出架構上衍生出Xeon至至強強、Celeron賽揚賽揚、Centrino迅馳三條著名的產品線迅馳三條著名的產品線,分分別面向服務器別面向服務器、低端桌面級
122、低端桌面級、移動端三大市場移動端三大市場,后續的后續的Core架構也是在架構也是在P6架構的奔騰架構的奔騰3移動版基礎上改進而來移動版基礎上改進而來奔騰Pro是P6架構的首款處理器,最重要的改變是引入了亂序執行,具體來說包含寄存器重命名、指令重排序等技術資料來源:Pentium Pro Family Developers Manual Volume 2(1996),中信證券研究部513.4.3.奔騰時代:奔騰時代:Netburst超深流水線沖擊高頻,面臨功耗問題超深流水線沖擊高頻,面臨功耗問題整個整個Netburst架構的核心目標就是高頻架構的核心目標就是高頻,超深流水線為此目標服務超深流水線
123、為此目標服務,最終撞上功耗墻最終撞上功耗墻,實現實現3.8GHz主頻主頻,對應的奔騰對應的奔騰4產品線也因此失敗產品線也因此失敗由于效果不佳,原計劃推出的Enhanced Netburst架構于2004年取消Netburst-2000工藝:180nm(Willamette),130nm(Northwood),90nm(Prescott)晶體管數量:42m(Willamette),55m(Northwood),169m(Prescott)主頻:1.5GHz(Willamette),3.8GHz(Prescott)2002年P4 Northwood引入超線程超線程(Hyper-Threading為
124、分時多線程技術);支持三級三級緩存緩存;超流水線超流水線(雙ALU);超深流水線超深流水線,Willamette 20級,級,Prescott 31級級;Prescott AMD64;2005 Pentium D雙核21世紀初業內對功耗墻的認知還不夠清晰,目標不切實際,認為5年后就能實現10GHz“These clock rates for future IA-32 processor based on the Intel NetBurst micro-architecture is expected to reach 10 GHz.”資料來源:wikichip:Enhanced Netbur
125、st,中信證券研究部處理器頻率發展趨勢與處理器頻率發展趨勢與Intel預期預期資料來源:wikichip:Enhanced Netburst,中信證券研究部523.5 多核時代:性能轉向能效,市場持續正反饋多核時代:性能轉向能效,市場持續正反饋資料來源:wind,中信證券研究部2006-2015年年 Intel與與AMD股價股價奔騰時代末期奔騰時代末期,基本只剩下基本只剩下Intel、AMD兩大主流廠商占據兩大主流廠商占據PC市場市場,服務器市場的大多數非服務器市場的大多數非x86廠商也已經退出廠商也已經退出。Core架構是架構是Intel、AMD競爭的一個關鍵轉折點競爭的一個關鍵轉折點,In
126、tel在此代產品選擇放棄Netburst架構,退回到移動端P6架構,不再單不再單一追求單核性能一追求單核性能,而是轉向能效比以及多核性能而是轉向能效比以及多核性能,并且接連推出雙核與并且接連推出雙核與4核產品核產品,產品節奏加快產品節奏加快,迫使迫使AMD再次退守低再次退守低端市場端市場,Intel利用利用Tick-Tock戰略持續擴大優勢戰略持續擴大優勢。Intel Tick-Tock能夠奏效的一個關鍵原因是從能夠奏效的一個關鍵原因是從“三軌并行三軌并行”的狀態的狀態(服務器端Itanium架構/產品線,桌面端Netburst架構/奔騰產品線,筆記本端Pentium M/迅馳產品線)轉向統一
127、的酷睿架構轉向統一的酷睿架構,研發資源高度集中研發資源高度集中,形成對形成對AMD的資源優勢的資源優勢。051015202530354045051015202530352006-012006-032006-052006-072006-092006-112007-012007-032007-052007-072007-092007-112008-012008-032008-052008-072008-092008-112009-012009-032009-052009-072009-092009-112010-012010-032010-052010-072010-092010-112011-0
128、12011-032011-052011-072011-092011-112012-012012-032012-052012-072012-092012-112013-012013-032013-052013-072013-092013-112014-012014-032014-052014-072014-092014-112015-012015-032015-052015-072015-092015-11英特爾復權收盤價(左軸)AMD復權收盤價(右軸)Nehalem架構,初代酷睿iCore架構,初代酷睿Sandy Bridge架構,第2代酷睿iHaswell架構,第4代酷睿iSkylake架構
129、,第6代酷睿i53功耗P與電壓的三次方成正比,或與頻率的三次方成正比,同樣工藝下頻率與電壓成正比隨著主頻不斷提升隨著主頻不斷提升,處理器功耗明顯提升處理器功耗明顯提升,甚至單個指令的功耗也不斷提升甚至單個指令的功耗也不斷提升靠單核性能提升不可持續,面臨功耗墻,必須采用其他方法提升處理器整體性能多核心資料來源:Intel IDF 2006:Intel DEG CTO Steve Pawlowski:Intel Core Microarchitecture資料來源:Intel IDF 2006:Intel CTO Justin Rattner:Energy:The Next Frontier199
130、0-2005處理器功耗指數級增加處理器功耗指數級增加歷代歷代Pentium處理器單指令能耗不斷增加處理器單指令能耗不斷增加3.5.多核時代:單核性能面臨功耗墻,多核成為必然選擇多核時代:單核性能面臨功耗墻,多核成為必然選擇54Core架構的誕生也伴隨第一代架構的誕生也伴隨第一代Core CPU的誕生的誕生,能效大幅提升能效大幅提升,相比相比2005年的奔騰年的奔騰4,2006年的年的Core Duo處理器執行處理器執行一條指令的能耗只有原來的一條指令的能耗只有原來的20%左右左右,同等功率下同等功率下,服務器端服務器端Core處理器性能表現提高處理器性能表現提高80%。優秀的表現讓優秀的表現讓
131、Intel在在PC與與服務器市場重新獲取主動權服務器市場重新獲取主動權,在多年內沒有受到有力挑戰在多年內沒有受到有力挑戰。資料來源:Intel IDF 2006:Intel CTO Justin Rattner:Energy:The Next Frontier,wikichipCore架構以能效為首要考量,實現單指令功耗大幅下降架構以能效為首要考量,實現單指令功耗大幅下降3.5.1.Core:功耗墻解決方案,能效表現飛躍提升:功耗墻解決方案,能效表現飛躍提升Core架構實現架構實現SPEC整數性能大幅提升整數性能大幅提升資料來源:Intel Software College:Processor
132、 Architecture-Core,wikichip,中信證券研究部(左上圖、左下圖)Core-2006/4工藝:65nm制程,面積143mm2(Woodcrest)晶體管數量:291m(Woodcrest)技術突破:共享二級緩存共享二級緩存,真正意義上的雙核處理器真正意義上的雙核處理器,從高主頻路線轉向多核路線,降低流水線級數降低流水線級數(14),能效成倍提升;SSE酷睿相比前代,同等功率下SPEC跑分甚至可提高80%,性能明顯提升55Core架構為何能夠如此成功架構為何能夠如此成功?主要原因是主要原因是Intel完成了兩大戰略方向轉變完成了兩大戰略方向轉變,第一是產品研發思路轉變第一是
133、產品研發思路轉變,收縮產品線收縮產品線,集中集中全部研發資源設計全部研發資源設計Core,第二是營銷思路轉變第二是營銷思路轉變,從追求極致高頻性能轉向寧可降低主頻從追求極致高頻性能轉向寧可降低主頻,追求綜合能效追求綜合能效。Intel全面轉向全面轉向Core架構,全面集中戰略資源架構,全面集中戰略資源3.5.1.Core:成功源自戰略轉向,追求高能效與研發資源集中:成功源自戰略轉向,追求高能效與研發資源集中資料來源:Intel IDF 2006:Intel DEG VP Stephen L.Smith&Intel IAG Architect Bob Valentine:Intel Core M
134、icroarchitecture,中信證券研究部資料來源:Intel IDF 2006:Intel CTO Justin Rattner:Energy:The Next Frontier,中信證券研究部Intel戰略思想改變,降頻求能效提升戰略思想改變,降頻求能效提升降頻20%,能耗降低49%,性能只降低14%超頻20%,性能提升13%,能耗提升73%Woodcrest、Conroe、Merom分別是Core架構的服務器、桌面、移動版本,架構統一化集中研發資源56從更具體的技術層面看,Core的成功有何架構技術基礎?Core架構以此前表現優異的的Pentium III-M處理器Tualatin
135、核心為基礎,融合Netburst架構新技術創新而成。Core包含五大核心架構創新:寬動態執行(4流水線,深度14級),數字媒體加速(SSE4指令集),智能緩存(共享L2),智能內存訪問(改進指令預取,內存消歧),先進功耗調節(降低頻率)資料來源:Intel Software College:Processor Architecture-Core,wikichip資料來源:Intel IDF 2006:Intel CTO Justin Rattner:Energy:The Next Frontier,wikichip,中信證券研究部Core架構框圖架構框圖Core架構五大新技術架構五大新技術3.
136、5.1.Core:Tualatin核心改進為核心改進為Conroe核心,降頻融核獲取高能效核心,降頻融核獲取高能效4寬度14級流水線;微指令融合單周期128位SSE(SSE4.1)共享L2緩存先進指令預??;內存消歧先進功耗調節57資料來源:Intel IDF 2008:Steve Gunther&Ronak Singhal:Nehalem Family,中信證券研究部NehalemNehalem增加增加L3L3緩存并且每個核心都有緩存并且每個核心都有QPIQPI高速總線高速總線3.5.2.Nehalem:初代:初代Core i,總線,總線/訪存訪存/緩存為多核深入優化緩存為多核深入優化Neha
137、lem-2008/8工藝:45nm HKMG,面積263mm2(Bloomfield)晶體管數量:731m(Bloomfield)技術突破:單芯片單芯片4核,三級緩存,核,三級緩存,QPI總線,總線,Ringbus,睿,睿頻技術(頻技術(Turbo Boost),單核心功耗控制,),單核心功耗控制,SSE4.2資料來源:wikichip:coffee lake,中信證券研究部初代初代CoreCore架構與架構與NehalemNehalem芯片架構的區別芯片架構的區別Nehalem架構對應初代酷睿架構對應初代酷睿i CPU,從此酷睿系列產品線有了比較明確的產品檔次劃分和命名方式從此酷睿系列產品線
138、有了比較明確的產品檔次劃分和命名方式,對于營銷有利對于營銷有利。從架構與技術角度來看從架構與技術角度來看,Nehalem架構擴大了架構擴大了Core的技術優勢的技術優勢,進一步樹立了進一步樹立了Core i系列高性能形象系列高性能形象??偩€方面,Nehalem用QPI總線取代了原先的FSB總線,每個核心可以單獨訪問外部,無需像原來一樣多個核心競爭FSB總線帶寬,在總線方面也做到不輸AMD緩存方面,Nehalem架構在芯片內部集成了共享L3,比初代Core只有L2性能更強內存訪問方面,Nehalem架構直接在芯片內集成了內存控制器,而不是原先的分立芯片,訪存性能大幅提升58資料來源:Intel
139、IDF 2008:Steve Gunther&Ronak Singhal:Nehalem Family超線程技術回歸為超線程技術回歸為NehalemNehalem架構帶來架構帶來SPECSPEC性能大幅提升性能大幅提升資料來源:Intel IDF 2008:Steve Gunther&Ronak Singhal:Nehalem FamilyNehalemNehalem首次允許不同核心進入不同工作狀態并分別管理功耗首次允許不同核心進入不同工作狀態并分別管理功耗3.5.2.Nehalem:允許每個核心單獨調節功耗,超線程技術回歸:允許每個核心單獨調節功耗,超線程技術回歸Nehalem架構對應初代酷
140、睿架構對應初代酷睿i CPU,從此酷睿系列產品線有了比較明確的產品檔次劃分和命名方式從此酷睿系列產品線有了比較明確的產品檔次劃分和命名方式,對于營銷有利對于營銷有利。從架構與技術角度來看從架構與技術角度來看,Nehalem架構擴大了架構擴大了Core的技術優勢的技術優勢,進一步樹立了進一步樹立了Core i系列高性能形象系列高性能形象。經過幾年前奔騰4、Core的市場教育,超線程技術接受度得到提高,更多應用支持超線程;并且Nehalem的總線帶寬明顯改善。兩方面因素為超線程技術回歸創造了條件,Nehalem超線程為其帶來了明顯的性能提升,在部分應用中可達30%以上。由于核心數較多,不同核心負責
141、不同任務,則每個核心單獨控制最有利于控制功耗。Nehalem首次能夠讓不同核心單獨控制功耗狀態。圖中展示了4核心處理器在不同核心執行不同任務時的功耗狀態,如果核心閑置,功耗可以非常接近于0。59資料來源:wikichip:Coffee Lake,中信證券研究部Sandy Bridge Sandy Bridge 架構相比前代變化架構相比前代變化資料來源:wikichip:Sandy Bridge(client),中信證券研究部Sandy Bridge 4Sandy Bridge 4核版本核版本 die shotdie shot3.5.3.Sandy Bridge:Netburst后首個全新微架構
142、,重點轉向后首個全新微架構,重點轉向SoC層面層面2010/9工藝:32nm HKMG,面積216mm2(4核心GT1)晶體管數量:1.16b(4核心GT1)技術突破:融合融合P6衍生系列與衍生系列與Netburst,首次將集顯、內存,首次將集顯、內存控制器、外部總線控制器集成在核心單芯片,控制器、外部總線控制器集成在核心單芯片,AVX指令集,指令集,Ring bus實現可擴展,睿頻實現可擴展,睿頻2.0Sandy Bridge對應第二代對應第二代Core i以及第一代至強以及第一代至強E5,集成了集成了GPU和系統代理和系統代理(包含各類對外連接包含各類對外連接),有較明顯的性能提有較明顯的
143、性能提升升,整體性價比進一步增強整體性價比進一步增強,強化強化Intel市場地位市場地位。Sandy Bridge將DMI總線、PCIe接口、顯示控制等外部接口整合到System Agent部分,同時集成核顯,提高集成度和性價比。Sandy Bridge用Ring bus取代了QPI總線,不同核心之間的協作更加緊密,延遲降低,帶寬提高,對多核性能有提升60資料來源:wikichip:Sandy Bridge(client),中信證券研究部從從P5P5架構到架構到Sandy BridgeSandy Bridge架構的演進,博采眾長使架構的演進,博采眾長使4 4代代Core Core i i成為經
144、典成為經典3.5.3.Sandy Bridge:Netburst后首個全新微架構,重點轉向后首個全新微架構,重點轉向SoC層面層面資料來源:AnandTech:Intel Haswell Architecture AnalyzedNehalemNehalem前端前端資料來源:AnandTech:Intel Haswell Architecture Analyzed,中信證券研究部Sandy BridgeSandy Bridge前端前端此前的奔騰M、Core、Nehalem等架構都是基于 P6 改 進 而 來,與Netburst完全獨立,而Sandy Bridge經過全新設計,融合了Netbur
145、st相關技術,比如增加了解碼后微指令緩存等結構,博采眾長,性能優秀。Sandy Bridge新增微指令緩存,近期已經解碼過的指令無需再進行解碼,能夠大大節約前端解碼單元功耗Sandy Bridge全新設計分支預測器,提升準確率,提升單核性能613.5.4.Haswell:延續:延續Sandy Bridge架構,針對筆電強化超低功耗表現架構,針對筆電強化超低功耗表現Haswell 2013/6工藝:22nm FinFET,面積177mm2(4核心GT2)晶體管數量:1.4b(4核心GT2)技術改進:能效比達到Nehalem 3.5倍,緩存間帶寬翻倍,DDR4,AVX2指令集,BMI1/BMI2指
146、令集,FMA3指令集Sandy BridgeSandy Bridge(上)與(上)與HaswellHaswell(下)(下)SoCSoC結構大體相同結構大體相同資料來源:wikichip前四代前四代Core Core i i核心閑置功耗核心閑置功耗資料來源:IDF2012,AnandTechHaswell深度優化了處理器能耗,調整了睡眠設置,使處理器閑置能耗降低到原來的十分之一以下。自自Core以來以來,Intel就將關注重點從桌面轉向筆記本電腦就將關注重點從桌面轉向筆記本電腦,因因此功耗控制愈發重要此功耗控制愈發重要,第四代第四代Core i所對應的所對應的Haswell架構對架構對功耗進行
147、了深入優化功耗進行了深入優化,讓筆記本電腦續航大幅增加讓筆記本電腦續航大幅增加,進一步增進一步增強強Intel在筆電市場的競爭力在筆電市場的競爭力。資料來源:IDF2012,AnandTech,中信證券研究部62Sandy BridgeSandy Bridge核心架構后端核心架構后端3.5.4.Haswell:延續:延續Sandy Bridge架構,更多執行單元,架構,更多執行單元,IPC小幅增強小幅增強HaswellHaswell核心架構后端核心架構后端資料來源:wikichip,real world technologies資料來源:wikichip,中信證券研究部性能方面性能方面Hasw
148、ell架構也比前代有所改進架構也比前代有所改進,全面增強筆記本市場競爭力全面增強筆記本市場競爭力。核心微架構方面,前端部分與Sandy Bridge相差不多,主要改進集中在后端,包括更大的亂序執行相關緩存,更多的指令執行單元,更大的讀寫緩存等。讀寫性能增強更多執行單元/發射端口亂序執行增強63資料來源:Intel IDF 15:Intel SPE Julius Mandelblat:Code Name Skylake,wikichip,中信證券研究部SkylakeSkylake架構主要改進架構主要改進3.5.5.Skylake:主要改進在于:主要改進在于SoC層面集成層面集成ISP、eDRAM
149、Skylake client-2015/8工藝:14nm FinFET,面積101.83mm2(2核心GT2)晶體管數量:1.75b(2核心GT2)技術改進:尺寸減小,可擴展性增強,多媒體功耗降低,集成ISP,增強超頻能力,核顯、內存、ringbus改進,軟件防護與內存保護擴展,DMI3.0,同頻整數性能提升10%Skylake與上一代架構與上一代架構Haswell乃至再上一代乃至再上一代Sandy Bridge相比相比,單核微架構方面改進并不多單核微架構方面改進并不多,微架構已經開始逐微架構已經開始逐漸飽和漸飽和,主要改進放在了主要改進放在了SoC層面層面,但由于市場缺乏有力競爭者但由于市場
150、缺乏有力競爭者,Intel仍然占據完全主導地位仍然占據完全主導地位。SoC層面改進主要包括集成了相機ISP、嵌入式DRAM控制器、更高分辨率顯示支持、輸入輸出接口集成等。資料來源:Intel IDF 15:Intel SPE Julius Mandelblat:Code Name Skylake64資料來源:wikichip:Skylake(client)Skylake die shotSkylake die shot資料來源:wikichip:Sandy Bridge(client)Sandy Bridge die shotSandy Bridge die shot3.5.5.Skylake
151、:芯片布局更改,通信效率與面積利用率更高:芯片布局更改,通信效率與面積利用率更高Skylake與上一代架構與上一代架構Haswell乃至再上一代乃至再上一代Sandy Bridge相比相比,單核微架構方面改進并不多單核微架構方面改進并不多,微架構已經開始逐漸飽微架構已經開始逐漸飽和和,主要改進放在了主要改進放在了SoC層面層面,但由于市場缺乏有力競爭者但由于市場缺乏有力競爭者,Intel仍然占據完全主導地位仍然占據完全主導地位。SoC布局方面,Skylake將四個核心從Nehalem時代開始的直線布局調整成為田字格布局,核心間距離更短,通信延遲更小,且芯片面積利用率更高。此外核顯面積明顯加大。
152、653.5.5.Skylake:單核改進不大,以量變為主:單核改進不大,以量變為主SkylakeSkylake消費端核心架構后端消費端核心架構后端資料來源:wikichip,中信證券研究部SkylakeSkylake消費端核心架構前端消費端核心架構前端資料來源:wikichip,中信證券研究部Skylake與上一代架構與上一代架構Haswell乃至再上一代乃至再上一代Sandy Bridge相比相比,單核微架構方面改進并不多單核微架構方面改進并不多,微架構已經開始逐漸飽微架構已經開始逐漸飽和和,主要改進放在了主要改進放在了SoC層面層面,但由于市場缺乏有力競爭者但由于市場缺乏有力競爭者,Int
153、el仍然占據完全主導地位仍然占據完全主導地位。單核前端主要是加大了指令隊列、微指令緩存等,后端主要加強亂序執行性能,整體來看并無技術突破整體來看并無技術突破,主要是量變主要是量變。亂序執行增強指令隊列增強663.5.5.Skylake:服務器與桌面端首次核心不同,支持:服務器與桌面端首次核心不同,支持SIMD增強增強AI計算計算SkylakeSkylake服務器端核心架構后端服務器端核心架構后端資料來源:wikichip:Skylake(Server),中信證券研究部Skylake SP/X/W-2017/5工藝:14nm FinFET,面積694mm2(28核)此前從此前從Celeron到到
154、Xeon都使用相同核都使用相同核心架構心架構,Skylake首次為桌面端和服首次為桌面端和服務器端構建不同核心務器端構建不同核心。服務器端主要服務器端主要強化強化SIMD,有向有向AI邁進的趨勢邁進的趨勢,其其對應產品為第一代至強可擴展對應產品為第一代至強可擴展,命名命名方式也從方式也從E3/5/7更換為更換為Platinum、Gold、Silver、Bronze。服務器端核心相比桌面端改進主要在后端,強化了SIMD性能,前端基本保持一致首次支持AVX-512,port 0/1可融合支持512位指令,port 4/5直接支持512位操作67資料來源:wikichip:Skylake(Serve
155、r)SkylakeSkylake SPSP XCC die shotXCC die shot3.5.5.Skylake:服務器端使用可擴展設計方便堆核:服務器端使用可擴展設計方便堆核SkylakeSkylake SPSP XCC XCC 架構圖與架構圖與MeshbusMeshbus資料來源:wikichip:Skylake(Server)服務器端在服務器端在SoC層面的改進:核心間互聯從層面的改進:核心間互聯從ringbus改為改為meshbus,采用高度可擴展設計采用高度可擴展設計,可便捷組成不同核心數的可便捷組成不同核心數的設計設計,處理器間使用處理器間使用UPI互聯互聯。這一類改進主要方
156、便堆核這一類改進主要方便堆核。Mesh架構主要構成要素包括Mesh(橫向與縱向的半個ringbus構成的網),Tile(模塊化可復制的核心IP塊,其中又分為Core Tile和IMC Tile,即integrated memory controller Tile),CHA(Caching/Home Agent,用于維持緩存一致性),CMS(Converged/Common Mesh Stop)683.6 減速時代:架構改進取決于工藝,集成與異構成為新趨勢減速時代:架構改進取決于工藝,集成與異構成為新趨勢資料來源:wind,中信證券研究部2016-2022 Intel與與AMD股價股價Skyla
157、ke架構后架構后,Intel工藝進展不順工藝進展不順,連帶架構也難以迭代連帶架構也難以迭代,導致產品性能逐漸被趕超導致產品性能逐漸被趕超,AMD利用開放大生態是一個關利用開放大生態是一個關鍵原因鍵原因。官方宣布Tick-Tock兩年周期變為PAO(工藝,架構,優化)三年周期,實際周期明顯超過三年工藝放緩與單核架構成熟已成為明顯趨勢工藝放緩與單核架構成熟已成為明顯趨勢,通過增加核心通過增加核心、異構集成等方式提升系統整體性能成為不得不走的道路異構集成等方式提升系統整體性能成為不得不走的道路。020406080100120140160180010203040506070英特爾復權收盤價(左軸)AM
158、D復權收盤價(右軸)Coffee Lake架構,8代酷睿iKaby Lake架構,7代酷睿iCoffee Lake R架構,9代酷睿iComet Lake架構,10代酷睿i桌面端693.6.1.多核時代的停滯:多核時代的停滯:Skylake后,工藝停滯,架構基本不變后,工藝停滯,架構基本不變更先進的微架構需要晶體管來實現,更多晶體管勢必要求更大的面積,更大的面積帶來更低的良率與更高的成本工藝的停滯導致面積無法縮小工藝的停滯導致面積無法縮小,對架構的提升有明顯制約作用對架構的提升有明顯制約作用原計劃接替Skylake的第一代第一代10nm處理器處理器Cannon Lake由于制程延遲而未真正大規
159、模量產由于制程延遲而未真正大規模量產,對應的對應的Palm Cove核心也被核心也被取消取消,僅有一款Core i3-8121U雙核芯片在2017年底進行了少量生產,并應用在一款面向教育市場的聯想筆記本Ideapad330和Intel Crimson Canyon NUC等極少數產品,且該芯片無法使用核顯,2020年Linux中上萬行服務Cannon Lake核顯的代碼被刪除2019年量產年量產10nm產品產品,直到直到2021年年7月月Intel才官方證實才官方證實10nm晶圓產量超過晶圓產量超過14nm,期間期間Intel為保持產品節奏臨時增加為保持產品節奏臨時增加了了Kaby Lake、
160、Coffee Lake(包含包含Amber Lake、Whiskey Lake兩款低功耗核心兩款低功耗核心)、Comet Lake三代三代14nm產品產品,而而架構層面幾乎沒有變化架構層面幾乎沒有變化,均維持著與均維持著與Skylake相同的相同的IPC,僅有主頻、內存頻率、chipset、核心數量、核顯等方面提升IntelIntel臨時增加的臨時增加的14nm14nm架構架構資料來源:wikichip:Sunny CoveIntelIntel歷代歷代14nm14nm工藝主要增強了驅動電流,有利于提高頻率并降低同頻功耗工藝主要增強了驅動電流,有利于提高頻率并降低同頻功耗資料來源:wikichi
161、p:Coffee Lake703.6.1.多核時代的停滯:多核時代的停滯:Skylake后,工藝停滯,架構基本不變后,工藝停滯,架構基本不變Kaby Lake 2016/8工藝:14nm+,126mm2(4核GT2,24EU)變動:沿用沿用Skylake核心架構核心架構,核顯從Gen9升級為Gen9.5,主頻提升主頻提升15%,內存頻率從2133升級到2400,增加Optane支持,臺式奔騰增加超線程支持Coffee Lake 2017/10工藝:14nm+,126mm2(4核GT2,24EU)變動:沿用沿用Skylake核心架核心架構構,沿用Gen9.5核顯,相比上代4核心,增加增加6核產品
162、核產品,LLC相應從8MB增加到12MB,(i3從2c到4c,i5/i7從4c到6c),chipset升級USB/WiFi工藝停滯時代的產品受到面積限制,為維持良率和成本,給新架構提供新空間較為困難,如果只是堆核心,則成本比較可控,可屏蔽損壞的核心,將產品放到下一檔次出售Comet Lake 2019/8工藝:14nm+變動:沿用沿用Skylake核心架核心架構構,沿用Gen9.5核顯,核心核心數從數從8增加到增加到10,LLC相應從16MB增加到20MB,chipset升級2.5G以太網與WiFi6支持,芯片減薄以增加散熱Coffee Lake Refresh 2018/10工藝:14nm+
163、,174mm2(8核)變動:沿用沿用Skylake核心架核心架構構,增加增加8核產品核產品,LLC相應從12MB增加到16MB資料來源:wikichip:Coffee Lake,中信證券研究部713.6.1.多核時代的停滯:多核時代的停滯:Skylake后,工藝停滯,架構基本不變后,工藝停滯,架構基本不變資料來源:Intel 2019 Investor Meeting,wikichip,中信證券研究部Intel服務器服務器CPU路線圖路線圖服務器端,隨著工藝制程的停滯,架構也隨之停滯,Skylake SP后兩代產品Cascade Lake和Copper Lake均沿用Skylake架構,導致產
164、品性能提升緩慢,相對AMD的原有優勢逐漸減弱,乃至被反超Cascade Lake 2019/4工藝:14nm FinFET變化:沿用沿用Skylake SP內核,芯片產品與內核,芯片產品與Skylake引腳兼容(引腳兼容(LGA-3647),增加),增加9200系列(系列(Cascade Lake AP,核心數量增加,最多可達,核心數量增加,最多可達56核以及核以及12個個DDR4通通道)道),繼續使用UPI連接,主頻提升,內存頻率與容量提升,增加Optane支持Copper Lake 2020/6工藝:14nm FinFET變化:單CPU支持UPI連接數從連接數從3提升到提升到6,內存頻率升
165、高,封裝變為LGA-4189,支持支持BFloat16數據格式以增強數據格式以增強AI性能性能三代產品架構本質上都是Skylake,四年內性能提升較小723.6.1.多核時代的停滯:多核時代的停滯:Skylake后,工藝停滯,架構基本不變后,工藝停滯,架構基本不變服務器端,隨著工藝制程的停滯,架構也隨之停滯,Skylake SP后兩代產品均沿用Skylake架構,Intel開始采用集成和堆核的方式提高產品性能,比如至強9200系列是由2個8200封裝而成,達到核心數翻倍的效果。兩個兩個8200封裝成一個封裝成一個9200,并可采用,并可采用UPI互聯互聯資料來源:wikichip:Cascad
166、e Lake AP,中信證券研究部每個9200內部都是兩個8200CPU73資料來源:wikichip:Ice Lake(client),中信證券研究部集成集成TB3TB3前(上)與集成后(下)外部布線情況前(上)與集成后(下)外部布線情況資料來源:wikichip:Ice Lake(client)Ice LakeIce Lake SoCSoC架構架構3.6.2.Ice Lake:工藝重啟帶動架構迭代,:工藝重啟帶動架構迭代,CPU集成雷電接口集成雷電接口2019/5工藝:10nm,122.52mm2(4核)技術突破:采用全新采用全新Sunny Cove核心,核心,IPC大幅提升,集成大幅提升
167、,集成Thunder Bolt 3控制器,集成神經網絡處理器控制器,集成神經網絡處理器GNA、第四代、第四代IPU,與與PCH共封裝,采用共封裝,采用OPI互聯互聯工藝提升帶動集成度和架構再次提升工藝提升帶動集成度和架構再次提升。Ice Lake集成雷電集成雷電3(TB3)接口和神經網絡加速器接口和神經網絡加速器(GNA),為近年來最大規模集為近年來最大規模集成成,同時核心提升也是近年來最大同時核心提升也是近年來最大,可見工藝對架構的重要性可見工藝對架構的重要性集成雷電3接口前,外部需要配置Titan Ridge專用芯片來接入外部設備集成雷電3接口后,外部布線大幅簡化743.6.2.Sunny
168、 Cove:工藝重啟帶動架構迭代,:工藝重啟帶動架構迭代,IPC提升提升18-20%資料來源:wikichip:Sunny Cove,中信證券研究部Sunny Cove微架構前端微架構前端Sunny Cove用于用于Ice Lake架構的架構的10代移動端酷睿代移動端酷睿,工藝制程提升帶來充足的架構升級空間工藝制程提升帶來充足的架構升級空間,為為Skylake后第一次大改后第一次大改,SPEC測試中測試中IPC提升提升18-20%,10代酷睿暫時在一定程度上緩解了來自代酷睿暫時在一定程度上緩解了來自AMD的進攻勢頭的進攻勢頭指令集方面推出SHA指令與AVX-512擴展,支持神經網絡計算,服務器
169、端還包含內存加密指令等相比Skylake微架構全方位提升,從前端來看,解碼緩存和指令隊列增加,能夠讓后端利用率更高SkylakeSkylake消費端核心架構前端消費端核心架構前端資料來源:wikichip753.6.2.Sunny Cove:工藝重啟帶動架構迭代,:工藝重啟帶動架構迭代,IPC提升提升18-20%資料來源:wikichip:Sunny Cove,中信證券研究部Sunny Cove微架構后端微架構后端Sunny Cove用于用于Ice Lake架構的架構的10代移動端酷睿代移動端酷睿,工藝制程提升帶來充足的架構升級空間工藝制程提升帶來充足的架構升級空間,為為Skylake后第一次
170、大改后第一次大改,SPEC測試中測試中IPC提升提升18-20%,10代酷睿暫時在一定程度上緩解了來自代酷睿暫時在一定程度上緩解了來自AMD的進攻勢頭的進攻勢頭相比Skylake微架構全方位提升,后端發射端口數量增加到10個,分支預測與亂序執行相關緩存也大幅增加,LSU、AGU增加SkylakeSkylake消費端核心架構后端消費端核心架構后端資料來源:wikichip發射端口增加亂序執行強化各類緩存增加讀寫性能強化執行單元增加分支預測強化763.6.3.Rocket Lake/Tiger Lake:Sunny Cove基礎上小改,提升不大基礎上小改,提升不大資料來源:Intel 2019 I
171、nvestor MeetingIce Lake到到Tiger Lake路線圖路線圖Rocket Lake 2021/3工藝:14nm變化:采用Cypress Cove核心,核心,該核心實際為Sunny Cove的14nm放大版,用于桌面端Tiger Lake 2020/9工藝:10nm變化:換用Willow Cove核心核心,該核心在Sunny Cove基礎上擴大了L2/L3緩存,增加了LPDDR5支持,提高內存帶寬,增加內存加密功能Tiger Lake和Rocket Lake分別用于11代酷睿的移動端和桌面端,本質上都是Sunny Cove的小改版,性能提升不明顯,因此在市面上也未能取得良好
172、進展,市場進一步被AMD占據。資料來源:Intel 2019 Investor Meeting,中信證券研究部資料來源:wikichip,中信證券研究部773.7.異構時代:核心微架構基本成熟,場景優化成為關鍵異構時代:核心微架構基本成熟,場景優化成為關鍵資料來源:Intel Architecture Day 2018(含預測),wikichip,中信證券研究部Intel異構核心路線圖異構核心路線圖自Sandy Bridge后,SoC架構演架構演進有所放緩進有所放緩,Skylake后進一步放緩單核微架構主要單核微架構主要技術在多年前就技術在多年前就已成熟已成熟指令集發展也較指令集發展也較為成熟
173、為成熟,邊際效用遞減,AVX-512等新指令集在大多數場景未收到良好效果借鑒借鑒ARM領域,領域,異構集成提高能異構集成提高能效成為下一步的效成為下一步的合理選擇合理選擇LakeFieldAlder Lake783.7.1.Lakefield:1 Sunny Cove+4 Tremont,異構集成牛刀初試,異構集成牛刀初試資料來源:Intel 2019 Investor Meeting,wikichip,中信證券研究部Intel Lakefield產品主要特點產品主要特點Sunny Cove大核提升單核性能大核提升單核性能4個個Tremont小核心有更好的多線程表現小核心有更好的多線程表現La
174、kefield 2019工藝:10nm計算核心+22nm基礎電路變化:采用采用1 Sunny Cove+4 Tremont的一大四小異構集成設計,能夠針對不同應用發的一大四小異構集成設計,能夠針對不同應用發揮最佳效果,能效比顯著提升,采用揮最佳效果,能效比顯著提升,采用Foveros先進封裝,先進封裝,10nm和和22nm共同封裝降低成共同封裝降低成本本根據2020架構日,混合架構給混合架構給LakeField降低降低91%待機功耗,提高待機功耗,提高24%高功率能效比,操高功率能效比,操作系統優化可進一步提高作系統優化可進一步提高33%網絡表現,提高網絡表現,提高17%能效能效資料來源:IE
175、EE Hot chips 2019,wikichip資料來源:IEEE Hot chips 2019,wikichip作為Intel首款異構集成產品,初步驗證了異構集成的可行性和優越性資料來源:Intel 2019 Investor Meeting,Intel architecture day 2020,wikichip,中信證券研究部79英特爾為異構處理器同步開發線程調度器英特爾為異構處理器同步開發線程調度器ITD(Intel ThreadDirector),調度協調兩類核心調度協調兩類核心,并與微軟合作并與微軟合作,優化了優化了ITD在在Windows 11上的性能上的性能ITD應用全新的
176、EcoQoS分類,使調度程序能夠判斷線程是更傾向于能效還是性能,決定線程是否會被調度到能效核。優先任務使用P核,后臺任務使用E核,AI線程使用P核,循環等待線程使用E核。資料來源:Intel Architecture Day 2021資料來源:Intel Architecture Day 2021Alder Lake 模塊化設計模塊化設計Intel線程調度器邏輯線程調度器邏輯3.7.2.Alder Lake:深度改進大小核異構,模塊化設計便于擴展:深度改進大小核異構,模塊化設計便于擴展Alder Lake 2021工藝:Intel 7(10nm Enhanced SuperFin)技術突破:異
177、構集成,同時具備大核心(異構集成,同時具備大核心(P Core)和小核心()和小核心(E Core);采用模塊化可擴展設計方式,不同功能單元可靈活拼);采用模塊化可擴展設計方式,不同功能單元可靈活拼裝,裝,1個P核與4個E核面積相當;采用全新設計的全新設計的Golden Cove大大核心核心(微架構大幅改進,IPC+19%)和和Gracemont小核心小核心(能效比顯著提升);開發線程調度器開發線程調度器ITD,使程序能夠靈活使用大小核資料來源:Intel Architecture Day 2021,中信證券研究部80性能核代號為性能核代號為Golden Cove,將單線程性能推向極致將單線程
178、性能推向極致Golden Cove核心采用超深前端+超寬后端+智能分支預測設計,前端解碼器數量從4增加到6,微指令緩存從2.25K增加到4K條;指令調度部分,重排序緩存ROB容量從352增加到512,發射端口數量從10增加到12,整數ALU從4個到5個;新增向量加法單元FADD,向量乘加單元支持FP16數據格式資料來源:Intel Architecture Day 2021資料來源:Intel Architecture Day 2021Golden Cove性能核心具有性能核心具有12發射、發射、5整數整數ALU超寬后端,超寬后端,512指令指令ROB超深前端超深前端Golden Cove比上
179、一代比上一代 IPC提升提升19%3.7.2.Golden Cove:Sunny Cove后又一力作,超寬架構后又一力作,超寬架構IPC+19%Performance(性 能性 能):GoldenCove在結構上具有巨大變化,依據SPEC rate 2017測試得到的IPC較上一代大核心WillowCove提升約19%Golden Cove核心新增矩陣運核心新增矩陣運算擴展單元算擴展單元(Intel AdvancedMatrix Extensions,AMX),適用于數據中心等場景,可大幅增強AI等任務表現81E核屬于核屬于Atom系列:系列:BonnellSaltwellSilvermont
180、AirmontGoldmontTremontGracemontPower(功耗功耗):單線程方面,Gracemont在同性能下可節約40%功耗;多線程下,比4核4線程的Gracemont 可比2核4線程的Skylake,同功耗性能提升80%,同性能功耗降低80%Area(尺寸尺寸):Gracemont微架構的核心非常小,在1個Golden Cove大核心的空間里可以塞進4個Gracemont小核心資料來源:Intel Architecture Day 2021資料來源:Intel Architecture Day 2021Gracemont能效核具有能效核具有6解碼解碼17發射的超寬架構,甚至
181、比蘋果的發射的超寬架構,甚至比蘋果的Fire Storm核心架構更寬核心架構更寬E核能效表現出色核能效表現出色3.7.2.Gracemont:17發射超寬設計,小核心能效翻倍提升發射超寬設計,小核心能效翻倍提升82四、基石技術:工藝推進核心性能,封裝+片內總線發力后摩爾時代4.14.1制程工藝:制程工藝:10nm10nm受阻拖慢研發節奏,受阻拖慢研發節奏,5 5年年4 4節點公司望王者歸來節點公司望王者歸來4.24.2先進封裝:后摩爾時代焦點,先進封裝:后摩爾時代焦點,IDMIDM模式下發展領先模式下發展領先4.3 4.3 片內總線結構:信息傳輸的通道,多核堆疊的關鍵片內總線結構:信息傳輸的通
182、道,多核堆疊的關鍵834.1.制程工藝:技術路線復雜,投入巨大,供給極其有限制程工藝:技術路線復雜,投入巨大,供給極其有限先進制程研發投入巨大先進制程研發投入巨大,各各IDM/代工廠陸續放棄推進代工廠陸續放棄推進,前沿玩家僅剩三家前沿玩家僅剩三家。隨著晶體管尺寸的縮小,發熱與漏電問題愈加顯著,先進制程的推進成本大幅上升,聯電與格羅方德等廠商宣布放棄先進制程的推進,轉而專注于45-14nm制程中。目前仍在局的玩家僅剩英特爾目前仍在局的玩家僅剩英特爾、臺積電與三星臺積電與三星,行業供給極其有限行業供給極其有限各制程供給格局圖各制程供給格局圖資料來源:Wikichip,Digitimes,半導體在線
183、(微信公眾號),中信證券研究部索尼索尼英飛凌英飛凌夏普夏普飛思卡爾飛思卡爾瑞薩瑞薩東芝東芝富士通富士通德州儀器德州儀器松下松下STM聯電聯電IBM中芯國際中芯國際AMD三星三星臺積電臺積電英特爾英特爾上海華力上海華力上海華力上海華力上海華力上海華力上海華力上海華力瑞薩瑞薩東芝東芝富士通富士通德州儀器德州儀器松下松下STM聯電聯電IBM中芯國際中芯國際格羅方德格羅方德三星三星臺積電臺積電英特爾英特爾瑞薩瑞薩東芝東芝富士通富士通德州儀器德州儀器松下松下STM聯電聯電IBM中芯國際中芯國際格羅方德格羅方德三星三星臺積電臺積電英特爾英特爾松下松下STM聯電聯電IBM中芯國際中芯國際格羅方德格羅方德三星
184、三星臺積電臺積電英特爾英特爾IBM格羅方德格羅方德三星三星臺積電臺積電英特爾英特爾聯電聯電中芯國際中芯國際格羅方德格羅方德三星三星臺積電臺積電英特爾英特爾三星三星臺積電臺積電英特爾英特爾三星三星臺積電臺積電英特爾英特爾三星三星臺積電臺積電英特爾英特爾1865nm45/40nm32/28nm22/20nm16/14nm10nm7nm5nm90nm14145106333024610nm7nm5nm3nm英特爾臺積電三星在同代的對比上;在同代的對比上;各家廠商出于營銷考慮,制程命名標準已不一致各家廠商出于營銷考慮,制程命名標準已不一致英特爾節點推進速度較慢,但其性能基本等同于英特爾節點推進速度較慢,
185、但其性能基本等同于另外兩家的下一代制程產品另外兩家的下一代制程產品晶體管密度同代對比(億個晶體管密度同代對比(億個/平方毫米)平方毫米)844.1.制程工藝:公司工藝迭代緩而持續,制程工藝:公司工藝迭代緩而持續,2025年望重回巔峰年望重回巔峰作為作為IDM廠商與摩爾定律開創者廠商與摩爾定律開創者,自有工藝制程革新是英特爾與自有工藝制程革新是英特爾與AMD之間的顯著差異之間的顯著差異工藝革新是晶體管密度提升的關鍵工藝革新是晶體管密度提升的關鍵。由90nm到如今的Intel 7(10nm),英特爾在制程工藝上經過了“應變硅、增強型應變硅技術、HKMG(High-K值絕緣層/金屬柵極)、增強型HK
186、MG、FinFET、增強型FinFET、”等工藝升級英特爾工藝路線圖英特爾工藝路線圖資料來源:Intel官網854.1.1.制程工藝:制程工藝:90、65nm應變硅技術,提升載流子遷移率應變硅技術,提升載流子遷移率應變硅技術應變硅技術(2003年年)90nm:利用一層僅為幾納米的超薄應變層:利用一層僅為幾納米的超薄應變層,替代原本的高純硅制造晶體管內部的通道替代原本的高純硅制造晶體管內部的通道資料來源:Intel65nm工藝實現與45nm工藝預覽-濮元愷應變硅應變硅增強型應變硅技術增強型應變硅技術(2005年年)65nm:而后英特爾首次在:而后英特爾首次在65nm制程制程,300mm晶圓上使用
187、增強改進后的應變硅技術晶圓上使用增強改進后的應變硅技術,特別有利于多內核處理器的制造特別有利于多內核處理器的制造使用使用超薄應變層進行替代超薄應變層進行替代晶體管內原子距離拉長,單數長度數量減少晶體管內原子距離拉長,單數長度數量減少減小有效質量,降低散射概率減小有效質量,降低散射概率增強載流子遷移率增強載流子遷移率1.提供超過“第一代應變硅技術”10%-15%的驅動電流,提升性能。2.晶體管門長度為35nm,門和通道間的氧化物絕緣層度為1.2nm,提升集成度3.在晶體管頂部使用NiSi化合物,進一步降低電阻4.繼續使用了Low K互連層技術,讓Low K材料擔任金屬互聯線路間使用的主要絕緣材料
188、?;ヂ摼€路使用了8層銅互連。5.使用了晶體管睡眠技術,大幅減少電能浪費。6.繼續堅持沒有使用SOI技術,而是使用耗盡型襯底晶體管(depleted substrate transistor,DST)代替。雙軸應變的形成雙軸應變的形成應變硅經典器件結構應變硅經典器件結構65nm增強型應變硅顯微圖增強型應變硅顯微圖增強型應變硅技術主要改進維度增強型應變硅技術主要改進維度資料來源:深亞微米應變硅器件的模擬研究-施昊,中信證券研究部資料來源:Intel65nm工藝實現與45nm工藝預覽-濮元愷,中信證券研究部86HKMG(High-K值絕緣層值絕緣層+金屬柵極金屬柵極)(2008年年)45nm:應變硅
189、沒有引入新的革命性材料:應變硅沒有引入新的革命性材料,柵極介質厚度已達極限柵極介質厚度已達極限,“更換材料以突破介電常數更換材料以突破介電常數”成為成為45nm工藝的關鍵工藝的關鍵4.1.2.制程工藝:制程工藝:45、32nm材料革命,材料革命,HKMG突破硅材料參數限制突破硅材料參數限制資料來源:中關村在線-劉坎拋開表面看本質 32nm移動處理器全解析,中信證券研究部增強型增強型HKMG(2010年年)32nm:第二代:第二代High-K值絕緣層值絕緣層+金屬柵極金屬柵極,采用第四代應變硅技術采用第四代應變硅技術,針對漏電電流進行針對漏電電流進行進進一步優化一步優化SiO 氧化層氧化層替換為
190、替換為High K絕緣層絕緣層柵極介質厚度需要不斷縮小,但柵極介質厚度需要不斷縮小,但SiO 氧化層在氧化層在2nm以下時,會出現以下時,會出現明顯的遂穿泄露,明顯的遂穿泄露,HfO2為英特爾使用的(為英特爾使用的(High K材材料,高介電常數材料),其介電常料,高介電常數材料),其介電常數為數為25(SiO 為為4),減少柵泄露),減少柵泄露硅材料柵極硅材料柵極替換替換為為金屬材料柵極金屬材料柵極High K的晶體管柵電場更強,若搭的晶體管柵電場更強,若搭配多晶硅柵極,會使“柵極耗盡”配多晶硅柵極,會使“柵極耗盡”問題更為嚴重問題更為嚴重在技術路線上,英特爾選擇了性能在技術路線上,英特爾選
191、擇了性能更優,難度更大的更優,難度更大的Gate-last,而,而IBM等廠商選擇更可行的等廠商選擇更可行的Gate-first1.與與45nm工藝相比,工藝相比,32nm工藝由于首次使用沉浸式光刻技工藝由于首次使用沉浸式光刻技術,等效氧化層厚度僅為術,等效氧化層厚度僅為0.9nm(45nm技術為技術為1nm)2.金屬柵級工藝流程更新,金屬柵級工藝流程更新,3.30nm柵極長度,第四代應變硅柵極長度,第四代應變硅4.當時業內最緊湊的柵極間距(當時業內最緊湊的柵極間距(112.5nm)5.晶體管性能提升晶體管性能提升22%6.同比封裝尺寸將是同比封裝尺寸將是45nm工藝產品的工藝產品的70%增強
192、型增強型HKMG主要改進維度主要改進維度英特爾英特爾32nm Core i5520M處理器實物圖處理器實物圖資料來源:中關村在線-劉坎拋開表面看本質 32nm移動處理器全解析87FinFET(2011年年)22nm:隨著制程的不斷縮?。弘S著制程的不斷縮小,“短溝道效應短溝道效應”愈加明顯愈加明顯,采用立體式的采用立體式的FinFET工藝工藝,能夠有效能夠有效擴大溝道寬度擴大溝道寬度,減少漏電流與降低短溝道效應減少漏電流與降低短溝道效應4.1.3.制程工藝:制程工藝:22nm結構由平面變立體,結構由平面變立體,FinFET經久不衰經久不衰資料來源:英銳恩官網,中信證券研究部平面架構下:平面架構下
193、:有效溝道寬度有效溝道寬度=w制程縮小與溝道寬度相悖制程縮小與溝道寬度相悖立體結構下:立體結構下:有效溝道寬度有效溝道寬度=w+h*2有效溝道寬度由有效溝道寬度由Fin(鰭)的高度決定(鰭)的高度決定優點:優點:1.1.更好的渠道控制更好的渠道控制2.2.抑制短通道效應抑制短通道效應3.3.更快的切換速度更快的切換速度4.4.更高的漏極電流更高的漏極電流5.5.較低的開關電壓較低的開關電壓6.6.更低的功耗更低的功耗平面晶體管與平面晶體管與FinFET結構對比結構對比FinFET工藝優缺點及應用場景工藝優缺點及應用場景缺點:缺點:1.1.電壓閾值難以電壓閾值難以控制控制2.2.三維輪廓導致三維
194、輪廓導致更高的寄生效更高的寄生效應應3.3.電容高電容高4.4.造價高造價高適合適合高投入高投入高價值高價值高性能高性能領域領域22nm22FFL14nm晶體管FinFETFinFETFinFET鰭片間距(nm)604542柵極間距(nm)9010870金屬間距(nm)809052邏輯單元高度(nm)840630399晶體管密度(百萬個/mm)15.317.837.5SRAM單元(nm)0.0920.0880.05FinFET后續工藝壽命長,經久不衰后續工藝壽命長,經久不衰資料來源:Lam Research,半導體行業觀察-李晨光資料來源:英特爾官網,中信證券研究部88激進的高目標激進的高目標
195、在原先摩爾定律的假定下,每一個節點的推進將使得晶體管密度提升兩倍左右。然而,英特爾在10nm工藝上的規劃是14nm的2.7倍,目標過于激進,即使后期將目標密度下調至2.4倍,效果仍不理想英特爾CEO布萊恩 科再奇也承認該目標“略有些激進”DUV+SAQP(2019年年)10nm:英特爾:英特爾10nm工藝原定工藝原定2016年量產年量產,但最終至但最終至2019年方量產年方量產,使得公司在制程端的優使得公司在制程端的優勢被逐漸追平勢被逐漸追平,甚至被超越甚至被超越4.1.4.制程工藝:目標激進技術保守,制程工藝:目標激進技術保守,10nm研發多年終突破研發多年終突破資料來源:WikiChip,
196、中信證券研究部圖案化技術圖案化技術標準化晶圓成標準化晶圓成本本193i 單次曝光(單次曝光(SE)1193i LELE(DP)2.5193i LELELE(TP)3.5193i SADP 2193i SAQP 3EUV 單次曝光(單次曝光(SE)4EUV SADP 6保守的技術保守的技術選擇選擇DUV,而非而非EUV光刻設備:光刻設備:英特爾的10nm性能接近于臺積電與三星的7nm工藝,但英特爾采用的是190nm的深紫外光刻技術(DUV)結合四重圖案曝光(SAQP)的技術路徑,而非像臺積電與三星一樣,采用波長13nm的深紫外光刻技術(EUV)的方案。英特爾選擇英特爾選擇DUV的原因:的原因:技
197、術考量,英特爾的10nm工藝開始較早,當時EUV技術尚未成熟,可見在制程推進上,先發不一定有優勢。成本考量,根據東京電子測算,DUV+SAQP方案的曝光工藝標準化晶圓成本約是EUV+單次曝光的3/4,約是EUV+SADP的1/2各曝光工藝標準化晶圓成本對比(相對各曝光工藝標準化晶圓成本對比(相對值)值)SADP與與SAQP:SADP將所需要將所需要刻蝕的圖案分解成兩次曝光利用刻蝕的圖案分解成兩次曝光利用圖形的疊加來實現更小的分辨率,圖形的疊加來實現更小的分辨率,SAQP則是連續使用兩次則是連續使用兩次SADP以以實現四重圖像曝光與更小分辨率。實現四重圖像曝光與更小分辨率。SAQPSADP英特爾
198、各節點晶體管密度提升對比英特爾各節點晶體管密度提升對比資料來源:英特爾官網資料來源:A.Raley et al.,Proc.SPIE 9782,97820F(2016),Wikiwand,中信證券研究部894.1.4.制程工藝:目標激進技術保守,制程工藝:目標激進技術保守,10nm研發多年終突破研發多年終突破資料來源:Hiroshige,中信證券研究部多重圖案化:多重圖案化:傳統傳統LELE、LELELE 與更為先進的與更為先進的SADP、SAQP工序示意圖工序示意圖保守的技術保守的技術選擇選擇DUV,而非而非EUVDUV的波長更長,光源更容易發生衍射,使得Pattern圖形無法做得更小,因此
199、在英特爾10nm工藝上,選擇了選擇了DUV就需要搭配就需要搭配SAQP,從而提高分辨率從而提高分辨率LELELELELESADPSAQP 90保守的技術保守的技術后段多重曝光的良率低后段多重曝光的良率低通過對英特爾10nm,臺積電7nm與三星7nm的工藝對比我們可以發現,三者的前段工藝相似三者的前段工藝相似,主要差別在后段工藝主要差別在后段工藝中中前段工藝中前段工藝中,鰭片的形成三家均采用多重四圖案曝光(SAQP),柵極形成均采用多重雙圖案曝光(SADP),Contact 層英特爾與臺積電采用LE/LE2/LE3/LE4等方法,三星則采用EUV方法。但在后段的金屬層形成上但在后段的金屬層形成上
200、,三家廠商技術路線有明顯區別,臺積電7nm采用多重雙圖案曝光(SADP)、三星采用EUV 方法,而英特爾選擇了多重四圖案曝光(SAQP)的方法。由于后段 M1 金屬層是光刻中尺寸最小的瓶頸,SAQP較SADP的難度大幅加大同時多技術同時代入導致量產良率低同時多技術同時代入導致量產良率低。英特爾還在 Contact 層和M1金屬層首次采用金屬Co。在10nm上,英特爾引入了多種技術(COAG+SDB+Co+SAQP),最終良率僅為50%60%,無法滿足量產要求,使得量產推遲4.1.4.制程工藝:目標激進技術保守,制程工藝:目標激進技術保守,10nm研發多年終突破研發多年終突破資料來源:Wikiw
201、and,中信證券研究部英特爾與臺積電、三星多重圖案曝光工藝比較英特爾與臺積電、三星多重圖案曝光工藝比較公司公司邏輯制程邏輯制程最小金屬間距最小金屬間距曝光工藝對比曝光工藝對比量產時間量產時間英特爾14nm52 nmSADP+切割2014英特爾10nm36 nmSAQP+LELE2019臺積電7FF40 nmSADP+切割2017初三星8LPP;7LPP44 nmLELELELE2018末91Intel 7(2021年年)原原10nm Enhanced SuperFin:從:從Intel 7開始開始,公司將采用全新的命名方式公司將采用全新的命名方式,而后的而后的“7nm”也更也更名為名為inte
202、l 4。事實上,英特爾10nm性能與臺積電7nm性能接近,英特爾7nm性能與臺積電4nm性能接近,此次更名,意在消除營銷對比上的劣勢Intel 7能耗比相對于能耗比相對于10nm SuperFin提升約提升約10%15,首次應用于21年年底的Alder Lake 12代酷睿以及22年第一季度的Sapphire Rapids四代可擴展至強Intel 7 同樣導入SAQP與COAG(Contact Over Active Gate)技術,以提升晶體管密度以提升晶體管密度4.1.5.制程工藝:制程工藝:Intel7后命名規則對標友商,消除營銷劣勢后命名規則對標友商,消除營銷劣勢資料來源:電子工程專輯
203、-歐陽洋蔥,英特爾官網,中信證券研究部COAGCOAG:柵接觸點(柵接觸點(Contact Contact)是源極)是源極(SourceSource)到漏極()到漏極(DrainDrain)電)電流的控制點。流的控制點。COAGCOAG將柵接觸點直接設在柵極的將柵接觸點直接設在柵極的上方,而非柵極的一側,節省約上方,而非柵極的一側,節省約10%10%的空間,進而提升組件密的空間,進而提升組件密度。度。英特爾英特爾COAG技術介紹及其示意圖技術介紹及其示意圖Intel 4(2022年年)7nm:擁抱:擁抱EUV,使用使用EUV,大幅減少光罩數量和制程步驟大幅減少光罩數量和制程步驟,降低工藝復雜性
204、降低工藝復雜性,相比相比Intel 7,Intel4 預計可達成預計可達成20%的每瓦性能提升的每瓦性能提升,成為公司推進先進制程的又一里程碑成為公司推進先進制程的又一里程碑將應用于PC端的Meteor Lake 處理器與數據中心的 Granite Rapids英特爾表示,Intel 4 在Fin的間距、接觸點間距以及低層金屬間距等關鍵尺寸都持續朝著微縮方向前進,并導入設計技術協同優化(DTCO)Intel 4采用新金屬強化銅(Enhanced Cu),取代Intel 7的鈷,外層用鈷、鉭包覆。因此兼具銅的低電阻特性,并降低自由電子撞擊原子使其移位的情況92英特爾英特爾23H2量產量產Inte
205、l 3 工藝芯片工藝芯片24H1量產量產20A(埃米)(埃米)工藝芯片工藝芯片24H2量產量產18A(埃米)工藝芯片(埃米)工藝芯片臺積電臺積電計劃計劃22H2量產量產3nm FinFET工藝工藝計劃計劃25年量產年量產2nm GAA芯片芯片三星三星22年年6月月30日,宣布量產日,宣布量產3nm GAA芯片,芯片,成為首家量產成為首家量產3nm的廠商的廠商Intel 3(23年年H2)對應此前對應此前7nm+工藝:同樣基于工藝:同樣基于EUV光刻光刻,每瓦性能提升約每瓦性能提升約18%對EUV技術的使用將進一步優化,并在芯片面積上改進,公司預計在2023年下半年投產Intel 3工藝節點仍將
206、使用FinFET技術。三家廠商中,僅三星在“3nm”節點上選擇GAAFET結構晶體管(三星稱其為MCBFET)Intel 20A(24年年H1)對應此前對應此前5nm工藝:應用工藝:應用RibbonFET和和PowerVia兩大突破性技術兩大突破性技術,芯片制造進入埃米時代芯片制造進入埃米時代RibbonFET是英特爾對于自家GAA FET晶體管的命名。其與FinFET結構相似,能沿用此前設備與技術,并擴大了柵極與通道的接觸面積從而實現對通道更好的控制。PowerVia為英特爾獨有技術,其將電源線由晶體管頂部移至底部,消除晶圓正面供電布線需求,優化信號傳輸。Intel 18A(24年年H2):
207、若如期完成:若如期完成,Intel 18A將成為英特爾重回領導者地位的標志性節點將成為英特爾重回領導者地位的標志性節點繼續改進RibbonFET及PowerVia技術可能會采用 ASML 最新的 high-NA(高數值孔徑)EUV 光刻機4.1.6.制程工藝:未來制程工藝:未來4年年5節點,重回芯片制造巔峰節點,重回芯片制造巔峰FinFET與與GAAFET結構示意圖結構示意圖三巨頭未來路線規劃對比三巨頭未來路線規劃對比FinFETGAAFET資料來源:英特爾官網,中信證券研究部資料來源:芯智訊(微信公眾號),中信證券研究部93Foveros屬于3D技術(縱向),其最下邊是封裝基底,基底之上為底
208、層芯片(Bottom Chip),底層芯片之上則放置著各種不同的芯片或模塊,兩者通過Face-to-Face的方式連,而上層芯片和模塊則通過TSV3D硅穿孔與系統其他部分連通。優點:優點:降低制造成本并降低能耗;充分利用縱向空間缺點:缺點:硅穿孔(TSV)電阻大,頂層供電困難;散熱難度大先進封裝先進封裝,后摩爾時代焦點:后摩爾時代焦點:進入后摩爾時代,制程推進難度變大,研發成本升高。2.5D/3D等先進封裝成為半導體“超越摩爾”的重要路徑。其為芯片提供縱向維度的擴張其為芯片提供縱向維度的擴張,進一步提升晶體管數量進一步提升晶體管數量,降低生產成本降低生產成本。英特爾先進封裝技術全球領先:英特爾
209、先進封裝技術全球領先:在先進封裝領域,英特爾與臺積電等廠商進行了較早的布局,因此在量產、應用及技術上都占據領先地位。目前英特爾的先進封裝主要主要供自家使用,已具備EMIB、Foveros、Co-EMIB、ODI、MDIO等技術。4.2.先進封裝:后摩爾時代下的縱向延伸,先進封裝:后摩爾時代下的縱向延伸,IDM模式下發展領先模式下發展領先資料來源:SiP與先進封裝技術-Suny Li,英特爾官網EMIB為高密度的2D平面式封裝技術,其結構類似SoC。英特爾于2017 年發布,其嵌入在封裝基板內、用來連接裸晶的硅橋(Silicon Bridge)優點:優點:高帶寬;低功耗;對裸片尺寸無要求;成本經
210、濟缺點:缺點:影響性能;不利于互連要求高的產品英特爾英特爾EMIB結構示意圖結構示意圖Foveros結構示意圖結構示意圖EMIBFoveros資料來源:Wikichip94基于高級接口總線(AIB)物理層互連技術,英特爾發布了MDIOMDIO(多裸片輸入輸出)技術,(多裸片輸入輸出)技術,能為EMIB提供標準化的SiP PHY級接口,可互連多個芯粒。MDIOMDIO推出于推出于20202020年,其較年,其較AIBAIB技術在各個維度均有明顯提升。技術在各個維度均有明顯提升。英特爾表示,與同時期臺積電的LIPINCON相比,MDIO仍具有競爭力優點:優點:其響應速度和帶寬密度是AIB 技術的兩
211、倍以上;能效提升缺點:缺點:技術難度大4.2.先進封裝:后摩爾時代下的縱向延伸,先進封裝:后摩爾時代下的縱向延伸,IDM模式下發展領先模式下發展領先資料來源:硬件世界-上方文Q,中信證券研究部ODI全稱Omni-Directional Interconnect,即Omni方向性互連技術,方向性指其能支持中小芯片之間實現全方位(水平+垂直)的相互鏈接。頂部的芯片可以像EMIB一樣,與其他小芯片進行水平通信,還可以像Foveros-樣,通過TSV 與下方的底部裸片進行垂直通信。優點:優點:互連通孔更大帶寬高于傳統TSV;電阻和延遲更低;供電穩定缺點:缺點:技術難度大英特爾英特爾ODI結構示意圖結構
212、示意圖英特爾英特爾MOIO相關性能參數比較相關性能參數比較類似類似EMIB的互的互連直接供電連直接供電類似類似Foveros的互連的互連裸片間裸片間IOIO界面對界面對比比單位單位AIB-第一代第一代(DARPA芯片)芯片)MDIO第一代第一代臺積電臺積電LIPINCON落地時間落地時間201720172020202020202020針速針速Gbps2 25.45.48 8Shoreline帶寬密度帶寬密度GBps/mm63632002006767Areal帶寬密度帶寬密度GBps/mm150150198198198198IO電壓擺幅電壓擺幅V0.90.90.50.50.30.3PHY功率效率
213、功率效率pJ/b0.850.850.50.50.560.56ODIMDIO資料來源:硬件世界-上方文Q,中信證券研究部95公司地區定位先進封裝日月光中國臺灣封測廠(OSAT)SiP、2.5D/3D、晶圓級封裝等均有涵蓋,具量產能力,為封測廠中技術涵蓋最全且能力最強的廠商安靠美國封測廠(OSAT)SiP、2.5D/3D、晶圓級封裝等均有涵蓋,具量產能力,SiP封裝在消費及汽車電子大放異彩長電科技中國大陸封測廠(OSAT)SiP、2.5D/3D、晶圓級封裝等均有涵蓋,具量產能力,SiP封裝及2.5/3D為其重點發展目標力成科技中國臺灣封測廠(OSAT)SiP、2.5D/3D、晶圓級封裝等均有涵蓋,
214、具量產能力,以存儲器封裝為主通富微電中國大陸封測廠(OSAT)SiP、2.5D/3D、晶圓級封裝等均有涵蓋,以CPU/GPU/服務器等為主華天科技中國大陸封測廠(OSAT)SiP、2.5D/3D、晶圓級封裝等均有涵蓋,以SiP、Fan-Out、Flip-Chip技術為主晶方科技中國大陸封測廠(OSAT)SiP、2.5D/3D、晶圓級封裝等均有涵蓋,以TSV技術為基礎的CIS封裝為主臺積電中國臺灣晶圓代工廠(Foundry)以2.5D、3D、晶圓級封裝為主,對3D IC技術平臺進行整合成3D Fabric,有全球最頂尖立體結構封測技術三星韓國IDM以2.5D、3D、晶圓級封裝為主,設立SAFE主
215、攻先進封裝技術,以3D-TSV技術為核心開發一系列技術英特爾美國IDM以2.5D、3D、晶圓級封裝為主,推出混合鍵合(Hybrid bonding)概念,圍繞異質整合及堆疊開發技術IDM便于協同:便于協同:目前IDM、Foundry、封測廠商均有參與先進封裝的布局。Foundry與封測廠各有優勢,但但IDM能更好協同能更好協同前后段工藝前后段工藝,在先進封裝中兼具在先進封裝中兼具Foundry與封測廠優勢與封測廠優勢,并進行緊密協同并進行緊密協同Foundry:熟悉前段流程,具有自有工藝,方便后期集成封測廠:熟悉芯片擺放布局、硅中介層設計IDM:兼具前兩者有點,并能更好得完成前后段工藝的協同公
216、司先進封裝資本支出巨大,技術領先持續卡位:根據公司先進封裝資本支出巨大,技術領先持續卡位:根據Yole數據,英特爾數據,英特爾2021在先進封裝領域的資本支出為在先進封裝領域的資本支出為35億美元,投億美元,投入規模占全球第一入規模占全球第一英特爾21年先進封裝資本支出主要投入Foveros及EMIB等先進封裝技術的研發及產能擴建4.2.先進封裝:后摩爾時代下的縱向延伸,先進封裝:后摩爾時代下的縱向延伸,IDM模式下發展領先模式下發展領先全球先進封裝主要玩家全球先進封裝主要玩家21年全球先進封裝資本支出排名年全球先進封裝資本支出排名資料來源:Yole,芯智訊,中信證券研究部先進封裝資本支出先進
217、封裝資本支出(億美元)(億美元)市占市占份額份額英特爾英特爾353529%29%臺積電臺積電30.4930.4926%26%日月光日月光202017%17%三星三星151513%13%安靠安靠7.87.87%7%長電科技長電科技5.935.935%5%通富微電通富微電4.874.874%4%合計合計119.09119.09100%100%資料來源:各公司公告,中信證券研究部96片內總線主要負責鏈接片內總線主要負責鏈接CPU內的各個模塊內的各個模塊,并負責互連通信的作用并負責互連通信的作用。這里的模塊主要指計算核心(Core),此外還包括外部控制器等,不同的時期與不同的核心數對應不同的片內總線結
218、構。早期:核心數較少早期:核心數較少,主要為星狀架構與全連接架構主要為星狀架構與全連接架構星狀架構:星狀架構:早期由于模塊較少,CPU內部采用星狀結構,以Core核心位于中央,其他模塊與之鏈接,各模塊之間不直接交互,而是通過Core中轉。全連接架構:全連接架構:在核心數(stop)達到4-6個,采用全連接的形式,具更高的互聯性能,包括帶寬和延遲,更高設計復雜度、更高成本和更高功耗4.3.片內總線結構:信息傳輸的通道,多核堆疊的關鍵片內總線結構:信息傳輸的通道,多核堆疊的關鍵星狀總線結構星狀總線結構全連接總線結構全連接總線結構主要應用于單核CPU,結構簡單。周圍的不同模塊信息靠中央核心中轉適合核
219、心數較少的(4-6核),實現點對點鏈接,延遲低。但隨著核心數的提升,設計復雜程度迅速增加。資料來源:知乎老狼各類總線結構類型總覽各類總線結構類型總覽97環狀總線環狀總線(Ring):進入多核時代后:進入多核時代后,星形結構就不再適用星形結構就不再適用,Ring總線應運而生總線應運而生。在Ring總線中,通常有兩個閉環,分別為順時針與逆時針,負責不同方向的通信。8核Ring總線結構,也可稱作8C Ring bus相比早期的Star總線,ring總線具有更低的通信延遲,各處模塊之間交互的效率也大大提升4.3.片內總線結構:信息傳輸的通道,多核堆疊的關鍵片內總線結構:信息傳輸的通道,多核堆疊的關鍵資
220、料來源:知乎超合金彩虹糖,中信證券研究部Ring總線架構結構示意圖總線架構結構示意圖順時針+逆時針設計,使得核心間的數據交互距離不會超過連接節點的一半環內為L3緩存L1L2緩存集成在核心模塊中單ring下,核心數一般為4-8,最高做至10-12核。為適應后摩爾時代核心數的增多,1.5ring與2ring誕生981.5Ring與與2Ring,環狀總線環狀總線(Ring)同結構下的拓展:同結構下的拓展:通過外擴總線的方式,在ring的外部增加核心(stop),并將不同的ring利用雙向的緩沖交換器并聯起來。隨著核心數量的增加,Ring總線不斷拉長,且經過的核心多導致存在更多的“中斷”,跨核延遲將不
221、斷上升,內部堆核的方法已與瓶頸。因此,技術路線上采用在外部新設1條或0.5條Ring,并利用緩沖交換器在兩條Ring間進行交換數據。此方案能進一步提升核心數,但缺點是數據通過緩沖交換器的時間較長4.3.片內總線結構:信息傳輸的通道,多核堆疊的關鍵片內總線結構:信息傳輸的通道,多核堆疊的關鍵資料來源:知乎超合金彩虹糖,中信證券研究部1.5 Ring總線架構結構示意圖總線架構結構示意圖2 Ring總線架構結構示意圖總線架構結構示意圖緩沖交換器緩沖交換器緩沖交換器資料來源:知乎超合金彩虹糖,中信證券研究部991.5Ring與與2Ring,環狀總線環狀總線(Ring)同結構下的拓展:同結構下的拓展:R
222、ing架構適應于多核場景,主要應用于服務器(至強產品系列)與高性能PC處理器(酷睿產品系列)服務器:服務器:以至強E5 V4 MCC版本為例,其內部在1.5個Ring中包含了15個核心(Core)并通過雙向緩沖交換器鏈接,從而突破單條ring中12個核心的上限,模塊訪問另一條Ring中的模塊延遲會顯著高于訪問同Ring模塊PC:以酷睿12代為例,其同樣采用Ring結構,但不同的是,由于其采用P核(大核)與E核(小核),其4個E核構成一簇,作為一個stop。因此16核的酷睿12代僅有10個stop。4.3.片內總線結構:信息傳輸的通道,多核堆疊的關鍵片內總線結構:信息傳輸的通道,多核堆疊的關鍵資
223、料來源:wikichip-Meshbus至強至強E5 V4 MCC版本片內架構圖版本片內架構圖i9-12900K 4個個E-core構成一簇總線架構結構示意圖構成一簇總線架構結構示意圖資料來源:電子工程專輯-黃燁峰,中信證券研究部4個E核構成一個Stop1個P核構成一個Stop100網狀總線網狀總線(Mesh):1.5Ring與與2Ring只是小幅提高只是小幅提高ring總線結構的上限總線結構的上限,高核心數下依然存在通信延遲高核心數下依然存在通信延遲。因此因此,網狀結網狀結構誕生構誕生,其其是介于環形總線和全連接的方案是介于環形總線和全連接的方案,其能其能幫助更好地進行信息交互幫助更好地進行
224、信息交互Mesh總線更復雜,所以當核心數較少時,Mesh總線延遲比單Ring高。但隨著核心數的增多,Mesh總線的低延遲優勢將逐漸顯現相比Ring 總線,Mesh總線連接的layout簡單,而且靈活性、可擴展性強英特爾在SkylakeX、Skylake SP等產品線中引入了Mesh總線4.3.片內總線結構:信息傳輸的通道,多核堆疊的關鍵片內總線結構:信息傳輸的通道,多核堆疊的關鍵資料來源:電子工程專輯-黃燁峰,中信證券研究部Skylake SP中的中的Mesh總線架構結構示意圖總線架構結構示意圖66 Mesh技術類似井字結構每個核心與周圍的四個核心相連,邊緣處核心則與周圍2、3個核心相連同時,
225、若是實現2行1列的core與6行6列的core之間的互聯,Mesh總線并不需要經過經過5個(橫向)+4個(縱向)=9個Stop,而是直接跳至2行6列,再“跳”至6行6列因此,Ring架構更像是“逢站必?!钡摹案哞F”,而Mesh架構更像是“極少中轉”的“飛機”,效率更高101同業比較:同業比較:在多核心堆疊上,競爭對手AMD則選擇的是更接近于“弱化版全連接”的MCM技術,其在核心數上更容易突破其在核心數上更容易突破上限上限,更節約成本更節約成本,但也容易造成延時問題但也容易造成延時問題在Zen架構上,四個核心通過全連接的方式形成一個CCX,四個核心均有自己獨立的L1與L2緩存,并與另外三個核心共
226、享8MB L3緩存。CCX之間通過高速Infinity Fabric通信,以實現8核、16核、32核處理器的設計而Zen2則是由兩個CCX組成一個CCD,將多個CCD與作為通訊中心(cIOD)的I/O die進行連接,形成多核心的互聯4.3.片內總線結構:信息傳輸的通道,多核堆疊的關鍵片內總線結構:信息傳輸的通道,多核堆疊的關鍵資料來源:中信證券研究部繪制AMD Zen2 內部多核心互聯架構內部多核心互聯架構小核心小核心CoreCore小核心小核心CoreCore小核心小核心CoreCore小核心小核心CoreCoreCCXCCXCCD部分為7nm工藝,cIOD部分則為12nm工藝體現chip
227、let/MCM技術節約成本的優越性資料來源:expreview102同業比較:同業比較:在多核心堆疊上,競爭對手AMD則選擇的是更接近于“弱化版全連接”的MCM技術,其在核心數上更容易突破其在核心數上更容易突破上限上限,更節約成本更節約成本,但也容易造成延時問題但也容易造成延時問題而在Zen 3上,一個CCX中包含8個小核心,8個Core共享32MB L3緩存,Zen與Zen 2中一個CCX僅包含4個小核心AMD表示其8個小核心的鏈接方式“沒有完全連接(全連接),但已經足夠接近了”,這一近似于“全連接”的方式使得Zen 3中核心之間的延遲將進一步降低4.3.片內總線結構:信息傳輸的通道,多核堆
228、疊的關鍵片內總線結構:信息傳輸的通道,多核堆疊的關鍵資料來源:hexus,AMD官網AMD Zen 2 與與Zen 3內部結構對比內部結構對比英特爾與英特爾與AMD不同結構導致性能差異不同結構導致性能差異1、延遲性:、延遲性:英特爾的Mesh技術更為簡單,原生核心的延遲更低。2、功耗:、功耗:AMD更多的核心數意味著其功耗相對更大,同時要求更好的散熱條件3、成本:、成本:小核心對單片晶圓面積的利用率更高,良率也更高,從而降低成本4、靈活性:、靈活性:Chiplet/MCM技術能夠對不同的結構使用不同的制程工藝,進一步降低制造成本英特爾與英特爾與AMD各維度性能差異各維度性能差異資料來源:各公司
229、官網,中信證券研究部103五、產品體系:產品分化,同步實現廣覆蓋與高適應性五、產品體系:產品分化,同步實現廣覆蓋與高適應性5.1 5.1 產品總覽:產品總覽:CPUCPU為業務基本盤,產品分化為適應細分市場關鍵為業務基本盤,產品分化為適應細分市場關鍵5.2 5.2 至強(服務器):商業化應用場景,性能與成本為首要考量至強(服務器):商業化應用場景,性能與成本為首要考量5.3 5.3 酷睿(中高端酷睿(中高端PCPC):取代奔騰成):取代奔騰成PCPC核心高端產品線核心高端產品線5.4 5.4 奔騰(中低端奔騰(中低端PCPC):引領):引領CPUCPU歷史變革,現用于教育歷史變革,現用于教育/
230、辦公場景辦公場景5.5 5.5 賽揚(低價低端賽揚(低價低端PCPC):性能較奔騰低一級,幫助實現市場下沉):性能較奔騰低一級,幫助實現市場下沉5.6 5.6 凌動(低功耗、物聯網):瞄準移動市場,集成化為迭代主線凌動(低功耗、物聯網):瞄準移動市場,集成化為迭代主線5.7 5.7 MovidiusMovidius視覺處理器:前瞻布局,針對邊緣與視覺處理器:前瞻布局,針對邊緣與AIAI設備設備1045.1.產品體系:技術孕育多維產品線,處理器為基本盤產品體系:技術孕育多維產品線,處理器為基本盤處理器為公司業務的核心處理器為公司業務的核心,但除處理器外但除處理器外,公司產品已延伸至至數字芯片領域
231、的多個應用場景公司產品已延伸至至數字芯片領域的多個應用場景,包括系統和設備包括系統和設備、服務器服務器產品產品、FPGA和可編程設備和可編程設備(來自收購的來自收購的Altera)、結構化結構化ASIC等等11類產品與服務類產品與服務英特爾各產品線業務情況英特爾各產品線業務情況資料來源:英特爾官網,中信證券研究部1055.1.產品體系:技術孕育多維產品線,處理器為基本盤產品體系:技術孕育多維產品線,處理器為基本盤公司的處理器產品已形成了極強的技術壁壘公司的處理器產品已形成了極強的技術壁壘,擁有針對不同應用場景的不同處理器家族擁有針對不同應用場景的不同處理器家族各處理器家族能為筆記本電腦、臺式機
232、、工作站和服務器提供支持,包括企業和個人用途、沉浸式游戲、內容創作、物聯網、人工智能等英特爾處理器產品系列情況英特爾處理器產品系列情況資料來源:英特爾官網,中信證券研究部產品名稱產品名稱具體功能具體功能應用場景應用場景至強至強 可擴展處理器可擴展處理器英特爾 至強 可擴展處理器家族在計算、存儲、網絡和安全方面提供不同凡響的擴展能力和性能。服務器至強至強 處理器處理器專為數據中心和工作站打造,可處理云、大數據、建模、人工智能等的繁重處理需求。服務器酷??犷?處理器處理器英特爾面向筆記本電腦和臺式機推出的性能最高的 CPU,提供先進的響應能力、連接性和顯卡。中高端PC奔騰奔騰 處理器處理器結合速度
233、、功耗和價值,用于在筆記本電腦、臺式機和迷你電腦上的日常計算。中低端PC賽揚賽揚 處理器處理器為入門級筆記本電腦和臺式電腦提供經濟的CPU性能,支持強連通性和長電池續航。低價低端PC凌動凌動 處理器處理器適合移動和物聯網設備,以及高密度、低能耗的數據中心應用程序。低功耗、物聯網、工控機Movidius 視覺處理器視覺處理器能夠高效完成要求苛刻的計算機視覺和邊緣人工智能工作負載。通過在將數據移動最小化的獨特架構中,將高度并行的可編程計算與面向特定工作負載的硬件加速相結合人工智能面向物聯網和嵌入式應面向物聯網和嵌入式應用的處理器用的處理器借助英特爾邊緣就緒計算和連接技術產品系列,快速部署邊緣應用程
234、序,可支持邊緣處理物聯網1065.1.產品迭代歷程:產品分化適應各細分市場,性能依托架構制程升級產品迭代歷程:產品分化適應各細分市場,性能依托架構制程升級而從時間維度上看而從時間維度上看,90年代與年代與21世紀初為英特爾處理器產品線的擴展時期世紀初為英特爾處理器產品線的擴展時期,其將產品線進一步分化以提高對不同應用場景的適應性,各大產品系列均在此期間推出1993年年,第一代第一代“奔騰奔騰”:世界上第一款超標量處理器超標量處理器(每時鐘至少執行2條指令),具更高的CPU吞吐量1998年年,第一代第一代“至強至強”:第一代至強名為“Pentium II Xeon”,由于面向服務器市場,所以其具
235、更大的緩存具更大的緩存與支持與支持4路或路或8路的路的SMP(對稱多CPU處理功能)。同年同年,第一代第一代“賽揚賽揚”:其為“奔騰”的低價簡化版。由于去除了片外二級緩存去除了片外二級緩存,因此整數性能低下,影響商業場景表現;但其浮點性能未受明顯影響,適合游戲等家庭應用場景。2006年年,“酷??犷!蓖瞥觯和瞥觯浩涿嫦蚋叨讼M者、硬件愛好者與工作站,以替代“奔騰”在中高端市場的應用。首代酷睿為兩核心兩核心,無超線程無超線程,并共享并共享L2緩存緩存,因此具有較高的能耗比。2008年年,第一代第一代“凌動凌動”:針對移動端場景,因此采用順序執行設計順序執行設計以減少晶體管數量,從而控制面積大小C
236、PU代號DrakeP6250nm1998核心微架構年份工藝制程第一代至強 支持4路或8路的SMP 動態執行技術各產品線開拓時期 關鍵技術變化80501P50.8m1993第一代奔騰 第一款超標量處理器CovingtonP6250nm1998第一代賽揚 去除片外二級緩存SilverthorneBonnell45nm2008第一代凌動 采用順序執行設計ConroeCore65nm2006第一代酷睿 取消超線程技術英特爾各產品系列初代誕生時間線英特爾各產品系列初代誕生時間線資料來源:Intel官網、中信證券研究部1075.1.產品迭代歷程:產品分化適應各細分市場,性能依托架構制程升級產品迭代歷程:產
237、品分化適應各細分市場,性能依托架構制程升級2006年公司啟動年公司啟動“Tick-Tock”戰略后戰略后,發力于架構與制程的快速迭代發力于架構與制程的快速迭代,實現產品性能的提升實現產品性能的提升。在Tick-Tock戰略前期,可以明顯看到公司保持2年一個迭代周期,Tick年改善工藝,Tock年改善架構,兩者交替進行公司沿著Tick-Tock的步伐,內部進行“架構+制程”的革新,這些技術最終都將表現為產品性能的持續升級以2008年的第1代Core i為例,其發布于Tock年,因此工藝僅作優化,架構則全面革新至“Nehalem”架構。此架構將北橋集成至CPU中,提高集成度與交互速度;內置L3緩存
238、,每一個處理器共享最小4MB至最大12MB;重新采用超線程技術,處理器性能提升30%+。微架構CorePenrynNehalemWestmereSandy BridgeIvy BridgeHaswellBroadwellCoreNehalemSandy BridgeHaswell65nm45nm32nm22nm14nm20062007200820092010201120132014TockTickTockTickTockTickTockTick核心微架構年份改進戰略工藝制程第一代Core/Core 2 取消超線程技術第1代Core i 首次量產HKMG工藝 增加三級緩存 采用超線程 初代睿頻
239、初代Ringbus桌面CPU產品 關鍵技術變化第2代Core i 首次集成核顯 第二代睿頻 256位環形總線Core2 制程改進版第1代Core i工藝改進版 第二代HKMG工藝第3代Core i 首次采用三柵極晶體管(FinFET)工藝第5代Core i 首次采用14nm FinFET第4代Core i 支持DDR3 首次為SoC架構進行專門優化第1代Xeon E7第1代Xeon E5第2代Xeon E第3代Xeon E第4代Xeon E服務器CPU產品英特爾架構、制程、產品迭代時間線英特爾架構、制程、產品迭代時間線(Tick-Tock戰略時期)戰略時期)資料來源:Chenfan Blog-
240、Jcf94,Wikichip,中信證券研究部1085.1.產品迭代歷程:產品分化適應各細分市場,性能依托架構制程升級產品迭代歷程:產品分化適應各細分市場,性能依托架構制程升級此后此后,制程推進受阻不但影響晶體管密度的提升制程推進受阻不但影響晶體管密度的提升,同時也使架構長期停滯于同時也使架構長期停滯于Skylake,導致公司產品迭代速度放緩導致公司產品迭代速度放緩公司長期停留在14nm中,使得架構開發受限,第7、8/9、10代Core i,雖然分別使用Kaby Lake、Coffee Lake、Comet Lake架構,但其僅在第6代的Skylake進行改進,雖有性能的優化與提升,但實際差異較
241、小因此第7、8/9、10代Core i系列在市場競爭中無明顯優勢,從而導致公司在CPU市場的份額出現一定程度的下降微架構SkylakeKaby LakeCoffee LakeComet LakeIce LakeTiger LakeAlder LakeSkylakeGolden Cove14nmIntel 720152016201720182019202020212022核心微架構年份工藝制程Sunny Cove14+nm14+nm14+nm10nm10+nmIntel 7Willow Cove微架構Sky LakeCascade LakeCopper LakeIce LakeRaptor La
242、keGolden Cove14+nm工藝制程14+nm14+nm10nmSunny CoveSkylake核心微架構第6代Core i 第三代DMI總線桌面CPU產品 關鍵技術變化第5代Xeon E3服務器CPU產品 關鍵技術變化第7代Core i 提高主頻與內存頻率第8/9代Core i 提高主頻與內存頻率 增加緩存與核心數第10代Core i 增加緩存與核心數第10代Core i 增加新指令 核顯大幅增強第11代Core i 緩存增加 核顯大幅增強第12代Core i 使用大小核混合架構 支持DDR5第1代Xeon Platinum等 Mesh總線第2代新Xeon 最大核心數從28增加到5
243、6第3代新Xeon第3代新Xeon 工藝換代 PCIe 4.0架構優化優化優化工藝架構架構優化改進戰略Sapphire RapidsIntel 7Golden Cove英特爾架構、制程、產品迭代時間線英特爾架構、制程、產品迭代時間線(PAO戰略至今戰略至今后)后)資料來源:Chenfan Blog-Jcf94,Wikichip,中信證券研究部1095.2.處理器至強(服務器):商業化應用場景,性能與成本為首要考量處理器至強(服務器):商業化應用場景,性能與成本為首要考量至強:設計針對服務器市場至強:設計針對服務器市場,商業化應用場景中商業化應用場景中,對于性能的優先級遠高于其他應用場景對于性能
244、的優先級遠高于其他應用場景相比用于PC端的酷睿處理器,“至強”并不注重個人游戲,影音等娛樂需求,因此通常無集成核心顯卡通常無集成核心顯卡“至強”注重穩定性與數據處理,因此主頻通常不會太高主頻通常不會太高,但具有更高的核心數與線程數更高的核心數與線程數,更適合服務器場景。例如,英特爾19Q2發布的至強鉑金9282處理器可擁有56個核心與112線程“至強”支持CPU多路互聯多路互聯,在單塊主板上安裝多塊互相連接的處理器,多顆CPU同時工作,提升處理器運算能力資料來源:英特爾官網,中信證券研究部電腦CPU服務器CPU指令集差異通常為CISC,追求指令集的大而全通常為RISC,調用速度和命中率高,針對
245、性強,能效高緩存差異近年才用緩存技術配一二三級緩存,運算能力強接口差異有顯卡卡槽配備的主板通常沒有顯卡卡槽穩定性差異連續工作72小時365天開機運行多路互聯支持差異一塊主板一個CPU單主板可安裝多個CPU價格差異基本在千元左右千、萬元以上,甚至幾十萬酷??犷9-9900至強鉑金至強鉑金9282上市時間19Q219Q2制程工藝14nm14nm內核856線程16112基率3.10 GHz2.60 GHz最大睿頻5.00 GHz3.80 GHz緩存16 MB77 MBTDP65 W400 W核心顯卡HD 630無核心數高線程數高主頻低無核顯散熱要求高緩存技術強PC CPU與服務器與服務器CPU差異
246、差異“至強”支持“至強”支持CPU多路互聯多路互聯同期酷睿與至強產品參數對比同期酷睿與至強產品參數對比資料來源:英特爾官網資料來源:國科科技,中信證券研究部1105.2.處理器至強(服務器):處理器至強(服務器):Pentium II Xeon低價策略贏得市場低價策略贏得市場第一代第一代“至強至強”Pentium II Xeon,明確以獨立產品線對標不同應用場景的策略明確以獨立產品線對標不同應用場景的策略,低價策略從早期服務器競爭脫穎低價策略從早期服務器競爭脫穎而出而出Pentium II Xeon是英特爾第一代“至強”系列產品,其CPU架構為英特爾的P6架構,采用250nm制程同時,其支持4
247、路或路或8路的路的SMP(對稱多對稱多CPU處理功能處理功能),即一臺設備同時使用多個處理器,各處理器之間共享內存系統、總線系統等資源,提高數據處理能力。其采用P6架構,因此具有動態執行技術動態執行技術,能通過預測分析程序流程與數據流,選擇最佳的指令執行順序,提高運行效率。在至強系列推出之前,服務器行業競爭已激烈,DEC、Sun、MIPS、IBM均已布局該領域,英特爾利用其PC電腦業務的成本管控經驗與規模效應,成功以低價策略逐漸獲得市場而后發布的而后發布的Pentium III Xeon則進一步補全性能則進一步補全性能,鞏固英特爾在服務器端的地位鞏固英特爾在服務器端的地位采用P6架構,0.18
248、微米工藝制造,Slot 2架構和SECC封裝形式新增70條指令集,提高多媒體、流媒體軟件執行速度,在緩存速度與系統總線結構上,也有同步改進資料來源:CPU-world,中信證券研究部Pentium II Xeon與與Pentium III Xeon性能參數對比性能參數對比架構架構工藝制程工藝制程緩存緩存頻率頻率接口接口指令集指令集位數位數Pentium II XeonP60.25微米2MB二級緩存450MHzSlot 2MMX32Pentium III XeonP60.25、0.18微米2MB二級緩存1GHzSlot 2MMX,SSE321115.2.處理器至強(服務器):跟進位數兼容競爭,步
249、入多核時代處理器至強(服務器):跟進位數兼容競爭,步入多核時代英特爾于英特爾于2005年推出年推出Nocona至強處理器至強處理器,其是一款其是一款32、64位混合模式計算平臺位混合模式計算平臺,打破公司打破公司32與與64位不兼容情況位不兼容情況。AMD于2003年推出Opteron皓龍處理器,兼容32位與64位計算,英特爾于2005年推出具同樣功能的NoconaNocona采用EM64T技術使其能夠同時支持32位和64位計算,并集成DBS,實現CPU運行頻率與功耗的動態調節根據ZDNet China,Opteron通過超傳輸(Hyper Transport)技術與計算機的其余組件相聯系,而
250、Nocona依賴PCIExpress。同時Nocona的速度更快,而Opteron在每一時鐘周期可以處理更多任務。Opteron配置有集成的內存控制器,而Nocona的控制器是獨立的芯片。2005年年10月月,公司推出公司推出Paxville DP雙核處理器雙核處理器,早期便體現公司封裝技術優勢早期便體現公司封裝技術優勢,從而步入多核時代從而步入多核時代Paxville DP同樣采用NetBurst架構,制程為90nm,緩存為22MB二級緩存,頻率為2.80 GHz,頻率的運行速度由于兩顆內核均配置高速緩存,大大減少了系統總線上的數據量,并加快內核存取數據的速度。此后至強產品的核心數跟隨架構的
251、革新不斷上升此后至強產品的核心數跟隨架構的革新不斷上升資料來源:中關村在線-范平,中關村在線-藺曉峰,中信證券研究部Nocona性能參數性能參數架構架構工藝工藝制程制程核心核心數數緩存緩存頻率頻率位數位數NoconaNetBurst90nm11MB L2緩存2.8/3.0/3.2/3.4/3.6GHz等32、64PaxvilleDPNetBurst90nm222MB L2緩存2.8GHz32至強系列多核處理器發展歷程至強系列多核處理器發展歷程首顆單核Pentium II Xeon(P6 250nm)1998年首顆雙核Paxville DP(NetBurst 90nm)2005年首顆四核Clov
252、ertownClovertown(Core 65nm)2006年首顆十二核Ivy Bridge(Sandy Bridge 22nm)2013年首顆十核Westmere(Nehalem 32nm)2011年首顆六核DunningtonDunnington(Nehalem 45nm)2008年首顆八核BecktonBeckton(Nehalem 45nm)2010年資料來源:英特爾官網,中信證券研究部1125.2.處理器至強(服務器):產品矩陣完備,實現高低端全覆蓋處理器至強(服務器):產品矩陣完備,實現高低端全覆蓋從目前的產品布局看從目前的產品布局看,至強系列針對服務器市場至強系列針對服務器市場
253、,可分為可分為“至強至強”與與“至強可擴展至強可擴展”兩個子系列兩個子系列“至強”系列性能由低到高分為至強D、至強E、至強W“至強可擴展”于2017年發布,在技術、規格上面進行了全面的更新,分為青銅、白銀、黃金、鉑金至強可擴展處理器擁有多達28顆內核,并能針對數據中心和通信網絡中各種需求進行優化可提供2插槽到8插槽及更多插槽配置支持和充足的擴展空間資料來源:英特爾官網,中信證券研究部至強產品命名規則至強產品命名規則品牌修飾符品牌修飾符+處理器架構處理器架構+性能等級性能等級+物理核心數量物理核心數量+產品線后綴產品線后綴品牌修飾符品牌修飾符+SKU 數值數值+代次指示符代次指示符+產品線后綴產
254、品線后綴至強系列分類情況至強系列分類情況產品系列產品系列具體應用具體應用至強至強D適應于空間和功耗非常寶貴的場景適應于空間和功耗非常寶貴的場景至強至強E為入門級服務器提供必要的業務。為入門級服務器提供必要的業務。至強至強W專為創意專業人士設計,可在工作站上提供專為創意專業人士設計,可在工作站上提供 VFX、3D 渲染和渲染和 3D CAD 所需的性能。所需的性能。至強青銅至強青銅針對小型企業和存儲服務器,具可靠性和可維護性。針對小型企業和存儲服務器,具可靠性和可維護性。至強白銀至強白銀面向入門級計算、網絡和存儲,提升性能與能效。面向入門級計算、網絡和存儲,提升性能與能效。至強黃金至強黃金多達多
255、達 4 個插槽的可擴展性能,先進的可靠性,以及高個插槽的可擴展性能,先進的可靠性,以及高級安全解決方案。級安全解決方案。至強鉑金至強鉑金具先進的具先進的2、4、8 路處理器性能,專為從邊緣到云的路處理器性能,專為從邊緣到云的要求苛刻的工作負載和服務而設計。要求苛刻的工作負載和服務而設計。資料來源:英特爾官網,中信證券研究部1135.2.至強可擴展處理器至強可擴展處理器Sapphire Rapids:專為數據中心而生:專為數據中心而生Sapphire Rapids:下一代數據中心處理器的標準下一代數據中心處理器的標準,采用采用Intel 7制程技術制程技術,結合結合性能核與全新加速器引擎性能核與
256、全新加速器引擎,突破低時延和突破低時延和單線程性能極限單線程性能極限Sapphire Rapids核心為一個分區塊、模塊化的SoC架構,同時采用嵌入式多芯片互連橋接(EMIB)封裝技術和先進的網格架構(Mesh),在保有單晶片CPU接口優勢的同時,具有顯著的可擴展性該處理器能夠提供單一、平衡的統一內存訪問架構,每個線程都能夠完全訪問緩存、內存和I/O等所有單元上的全部資源,使得整個SoC具有一致的低時延與高橫向帶寬。Sapphire Rapids同時提供多類針對數據中心的加速器,包括新指令集架構和集成IP。資料來源:Intel Architecture Day 2021至強可擴展處理器至強可擴
257、展處理器Sapphire RapidsIntel加速器接口架構指令集(加速器接口架構指令集(AiA):):可以進行加速器調度,便于使用。Intel高級矩陣擴展(高級矩陣擴展(AMX):):張量計算,加速深度學習類任務。INT8算力達到AVX-512的8倍,BFP16算力達到AVX-512的16倍Intel數據流加速器(數據流加速器(DSA):):將數據流處理/移動任務從CPU剝離出來,使CPU增加39%的可利用時間。Intel加解密加解密/壓縮解壓引擎(壓縮解壓引擎(QAT):可解放98%的加密/解密/壓縮/解壓算力。資料來源:Intel Architecture Day 2021,中信證券研
258、究部Sapphire Rapids與數據中心相關的各類加速器與數據中心相關的各類加速器1145.3.酷睿(中高端酷睿(中高端PC):取代奔騰成):取代奔騰成PC核心高端產品線核心高端產品線微架構CorePenrynNehalemWestmereSandy BridgeIvy BridgeHaswellBroadwellCoreNehalemSandy BridgeHaswell65nm45nm32nm22nm14nm20062007200820092010201120132014TockTickTockTickTockTickTockTick核心微架構年份改進戰略工藝制程第一代Core/Cor
259、e 2 取消超線程技術第1代Core i 首次量產HKMG工藝 增加三級緩存 采用超線程 初代睿頻 初代Ringbus桌面CPU產品 關鍵技術變化第2代Core i 首次集成核顯 第二代睿頻 256位環形總線Core2 制程改進版第1代Core i工藝改進版 第二代HKMG工藝第3代Core i 首次采用三柵極晶體管(FinFET)工藝第5代Core i 首次采用14nm FinFET第4代Core i 支持DDR3 首次為SoC架構進行專門優化微架構SkylakeKaby LakeCoffee LakeComet LakeIce LakeTiger LakeAlder LakeSkylake
260、Golden Cove14nmIntel 720152016201720182019202020212022核心微架構年份工藝制程Sunny Cove14+nm14+nm14+nm10nm10+nmIntel 7Willow CoveRaptor LakeGolden Cove第6代Core i 第三代DMI總線桌面CPU產品 關鍵技術變化第7代Core i 提高主頻與內存頻率第8/9代Core i 提高主頻與內存頻率 增加緩存與核心數第10代Core i 增加緩存與核心數第10代Core i 增加新指令 核顯大幅增強第11代Core i 緩存增加 核顯大幅增強第12代Core i 使用大小核
261、混合架構 支持DDR5架構優化優化優化工藝架構架構優化改進戰略歷代酷睿發展歷程歷代酷睿發展歷程與與Tick-tock與與PAO戰略下快速成長戰略下快速成長資料來源:Chenfan Blog-Jcf94,Wikichip,中信證券研究部1155.3.酷睿(中高端酷睿(中高端PC):取代奔騰成):取代奔騰成PC核心高端產品線核心高端產品線自自2006年第一代酷睿推出后年第一代酷睿推出后,公司又于公司又于2008年推出第一代年推出第一代Core i系列系列,從此酷睿系列便以從此酷睿系列便以i3、i5、i7、i9劃分產品性能劃分產品性能,方便消費者進行選購與對比方便消費者進行選購與對比Core i7
262、965E/920為第一代酷睿為第一代酷睿,其進行大量革新其進行大量革新,成為一代經典成為一代經典采用Nehalem架構,45nm制程,并采用原生四核以提高芯片性能超線程技術(hyper-threading technology)重新回歸,多任務處理能力提升使用QuickPath Interface(英特爾智能互連技術(QPI))取代此前的FSB(前端總線),將北橋整合進CPU中,使得CPU與芯片組具更快的連接速度FSB(Front side bus)前端總線結構及與)前端總線結構及與QPI對比對比資料來源:電腦吧評測室,中信證券研究部FSBFSB總線結構下,總線結構下,北橋位于CPU與內存、顯
263、卡、南橋芯片之間,負責數據交換,各部分呈現“CPU-北橋-內存/顯卡/南橋芯片”排列,FSB總線用于連接CPU與北橋芯片,內存/顯卡/南橋芯片上的數據傳輸必須經過FSB這一條總線,因此因此FSBFSB的傳輸速度將直接的傳輸速度將直接影響影響CPUCPU的數據處理速度。的數據處理速度。而而QPIQPI結構,結構,則是將北橋整合進CPU中,系統總線也將會被分成多條連接,各條總線的頻率、速度可以不同,大大提升數據傳輸速度大大提升數據傳輸速度。1165.3.酷睿(中高端酷睿(中高端PC):取代奔騰成):取代奔騰成PC核心高端產品線核心高端產品線二代酷睿:二代酷睿:使用Sandy Bridge架構,并全
264、線加入核顯全線加入核顯,大幅提高內存的兼容性。五代酷睿:首次嘗試五代酷睿:首次嘗試14納米制程納米制程,指令集指令集Bug使其產品壽使其產品壽命短暫命短暫五代酷睿使用Broadwell架構,并使用可與入門級獨顯媲美的P系列核顯,開始支持DDR4;其在桌面端只有5775C和5675C兩款產品CPU,更多的是應用于OEM及移動市場。根 據 電 科 技,五 代 酷 睿 由 于 指 令 集 Bug 問 題(BDM101/BDM86錯誤),使其會出現MCE(機器異常檢查)錯誤,用戶在使用時會出現崩潰、藍屏等狀況。因此其也成為酷睿系列產品壽命最短的處理器此后此后,AMD發布發布Zen架構架構,英特爾與英特
265、爾與AMD在在PC市場競爭市場競爭日益激烈日益激烈八代酷睿與ZEN+架構的二代銳龍同期發布;九代酷睿與ZEN2架構的三代銳龍同期發布;十代酷睿與ZEN3架構的5000系列銳龍同期發布十代酷睿的架構主體依舊是Skylake,僅在其基礎上稍作修改。面對AMD的堆核設計與大緩存設計,十代酷睿開始出現降價,競爭日益激烈資料來源:知乎-(作者:老狼),Anandtech十代架構十代架構Sunnny Cove與前代、與前代、AMD架構對比架構對比1175.3.酷睿(中高端酷睿(中高端PC):取代奔騰成):取代奔騰成PC核心高端產品線核心高端產品線目前目前,酷睿為英特爾面向筆記本電腦和臺式機推出的性能最高的
266、酷睿為英特爾面向筆記本電腦和臺式機推出的性能最高的CPU產品性能由低端到高端分別為酷睿i3、i5、i7、i9四個系列,適應于商務、創意、游戲等場景X系列具有更高的核心數系列具有更高的核心數,因此能夠迅速響應多個CPU的密集型任務。如:開發CG游戲人物;圖像處理、3D渲染、視頻剪輯;電影級的3D渲染與性能類似的至強系列相比,酷??犷更多應用于個人更多應用于個人PC平臺平臺,而非服務器等企業級場景酷睿系列產品命名規則:酷睿系列產品命名規則:品牌修飾符+代次指示符+SKU 數值+產品線后綴酷睿系列分類情況酷睿系列分類情況資料來源:英特爾官網,中信證券研究部產品系列具體應用酷睿i3高性價比的處理器為
267、日常任務提供出色的性能??犷5專為數據中心和工作站打造,可處理云、大數據、建模、人工智能等的繁重處理需求??犷7這款 CPU 集合了多達 14 個核心的能力來加速計算,支持高端游戲、連接性和安全性??犷9為家用電腦和商用電腦提供卓越性能,用于游戲、創意和多任務處理??犷處理器未鎖頻的CPU可提供多達18個內核,用于最極端的游戲、創意制作和多任務處理。品牌修飾符:品牌修飾符:數字越大表示其提供的性能級別更高代次指示符:代次指示符:第一或第二位數字表示第X代產品,通常越大性能越高SKU 數值:數值:按照代次和產品線中的處理器開發順序分配(同等級同代下,絕對性能差距不大)后綴:后綴:用于區分
268、其它性能區別,比如E代表“嵌入式”、F代表“需要獨立顯卡”、K代表“未鎖頻”等酷睿產品命名規則酷睿產品命名規則資料來源:英特爾官網,中信證券研究部1185.3.處理器酷睿:異構趨勢初現處理器酷睿:異構趨勢初現最新一代酷睿已發展到第最新一代酷睿已發展到第12代處理器代處理器Alder Lake采用intel 7(10nm)制程工藝內存支持DDR5和LPDDR5十年最大的構轉型(性能混合架構),16核心24線程,內置性能核性能核(P核核)與能效核能效核(E核核)兩種內核,充分平衡性能與能效其中,性能核(P核)采用Golden Cove架構,IPC提升約19%;能效核采用Gracemont架構,性能
269、接近Skylake,能效比高資料來源:英特爾官網,中信證券研究部12代酷睿主要產品性能代酷睿主要產品性能專業軟件性能優于專業軟件性能優于11980HK、Ryzen 9 5900HX、M1 Max資料來源:英特爾官網,中信證券研究部1195.4.奔騰(中低端奔騰(中低端PC):引領):引領CPU歷史變革,現用于教育歷史變革,現用于教育/辦公場景辦公場景在在8086等處理器取得成功后等處理器取得成功后,英特爾于英特爾于1993年發布第一代奔騰年發布第一代奔騰,其非數字形式的名字是為了申請商標其非數字形式的名字是為了申請商標,防止友商模仿式命防止友商模仿式命名名,從而強化自身品牌從而強化自身品牌英特
270、爾的8086、80286、80386產品取得成功后,為防止競爭對手使用相似的命名(如AMD的Am386、Am486等),便希望將80586申請商標,而由于數字無法申請商標,因此公司將80586取名為“Pentium”,由此“奔騰”誕生奔騰為英特爾早期的唯一產品奔騰為英特爾早期的唯一產品,而后由其衍生出至強而后由其衍生出至強、賽揚等系列賽揚等系列P5P6NetBurst350nm250nm250nm65nm65nm19931996199519971999200020052003核心微架構年份工藝制程Pentium 第一款超標量處理器Pentium Pro 16KB L1緩存 256KB L2緩存
271、CPU產品 關鍵技術變化Pentium III 擴充SSE指令Pentium MMX 使用MMX指令Pentium II 改進16位數處理能力Pentium 4 前端總線頻率達800MHzPentium M低功耗,高性能,為筆電而生架構更接近Pentium III的短流水線設計Pentium D 具兩個奔騰4處理核心早期奔騰迭代歷史早期奔騰迭代歷史45nm2006Pentium Dual-Core 雙核雙線程,功耗低,處理能力更強350nmP5、P54CSTillamookP6DeschutesTualatinCedar MillPreslerDothanCPU代號Wolfdale-3MP6C
272、ore130nm65nm資料來源:英特爾官網,wikichip,中信證券研究部1205.4.奔騰(中低端奔騰(中低端PC):引領):引領CPU歷史變革,現用于教育歷史變革,現用于教育/辦公場景辦公場景隨著處理器性能要求的提升隨著處理器性能要求的提升,在英特爾在英特爾2006年推出酷睿系列后年推出酷睿系列后,奔騰推出產品的市場定位逐漸轉向中低端奔騰推出產品的市場定位逐漸轉向中低端PC從目前的產品特點看從目前的產品特點看,奔騰的特點為性價比高奔騰的特點為性價比高。注重性能注重性能、體驗和價值的平衡體驗和價值的平衡,適用于從筆記本電腦適用于從筆記本電腦、臺式機和迷你電腦臺式機和迷你電腦的多種設備的多
273、種設備,下分奔騰金牌與奔騰銀牌下分奔騰金牌與奔騰銀牌,老版命名方式可分為老版命名方式可分為G、D、J系列系列金牌:適用于日常計算,例如基本辦公任務和瀏覽視覺效果豐富的網頁,同時可進行輕量照片編輯、視頻編輯和多任務處理銀牌:為入門級電腦市場帶來經濟實惠的解決方案,提供出色的視頻會議功能、更快的無線連接和較長的電池續航時間。教師和學生可以快速完成日常任務并節約寶貴時間早期:初代奔騰與奔騰早期:初代奔騰與奔騰Pro,分別面向個人與服務器市場,分別面向個人與服務器市場資料來源:wikichip,中信證券研究部第一代奔騰處理器第一代奔騰處理器發布于1993年,采用0.60 微米工藝,晶體管數量為320
274、萬8505于22Q1推出,是英特爾最新一代的奔騰處理器?,F如今,奔騰處理主要應用于辦公場景。所應用的機型價格相對較低現為入門級應用:搭載奔騰金牌現為入門級應用:搭載奔騰金牌8505的的DELL靈越靈越5411一體機一體機奔騰奔騰pro發布于1995年,32位,面向服務器與工作站,晶體管數量550萬地址總線擴展至36位,增加PAE技術,能夠支持64GB的RAM資料來源:京東商城,中信證券研究部1215.5.賽揚(低價低端賽揚(低價低端PC):性能較奔騰低一級,幫助實現市場下沉):性能較奔騰低一級,幫助實現市場下沉第一代第一代“賽揚賽揚”Covington與與“至強至強”同年同年(1998年年)推
275、出推出,但其無但其無L2緩存等設計緩存等設計,旨在進一步做出差異化旨在進一步做出差異化與Pentium II Xeon一樣,Covington同樣采用P6架構與250nm制程,但其不配備L2緩存,因此對硬件的保護需求,散熱需求較低。由于缺少二級緩存,第一代“賽揚”的整數性能受影響較大,浮點性能影響較小但結構簡化使得Covington具有更低的價格與更強的超頻能力,能夠更適應低端市場第二代第二代“賽揚賽揚”Mendocino設計則帶有設計則帶有L2緩存緩存,其成功奪回大量市場其成功奪回大量市場,競爭力強大競爭力強大第二代“賽揚”Mendocino配備128KB片內全速L2緩存,因此頻率由300M
276、Hz升至533MHz其SLOT 1也改為專用于低成本處理器的Socket 370接口其成功的設計快速搶占亞洲各國PC組裝市場,與同代對手AMD的K6-2相比依舊保有競爭力Covington是個人電腦普及是個人電腦普及,低端低端CPU價格戰的產物價格戰的產物,有效幫助公司早期實現市場下沉有效幫助公司早期實現市場下沉1998年前后,個人電腦滲透率快速提升,大量的低價CPU需求使得各廠商在低端領域展開激烈的價格戰,英特爾推出賽揚系列與AMD的K6-2系列在該領域展開激烈競爭,并打擊了Cyrix、Centaur、Rise等一眾CPU廠商資料來源:CPU-world,中信證券研究部Covington與與
277、Mendocino性能參數對比性能參數對比架構架構工藝制程工藝制程核心數核心數緩存緩存頻率頻率(MHz)總線頻率總線頻率(MHz)接口接口指令集指令集位數位數CovingtonP6250nm1無266-30066Slot 1/SC242MMX32MendocinoP6250nm1128 KB L253366Slot 1/Socket 370MMX321225.5.賽揚(低價低端賽揚(低價低端PC):性能較奔騰低一級,幫助實現市場下沉):性能較奔騰低一級,幫助實現市場下沉目前低端目前低端、低價低價、較強穩定性的賽揚系列較強穩定性的賽揚系列,主要用于入門級電腦主要用于入門級電腦賽揚系列性能較低,適
278、用于入門級電腦、嵌入式應用,核心數普遍為2,部分為4,且為單線程。其性能較奔騰更低一級,主要可分為G、J、N系列但其價格普遍較低但其價格普遍較低,例如例如22Q1推出的賽揚推出的賽揚G6900,價格區間為價格區間為42-52美元美元,較酷睿較酷睿、奔騰系列經濟實惠奔騰系列經濟實惠英特爾部分新品參數、價格對比英特爾部分新品參數、價格對比資料來源:英特爾官網,中信證券研究部i9i9-1290012900i3i3-1210012100G7400G7400D1702D1702D1739D173985058505G6900G6900G6900TEG6900TE系列系列酷睿i9酷睿i9奔騰金牌至強D至強D
279、奔騰金牌賽揚賽揚賽揚賽揚發行日期發行日期Q122Q122Q122Q122Q122Q122Q122Q122垂直市場垂直市場DesktopDesktopDesktopServerServerMobileDesktopEmbedded光刻光刻Intel 7Intel 7Intel 7Intel 7Intel 7Intel 7Intel 7Intel 7使用條件使用條件PC/Client/Tablet WorkstationPC/Client/TabletPC/Client/TabletServer/EnterpriseServer/Enterprise/PC/Client/TabletEmbedde
280、d Broad Market Commercial Temp內核數內核數16422852 22 2性能核數性能核數8422812 22 2能效核數能效核數8000040 00 0線程數線程數248441662 22 2緩存緩存30 MB Intel Smart Cache12 MB Intel Smart Cache6 MB Intel Smart Cache5 MB15 MB8 MB Intel Smart Cache4 MB Intel Smart Cache4 MB Intel Smart Cache提供嵌入式提供嵌入式方案方案是是否否否否否否是是最大內存最大內存大小大小128 GB12
281、8 GB128 GB256 GB384 GB64 GB128 GB128 GB美元價格美元價格489489-519519122122-1291296464-74741131137437431611614242-525244441235.6.處理器凌動(低功耗、物聯網):瞄準移動市場,集成化為迭代主線處理器凌動(低功耗、物聯網):瞄準移動市場,集成化為迭代主線凌動為英特爾的超低電壓處理器凌動為英特爾的超低電壓處理器,其主要應用場景為其主要應用場景為智能手機智能手機、平板電腦和低成本平板電腦和低成本PC凌動于2008年首次發布,一開始的Z系列全為單核第一代第一代“凌動凌動”:產品針對上網本移動市場
282、:產品針對上網本移動市場,面積與面積與功耗成為設計的重要考量功耗成為設計的重要考量。第一代凌動采用Bonnell微處理器架構,45nm制程。其放棄亂序執行單元,而采用順序執行設計。此舉犧牲了部分處理器性能,但減少大量的晶體管數量,從而大幅減小芯片體積。同時,45nm制程工藝也有助于進一步縮小產品面積雖然其能耗比出色,但性能相對孱弱,一定程度上影響第一代“凌動”的銷量第二代第二代“凌動凌動”:嘗試同步提升性能與減少面積的設:嘗試同步提升性能與減少面積的設計計,彌補一代缺陷彌補一代缺陷2009Q4,英特爾推出第二代“凌動”Pine Trail,其架構同樣為Bonnell,制程為45nm。但相較于一
283、代凌動,其采用雙芯片設計將北橋芯片整合進CPU中,此舉既能大幅降低內存延遲,提升運算速度;又能將芯片體積減小60%-70%。資料來源:Intel官網,unwire一代“凌動”與二代“凌動”結構對比一代“凌動”與二代“凌動”結構對比整合北橋整合北橋1245.6.處理器凌動(低功耗、物聯網):瞄準移動市場,集成化為迭代主線處理器凌動(低功耗、物聯網):瞄準移動市場,集成化為迭代主線第三代第三代“凌動凌動”:面對手機市場的巨大機遇與:面對手機市場的巨大機遇與ARMARM的強大地位的強大地位,英特爾推出新一代產品英特爾推出新一代產品MedfieldMedfield,成效顯著成效顯著Medfield由M
284、enlow迭代而來,其微架構為Saltwell,但制程升級至32nm,處理器頻率達1.80GHz或1.86GHz其將處理器與芯片整合為其將處理器與芯片整合為SoCSoC(名為名為PenwellPenwell)進一步提升集成度進一步提升集成度,整個SoC的尺寸為12mm x 12mm,較前代縮小一半;同時其功耗表現也普遍由于同期產品,根據Anandtech數據,與蘋果三星同期手機相比,Medfield在待機、通話、瀏覽等應用場景功耗均表現優異資料來源:Intel 2009投資者會Medfield迭代歷程迭代歷程待機待機(3G)談話談話(3G)瀏覽瀏覽(3G)視頻播放視頻播放720p蘋果蘋果 iP
285、hone 4S38mW800mW1.3W500mW英特爾英特爾 Medfield 參考參考18mW700mW1.0W850mW三星蓋樂世三星蓋樂世 S II19mW675mW1.2W650mWPenwell SoC 內部結構框架圖內部結構框架圖資料來源:AnandtechMedfield與同期產品功耗對比與同期產品功耗對比資料來源:Anandtech,中信證券研究部1255.6.處理器凌動(低功耗、物聯網):瞄準移動市場,集成化為迭代主線處理器凌動(低功耗、物聯網):瞄準移動市場,集成化為迭代主線此后此后,“凌動凌動”陸續推出多代處理器陸續推出多代處理器,但在智能手機市場依舊不敵但在智能手機市
286、場依舊不敵ARMARM在Medfield之后,“凌動”推出了Baytrail、Braswell、Apollo Lake等平臺,并投資約100億美元用于產品折扣、聯合營銷、設備商補貼等。根據21IC,補貼結束后,凌動出貨量同比下降44%,巨額投資讓利并未強化客戶粘性與提升市場地位巨額投資讓利并未強化客戶粘性與提升市場地位我們認為我們認為,生態生態、兼容性兼容性、X X8686適配性不足等因素是英特爾在移動端市場開拓不順的主要原因適配性不足等因素是英特爾在移動端市場開拓不順的主要原因生態:生態:“凌動”入局較晚,ARM生態已初步建立兼容性:兼容性:“凌動”對安卓系統的兼容性問題始終存在,生態突破難
287、度提升功耗與能效:功耗與能效:英特爾的功耗高于ARM,在移動端競爭中劣勢大資料來源:各公司官網,中信證券研究部“凌動”系列在移動端發展阻礙“凌動”系列在移動端發展阻礙阻礙維度阻礙維度具體內容具體內容生態生態“凌動”入局較晚,“凌動”入局較晚,ARMARM生態已初步建立。生態已初步建立?!傲鑴印碑a品線2008年方成立,彼時ARM已成功鑄造自己的生態壁壘,大量的開發商與軟件已與ARM形成深度綁定,Arm+Android的合作一如當年的“Wintel”聯盟,先到先得、贏者通吃兼容性兼容性“凌動”對安卓系統的兼容性問題,使得生態突破難度提升?!傲鑴印睂Π沧肯到y的兼容性問題,使得生態突破難度提升?!傲鑴?/p>
288、”系列依舊為X86架構,而大多數移動端應用開發者不愿意為X86手機提供針對性的安裝包。無論英特爾如何優化,其由于架構不同產生的兼容性問題依舊存在功耗與能效功耗與能效英特爾的功耗高于英特爾的功耗高于ARMARM,在移動端競爭中劣勢大。,在移動端競爭中劣勢大。應用于PC端的英特爾處理器具有更高的功耗,無法滿足移動端的功耗需求,需要重新設計,其設計方案往往以犧牲性能為代價實現功耗的降低,但其能耗比依舊低于ARM1265.6.處理器凌動(低功耗、物聯網):瞄準移動市場,集成化為迭代主線處理器凌動(低功耗、物聯網):瞄準移動市場,集成化為迭代主線目前目前,“凌動凌動”系列逐漸邊緣化系列逐漸邊緣化,但相關
289、架構應用于但相關架構應用于12代酷睿的能效核中代酷睿的能效核中2016年4月底,英特爾公司發言人證實原定在2016年推出的移動處理器凌動產品線的兩個新版本將會取消發布,換言之英特爾將會退出智能手機芯片市場英特爾將會退出智能手機芯片市場而后由于公司布局調整,其Atom的N系列被并入奔騰與賽揚中;目前所保留的C系列、P系列主要針對服務器、基站等應用領域;后整個系列的核心數跨度也逐漸變大,最小為2核,最大為24核(如凌動P5900系列的P5962B)智能手機市場逐漸被ARM所占據,Atom系列不再更新,但在12代酷睿中,Atom則作為高能效比的“小核”(能效核),再次出現,在“大小核”時代發揮其作用
290、。凌動凌動P5900系列產品特點系列產品特點資料來源:英特爾官網,中信證券研究部英特爾第一款為英特爾第一款為5G基站打造的基站打造的SoC單顆芯片,專為單顆芯片,專為 5G 的高帶的高帶寬和低延遲而設計。寬和低延遲而設計。功耗完全滿足基站要求功耗完全滿足基站要求將計算、連接、加速器集成到單將計算、連接、加速器集成到單顆顆SoC片上系統中。采用英特爾片上系統中。采用英特爾10納米納米延續英特爾的專長,擁有極強的延續英特爾的專長,擁有極強的計算能力;在連接上,具有內置計算能力;在連接上,具有內置的交換,速度高達的交換,速度高達 440T。P5962BP5962B系列系列凌動P發行日期發行日期Q12
291、0垂直市場垂直市場Server光刻光刻10 nm使用條件使用條件Base Transceiver Station內核數內核數24基本頻率基本頻率2.20 GHz線程數線程數24緩存緩存27 MB L2 Cache提供嵌入式方案提供嵌入式方案是UPI UPI 鏈接數鏈接數0QPI QPI 鏈接數鏈接數0最大內存大小最大內存大小128 GB凌動凌動P5962B性能參數性能參數資料來源:英特爾官網,中信證券研究部12代酷睿大小核設計代酷睿大小核設計能效核能效核*4隸屬凌動系列資料來源:IAD 2021,中信證券研究部1275.7.Movidius視覺處理器:前瞻布局,針對邊緣與視覺處理器:前瞻布局,
292、針對邊緣與AI設備設備Movidius視覺處理器視覺處理器(VPU)用于計算機視覺和邊緣人工智能工作負載用于計算機視覺和邊緣人工智能工作負載通過獨特架構,將高度并行的可編程計算與面向特定工作負載的硬件加速相結合,并可實現電源效率和計算性能之間的平衡借助深度神經網絡和基于計算機視覺的應用程序,為智能攝像頭、邊緣服務器和人工智能設備提供支持目前,英特爾官網僅子公司Movidius推出的Myriad X一顆VPU產品Movidius Myriad X性能參數性能參數資料來源:Anandtech,中信證券研究部 工藝制程為16nm FinFET 引入了被稱為神經計算引擎(Neural Compute
293、Engine)的片上 DNN 加速器,在 Myriad X 的理論 4+TOPS 計算能力的基礎下,可以實現每秒超過1 萬億次操作(TOPS)的峰值 DNN 推理吞吐量 擁有四個 C 編程 128 位 VLIW 失量處理器 支持 30 Hz(H.264/H.265)和60 Hz(M/JPEG)的 4K 硬件編碼。在接口方面,支持 USB 3.1 和 PCIe 3.0128六、行業演變:多年積累,競合不斷,成就行業兩大龍頭六、行業演變:多年積累,競合不斷,成就行業兩大龍頭6.1 6.1 發展演變:相互競合,初始稟賦與體量決定不同發展戰略發展演變:相互競合,初始稟賦與體量決定不同發展戰略6.2 6
294、.2 競爭格局:差距逐漸縮小,筆記本服務器市場公司優勢顯著競爭格局:差距逐漸縮小,筆記本服務器市場公司優勢顯著129仙童半導體仙童半導體英特爾在英特爾在CPU上主要競爭對手是上主要競爭對手是AMD,兩者在各個發展階段聯系緊密兩者在各個發展階段聯系緊密,競合不斷競合不斷公司創立公司創立英特爾與英特爾與AMD的創始人均來自的創始人均來自“仙童半導體仙童半導體”?!坝⑻貭枴眲摿⒑?,仙童半導體銷售部主管杰里 桑德斯加入無果,便與其它7名仙童半導體員工共同創立了“AMD”6.1.發展演變:發展演變:AMD,同根同源的對手,競合不斷,同根同源的對手,競合不斷資料來源:Wikichip,中信證券研究部;注:
295、Logo來自各公司官網羅伯特羅伯特 諾伊斯諾伊斯戈登戈登 摩爾摩爾安迪安迪 格魯夫格魯夫杰里杰里 桑德斯桑德斯7名仙童員工名仙童員工 同根同源,擁有相似的產業資源、趨勢研判 羅伯特 諾伊斯曾以個人信用為AMD做擔保,幫助解決前期籌資問題 相似且緊密的關系為后續的競合埋下伏筆錯位成長錯位成長作為英特爾的作為英特爾的“第二供應商第二供應商”,重學習追趕重學習追趕,輕正面對抗輕正面對抗。AMD推出的第一款CPU AM9080,實質是對Intel8080A的逆向參考,并具有增強的電氣特性和更低的功耗 AMD不與英特爾競爭,而是通過產品性能打敗其余競爭對手,成為“第二供應商”符合當時下游廠商的“多供應商
296、”需求,避免正面對抗 蘋果等公司如今依舊采用“多供應商”的策略模仿逆向于模仿逆向于AMD AM9080Intel 8080A資料來源:cpu-world,中信證券研究部130共同發展共同發展AMD作為作為“第二供應商第二供應商”,與英特爾共同進入與英特爾共同進入IBM供應鏈供應鏈,收獲收獲X86架構架構。為滿足IBM“第二供應商”要求及打入IBM供應鏈,英特爾同意授權AMD生產X86處理器,同時AMD放棄自有產品,成為第二供應商6.1.發展演變:由發展演變:由AMD追隨模仿,到雙方各展所長追隨模仿,到雙方各展所長 英特爾:逐漸意識到微處理器的重要性,并調整自身業務核心 AMD:成功進入X86架
297、構,并在后續以此為藍本推出Am286處理器產權對抗產權對抗“第二供應商第二供應商”策略帶來的知識產權風險:策略帶來的知識產權風險:模仿追隨下,AMD迅速發展。英特爾開始對AMD“專利侵權”展開訴訟,最終英特爾敗訴。AMD獲得80386的任何知識產權(包括X86指令集)各顯神通各顯神通英特爾加快產品研發英特爾加快產品研發,并推出并推出“Intel inside”運動運動,強化品牌強化品牌。AMD基于X86架構下的內研外并,構筑自有產品力,主打性價比IBM英特爾英特爾AMD第一供應商第一供應商第二供應商第二供應商相互授權相互授權英特爾英特爾AMD 雙方開始根據自身行業地位制定市場戰略 英特爾旨在提
298、高品牌辨識度,做出品牌差異 AMD瞄準中端市場,提升性價比 雙方均重視CPU性能的提升,開始在產品迭代上進行競爭。陸續推出386、486、以及具有跨時代意義的奔騰(586)處理器推出Intel inside:只要下游客戶在其相關產品廣告中打出Intel inside的標志,就能獲得英特爾的“廣告報銷”推出Am386,與intel的386兼容,性價比高而后收購NexGen,推出“速龍”處理器,前于英特爾發布全球首款1GHZ的處理器資料來源:自各公司官網,中信證券研究部131英特爾英特爾Tick-Tock策略策略2006年年,英特爾提出英特爾提出“Tick-Tock”戰略戰略。公司以兩年一個周期進
299、行工藝與架構的交替更新,從而保證產品性能的持續提升“Tick-Tock”“PAO”:技術無法跟上迭代節奏,延長為三年一周期,多添加“優化”環節6.1.發展演變:英特爾發展演變:英特爾加速研發,拉開差距加速研發,拉開差距 保證產品迭代速度:保證產品迭代速度:使得AMD無法跟隨英特爾快速的產品迭代速度,有效拉開與AMD的差距。更具穩定性:更具穩定性:將工藝與架構交錯升級,避免工藝與架構同時更新失敗的風險工藝年(Tick):使用新的制程,架構方面僅做微小調整架構年(Tock):主要針對架構進行較大改進,并優化前一年線程資料來源:CSDN-CHENG Jian,英特爾官網,中信證券研究部2016年,由
300、于14nm、10nm工藝進展不順,英特爾放棄“Tick-Tock”戰略,而采用PAO”戰略采用“PAO”戰略,以三年為一周期,進行“工藝-架構-優化”的交替迭代英特爾英特爾“Tick-Tock”戰略產品規劃圖戰略產品規劃圖英特爾英特爾“PAO”戰略產品規劃圖戰略產品規劃圖資料來源:CSDN-CHENG Jian,英特爾官網132AMD由由IDM轉為轉為Fabless:2009年,由于AMD資金緊張,無法繼續在代工方面投入大量的資金,其將自有的代工廠“格羅方德”分拆出售,由IDM轉為Fabless,專注于芯片的研發環節借力于臺積電借力于臺積電,實現趕超:實現趕超:英特爾10nm制程進展不順,而A
301、MD選擇臺積電進行代工,首次實現在制程維度的反超。借助臺積電先進工藝,結合自身研發多年的Zen架構,AMD CPU性能提升明顯,迅速搶占市場6.1.發展演變:發展演變:AMD內研架構,外尋工藝,實現追趕內研架構,外尋工藝,實現追趕AMD Zen架構架構CPU路線圖路線圖資料來源:知乎半導體行業觀察,tomshardware 架構+制程:CPU性能提升的兩大關鍵 無論是英特爾還是AMD,CPU廠商在進行向上突破時,都極大依賴于架構與制程的革新 專注研發的Fabless模式,更適合體量較小的CPU廠商 17年,AMD推出了耗時4年研發的“Zen”架構,EPYC霄龍服務器處理器性能大幅提升 19年,
302、推出“Zen2”架構的第二代霄龍,為首顆7nm制程的服務器處理器,由臺積電代工 21年推出“Zen3”架構的第三代霄龍服務器處理器,同為7nm,實現19%的代際 IPC 提升AMD Zen霄龍服務器產品歷程霄龍服務器產品歷程資料來源:AMD官網,中信證券研究部133AMD與英特爾在同頻下與英特爾在同頻下Cinebench R15單核跑分對比單核跑分對比050100150200250201220132014201520162017201820192020AMD單核得分英特爾單核得分在架構上在架構上,Zen架構快速提升單核性能架構快速提升單核性能,彌補自身產品長期以來的劣勢;此后彌補自身產品長期以
303、來的劣勢;此后,Zen2實現性能反超實現性能反超一直以來,AMD的CPU都存在單核性能羸弱的特點,單核性能始終弱于同期同等級的英特爾產品,只能依靠“堆核”的策略縮小兩者的差距根據Cinebench R15數據,AMD在2019年憑借其Zen 2架構,成功實現CPU單核跑分的超越6.1.發展演變:發展演變:AMD內研架構,外尋工藝,實現追趕內研架構,外尋工藝,實現追趕資料來源:Cinebench R15,前瞻產業研究院,中信證券研究部AMDAMD單核性能明顯弱單核性能明顯弱于同期英特爾產品于同期英特爾產品注:2018年及以前為(4.0GHz),2019年為4.1GHz20192019年年5 5月
304、,月,AMDAMD發布搭載發布搭載Zen2Zen2架構架構的銳龍的銳龍3000CPU3000CPU,實現,實現21%21%的代際性的代際性能提升,能提升,IPCIPC部分提升部分提升+60%+60%,單核性,單核性能反超英特爾能反超英特爾AMD ZenAMD Zen架構誕生,顯架構誕生,顯著縮小與英特爾差距著縮小與英特爾差距134同時同時,Foundry廠商臺積電專注于代工制造廠商臺積電專注于代工制造,能夠具有充足的資本投入于制程的推進能夠具有充足的資本投入于制程的推進,因此能幫助因此能幫助AMD迅速補足工藝制程迅速補足工藝制程的不足的不足2017年以前,AMD的各代產品在制程上都落后于英特爾
305、的同期產品,英特爾在2013年已成功量產14nm產品,而同期AMD仍停留在32nm制程而在17年后,AMD借助臺積電成功實現制程上的反超,率先量產7nm CPU6.1.發展演變:發展演變:AMD內研架構,外尋工藝,實現追趕內研架構,外尋工藝,實現追趕2008-2021 英特爾與英特爾與AMD處理器架構與制程對比處理器架構與制程對比資料來源:前瞻產業研究院,英特爾官網,AMD官網,中信證券研究部英特爾英特爾AMDAMD年份年份架構架構工藝工藝架構架構工藝工藝20082008Corei7(Nehalem)45nmPhenom FX(Agena)65nm20102010Corei7(Westmere
306、)32nmPhenom II(Thuban)45nm20112011Sandy Bridge32nmFX(Bulldozer)APU(Liano)32nm20122012lvy Bridge22nmFX(Piledriver)APU(Trinity)32nm20132013Haswell14nmFX(Piledriver)APU(Richard)32nm20142014Broadwell14nmFX(Pildriver)28nm20152015Skywell14nmAPU(Godavri,Carrizo)28nm20162016Kabylake14nm+FX(Zen)14nm20172017C
307、annonlake14nm+APU(Zen)14nm20182018Cannonlake/Coffeelake14nm+Zen+12nm20192019Icelake10nmZen 27nm20202020Tigerlake10nmZen 37nm20212021Alderlake7nmAMDAMD制程落后,產品制程落后,產品性能不足,市場份額性能不足,市場份額日益減少日益減少AMD+AMD+臺積電臺積電Fabless+FoundryFabless+Foundry各自聚焦架構與工藝各自聚焦架構與工藝實現反超實現反超135在在CPU市場市場,兩者分別在不同時期憑借自身正確的發展戰略迅速提升份額兩
308、者分別在不同時期憑借自身正確的發展戰略迅速提升份額06年以前,英特爾與AMD在CPU市場中的份額逐漸接近,而后英特爾發揮技術累積優勢,利用“Tick-Tock”戰略快速提升產品研發速度,市場份額再次拉開。15年以后,AMD逐漸注重非PC市場,加強與三大游戲廠商微軟、索尼、任天堂的合作同時AMD開始注重高性能市場,與17年推出全新Zen架構,搭配臺積電10nm、7nm先進制程,份額快速提升6.2.競爭格局:競爭格局:CPU市場英特爾優勢明顯,市場英特爾優勢明顯,AMD奮起追趕奮起追趕推出自有研發的推出自有研發的Zen架構,架構,性能遠超同期競品性能遠超同期競品推行推行Tick-Tock戰略,加戰
309、略,加速產業研發速度,持續迭速產業研發速度,持續迭代代借助借助Zen、Zen2、Zen3的架構的架構改進及改進及臺積電臺積電10nm、7nm的先進制的先進制程工藝,提升份額程工藝,提升份額與三大游戲廠商微軟、索尼、任天堂與三大游戲廠商微軟、索尼、任天堂持續深化合作持續深化合作AMD的雙核速龍芯片的雙核速龍芯片性能優于同期英特爾性能優于同期英特爾的雙核處理器奔騰的雙核處理器奔騰D資料來源:PassMark,中信證券研究部注:Passmark市場份額數據來自于運行測試軟件的主機,故不反應實際市場份額,但可反應趨勢。英特爾與英特爾與AMD CPU市場份額變化情況市場份額變化情況136其中其中,桌面端
310、電腦為桌面端電腦為CPU的主要戰場的主要戰場,競爭相對激烈競爭相對激烈,AMD憑借憑借Zen架構一度實現反超架構一度實現反超作為CPU的主要競爭市場,兩家公司均在桌面端持續發力,份額也相對接近16Q1,AMD市場份額為53.9%,首度超過英特爾,雖只維持了一個季度,但也使得英特爾意識到自身主業的競爭危機21Q1,疫情換機需求+半導體歷史級行情使得桌面端需求與ASP迅速提升,銳龍4000的持續需求與銳龍5000系列的推出幫助AMD迅速成長。6.2.競爭格局:桌面端競爭格局:桌面端AMD發展迅速,差距明顯縮小發展迅速,差距明顯縮小7nm制程制程定義存在問題定義存在問題宣布延期宣布延期AMD份額首度
311、份額首度超過英特爾超過英特爾Tick-Tock戰略戰略英特爾黃金發展期英特爾黃金發展期Zen+臺積電,臺積電,AMD黃金發展期黃金發展期疫情換機需求驅動疫情換機需求驅動銳龍銳龍 4000、5000系列推出系列推出AMD份額再度超過英特爾份額再度超過英特爾收購收購GPU廠商廠商ATIGPU+CPU雙線發展雙線發展分身乏術分身乏術英特爾與英特爾與AMD 桌面端桌面端CPU市場份額變化情況市場份額變化情況資料來源:PassMark,中信證券研究部注:Passmark市場份額數據來自于運行測試軟件的主機,故不反應實際市場份額,但可反應趨勢。137由于功耗由于功耗、穩定性穩定性、單核性能等優勢單核性能等
312、優勢,英特爾在筆記本電腦市場一直表現強勢英特爾在筆記本電腦市場一直表現強勢。近年來公司份額有所下降近年來公司份額有所下降,但優勢不減但優勢不減筆記本電腦對功耗、發熱均更敏感,要求更為苛刻,而這些維度又恰是AMD的相對弱項,因此AMD在筆記本市場一直無法撼動英特爾的市場地位AMD在筆記本端一直發力不足,份額一直在20%左右徘徊;相反,英特爾在筆記本市場投入不斷,相繼推出“超極本”、“雅典娜計劃”的方案,實現續航、性能、重量的同步提升6.2.競爭格局:筆記本端格局穩定,英特爾優勢明顯競爭格局:筆記本端格局穩定,英特爾優勢明顯銳龍系列在性能和功耗控制銳龍系列在性能和功耗控制上有明顯改善,推高份額上有
313、明顯改善,推高份額Zen3架構大幅架構大幅優化電源管理優化電源管理推出超極本,推出超極本,主打完備、便攜、長續航主打完備、便攜、長續航滿足市場的需求迭代滿足市場的需求迭代AMDAMD在功耗、能效上的劣勢被筆在功耗、能效上的劣勢被筆記本市場進一步放大。記本市場進一步放大。同時英特爾同時英特爾CPUCPU更為穩定,更適更為穩定,更適合移動、微撞擊、微震動的筆合移動、微撞擊、微震動的筆記本場景記本場景兩者差距在筆記本端更為明顯兩者差距在筆記本端更為明顯英特爾與英特爾與AMD 筆記本筆記本CPU市場份額變化情況市場份額變化情況資料來源:PassMark,中信證券研究部注:Passmark市場份額數據來
314、自于運行測試軟件的主機,故不反應實際市場份額,但可反應趨勢。138服務器市場更加強調性能服務器市場更加強調性能,因此英特爾的龍頭地位更加顯著因此英特爾的龍頭地位更加顯著,呈現呈現“強者恒強強者恒強”格局格局英特爾08年Q1在服務器市場的份額為70.8%,此后份額迅速提升,15Q1英特爾在服務器市場的份額已達98.1%。成為該市場的絕對龍頭2019年3月,基于Zen3架構的霄龍第三代服務器處理器推出,幫助AMD迅速搶占市場份額。根據PassMark數據,AMD市場份額由21Q1的2.4%增至21Q3的8.4%。而后英特爾10nm的Ice Lake出貨,又逐漸奪回部分市場份額6.2.競爭格局:服務
315、器端差距擴大,性能導向致使強者恒強競爭格局:服務器端差距擴大,性能導向致使強者恒強推出基于推出基于Zen架構的架構的14nm霄龍處理器霄龍處理器英特爾英特爾14nm Cascade Lake服務器處理器上市服務器處理器上市19年年8月,推出基于月,推出基于Zen2架構架構的的7nm霄龍二代處理器霄龍二代處理器19年年8月,推出基于月,推出基于Zen3架構的架構的7nm霄龍三代處理霄龍三代處理器,器,IPC+19%10nm的的Ice Lake處理器出貨處理器出貨英特爾與英特爾與AMD 服務器服務器CPU市場份額變化情況市場份額變化情況資料來源:PassMark,中信證券研究部注:Passmark
316、市場份額數據來自于運行測試軟件的主機,故不反應實際市場份額,但可反應趨勢。139七:行業啟示:下游需求引領行業變革,商業模式需適配產業趨勢7.1 7.1 架構先行:微架構是架構先行:微架構是CPUCPU競爭的核心法寶,相對成熟利于追趕競爭的核心法寶,相對成熟利于追趕7.2 7.2 生態為王:生態是企業壯大的關鍵,強者愈強地位穩固生態為王:生態是企業壯大的關鍵,強者愈強地位穩固7.37.3需求引領:需求迭代催生后浪巨頭,把握下游打開新興市場需求引領:需求迭代催生后浪巨頭,把握下游打開新興市場7.47.4商業模式:商業模式:FablessFabless展現優勢,分工合作利于規模擴張展現優勢,分工合
317、作利于規模擴張1401407.1 架構先行:架構先行:CPU競爭的核心法寶,技術相對成熟,國產廠商加速追趕競爭的核心法寶,技術相對成熟,國產廠商加速追趕國際上來看國際上來看,微架構是微架構是CPU競爭的核心法寶競爭的核心法寶,目前主要的架構技術已經相對成熟目前主要的架構技術已經相對成熟。指令集架構方面,主要的發展集中于SIMD,到AVX512已經面臨GPU等芯片挑戰,且應用場景有限。微架構方面,流水、緩存、亂序等都已經出現數十年,現在邊際效用已經出現明顯遞減。微架構是國產微架構是國產CPU最主要的發力點最主要的發力點,不斷縮小與海外龍頭差距不斷縮小與海外龍頭差距。工藝制程、先進封裝等影響性能的
318、關鍵因素受限于國產半導體產業鏈的技術水平,CPU企業自身難以獨立決定,對于CPU企業自身而言,微架構的持續創新迭代成為競爭的重點。主要技術主要技術 首次出現首次出現在在CPU上首次出現上首次出現流水線1960,IBM 7030 Stretch1982,Intel 80286高速緩存1969,IBM 360/851984,Intel 80386亂序執行1967,IBM 360/911995,Intel Pentium ProSIMD1997,Intel Pentium MMX架構改進幅度架構改進幅度IPC提升幅度提升幅度微指令緩存+68.75%約3%L2緩存+100%約1%分支預測緩存+50%約
319、2%亂序執行緩存+25%約1%指令集架構指令集架構/微架構的核心思想在數十年前就已經出現微架構的核心思想在數十年前就已經出現架構改進的效用已經明顯縮小架構改進的效用已經明顯縮小資料來源:TechNews科技新報回顧歷史夢幻處理器:計算機結構、商業大型主機與超級計算機的誕生(handymantw),IBM Archives:IBM Mainframe,中信證券研究部資料來源:AMD Ryzen 7000系列發布會,Twitterchiakokhua,中信證券研究部測算1411417.2.生態為王:生態是第一競爭力,強者愈強難以顛覆生態為王:生態是第一競爭力,強者愈強難以顛覆中國部分主流中國部分主
320、流APP活躍用戶數(億)活躍用戶數(億)軟件生態圈通??偸窃絹碓椒€固,難以顛覆,其依賴的指令集也因而難以顛覆軟件生態圈通??偸窃絹碓椒€固,難以顛覆,其依賴的指令集也因而難以顛覆指令集相當于語言,則軟件相當于書籍,語言為書籍提供建立基礎,書籍為語言帶來大量用戶在大規模生態中在大規模生態中,大批用戶能夠吸引大批開發者大批用戶能夠吸引大批開發者,進而產生大批量應用程序進而產生大批量應用程序,進一步吸引用戶進一步吸引用戶,形成正反饋形成正反饋。生態文化圈用戶粘性不斷增強,可以在各APP的活躍用戶數體現開放環境中,生態對于市場的影響力遠超技術水平、自主程度,其他因素難以顛覆生態0.02.04.06.08
321、.010.012.02014-072014-092014-112015-012015-032015-052015-072015-092015-112016-012016-032016-052016-072016-092016-112017-012017-032017-052017-072017-092017-112018-012018-032018-052018-072018-092018-112019-012019-032019-052019-072019-092019-112020-012020-032020-052020-072020-092020-112021-012021-03微信美
322、團騰訊視頻京東拼多多淘寶QQ微博資料來源:wind,中信證券研究部1421427.2.生態為王:生態是第一競爭力,強者愈強難以顛覆生態為王:生態是第一競爭力,強者愈強難以顛覆資料來源:各公司官網中信證券研究部Arm架構生態日益壯大,逐漸蠶食架構生態日益壯大,逐漸蠶食X86架構生態,架構生態,Windows 11已增加已增加ARM支持支持目前目前CPU主要的兩大生態分別是:主要的兩大生態分別是:1、以英特爾以英特爾、AMD為代表的為代表的X86架構生態架構生態。2、以以ARM授權公司授權公司(高通高通、蘋果蘋果、華為華為)為代表的為代表的Arm架構生態架構生態同時,ARM生態發展正逐漸壯大,有逐
323、漸蠶食X86架構生態的趨勢對于一些國產自研架構對于一些國產自研架構,除技術外除技術外,生態也是亟待處理解決的問題生態也是亟待處理解決的問題。如若架構上沒有豐富的軟件生態,架構則會“空有骨架,缺乏靈魂”解決方法解決方法指令翻譯:指令翻譯:利用類似于蘋果Rosetta 2的指令翻譯程序,將其他架構上的程序進行指令集轉譯,從而遷移到目標架構上,但這一做法不能保證軟件的完整運行Windows Windows 7/8/107/8/10X86/X64AndroidiOS/iPadOS/MacOSARMWindows Windows 1111X86/X64Windows 11AndroidiOS/iPadO
324、S/MacOSARM143143成熟生態壁壘過高成熟生態壁壘過高,難以顛覆難以顛覆,要開辟新的市場機會則必須有新的市場需求要開辟新的市場機會則必須有新的市場需求。新的市場需求會創造原有生態不能滿足的空白市場,使新生態得以產生要充分利用尚未被滿足的需求要充分利用尚未被滿足的需求,其中其中,速度至關重要速度至關重要。盡早推出產品才能占據先發優勢,盡早產生正反饋,培植自身生態圈,對后發者產生壓制作用IBM model 5150是開放式PC商業模式的鼻祖,采用Intel 8086/8088處理器,并且可以選擇MS-DOS操作系統摩托羅拉MC68000處理器性能優于Intel 8086,但誕生時間晚了1
325、5個月,剛發布便面臨劣勢,最終沒能成功獲得IBM訂單,摩托羅拉也進一步失去了PC市場微軟購買了QDOS并在幾個月內改為MS-DOS,賣給IBM,取代了此前主流的CP/M操作系統IBM model 5150采用采用Intel 8086/8088處理器處理器摩托羅拉摩托羅拉MC68000處理器處理器7.3.需求引領:需求引領:PC成就成就wintel,快速搶占生態位至關重要,快速搶占生態位至關重要資料來源:中關村在線-劉亮PC發展史3:個人PC開山鼻祖的前世今生資料來源:中關村在線-劉亮PC發展史3:個人PC開山鼻祖的前世今生144144資料來源:wind,IDC,中信證券研究部全球智能終端出貨量
326、(億臺)全球智能終端出貨量(億臺)7.3.需求引領:移動端鑄就需求引領:移動端鑄就ARM護城河,護城河,Intel亦難撼動亦難撼動高通歷年營收(億美元)高通歷年營收(億美元)ARM低功耗優勢明顯,隨著移動通信而崛低功耗優勢明顯,隨著移動通信而崛起。早期手機大量采用起。早期手機大量采用ARM處理器,但也未處理器,但也未必采用必采用ARM早期處理器例如TI的OMAP、Intel的Xscale等都是ARM架構2000年摩托羅拉天拓A6188手機采用自研的龍珠(DragonBall)處理器,其最早的型號MC68328出現于1995年,基于MC68000內核開發智能手機的興起帶動了智能手機的興起帶動了A
327、RM生態生態手機智能化促進移動端軟件發展,迫使硬件指令集統一高通與智能手機高增速時期重合Intel也無法打破也無法打破ARM一家獨大一家獨大2008年Intel推出Atom,2010收購英飛凌基帶部門,2012年Atom手機聯想K800面世,2016年放棄Broxton和SoFIA開發,實質上放棄移動端。用戶缺乏對x86/Windows平板的需求56.7375.2688.71111.42104.16109.91149.57191.21248.66264.87252.81235.54222.91227.32242.73235.31335.66050100150200250300350400200
328、52006200720082009201020112012201320142015201620172018201920202021051015202520052006200720082009201020112012201320142015201620172018201920202021PC平板電腦手機智能手機資料來源:wind,中信證券研究部145145云原生趨勢推動了軟件架構的變革云原生趨勢推動了軟件架構的變革,對硬件提出了新需求對硬件提出了新需求云原生條件下的新軟件往往采用微服務架構,對單核性能需求減弱,因此多核性能、網絡性能、低能耗等因素更為重要。云原生需求帶動了多核心數的ARM服務器C
329、PU數據中心業務占據Intel約三分之一營收,云原生趨勢對其業績潛在影響較大原有生態并未覆蓋物聯網生態原有生態并未覆蓋物聯網生態,為新架構為新架構、新生態提供了機會新生態提供了機會物聯網成為RISC-V的突破口,為應對開源的RISC-V,ARM免去M0-M3授權費。變革往往在不起眼的地方發生,正如液晶在電視屏幕上的早期應用失敗,其真正的成功是從手表屏幕開始的AWS實例中不同處理器占比與新增占比實例中不同處理器占比與新增占比全球全球IaaS實例數量按處理器分類實例數量按處理器分類7.3.需求引領:云原生助推自研需求引領:云原生助推自研ARM,物聯網助力新架構,物聯網助力新架構資料來源:Anand
330、Tech,Liftr Insights資料來源:Liftr Insights146146隨著摩爾定律走向終結隨著摩爾定律走向終結,先進制程成本過高先進制程成本過高,迫切需要大規模生產攤薄成本迫切需要大規模生產攤薄成本先進制程晶圓價格增長明顯,據Twitterchiakokhua(前TSMC工程師)測算,從2018Q3至2020Q1,5nm晶圓價格比7nm提升80%以上Fabless+Foundry模式能夠整合各個生態圈需求模式能夠整合各個生態圈需求,有效擴大生產規模有效擴大生產規模,降成本促迭代降成本促迭代僅蘋果手機全球出貨量就與全球PC總出貨量較為接近,加上其余大量客戶,能夠大幅增加臺積電生
331、產規模,攤薄固定成本,增加報價吸引力,有利于獲取更多利潤并進行研發投入,保持領先優勢。Fabless模式展現出比Intel IDM模式更強的生存、進化能力每每5萬片晶圓產能設備投資(億美元)萬片晶圓產能設備投資(億美元)2020年年TSMC不同制程節點成本不同制程節點成本拆分測算拆分測算7.4.商業模式:商業模式:Fabless展現優勢,分工合作利于規模擴張展現優勢,分工合作利于規模擴張21.3425.0430.8239.547.4662.7284.49114.2155.57214.95050100150200250906545282016/1410753資料來源:IBS(轉引自中芯國際科創板
332、招股說明書),中信證券研究部資料來源:Twitterchiakokhua(前TSMC工程師)147147CPU芯 片依賴不 斷推進的 先進 制程芯 片依賴不 斷推進的 先進 制程,且 每一 節點停留 時間 短且 每一 節點停留 時間 短,使得使得 IDM廠 商對舊 節點的 利用率較低廠 商對舊 節點的 利用率較低,而而Fabless+Foundry模式則能有效利用模式則能有效利用CPU等數字芯片性能依賴晶體管密度的提升,相較于模擬芯片,其產品更新迭代快,壽命普遍較短,因此每代產品在相應制程上的停留時間短,對相應制程節點的利用率不足如果采用Fabless+Foundry模式,則可利用較為老舊的制
333、程進行其它芯片的代工服務。以臺積電為例,其5nm、7nm占營收占不斷提高,但其16nm及以上制程依然保有較高且穩定的營收占比。22Q2,臺積電16nm及以上制程的營收占比為49%資料來源:思瑞浦招股說明書,中信證券研究部資料來源:臺積電官網,中信證券研究部數字芯片(數字芯片(CPU)與模擬芯片維度比較)與模擬芯片維度比較臺積電各制程節點營收占比臺積電各制程節點營收占比7.4.商業模式:商業模式:Fabless展現優勢,分工合作利于規模擴張展現優勢,分工合作利于規模擴張0%10%20%30%40%50%60%70%80%90%100%20Q120Q220Q320Q421Q121Q221Q321Q422Q122Q25nm7nm10nm16/20nm28nm40/45nm65nm90nm0.11/0.13m0.15/0.18m0.25m and above項目項目模擬芯片模擬芯片數字芯片數字芯