《計算機行業Sora劃時代:算力應用再加速-240219(34頁).pdf》由會員分享,可在線閱讀,更多相關《計算機行業Sora劃時代:算力應用再加速-240219(34頁).pdf(34頁珍藏版)》請在三個皮匠報告上搜索。
1、華西計算機團隊華西計算機團隊2024年2月19日請仔細閱讀在本報告尾部的重要法律聲明請仔細閱讀在本報告尾部的重要法律聲明僅供機構投資者使用證券研究報告|行業深度研究報告分析師:劉澤晶分析師:趙宇陽SAC NO:S1120520020002SAC NO:S1120523070006郵箱:郵箱:Sora劃時代:算力應用再加速核心邏輯Sora:劃時代的文生視頻大模型文本生成視頻:Sora能夠根據用戶提供的文本描述生成長達60S的視頻。深化語言理解:利用GPT技術將簡短的用戶提示轉換為更長的詳細轉譯,并將其發送到視頻模型。圖片生成能力:Sora可以根據用戶需求,生成可變大小的圖像,最高可達驚人的204
2、8 2048分辨率。新的模擬能力:Sora具有3D一致性、較長視頻的連貫性和對象持續性,能與世界互動,模擬數字世界。多模態下游應用百花齊放多模態+視頻創作:提升創作者效率。除了Sora、Runway外,Lumiere能夠在單個過程中生成完整的視頻序列,而非簡單組合靜態幀。這種技術能夠同時處理視頻的空間(即視頻中的對象)和時間(即視頻中的運動)方面,為用戶帶來更加自然和流暢的運動感知體驗。多模態+自動駕駛:徹底改變人車交互。商湯提出DriveMLM模型,可實現閉環測試中操控車輛,超過之前的端到端和基于規則的自動駕駛系統方法。多模態+廣告(電商):創造多樣化營銷賣點。利用AI技術進一步提升數字人的
3、多樣性,比如人臉替換、背景替換、口音語音替換去適配我們的prompt,最后腳本、數字人臉替換、背景替換等,視頻壓制之后,就可以得到一個口播視頻;還可以幫助商業實現營銷海報的生成。多模態+教育:提升教學效率,加強人機互動。Stable Diffusion等圖像生成模型,可以依據教學需求輸入主體及其細節的文本描述,快速自動生成多種風格、高清逼真、蘊含美感的美育類教學資源,所生成的教學資源既具備顯著的跨模態性,又具有新穎性與獨特性。多模態+醫療:為臨床醫療任務提供更為智能、高效的解決方案。臨床醫療業務產生的大量數據以不同模態存儲于數據庫中,對它們整理、清洗后,再經過預處理進行多模態融合。多模態融合可
4、以有機整合不同的信息,相比單模態信息更加全面。多模態+安防:AI+安防加速演變。根據全球政企解決方案,目前在國內“AI+安防”領域AI技術三個落地到產品端的應用方向是:生物識別技術、視頻結構化和物體識別系統。其中,生物識別技術應用時間最早,涉及較為范圍廣,且為人像識別的入口技術。受益標的:多模態素材:萬興科技、虹軟科技、超訊通信、佳都科技、平治信息、博匯科技、美圖公司;應用:科大訊飛、大華股份、??低?、潤達醫療、中科創達、千方科技、盛通股份;算力基礎設施:中科曙光、開普云、高新發展、網宿科技、神州數碼、拓維信息、海光信息、首都在線。風險提示:1)政策落地不及預期;2)技術發展不及預期;3)經
5、濟發展不及預期。2UZYZ1XDXTUAUSU9PcMbRoMpPoMnRiNmMsQiNsQrR9PpPyRuOsRqOxNpOoO013Sora:劃時代的文生視頻大模型Sora是由OpenAI發布的文生視頻大模型,此模型發布預示著大模型時代進階。Sora能夠僅僅根據提示詞,生成60s的連貫視頻,遠超行業目前大概只有平均“4s”的視頻生成長度。Sora的出現,預示著一個全新的視覺敘事時代的到來,它能夠依據客戶的文本提示,將人們的想象力轉化為生動的動態畫面。Sora作為一款通用的視覺數據模型,其卓越之處在于能夠生成跨越不同持續時間、縱橫比和分辨率的視頻和圖像,甚至包括生成長達一分鐘的高清視頻。
6、打造虛擬世界模擬器。Sora采用了Transformer架構,該架構對視頻的時空序列包和圖像潛在編碼進行操作。隨之誕生的最強大模型Sora,也就具備了生成一分鐘高質量視頻的能力。擴展視頻生成模型的規模,是構建模擬物理世界通用模擬器的非常有希望的方向。1.1 Sora劃時代文生視頻大模型4 文生視頻大模型文生視頻大模型SoraSora1.1 Sora劃時代文生視頻大模型5資料來源:Sora官網,華西證券研究所OpenAIOpenAI專門設計的解碼器模型,它可以將生成的潛在表示重新映射回像素空間專門設計的解碼器模型,它可以將生成的潛在表示重新映射回像素空間Sora將不同類型的視覺數據轉化為統一的格
7、式,以便于對生成模型進行大規模訓練。將可視數據轉換成數據包(patchs),大語言模型通過token將各種形式的文本代碼、數學和自然語言統一起來,而Sora則通過視覺包(patchs)實現了類似的效果。對于不同類型的視頻和圖像,包是一種高度可擴展且有效的表示方式,對于訓練生成模型具有重要意義。從宏觀角度來看,首先將視頻壓縮到一個低維度的潛在空間:這是通過對視頻進行時間和空間上的壓縮實現的。這個潛在空間可以看作是一個“時空包”的集合,從而將原始視頻轉化為這些包。1.1 Sora劃時代文生視頻大模型6資料來源:Sora官網,華西證券研究所SoraSora根據文字生成視頻根據文字生成視頻視頻壓縮網絡
8、:Sora研究員專門訓練了一個網絡,專門負責降低視覺數據的維度。這個網絡接收原始視頻作為輸入,并輸出經過壓縮的潛在表示。Sora模型就是在這個壓縮后的潛在空間中接受訓練,并最終生成視頻。此外,研究員還設計了一個解碼器模型,它可以將生成的潛在表示重新映射回像素空間,從而生成可視的視頻或圖像。時空包:當給定一個壓縮后的輸入視頻時,從中提取出一系列的時空包,這些包被用作轉換token。這一方案不僅適用于視頻,因為視頻本質上就是由連續幀構成的,所以圖像也可以看作是單幀的視頻。通過這種基于包的表示方式,Sora能夠跨越不同分辨率、持續時間和縱橫比的視頻和圖像進行訓練。在推理階段,研究員只需在適當大小的網
9、格中安排隨機初始化的包,就可以控制生成視頻的大小和分辨率。1.1 Sora劃時代文生視頻大模型7資料來源:Sora官網,華西證券研究所用于視頻生成的縮放Transformers:Sora是一個擴散模型,它接受輸入的噪聲包(以及如文本提示等條件性輸入信息),然后被訓練去預測原始的“干凈”包。重要的是,Sora是一個基于擴散的轉換器模型,這種模型已經在多個領域展現了顯著的擴展性,包括語言建模、計算機視覺以及圖像生成等領域。擴散轉換器在視頻生成領域同樣具有巨大的潛力,不同訓練階段下,使用相同種子和輸入的視頻樣本對比,結果證明了隨著訓練量的增加,樣本質量有著明顯的提高。隨著訓練量的增加,擴散轉換器生成
10、的樣本質量有了明顯提高隨著訓練量的增加,擴散轉換器生成的樣本質量有了明顯提高1.1 Sora劃時代文生視頻大模型8資料來源:Sora官網,36氪,澎湃新聞,同花順,華西證券研究所Sora依托Transformers架構等技術手段,產品力全面碾壓Runway等文生視頻模型。Sora是將Latent Diffusion Model架構與Diffusion Transformer架構結合,但是Runway只用了Latent Diffusion Model架構。由于Transformer架構強大的參數可拓展性,即隨著參數量的增加,Transformer 架構的性能提升會更加明顯,DiT在LDM的基礎上
11、,把模型從U-Net換成了Transformer,因而Sora比Runway具有更強大的性能。憑借Transformer架構可以隨意設置位置編碼,Sora可以接受任意分辨率和尺寸的素材,而Runway需要將素材裁剪至相同的大小。Sora引入GTP-4將簡短的用戶提示轉換為更長的詳細字幕,然后發送到視頻模型,有助于Sora更好理解客戶需求;而Runway很難理解細微差別,堅持提示中的特定描述而忽略其他描述。Sora依靠從頭訓練了一套能直接壓縮視頻的自編碼器,Sora 的自編碼器不僅能在空間上壓縮圖像,還能在時間上壓縮視頻長度,使時長達到了一分鐘,而Runway時長小于20秒。拼成“拼成“SORA
12、”SORA”的逼真云的圖像的逼真云的圖像主要視頻生成模型對比主要視頻生成模型對比1.2 模型能力行業領先9資料來源:Sora官網,華西證券研究所SoraSora可以為各種設備生成與其原始縱橫比完美匹配的內容可以為各種設備生成與其原始縱橫比完美匹配的內容Sora生成的視頻具有多樣化表現。在原始視頻圖像數據直接訓練:過去,圖像和視頻生成方法常常需要將視頻調整大小、裁剪或修剪至標準尺寸,如4秒、256x256分辨率的視頻。但Sora打破了這一常規,它直接在原始大小的數據上進行訓練,從而帶來了諸多優勢。采樣更靈活:Sora具備出色的采樣能力,無論是寬屏1920 x1080p視頻、垂直1080 x192
13、0視頻,還是介于兩者之間的任何視頻尺寸,它都能輕松應對。這意味著Sora可以為各種設備生成與其原始縱橫比完美匹配的內容。更令人驚嘆的是,即使在生成全分辨率內容之前,Sora也能以較小的尺寸迅速創建內容原型。而所有這一切,都得益于使用相同的模型。1.2 模型能力行業領先10資料來源:Sora官網,華西證券研究所改進構圖與框架:實驗結果顯示,在視頻的原始縱橫比上進行訓練,能夠顯著提升構圖和框架的質量。為了驗證這一點,將Sora與一個將所有訓練視頻裁剪為方形的模型版本進行了比較。結果發現,在正方形裁剪上訓練的模型有時會生成僅部分顯示主題的視頻。而Sora則能呈現出更加完美的幀,充分展現了其在視頻生成
14、領域的卓越性能。將所有訓練視頻裁剪為方形的模型相比(左),將所有訓練視頻裁剪為方形的模型相比(左),SoraSora能呈現出更加完美的幀能呈現出更加完美的幀1.2 模型能力行業領先11 Sora深化語言理解。為了訓練文本轉視頻生成系統,需要大量帶有相應文本字幕的視頻。為此,研究員借鑒了DALLE3中的re-captioning技術,并應用于視頻領域。首先,研究員訓練了一個高度描述性的轉譯員模型,然后使用它為訓練集中的所有視頻生成文本轉譯。通過這種方式,研究員發現對高度描述性的視頻轉譯進行訓練,可以顯著提高文本保真度和視頻的整體質量。與此同時,與DALLE3類似,研究員還利用GPT技術將簡短的用
15、戶提示轉換為更長的詳細轉譯,并將其發送到視頻模型。這一創新使得Sora能夠精確地按照用戶提示生成高質量的視頻。SoraSora深化的語言理解能力深化的語言理解能力Sora具有圖像和視頻的多樣化提示。它可以接受圖像或視頻等其他形式的輸入。這就讓Sora能夠完成一系列圖像和視頻編輯任務,比如制作無縫循環視頻、給靜態圖片添加動態、在時間線上擴展視頻的長度等等。為DALLE圖像賦予生命:Sora還能在提供圖像和提示作為輸入的情況下生成視頻。下面展示的示例視頻就是基于DALLE 2和DALLE 3的圖像生成的。這些示例不僅證明了Sora的強大功能,還展示了它在圖像和視頻編輯領域的無限潛力。12資料來源:
16、Sora官網,華西證券研究所一只戴著貝雷帽、穿著黑色高領毛衣的柴犬生成視頻一只戴著貝雷帽、穿著黑色高領毛衣的柴犬生成視頻1.2 模型能力行業領先視頻時間線的靈活擴展:Sora不僅能生成視頻,還能將視頻沿時間線向前或向后擴展。從同一個視頻片段開始,向時間線的過去延伸。盡管開頭各不相同,但最終都匯聚于同一個結尾。而通過這種方法,就能將視頻向兩個方向延伸,創造出一個無縫的循環視頻。1.2 模型能力行業領先13資料來源:Sora官網,華西證券研究所SoraSora甚至可以創造出無限循環視頻甚至可以創造出無限循環視頻1.2模型能力行業領先視頻到視頻編輯:將一種名為SDEdit 32 的編輯基于文本提示的
17、圖像和視頻的技術應用于Sora,這項技術賦予了Sora轉換零拍攝輸入視頻風格和環境的能力,為視頻編輯領域帶來了革命性的變革。視頻的無縫連接:Sora還能在兩個截然不同的輸入視頻之間實現無縫過渡。通過逐漸插入技術,我們能夠在具有完全不同主題和場景構圖的視頻之間創建出流暢自然的過渡效果。14 SoraSora轉換零拍攝輸入視頻風格和環境轉換零拍攝輸入視頻風格和環境1.2模型能力行業領先15資料來源:Sora官網,華西證券研究所Sora具有圖片生成能力。Sora的出色能力不止于數據處理和分析,它現在還能生成圖像。這一創新功能的實現得益于一種獨特的算法,該算法在一個精確的時間范圍內,巧妙地在空間網格中
18、排列高斯噪聲補丁。值得一提的是,Sora的圖像生成功能不僅限于特定大小的圖像。它可以根據用戶需求,生成可變大小的圖像,最高可達驚人的2048 2048分辨率。SoraSora生成的圖片生成的圖片1.2模型能力行業領先Sora具有新的模擬能力。在大規模訓練過程中,研究員發現視頻模型展現出了許多令人興奮的新能力。這些功能使得Sora能夠模擬現實世界中的人物、動物和環境等某些方面。值得注意的是,這些屬性的出現并沒有依賴于任何明確的3D建模、物體識別等歸納偏差,而是純粹通過模型的尺度擴展而自然涌現的。3D一致性:Sora能夠生成帶有動態攝像頭運動的視頻。隨著攝像頭的移動和旋轉,人物和場景元素在三維空間
19、中始終保持一致的運動規律。16資料來源:Sora官網,華西證券研究所SoraSora的的3D3D一致性:冬天的日本一致性:冬天的日本SoraSora的的3D3D一致性:山間一致性:山間1.2模型能力行業領先較長視頻的連貫性和對象持久性:視頻生成領域面對的一個重要挑戰就是,在生成的較長視頻中保持時空連貫性和一致性。Sora,雖然不總是,但經常能夠有效地為短期和長期物體間的依賴關系建模。例如,在生成的視頻中,人物、動物和物體即使在被遮擋或離開畫面后,仍能被準確地保存和呈現。同樣地,Sora能夠在單個樣本中生成同一角色的多個鏡頭,并在整個視頻中保持其外觀的一致性。17資料來源:Sora官網,華西證券
20、研究所SoraSora制作出的窗臺上的斑點狗制作出的窗臺上的斑點狗SoraSora制作出的街頭機器人制作出的街頭機器人1.2模型能力行業領先與世界互動:Sora有時還能以簡單的方式模擬影響世界狀態的行為。例如,畫家可以在畫布上留下新的筆觸。隨著時間的推移,一個人吃漢堡時也能在上面留下咬痕。18資料來源:Sora官網,華西證券研究所SoraSora制作出的畫家的筆觸制作出的畫家的筆觸SoraSora制作出的漢堡的咬痕制作出的漢堡的咬痕1.2模型能力行業領先模擬數字世界:Sora還能夠模擬人工過程,比如視頻游戲。它可以在高保真度渲染世界及其動態的同時,用基本策略控制我的世界中的玩家。這些功能都無需
21、額外的訓練數據或調整模型參數,只需向Sora提示“我的世界”即可實現。這些新能力表明,視頻模型的持續擴展為開發高性能的物理和數字世界模擬器提供了一條充滿希望的道路。通過模擬生活在這些世界中的物體、動物和人等實體,我們可以更深入地理解現實世界的運行規律,并開發出更加逼真、自然的視頻生成技術。19資料來源:Sora官網,華西證券研究所SoraSora模擬“我的世界”模擬“我的世界”1.3模型能力行業領先Sora依舊有局限性,但未來可期。盡管Sora在模擬能力方面已經取得了顯著的進展,但它目前仍然存在許多局限性。例如,它不能準確地模擬許多基本相互作用的物理過程,如玻璃破碎等。此外,在某些交互場景中,
22、比如吃東西時,Sora并不能總是產生正確的對象狀態變化,包括在長時間樣本中發展的不一致性或某些對象不受控的出現等。我們相信隨著技術的不斷進步和創新,Sora所展現出的能力預示著視頻模型持續擴展的巨大潛力。未來,期待看到更加先進的視頻生成技術,能夠更準確地模擬現實世界中的各種現象和行為,并為人們帶來更加逼真、自然的視覺體驗。20 SoraSora依舊有局限性依舊有局限性02多模態下游應用百花齊放212.1 多模態+視頻創作:提升創作者效率Lumiere:Lumiere的核心功能之一是其支持文本到視頻和圖像到視頻的轉換能力。這得益于其采用的時空 U-Net(STUNet)架構,這一架構的設計重點在
23、于提高 AI 生成視頻中運動的真實感。Lumiere能夠在單個過程中生成完整的視頻序列,而非簡單組合靜態幀。這種技術能夠同時處理視頻的空間(即視頻中的對象)和時間(即視頻中的運動)方面,為用戶帶來更加自然和流暢的運動感知體驗。Bilibili:在生成式人工智能領域,大語言模型展現出不俗的實力,無論是撰寫文章、編寫代碼、還是開放式問答,都展現出無限的潛力?;诖笳Z言模型強大的理解能力,通過將視頻字幕處理成格式化的文本,輸入給模型,讓它結合上下文語境,挑選出最精彩的部分。通過提示工程(Prompt Engineering),大語言模型在視頻高能點的選取上也有很高的準確度。嗶哩嗶哩還在積極探索相關技
24、術在其他業務形態下的應用場景,如:視頻章節拆分與直播帶貨大綱來提高創作者效率。22資料來源:AI創業伙伴,嗶哩嗶哩技術,華西證券研究所LumiereLumiere視頻設計視頻設計BilibiliBilibili用戶提示微調(用戶提示微調(P P-tuningtuning)示意圖)示意圖2.2 多模態+自動駕駛:徹底改變人車交互LimSim+:一個自動駕駛中部署多模態LLMs的閉環平臺。LimSim+提供了一個包含道路拓撲、動態交通流、導航、交通控制和其他基本信息的閉環系統。提示是(M)LLM支持的智體系統基礎,它包含通過圖像或文本描述呈現的實時場景信息。LLM支持的智體系統具有信息處理、工具使
25、用、策略制定和自我評估等功能。V2VFormer+:首個多模態V2V框架。對于每輛車,采用具有特定模態backbone的雙流網絡在 BEV 平面中進行相機-LiDAR 特征提?。ㄊ褂孟∈杞徊孀⒁?SCA 模塊進行相機-視圖變換),并設計動態通道融合(DCF)以實現精細-粒度像素點聚合。給定多模態BEV圖,進行數據壓縮和共享以生成一組在自車-坐標處的特征圖Fcav。隨后,提出了全局-局部transformer協同策略,用于相鄰 CAV 之間的通道語義探索和空間相關建模。最后,將多車輛融合圖 Fjoint 輸入到預測頭中以進行目標分類和定位回歸。23資料來源:自動駕駛之心,機器視覺深度學習和自動駕
26、駛,華西證券研究所LimSim+LimSim+的組件示意圖的組件示意圖V2VFormer+V2VFormer+架構圖架構圖2.2 多模態+自動駕駛:徹底改變人車交互商湯提出了DriveMLM模型,它和現有自動駕駛系統行為規劃模塊中的決策狀態對齊,可實現閉環測試中操控車輛,超過之前的端到端和基于規則的自動駕駛系統方法。首先它將LLM的語言決策輸出,和成熟模塊化方案中規控部分的決策狀態對齊,由此LLM輸出的語言信號就可轉化為車輛控制信號。其次,DriveMLM的MLLM planner模塊,包含多模態分詞器(Multi-modal tokenizer)和MLLM解碼器兩個部分。前者負責將攝像頭、激
27、光雷達、用戶語言需求、交通規則等各種輸入轉化為統一的token embedding;后者,即MLLM解碼器則基于這里生成的token,再生成圖片描述、駕駛決策和決策解釋等內容。在CARLA中廣泛使用的Town05Long基準上,它的駕駛得分(Driving Score)和路線完成度(Route Completion)明顯比Apollo等非大模型方法都要高。24資料來源:量子位,華西證券研究所DriveMLMDriveMLM框架框架和業內的其他駕駛方法相比,和業內的其他駕駛方法相比,DriveMLMDriveMLM實現了閉環測試的實現了閉環測試的SOTASOTA成績成績2.3 多模態+廣告(電商
28、):創造多樣化營銷賣點利用AI技術進一步提升數字人的多樣性,比如人臉替換、背景替換、口音語音替換去適配我們的prompt,最后腳本、數字人唇形替換、背景替換、人臉替換,視頻壓制之后,就可以得到一個口播視頻??蛻舻靡岳脭底秩说姆绞饺ソ榻B產品對應的一些營銷賣點。這樣3分鐘即可做好一個數字人,極大地提升了廣告主做數字人的能力。大模型還可以幫助商業實現營銷海報的生成和商品背景的替換。通過大數據的訓練之后,客戶還希望有一些特別個性化的東西,未來還需要加入一些微調的方式。25資料來源:DataFunTalk,華西證券研究所復合模態的營銷數字人視頻生成,復合模態的營銷數字人視頻生成,3 3 分鐘創造分鐘創
29、造 1 1 個數字人個數字人營銷海報圖生成,結合多模態表征的營銷圖片生成營銷海報圖生成,結合多模態表征的營銷圖片生成2.4 多模態+教育:提升教學效率,加強人機互動教學資源自動生成:在教學資源自動生成方面,當前通用領域的多模態大模型已展現出一定的能力。Stable Diffusion等圖像生成模型,可以依據教學需求輸入主體及其細節的文本描述,快速自動生成多種風格、高清逼真、蘊含美感的美育類教學資源,所生成的教學資源既具備顯著的跨模態性,又具有新穎性與獨特性。人機協同過程支持:當前通用領域的多模態大模型也已展現出良好的潛力。在知識問答方面,百度提出的ERNIE大模型可以對領域實體知識與專業術語進
30、行知識增強,并利用問答匹配任務進行模型訓練,從而深入理解領域知識及其內在聯系。教師教學智能輔助:在利用大模型開展教師教學智能輔助方面,當前工業界和學術界也已開始進行積極的探索。好未來基于教師線上教學語音轉寫產生的約2000萬條教育文本數據,構建了在線教學大模型TAL-EduBERT。26資料來源:電化教育研究,華西證券研究所教育領域大模型構建及其多類型教育任務適配教育領域大模型構建及其多類型教育任務適配“多模態漢字學習系統”基本架構“多模態漢字學習系統”基本架構2.5 多模態+醫療:為臨床醫療任務提供更為智能、高效的解決方案RadFM 具有巨大的臨床應用意義:支持三維數據:在實際臨床環境中,C
31、T 和 MRI 被廣泛使用,大多數疾病的診斷在很大程度上依賴于它們。RadFM 的模型設計能夠處理真實的臨床成像數據。多圖像輸入:診斷通常需要輸入來自各種模態的多影像作為輸入,有時甚至需要歷史放射圖像,因此支持多圖像輸入 RadFM 能夠很好的滿足此類臨床需求。交錯數據格式:在臨床實踐中,圖像分析通常需要了解患者的病史或背景。交錯數據格式允許用戶自由輸入額外的圖像背景信息,確保模型能結合多源信息完成復雜的臨床決策任務。27資料來源:Sora官網,華西證券研究所RadFM 首先在大規模的數據集 MedMD 上進行 Pre-training 然后在 RadMD 上進行領域適配。在模型架構上,Rad
32、FM 首次支持了 2D 和 3D 自由混合,文本和圖像自由混合的輸入形式。RadMD RadMD 上模態、上模態、2D/3D2D/3D、Anatomy Anatomy 分布展示分布展示RadFMRadFM 模型架構模型架構2.6 多模態+安防:AI+安防加速演變算法精確度和效果提升:例如,在視頻監控場景中這些技術可以通過對圖像和聲音的分析,實現目標行為識別和異常檢測等功能。多模態算法融合應用:在安防領域,多模態技術可以將圖像、語音和文本等數據進行融合,從而實現更全面和準確的情報分析和預警。AI算法從邊緣智能向中心智能的傾斜:安防AI算法最開始是以中心智能算法處理為主,后來開始興起邊緣智能設備,
33、把算法集成到終端;隨著大模型的推廣,中心智能的必要性將增加,AI的智能算法中心將起到新的核心作用。算法自適應學習:在安防領域,這種技術可以通過對歷史數據的分析和學習,實現對未知事件的快速響應和處理。智能決策支持:在安防領域,這種技術可以通過對事件的分類和預測,實現智能化的決策支持和應急響應。個性化服務:在安防領域,這種技術可以為不同的客戶提供特定的安全方案和風險評估。28資料來源:Sora官網,華西證券研究所AIAI與安防關系與安防關系在安防行業應用較多的兩類技術分別為識別技術和認知技術在安防行業應用較多的兩類技術分別為識別技術和認知技術03投資建議293.受益標的30 代碼公司收盤價市值PE
34、PS2024E2025E2024E2025E300624.SZ萬興科技84.20115.9579.4456.166.054.87603108.SH潤達醫療15.0589.8815.4012.520.660.56688088.SH虹軟科技26.09105.9349.7036.8212.279.81603322.SH超訊通信27.6643.5935.7324.091.521.32600728.SH佳都科技4.91105.2933.0423.231.461.26300571.SZ平治信息20.5728.7012.7910.300.750.65688004.SH博匯科技15.158.6112.348.
35、642.692.14300079.SZ數碼視訊4.4663.73-002230.SZ科大訊飛43.551,008.4880.6954.833.943.15002236.SZ大華股份17.50576.5313.0510.901.501.29002415.SZ??低?3.653,139.7518.4415.693.142.75300496.SZ中科創達52.79242.8423.4817.543.312.57002373.SZ千方科技9.59151.5418.7614.561.411.17002599.SZ盛通股份4.4523.9223.1717.600.890.791357.HK美圖公司2.5
36、4113.7420.6012.833.012.33688228.SH開普云39.2826.5214.0310.283.092.54603019.SH中科曙光34.00497.6220.0216.062.852.41000628.SZ高新發展39.11137.78-300017.SZ網宿科技8.59209.3539.5731.873.723.39000034.SZ神州數碼24.81166.1211.299.540.130.12002261.SZ拓維信息11.78147.7049.0031.163.542.61688041.SH海光信息76.721,783.23105.9878.2320.8115
37、.73300846.SZ首都在線9.1242.57-04風險提示314.風險提示32資料來源:華西證券研究所 政策落地不及預期:政策出臺對科技企業發展具有較強指引,如果政策進展不及預期會影響行業內公司整體發展。技術發展不及預期:公司屬于技術密集型企業,如果技術發展不及預期,或將在市場上競爭力減弱,并對公司整體業務產生影響。經濟回暖不及預期:經濟影響客戶預算,如果經濟恢復不及預期,影響下游需求恢復。免責聲明33分析師分析師簡介簡介劉澤晶(首席分析師):中央財經大學碩士,13年證券從業經驗,曾任職于招商證券、興業證券、國泰君安、中信建投證券。2014-15年新財富前三,水晶球前三;2019年新浪金
38、麒麟分析師計算機行業第四;金牛獎:2020、2019、2017、2016、2014第五、第三、第四、第三、第四;Wind金牌分析師:2023、2022,2020、2018、2015、2014第一,2021第二。趙宇陽(分析師):上海財經大學碩士,3.5年賣方研究經驗,2023年加入華西證券研究所,第十屆 Chioce 最佳分析師,第十一屆 Wind 金牌分析師第一名,擅長自上而下分析產業鏈趨勢,挖掘投資機會,價值與彈性兼顧,主要負責AI與AI+方向。分析師承諾分析師承諾作者具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力,保證報告所采用的數據均來自合規渠道,分析邏輯基于作者的職
39、業理解,通過合理判斷并得出結論,力求客觀、公正,結論不受任何第三方的授意、影響,特此聲明。評級說明評級說明公司評級標準公司評級標準投資評級投資評級說明說明以報告發布日后的6個月內公司股價相對上證指數的漲跌幅為基準。買入分析師預測在此期間股價相對強于上證指數達到或超過15%增持分析師預測在此期間股價相對強于上證指數在5%15%之間中性分析師預測在此期間股價相對上證指數在-5%5%之間減持分析師預測在此期間股價相對弱于上證指數5%15%之間賣出分析師預測在此期間股價相對弱于上證指數達到或超過15%行業評級標準行業評級標準以報告發布日后的6個月內行業指數的漲跌幅為基準。推薦分析師預測在此期間行業指數相對強于上證指數達到或超過10%中性分析師預測在此期間行業指數相對上證指數在-10%10%之間回避分析師預測在此期間行業指數相對弱于上證指數達到或超過10%華西證券研究所:華西證券研究所:地址:北京市西城區太平橋大街豐匯園11號豐匯時代大廈南座5層網址:http:/