計算機行業尋找AI技術潛在應用場景的方法論:AI大航海時代的數字羅盤-230407(21頁).pdf

編號:121349 PDF 21頁 1.38MB 下載積分:VIP專享
下載報告請您先登錄!

計算機行業尋找AI技術潛在應用場景的方法論:AI大航海時代的數字羅盤-230407(21頁).pdf

1、請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 2023.04.07 AI 大航海時代的數字羅盤大航海時代的數字羅盤 尋找尋找 AI技術潛在應用場景技術潛在應用場景的的方法論方法論 李沐華李沐華(分析師分析師)齊佳宏齊佳宏(分析師分析師)010-83939797 010-83939837 證書編號 S0880519080009 S0880519080007 本報告導讀:本報告導讀:本文構建本文構建了了一套標準來一套標準來幫助我們勾勒幫助我們勾勒AI技術在應用端的潛在技術在應用端的潛在落地場景落地場景,這套體系包,這套體系包括技術邊界、商業邊界以及括技術邊界、商業邊界以及對對不

2、同場景下不同場景下 AI商業價值歸屬的探討。商業價值歸屬的探討。摘要:摘要:技術可技術可實現實現性:尋找現階段性:尋找現階段 AI 的“技術能力邊界”的“技術能力邊界”。我們以微軟對 GPT-4 的測評作為基礎尋找現階段 AI 落地的“技術邊界”。在現階段 AI 技術的各種局限性當中,我們認為最核心的掣肘仍然是 AI 能力的不可解釋性,當某個問題存在標準答案、這個答案無法被找到,且我們對于錯誤難以容忍時,AI 是難以落地的;此外,AI 的知識邊界來自于人類已知的知識邊界,這就意味著 AI 無法進行真正意義上的創造性工作。商業可行性:在技術可商業可行性:在技術可實現實現的前提下,尋找的前提下,尋

3、找 AI落地的商業價值邊界落地的商業價值邊界。在技術可實現的前提下,我們嘗試勾勒 AI 落地的商業價值邊界。技術可實現性并不意味著商業可行性,我們通過“幫客戶賺錢”和“幫客戶省錢”的劃分方式分別討論了 B2B2C 場景和 B2B 場景下 AI 落地的商業價值。在 B2B2C 場景中,我們認為 AI 商業落地潛力在于其技術差異是否能夠被終端用戶所感知并進一步影響消費行為;在 B2B場景中,我們認為 AI的商業落地潛力取決于原場景中可被 AI 替代的任務比例。整體上看,我們認為 B2B2C 場景優于 B2B場景。商業價值歸屬:著重關注場景是否開放和商業價值是否為新增商業價值歸屬:著重關注場景是否開

4、放和商業價值是否為新增。我們根據“市場的大小”、“場景的開放程度”兩個指標構建了場景矩陣,進而得出兩個結論:第一,開放場景中后來者更容易通過被大模型賦能實現“彎道超車”;封閉場景中,更可能是小模型時代的領先者利用大模型實現“自我迭代”。第二,對于非巨頭企業而言,由于大模型出現而“新增”的商業價值或將更多來自“長尾場景”而非“頭部場景”。繼續推薦繼續推薦金山辦公、科大訊飛、杰創智能、凌志軟件金山辦公、科大訊飛、杰創智能、凌志軟件。金山辦公:公司是國產辦公軟件龍頭,全力發力 AI 戰略,加大 AI 人才投入力度,預計在2023H1 推出 AI 新品,與微軟有直接映射關系??拼笥嶏w:采用“1+N”架

5、構,將大模型落地于教育、醫療、人機交互、辦公等多個行業,大模型將率先賦能訊飛聽見、學習機,5 月 6 日產品級發布。杰創智能:AI 技術可以幫助提高公司公共安全產品性能,降低成本,且外銷一帶一路國家。凌志軟件:公司長期服務日本金融市場,目前已有 GPT 相關應用落地(自動生成招股書),也可通過 GPT 實現內部最高 75%降本。風險提示:風險提示:AI 技術落地不及預期、AI 大模型受到政策強監管 評級:評級:增持增持 上次評級:增持 細分行業評級 計算機 增持 相關報告 計算機 3月訂單環比有所回升,表現分化 2023.04.03 計算機AI 大模型引發科技革命 2023.03.31 計算機

6、 文心千帆發布,AI應用發展有望超預期 2023.03.28 計算機浪潮已到,AI 產業化快速推進 2023.03.26 計算機 大模型將徹底改變AI模型的開發模式 2023.03.19 行業更新行業更新 股票研究股票研究 證券研究報告證券研究報告 計算機計算機 行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 2 of 21 目目 錄錄 1.序言.3 2.技術可行性:尋找現階段 AI 的“技術能力邊界”.5 2.1.可解釋性邊界:模型能力難以被解釋是 AI 最核心的問題.7 2.2.創造性邊界:AI 不創造知識,AI 只是知識的搬運工.10 3.商業可行性:

7、在技術可行的前提下,尋找 AI 落地的商業邊界.11 3.1.幫客戶賺錢:技術差異需被終端用戶感知,并能影響消費行為 12 3.2.幫客戶省錢:“降本增效”的潛力需要足夠大.14 3.3.總體來看,“賺錢邏輯”好于“省錢邏輯”.15 4.商業價值歸屬:探尋大模型帶來的商業價值屬于哪類玩家.16 4.1.開放場景更易“彎道超車”,封閉場景更易“自我迭代”.17 4.2.對非 IT 巨頭來說,大模型商業價值或更多來自“長尾場景”而非“頭部場景”.18 4.3.小結.18 5.總結.19 6.投資建議.20 7.風險提示.20 EYbWgVmUbVlWrYtWvUbR8Q7NsQqQoMtQlOnN

8、tPfQoOxO8OoMmPMYpNoOxNmNsR 行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 3 of 21 1.序言序言 雖然目前市場上已經有很多關于 AI 潛在落地場景的討論,但討論方法主要是基于“開腦洞”式的窮舉或是基于已有落地場景的歸納。而微軟、Open AI 以及此前 MIT 和 CMU 學者的討論落腳點都在于 AI 對不同職業的替代程度。所以,我們所以,我們希望希望構建一套構建一套“標準標準”來進行“來進行“AI 落地場景的發現”。落地場景的發現”。只聚焦在“前端應用的落地場景”而不討論后端各大模型孰優孰劣。只聚焦在“前端應用的落地場景”

9、而不討論后端各大模型孰優孰劣。因為能夠自建大模型的玩家很少,且大模型作為一個復雜系統,每個模型都會有自己的一些特點和優勢指標,事實上我們是不太可能通過一些簡單的量化指標客觀評估各家模型的能力,單純問“如果GPT-4 是 100 分,百度文心一言大概多少分”沒有答案也沒有意義。我們我們希望希望提出一些標準,來粗略描繪現階段提出一些標準,來粗略描繪現階段 AI能夠落地的“場景能夠落地的“場景邊界”。邊界”。我們希望基于另一種思路展開討論:基于 AI 的技術局限和商業局限提出一些標準,來粗略勾勒我們心中現階段 AI 能夠落地的“場景邊界”。打一個比方,我們可以把所有的潛在落地場景看作一張紙,而每一條

10、標準就像是一條線,把這張紙分成不同的部分,多條標準交叉就會勾勒出滿足各個條件或至少多數條件的交集。圖圖 1:我們希望通過提出一些判斷標準來粗略描繪我們希望通過提出一些判斷標準來粗略描繪 AI 可落地場景邊界可落地場景邊界 數據來源:國泰君安證券研究 文中文中“標準標準”的提出主要基于的提出主要基于幾方面的考慮幾方面的考慮:某種能力是否可以被 AI 技術實現;商業方面是否具備可行性;基于已落地場景和落地形式的歸納。這一條僅僅作為輔助,原因在于基于現有落地案例的小樣本進行歸納很有可能會讓我們得出一些“虛假”的因果關系。具體的思路是具體的思路是:利用 AI 的技術局限性找到現階段的“AI 落地場景的

11、技術邊界”(對于是否能落地,我們的判斷標準是能不能徹底解決問題,而不是能否“將就用”);行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 4 of 21 在技術可達成的范圍內剔除掉缺乏商業價值的集合,得到可落地的商業場景邊界;在這個基礎上,我們展開一些衍生討論,討論的重點在于商業價值的歸屬權。圖圖 2:全文思路是基于全文思路是基于 AI的技術的各種局限性找到其“技術邊界”,在此基礎上剔除缺乏商業價值的場景找出的技術的各種局限性找到其“技術邊界”,在此基礎上剔除缺乏商業價值的場景找出“商業邊界”,同時給出對于一般企業可觸達的“商業邊界”“商業邊界”,同時給出對于

12、一般企業可觸達的“商業邊界”數據來源:國泰君安證券研究 在文中我們會舉出各種例子,對于這些例子,在文中我們會舉出各種例子,對于這些例子,需要注意的是需要注意的是:例子是為了方便讀者理解我們提出的標準,而不是希望對場景進行窮舉;在選擇例子的過程中,我們希望場景越小、越具象越好,而并不希望給出的案例落腳在諸如 AI 在教育領域落地容易、在醫療領域落地難之類。因為每個大行業中都存在一些 AI 可以落地的場景,而另一部分場景中 AI 的落地就比較難,把場景框得太大是沒有意義的。需要說明需要說明的是的是:第一,第一,我們我們把把討論語境設定在討論語境設定在當下當下可預見的范圍內可預見的范圍內,著眼在全球

13、,著眼在全球。如果模型開發范式再次發生轉換或是 GPT-5 等大模型“涌現”出新的重要能力,或是法律法規、倫理等邊界發生變化,都不在我們目前的討論范圍之內。就像 MIT 和 CMU 教授在What Can Machines Learn,and What Does It Mean for Occupations and the Economy?中提出的很多標準在大模型出現后已不再適用。同時,由于著眼點在全球,文中不討論由于 GPU 短缺、中文語料質量不如英文等因素造成的局限。通過各條長期通過各條長期技術局限取交技術局限取交集得出集得出AIAI落地落地的技術邊界的技術邊界在技術可在技術可實現實現范

14、圍范圍內內,找到找到AIAI落地的落地的“商商業價值邊界業價值邊界”根據根據“場景的場景的開 放 性開 放 性”和和“是否為新增是否為新增商業價值商業價值”分分類討論商業價類討論商業價值的歸屬權值的歸屬權所有潛在落地場景技術上可行的場景商業上可行的場景新玩家可獲得商業價值的場景 行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 5 of 21 第二,第二,我們我們只討論“大腦”層面的問題,而不討論“手”的只討論“大腦”層面的問題,而不討論“手”的問題問題。很顯然,部分對物理世界實操要求較高的場景對現階段大模型而言是很難落地的,這是自動化等其他方面造成的限制,不

15、在我們的討論范圍內。第三第三,這只是一個初步的討論,至少受限于這只是一個初步的討論,至少受限于以下以下一些方面:一些方面:1.對于技術的理解偏差。筆者畢業于力學系,并未直接從事過 AI 相關的科學研究,對于 AI 大模型的能力邊界的理解可能存在偏差;2.對于其他行業進展的了解程度不足。筆者聚焦于計算機行業研究,對于其他各個行業實際情況的了解可能存在滯后或偏差;3.各個標準之間可能存在相關性,而不是完全獨立的;4.標準與場景之間存在“虛假”的因果關系。我們認為,尋找標準的方式甚至比標準本身更重要我們認為,尋找標準的方式甚至比標準本身更重要。事實上,比起“每個標準都一定正確”,我們更希望的是在這里

16、提供一個討論的基點,讓學界、業界、投資者等在思考 AI 大模型對于自身行業潛在賦能場景的時候,不單純依賴“開腦洞”式的窮舉法,或者直接喊出“萬物皆可 AI”,而是共同構建一套標準去進行“AI 落地場景發現”。這是一個漸進明晰的過程,歡迎各位讀者對我們提出的標準進行討論、完善和修正。2.技術可行性:尋找現階段技術可行性:尋找現階段 AI的“的“技術技術能力能力邊界邊界”我們把目前的大模型假設成“巨型鸚鵡”,而不是“烏鴉”(對于“鸚鵡智能”和“烏鴉智能”的表述可參照北京大學人工智能研究院朱松純教授的相關文章,即大模型并不能真正理解自然語言。因為如果給出“GPT-4 已經具備完全意義上的烏鴉智能”的

17、結論,就意味著 AGI 已經到來,所有的討論已經毫無意義。技術邊界的討論的起始點來自微軟的論文Sparks of Artificial General Intelligence:Early experiments with GPT-4,這篇文章列出了基于測評得出的 GPT-4 的局限性。表表 1:微軟發布的測評中列舉了目前微軟發布的測評中列舉了目前 GPT-4 的局限性的局限性 信心校準信心校準 信心校準該模型很難知道什么時候它應該有信心,什么時候它只應該猜測。它既會編造在其訓練數據中沒有出現過的事實,也會在生成的內容和提示之間表現出不一致。這些幻覺可以用一種自信的、有說服力的方式被陳述出來,

18、很難被發現。因此,這樣的世代會導致錯誤,也會導致混亂和不信任。長期記憶長期記憶 該模型的上下文非常有限,它以一種無狀態的方式運作,沒有明顯的方法來教該模型新的事實。事實上,我們甚至不清楚該模型是否能夠完成需要不斷發展的記憶和背景的任務,例如閱讀一本書,任務是在閱讀過程中跟隨情節并理解對先前章節的引用。持續的學習持續的學習 模型缺乏自我更新和適應環境變化的能力。模型被訓練好后是固定的,沒有機制可以納入新的信息或來自用戶或世界的反饋。人們可以在新的數據上對模型進行微調,但這可能導致模型性能下降或過度擬合。鑒于訓練周期之間的潛在滯后性,當涉及到最近的訓練周期之后出現的事件、信息和知識時,系統往往會過

19、時。個性化個性化 一些應用要求模型為特定的組織或終端用戶量身定做。該系統可能需要獲得關于一個組織的運作或個人的偏好的知識。在許多情況下,系統需要在一段時間內以個性化的方式適應與人和組織的動態有關的具體變化。規劃和概念規劃和概念性跳躍性跳躍 該模型在執行需提前計劃或需要尤里卡時刻的任務時表現出困難。換言之,該模型在需要概念跳躍的任務上表現不佳,而這種概念跳躍的形式往往是人類天才的典型代表。透明度、可透明度、可解釋性和一解釋性和一模型不僅會產生幻覺、編造事實和產生不一致的內容,而且似乎沒有辦法驗證它產生的內容是否與訓練數據一致,或者是否是自洽的。雖然模型通常能夠為其決策提供高質量的事后解釋,但只有

20、當導致某個決策或結論的過 行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 6 of 21 致性致性 程被準確建模,并且一個足夠強大的解釋過程也被準確建模時,使用解釋來驗證該過程才行得通。這兩個條件都很難驗證,而當它們失敗時,就會出現是模型的決定和它的解釋之間的不一致。由于模型對其自身的局限性沒有明確的認識,所以如果不在一個狹窄的領域進行廣泛的實驗,就很難與用戶建立信任或合作。認知謬誤和認知謬誤和非理性非理性 模型似乎表現出人類知識和推理的一些局限性,如認知偏差和非理性和統計謬誤。該模型可能會繼承其訓練數據中存在的一些偏見、成見或錯誤,這可能反映了與人口的子集

21、或更大的共同觀點和評估有關的意見或觀點的分布。對輸入的敏對輸入的敏感性感性 模型的反應可能對提示的框架或措辭的細節以及它們在會議中的順序非常敏感。在工程提示及其排序方面往往需要大量的努力和實驗,而在人們沒有投入這種時間和努力的情況下使用,會導致次優和不一致的推論和結果。數據來源:Sparks of Artificial General Intelligence:Early experiments with GPT-4,國泰君安證券研究 在此基礎上,在此基礎上,我們根據我們根據下面下面幾條幾條標準標準把部分局限性剔除把部分局限性剔除:1.這條局限是屬于大模型的還是只屬于 GPT 系列的,比如 E

22、ncoder-Decoder 模式更適合自然語言理解,而以 GPT 為代表的 Decoder-only 模式更適合自然語言生成。如果某條局限性僅僅屬于 GPT 系列,我們把它剔除;2.這條局限是大模型和小模型同時存在,還是只有大模型存在?對于后者,我們把它刪除。比如大模型的預訓練時間必然是非常久的,但小模型不存在這個問題;3.這些局限是不是中短期內有可能解決的,比如 GPT 系列模型可以直接讀取的文本長度在快速增加,從 GPT-3.5 的 4096 個上升到了 GPT-4 的32000 個,而且可以預見會持續增加。如果這些局限有希望在中短期內通過漸進式的技術突破被解決,我們把它剔除。表表 2:

23、我們認為,我們認為,GPT-4 的的部分部分局限性并不適用于整個局限性并不適用于整個 AI 范疇或在中短期內可以通過漸進式突破解決范疇或在中短期內可以通過漸進式突破解決 GPT 系列系列 不能代表不能代表 AI邊界邊界 大模型大模型 不能代表不能代表 AI邊界邊界 中短期可能通過中短期可能通過 漸進式突破解決漸進式突破解決 無法無法被剔除被剔除 信心校準信心校準 長期記憶長期記憶 持續的學習持續的學習 個性化個性化 規劃和概念性跳躍規劃和概念性跳躍 透明度、可解釋性和一致性透明度、可解釋性和一致性 認知謬誤和非理性認知謬誤和非理性 對輸入的敏感性的挑戰對輸入的敏感性的挑戰 數據來源:Spark

24、s of Artificial General Intelligence:Early experiments with GPT-4,國泰君安證券研究 在按照前述標準把表格里的部分局限性剔除,并把剩余局限性進行重新歸類后,我們得出了現有范式下 AI 落地在技術方面的掣肘:能力可解釋性邊界能力可解釋性邊界?!靶判男省?、“透明度、可解釋性和一致性”、“對輸入的敏感性”局限都可以歸結為 AI 的最根本問題:深度學習是否是達成 AGI 的可行技術路徑?換言之,目前預訓練大模型在“深度學習+人類反饋強化學習”的統計學框架下表現出了一定程度的“烏鴉智能”,這種智能是基于模型對于自然語言的理解或依然是“鸚鵡

25、學舌”?在我們的弱假設下(大模型是巨型鸚鵡而不是烏鴉),這個問題構成了現階段 AI 的主要技術邊界。創造性邊界創造性邊界。除上述局限之外,僅剩的“規劃和概念性跳躍”局限 行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 7 of 21 是否可以被第一個問題所囊括?就像“尤里卡時刻”能否理解成人類智力中難以被觸達的“Corner Case”?如果這個問題的答案為“是”,AI 所有的技術邊界將“坍縮”成這 AI 的本質問題。以筆者的能力,尚無法判斷這兩個“邊界”之間的關系。在文中,我們權且把兩個邊界作為獨立邊界分別討論。2.1.可解釋性邊界:可解釋性邊界:模型能力

26、模型能力難以難以被被解釋解釋是是 A AI I 最核心的最核心的問題問題 如前文所述,由于 GPT-3 的“理解”能力是“涌現”的,目前對這些能力來源的可解釋性比較差。我們假設目前的大模型是“巨型鸚鵡”,在現階段技術范式下沒有辦法突破“信心校準”、“透明度、可解釋性和一致性”、“對輸入的敏感性”等方面的局限。我們我們把這些技術局限把這些技術局限按照遞進關系歸結為三個問題:按照遞進關系歸結為三個問題:是否有標準答案?如果有標準答案(最優解),這個答案可以被 AI 找到么?如果 AI 找不到標準答案,我們能不能接受?圖圖 3:我們把“鸚鵡我們把“鸚鵡智能智能”帶來的局限歸結為三個問題帶來的局限歸結

27、為三個問題 數據來源:國泰君安證券研究 第一個分岔路口:某個問題有標準答案么?第一個分岔路口:某個問題有標準答案么?對于沒有標準答案的場景,對于沒有標準答案的場景,AI的落地似乎是沒有什么的落地似乎是沒有什么技術技術限制的。限制的。這部分包含了生成式 AI 的目前最為常見的一些應用場景,比如文字生成圖片、生成文章摘要、生成營銷文案等。我們認為,我們認為,由于由于:這些問題的答案比較開放,不存在絕對的錯誤答案;如果對于生成的答案不滿意可以通過新增條件的方式讓模型對答案進行修改;人工同樣可以重新修改答案;等原因,這些場景中 AI 的落地很難看到對“可解釋性推理能力”的高要求,技術上并不存在掣肘。當

28、然,在這類場景中,可能會存在無法保證嚴格遵守道德和法律規定的問題,比如涉及隱私、著作權等方面的風險,但這些風險可以通過商務條款進行規避,都屬于“商業風險”,被我們歸為“商業邊界”范疇。是否是否有有標準答案標準答案無(無(AIAI落地相對容易)落地相對容易)如可被人類修改的文稿有有標準答案是否標準答案是否可以被可以被AIAI找到找到可以可以(AIAI落地相對容易)落地相對容易)如棋類運動不可以不可以我們是否能接受我們是否能接受能能(AIAI落地相對容易)落地相對容易)如個性化教育不能(不能(AIAI落地落地相對困難)相對困難)如內科手術中的醫療影像 行業更新行業更新 請務必閱讀正文之后的免責條款

29、部分請務必閱讀正文之后的免責條款部分 8 of 21 第二個分叉路口:第二個分叉路口:如果有標準答案,如果有標準答案,AI能幫助我們找到這個標準答案么?能幫助我們找到這個標準答案么?我們認為,這是一個“有限場景”和“無限場景”的問題我們認為,這是一個“有限場景”和“無限場景”的問題。在所有情況可以被遍歷的場景中,AI 的任務是在所有可能的方案里尋找“最優解”,這對 AI 來說是容易的;反之則是困難的。比如,比如,在在棋類運動棋類運動中中“達到人類智力邊界”對“達到人類智力邊界”對 AI 來說來說是是比較比較容易的容易的,本質上在于它是一個“有標準答案且情況可以被遍歷”的場景本質上在于它是一個“

30、有標準答案且情況可以被遍歷”的場景。上一次AI 形成全球范圍的討論毫無疑問是 2016 年 AlphaGo戰勝李世石的時候。我們把這個例子納入到我們的討論。很顯然,棋類運動是典型的“有限場景”的例子。無論是圍棋還是象棋,都是在一套特定的規則框架下戰勝對手,每一步可以“落子”的情況都是有限的集合,換句話說,所有可能性是可以被遍歷的。這種場景本質上是在所有可能的方案里尋找“最優解”,AI 的計算優勢被發揮得淋漓盡致。那么,什么樣的場景那么,什么樣的場景是是“有標準答案且情況無法被遍歷有標準答案且情況無法被遍歷”的場景?的場景?我們認為,一個典型的場景就是我們認為,一個典型的場景就是公開公開道路道路

31、自動駕駛。自動駕駛。事實上,我們理論上永遠沒有辦法通過路測實現對路況的全覆蓋。Waymo 是自動駕駛領域的霸主,但是在過去很多年里,在感知問題、行人問題、軟件問題等方面,Waymo 的接管頻率并沒有收斂(基于加州路測報告)。毫無疑問,Waymo 的自動駕駛能力是逐年增強的;那么,Waymo 在軟件問題、行人問題等方面的表觀“退步”就只能用它在覆蓋更多的 corner case 來解釋。比如,在高速公路等路況相對簡單的場景下測試獲得好的結果之后,Waymo 會把路測地點逐漸向難度更高的城區街道進行拓展。需要說明的是,我們并不是在否認 AI 在自動駕駛中的價值,包括目前海外已經有很多廠商通過 AI

32、 進行數據生成,而不再單純用自動駕駛車隊,大大提高了效率。但我們認為,通過 AI 實現對路況的遍歷是無法實現的,這會始終成為開放道路自動駕駛落地的重要掣肘。表表 3:2021年感知問題、行人問題、軟件問題等方面,年感知問題、行人問題、軟件問題等方面,Waymo的接管頻率表觀值相對于的接管頻率表觀值相對于 2016年并未發生明年并未發生明顯變化(單位:次顯變化(單位:次/百萬公里)百萬公里)問題類型 2015 2016 2017 2018 2019 2021 感知問題 281 31 43 24 36 25 硬件的性能問題 92 0 37 2 6 4 預測問題 19 9 14 3 5 3 行人問題

33、 54 16 3 17 8 10 多余操作,謹慎過頭 130 47 54 40 21 25 天氣問題 31 2 0 2 1 0 軟件問題 189 80 26 1 0 58 數據來源:歷年加州路測報告,國泰君安證券研究 圖圖 4:Waymo2019 年脫離場景中“年脫離場景中“highway”占”占 21%圖圖 5:Waymo2021 年脫離場景中“年脫離場景中“highway”占”占 3%行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 9 of 21 數據來源:2019 年加州路測報告,國泰君安證券研究 數據來源:2021 年加州路測報告,國泰君安證券研究

34、第三個分岔路口:如果第三個分岔路口:如果 AI 真的找不到正確答案(哪怕是局部最優解),真的找不到正確答案(哪怕是局部最優解),我們能接受么?我們能接受么?仍采用我們最初的假設,在“深度學習+強化學習”的技術路徑下,雖然大模型“涌現”出了一定的推理能力,但仍不是完全意義上的 AGI。在這種情況下,一旦所有情況無法被遍歷,必然會出現 Bad Case。那么,我們對于這些 Bad Case 能接受么?討論到這一階段,討論到這一階段,AI 的落地難度變成了的落地難度變成了錯誤容忍度錯誤容忍度的的問題。問題。毫無疑問,在所有無法實現對 Corner Case 進行遍歷的情況下,如果我們對于 Bad C

35、ase 的容忍度足夠高,AI 的落地就變得非常順暢,反之,AI 落地艱難。我們通過一正一反兩個例子來說明我們的觀點:我們通過一正一反兩個例子來說明我們的觀點:正向例子:正向例子:“因材施教”是一個典型的對于錯誤的容忍度較高的場“因材施教”是一個典型的對于錯誤的容忍度較高的場景。景。在教育領域,AI 的典型應用場景是針對學生在學習過程中產生的數據做分析,判斷學生對各個知識點的掌握程度,再有針對性地為學生做題目推送。在這個過程中,必然會存在一些推送不當的情況,但推送錯誤所造成的損失是非常小的,只要絕大部分的題目是推送恰當的,對用戶來說就是一款好產品。即如果推送的 10 道題中有 7 道是合適的,3

36、 道是不恰當的,所有學生和家長一定是“交口稱贊”而不是“一片罵聲”。在這類場景下,用戶關心的是“整體效果”。反向例子:反向例子:內科手術的內科手術的醫療影像是對錯誤容忍度非常低的場景。醫療影像是對錯誤容忍度非常低的場景。由于醫療事故會產生非常嚴重的后果,導致在評價產品效果的時候更多地關注誤判的案例,而不是整體的正確率。對于醫療影像而言,99%的可靠性也是不能接受的,因為這意味著每 100 次診斷都可能會造成一次醫療事故。而且,在這種場景中,并不能認為 AI 比醫生的準確率高就能夠快速落地,因為醫生的每次診斷都是需要簽字的,醫療事故的責任劃分相對清晰;而 AI 影像一旦出現錯誤,責任的劃分是不清

37、晰的。表表 4:誤判誤判所造成損失所造成損失的大小在一定程度上決定了的大小在一定程度上決定了 AI 在不同場景下的推廣速度在不同場景下的推廣速度 個性化學習個性化學習 醫療影像醫療影像在在內科內科手術中的應用手術中的應用 出現負面的應用個例所造成的損失 小 大 效果驗證方式 整體 個體 FreewayhighwayParking FacilitystreetFreewayhighwayParking Facilitystreet 550949 行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 10 of 21 企業的核心關注點 效率 安全 對于可解釋性、準確性

38、的要求 低 高 AI 落地速度 快 慢 數據來源:國泰君安證券研究 2.2.創造性邊界:創造性邊界:A AI I 不創造知識,不創造知識,A AI I 只是知識的搬運工只是知識的搬運工 所有基于現有知識的“裁剪”和“縫合”都不構成所有基于現有知識的“裁剪”和“縫合”都不構成 AI 的技術邊界,而的技術邊界,而對于新知識的“創造”無法通過對于新知識的“創造”無法通過 AI獨立完成獨立完成,AI大模型的邊界是人類大模型的邊界是人類的已知知識。的已知知識。換言之,AI 不創造知識,AI 只是知識的搬運工。在微軟的報告中,把在微軟的報告中,把“創造新知”類的“創造新知”類的任務任務叫做不連續的任務。這

39、些任叫做不連續的任務。這些任務務不能不能單純單純以漸進或連續的方式完成,而是需要某種以漸進或連續的方式完成,而是需要某種“尤里卡尤里卡”的想法,的想法,在解決任務的過程中實現不連續的飛躍。在解決任務的過程中實現不連續的飛躍。比如牛頓看到蘋果落地發現了萬有引力,阿基米德洗澡時發現了浮力定律,這些場景涉及到發現或者發明一種看待事物或構建問題的新方法。比較有意思的是,同一個場景下可能同時存在“漸進式任務”和“不連比較有意思的是,同一個場景下可能同時存在“漸進式任務”和“不連續任務”,前者不構成技術局限,而后者是續任務”,前者不構成技術局限,而后者是 AI 的技術邊界。的技術邊界。我們用我們用 AI

40、制藥中兩個可能制藥中兩個可能出現出現的環節作為例子來進行說明:的環節作為例子來進行說明:2016 年左右,中科大聯合多個研究小組發現了一種能用于早期診斷阿爾茨海默癥的生物標志物分泌酶,患者大腦中這種酶的活性普遍較高。在此基礎上,醫療工作者希望努力找到一種方式來降低這種酶的活性,其中可能涉及尋找靶點的工作。在這個過程中,“抑制分泌酶的活性可能可以治療阿茲海默”、“某個分子構型能夠實現降低分泌酶活性的效果”這兩個猜想都需要人類的經驗和“靈光一現”,這是 AI 無法代替的;而后續的工作就類似于“搜索”邏輯,在一系列答案中尋找一個可行的解。就像復仇者聯盟 3里奇異博士通過對 14000605 種結局的

41、“搜索”找到了能戰勝滅霸的“局部最優解”,這是 AI 能有用武之地的環節。同樣,我們同樣,我們還可以給出還可以給出一個數學一個數學證明證明方面的例子方面的例子。AI大模型可以實現對數學定理的證明。比如在微軟對于 GPT-4 的測評報告中有一個例子,表明 GPT-4 可以對“有無限多的質數”給出證明過程。但我們認為,證明的實現有兩個基本的前提:猜想已經被提出猜想已經被提出。人類必須提出一個準確的目標,而不能讓大模型自己提出猜想;這個猜想已經被人類證明從而成為了定理這個猜想已經被人類證明從而成為了定理。如果我們認為大模型是“巨型鸚鵡”,那么人類的已知知識就是其邊界。換言之,GPT 是無法去證明哥德

42、巴赫猜想或者黎曼猜想的。圖圖 6:在微軟的測評報告中,在微軟的測評報告中,GPT-4 能給出對“有無限多的質數”的證明能給出對“有無限多的質數”的證明 行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 11 of 21 數據來源:微軟 3.商業可行性:商業可行性:在技術在技術可行可行的的前提下前提下,尋找尋找 AI落地落地的的商業邊界商業邊界 技術上技術上可可實現并不意味著商業上實現并不意味著商業上可行可行,我們希望在技術可實現的范圍內,我們希望在技術可實現的范圍內剔除掉缺乏商業價值的場景剔除掉缺乏商業價值的場景。對于 IT 公司而言,賺的都是幫助客戶額外賺到

43、的錢或者幫助客戶省下的錢。在“既不能賺錢又不能省錢的場景”下,大模型顯然是很難落地的。我們認為,除了大模型的擁有方直接“下場”的個別場景外,大模型落地的絕大部分場景在商業模式上可以歸結為 B2B2C 和 B2B 兩類,前者大致對應“幫客戶賺錢”的邏輯,后者大致對應“幫客戶省錢”的邏輯。廣義來看,甚至 Copilot 也可以認為是一個特殊的 B2B2C 場景,即“Open AI-微軟-消費者”,屬于“Open AI 幫微軟賺錢”的場景。圖圖 7:在技術可實現的范圍內,我們希望找到在技術可實現的范圍內,我們希望找到 AI 落地的“商業價值邊界”落地的“商業價值邊界”數據來源:國泰君安證券研究 商業

44、價值商業價值來源來源幫客戶賺錢幫客戶賺錢幫客戶省錢幫客戶省錢可以可以不可以(不可以(AIAI落地相對困難)落地相對困難)是(是(AIAI落地相對容易)落地相對容易)否否(AIAI落地相對困難)落地相對困難)是否影響消是否影響消費行為費行為技術技術差異是否差異是否可以被感知可以被感知AIAI可替代可替代的人的人類工作量比例類工作量比例高高(AIAI落地相對容易)落地相對容易)低(低(AIAI落地落地相對困難)相對困難)AI 在某個場景中的“降本增效”價值=可替代的人類工作量場景中人類的總工作量=不同工種某一工種可被替代的工作量不同工種某一工種的總工作量 行業更新行業更新 請務必閱讀正文之后的免責

45、條款部分請務必閱讀正文之后的免責條款部分 12 of 21 下面我們對兩種場景分開討論。3.1.幫客戶賺錢幫客戶賺錢:技術差異需被終端:技術差異需被終端用戶用戶感知,并能影響消費感知,并能影響消費行為行為 如果我們把大模型廠商作為獨立供應方,“幫客戶賺錢”的場景在商業模式上很顯然是“B2B2C”。對于這類場景,我們認為 AI 是否有商業價值核心在于兩個問題:AI 技術差異能否形成代差?對于終端用戶而言這種技術差異是不是足夠可感知的?如果技術差異可以被感知,能否能夠直接影響消費者的消費行為?在某個場景下,在某個場景下,如果如果上述上述兩個問題的答案都是“兩個問題的答案都是“是是”,AI的的落地會

46、非常落地會非??炜?;反之,反之,AI 技術的技術的落地就更多取決于落地就更多取決于 B端客戶的決策了。端客戶的決策了。智能語音助手智能語音助手可能可能是個是個比較比較合適的例子。合適的例子。第一階段的故事,第一階段的故事,Iphone4S 的熱銷的熱銷很大程度上歸功于很大程度上歸功于 Siri。2011 年 10 月 4 日,Siri正式發布。作為全球首個智能語音助手,Siri一經上市就迅速點燃了市場的熱情,首個搭載 Siri 的機型iPhone4S 在推出后的第一個周末就售出 400 萬部,并帶動 2011Q4蘋果手機銷量大幅提升至 3704 萬臺(單季環比增速+117%),占 2011年全

47、年銷售量的 40%。圖圖 8:第一階段的故事,第一階段的故事,Siri 首發助力首發助力 iPhone 銷售量大幅提升銷售量大幅提升 數據來源:天貓精靈 第二階段的故事,現在沒人會因為第二階段的故事,現在沒人會因為 Siri 買買 Iphone12。一個非常有意思的現象是,現在不會有任何消費者再因為 Siri 選擇蘋果了,背后的原因是什么?一個最為直觀的回答是:因為現在很多品牌都有了同樣的功能。但事實真的是這樣么?我們試想一下,如果 Siri 能夠實現“技術代差”,做到一些其他語音助手無法實現的功能,情況顯然不會如此,甚至我們對于 ChatGPT 的驚嘆程度也要打一些折扣。但實時情況是,但實時

48、情況是,Siri 和其他語音助手和其他語音助手之間之間的“技術代差”并不存在。的“技術代差”并不存在。行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 13 of 21 一個最簡單的例子:當我們對 Siri 說“推薦金融街附近的餐廳”時,它馬上給出了很多選項,把任務完成的很好。但是,當我進一步和他對話,說“我想吃飯但不想吃永和大王”的時候,讓人失望的事情發生了Siri 給我推薦了滿屏幕的永和大王。如果我們把問題換成“我想住酒店但不住漢庭”,我們又將收獲滿屏幕的漢庭門店。這個小測試說明什么?說明此前各個手機智能語音助手背后的本質還是填槽,通過對話抓取關鍵詞,當系

49、統把所需要的關鍵詞都收集完之后就可以輸出結果,而這樣的技術框架是沒有辦法做即使看起來很簡單的邏輯判斷的。如果我們用華為語音助手做同樣的測試,結果是一樣的。換句話說,此前大家的底層技術邏輯是一樣的。在這種情況下,可能 Siri 的技術做到了 80 分,華為只做到了 70 分,但在用戶體驗上,二者是沒有差異的。畢竟“他能做的我也能做,我做不了的他也做不了”。在這個階段,技術上的差異不會影響消費者的消費選擇。我們認為,這才是沒有人會因為 Siri 去買 iPhone12 的底層邏輯。圖圖 9:第二階段的故事,“我不喜歡吃永和大王”讓智能語音助手束手無第二階段的故事,“我不喜歡吃永和大王”讓智能語音助

50、手束手無策策 數據來源:國泰君安證券研究 第三第三階段的故事,階段的故事,阿里大模型團隊依靠知名脫口秀演員鳥鳥的音頻阿里大模型團隊依靠知名脫口秀演員鳥鳥的音頻做出“鳥鳥分鳥”版智能音箱做出“鳥鳥分鳥”版智能音箱,AI大模型是否會重新影響消費行為?大模型是否會重新影響消費行為?相關測評視頻顯示,該智能音箱所表現出的多輪對話、個性化形象塑造等方面的能力遠超以往所有的智能語音助手或智能音箱。新版天貓精靈進入市場后,有多少人會因為其大模型加持下產生的新能力選擇天貓精靈?我們認為,這僅僅取決于兩個因素:第一,新技術相對于之前有多少“質變”以致于讓“技術代差”足夠被消費者所感知;第二,其他玩家利用大模型“

51、復現”其新能力需要多長時間。圖圖 10:第三階段的故事,第三階段的故事,阿里大模型團隊依靠知名脫口秀演員鳥鳥的音阿里大模型團隊依靠知名脫口秀演員鳥鳥的音頻做出“鳥鳥分鳥”版智能音箱頻做出“鳥鳥分鳥”版智能音箱 行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 14 of 21 數據來源:天貓精靈 畢竟畢竟,比起很多其他炫酷的科技概念,所有人都認為,比起很多其他炫酷的科技概念,所有人都認為AGI是產業趨是產業趨勢,而且這一趨勢必然能夠實現,分歧僅僅在于技術路徑和時間勢,而且這一趨勢必然能夠實現,分歧僅僅在于技術路徑和時間。AGI 這場仗沒有哪家巨頭輸得起。這場仗

52、沒有哪家巨頭輸得起。就像 Siri 出現后,谷歌在第二年就發布了 Google Now;ChatGPT 發布后僅僅不到一個季度,谷歌就投資了 ChatGPT 的競品 Anthropic,甚至可以預見的是,如果之后再次出現“Siri”或是“ChatGPT”,各家大廠的反應也會是一樣的。3.2.幫客戶省錢幫客戶省錢:“降本增效”的潛力需要足夠大:“降本增效”的潛力需要足夠大 能能夠夠幫客戶省錢幫客戶省錢的場景的場景中中,AI的落地也的落地也具備商業具備商業落地落地價值價值。在這類場景在這類場景中,中,AI 潛在潛在商業價值的大小取決于“降本增效”的商業價值的大小取決于“降本增效”的潛力潛力。由于幫

53、客戶省錢的主要邏輯在于“模型可以幫助員工提升工作效率,從而對部分原有人員進行替代”,所以我們把 AI 的“降本增效”潛能歸結為下面的公式:圖圖 11:AI 在某個場景中的“降本增效”價值可以用它對于人類工作量的替代來衡量在某個場景中的“降本增效”價值可以用它對于人類工作量的替代來衡量 AI 在某個場景中的“降本增效”價值=可替代的人類工作量場景中人類的總工作量=不同工種某一工種可被替代的工作量不同工種某一工種的總工作量 數據來源:國泰君安證券研究 從公式中我們可以發現,從“降本增效”的角度,AI 在某個場景中落地的價值潛力主要取決于兩個因素:這個場景中有多大比例的員工的工作量會由于 AI 大模

54、型的出現而受到影響;這些員工的任務中有多大比例可以被 AI 大模型替代。我們發現問題可以我們發現問題可以從“從“場景層面場景層面 AI能夠提供多大的能夠提供多大的降本增效價值”轉降本增效價值”轉化為化為“該“該場景中勞動力場景中勞動力可以被可以被 AI替代替代的的比例比例有多大”。有多大”。而對于后一個問題,我們完全可以借用 Open AI 對于 AI 大模型對不同職業影響情況的討論。(可參照 GPTs are GPTs An Early Look at the Labor Market Impact)Open AI 在報告中在報告中給出給出了了 GPT-4 或或 LLM對不同職業的替代程度對

55、不同職業的替代程度的的討討論論。在 Open AI 的討論中定義了“暴露百分比”指標,用來表征某個職業的任務中有多大比例可以被 GPT-4 或基于 GPT-4 開發的其他軟件所替代,其簡化結論見下表(原文有針對更多職業的結論,這里不再列示):表表 5:諸多職業將由于諸多職業將由于 GPT-4 或或 LLM 而實現效率提升而實現效率提升 職業職業 程度程度 行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 15 of 21 高度直接暴露高度直接暴露 口譯員和筆譯員 76.5 調查研究員 75.0 詩人、作詞家和創意作家 68.8 動物科學家 66.7 公共關系專

56、家 66.7 均衡暴露均衡暴露 調查研究員 84.4 作家與作者 82.5 口譯員和筆譯員 82.4 公共關系專家 80.6 動物科學家 77.8 高度間接暴露高度間接暴露 數學家 100.0 報稅員 100.0 金融量化分析師 100.0 作家與作者 100.0 網頁與數字界面設計師 100.0 注:直接暴露指使用 GPT 或 LLM 能降低至少 50%工作量;簡介暴露指基于 GPT 或 LLM 開發的軟件能使其降低至少 50%工作量。均衡暴露中“直接暴露”的權重為 1,“間接暴露”的權重為 0.5 數據來源:Open AI、未盡研究,國泰君安證券研究 在這里,我們給出在這里,我們給出關于電

57、商智能客服和運營商線上客服的例子關于電商智能客服和運營商線上客服的例子,方便讀,方便讀者更直觀地理解上面的結論者更直觀地理解上面的結論。我們認為,雖然二者都屬于“智能客服”,但電商智能客服我們認為,雖然二者都屬于“智能客服”,但電商智能客服場景中場景中AI大大模型的“降本增效”模型的“降本增效”潛力潛力遠遠高于運營商線上客服,前者落地更遠遠高于運營商線上客服,前者落地更容易容易。核心原因在于:電商智能客服:電商智能客服:消費者使用智能客服的頻率相對于消費的頻率是比較高的,這就導致智能客服成本在電商場景中的成本占比較高,AI替代人工的“降本增效”價值較高;運營商智能客服:運營商智能客服:對于消費

58、者來說,智能客服是一個低頻應用,導致智能客服成本在運營商場景中的成本占比比較低,AI 替代人工的“降本增效”價值較低。表表 6:同樣是智能客服,在不同場景中“同樣是智能客服,在不同場景中“AI 大模型替代人工”大模型替代人工”能夠能夠實現的降本增效價值并不相同實現的降本增效價值并不相同 電商智能客服電商智能客服 運營商運營商線上線上智能客服智能客服 消費者使用頻次(相對于消費頻次)消費者使用頻次(相對于消費頻次)高 低 線上客服占成本的比重線上客服占成本的比重 高 低 AI大模型對于線上客服的部分替代產生的大模型對于線上客服的部分替代產生的“降本增效”“降本增效”價值價值 高 低 數據來源:國

59、泰君安證券研究 3.3.總體來看,“總體來看,“賺錢邏輯賺錢邏輯”好于好于“省錢邏輯省錢邏輯”總體總體來看來看,“幫客戶“幫客戶賺錢賺錢”的”的場景場景在商業在商業落地方面落地方面會優于會優于“幫客戶“幫客戶省錢省錢”的的場景。場景。這個道理不止適用于這個道理不止適用于 AI的商業落地,也適用于絕大多數的商業落地,也適用于絕大多數技術在技術在商商業場景業場景中的中的落地落地。就像一個公司里“成本中心”的地位往往比不上“利潤中心”。本質上還是因為收入端的商業價值是更清晰的,成本端的商業價值只能靠諸如“替代多少員工”的邏輯來計算,其商業 行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀

60、正文之后的免責條款部分 16 of 21 價值和收入端相比是比較模糊的。尤其當終端場景屬于“低頻次,高消費”的場景時,做成本端的優化是一件“吃力不討好”的事。這里我們僅簡單舉出一個家裝行業的例子作為對比這里我們僅簡單舉出一個家裝行業的例子作為對比。在家裝行業中,前端的設計軟件是幫助家裝公司更快更好地畫出設計效果圖,從而吸引消費者,直接幫助家裝公司提升收入,家裝公司愿意買單。在這一領域誕生了三維家、酷家樂等等一系列公司。而后端的施工信息化本質上是通過把施工拆分成不同的施工節點,降低對于工人的能力要求,提升家裝公司的規模效應。這類軟件要真正有用,難度比前端設計軟件高非常多,而且它的商業價值很難被量

61、化。尤其在“低頻次,高消費”的場景中,在用戶的消費行為已經發生后,幫助客戶提升消費體驗是不經濟的。對于這類軟件,家裝公司的買單意愿較弱。表表 7:尤其在尤其在“低頻次,高消費”的場景中,成本端的優化對于商家來說性價比“低頻次,高消費”的場景中,成本端的優化對于商家來說性價比較低較低 “地產后周期”“地產后周期”產業鏈中產業鏈中的各個的各個環節環節 家裝家裝 家居家居 家電家電 消費頻次消費頻次 低 中 高 單次消費金額單次消費金額 高 中 低 客群積累客群積累與品牌力構建與品牌力構建 難 中 低 標準化程度標準化程度 低 中 高 代表企業代表企業 東易日盛、業之峰 歐派、索菲亞 格力、美的 數

62、據來源:國泰君安證券研究 4.商業價值歸屬:商業價值歸屬:探尋大模型帶來的商業價值屬于哪探尋大模型帶來的商業價值屬于哪類玩家類玩家 在本章的討論中,我們聚焦在本章的討論中,我們聚焦三個三個問題:問題:這些應用場景是否會被大模型廠商直接做掉?垂直封閉大場景會不會發生業態變化?這些場景是否是 AI 技術可以落地的新場景?第一個問題的答案是顯而易見的第一個問題的答案是顯而易見的,這里這里只做簡單討論只做簡單討論。毫無疑問,大模型的擁有者必然是 IT 巨頭。對于它們已經占據的核心場景,其他玩家對于它們已經占據的核心場景,其他玩家沒有機會。沒有機會。比如Copilot必然率先誕生在微軟,GPT 相關的醫

63、療應用必然先用于 Nuance(此前的全球智能語音龍頭,已經被微軟收購);同樣地,如果在電商場景里出現一個能真正獲取收入的 AI 大模型應用,它也大概率來自阿里巴巴。對于這類場景,我們不再討論。對于對于 IT巨頭巨頭而言,而言,除了除了它們它們已經圈定的核心場景外,已經圈定的核心場景外,大概率是不大概率是不會在其他場景中“親自下場”的會在其他場景中“親自下場”的。原因很簡單,過多的“親自下場”不利于生態的構建,而大模型本身的商業價值遠遠大于某一個垂直場景應用。對大模型擁有者來說,生態壁壘要比特定垂直場景下的商業價值重要得多。所以,我們把討論聚焦在后兩個問題上。行業更新行業更新 請務必閱讀正文之

64、后的免責條款部分請務必閱讀正文之后的免責條款部分 17 of 21 4.1.開放場景更易“彎道超車”,封閉場景更易“自我迭代”開放場景更易“彎道超車”,封閉場景更易“自我迭代”對于第二個問題的詳細表述是:在此前小模型已經大規模落地的“大型垂域場景”中,到底是一些新玩家會依靠大模型更強大的模型能力彎道超車,還是在小模型時代處于領先的玩家利用大模型實現自我迭代?我們認為,這是“模型能力”和“數據獲取能力”的對決,背后反映的我們認為,這是“模型能力”和“數據獲取能力”的對決,背后反映的是“場景開放性”的問題。是“場景開放性”的問題。對于場景開放性的討論,我們仍然沿用對于場景開放性的討論,我們仍然沿用

65、此前此前的分類方式。的分類方式。需要注意的是,這里的劃分標準是“大模型向小模型遷移時數據的可獲得性,而不是訓練大模型的數據的可獲得性”:開放場景:開放場景:基于大模型訓練小模型時,小模型精調所需要的數據可基于大模型訓練小模型時,小模型精調所需要的數據可以通過公開手段獲得。以通過公開手段獲得。包括傳統或者新興的消費電子單品所衍生出來的各種應用,比如手機上的生態軟件、智能音箱上的軟件等等。這些是都是典型的“開放場景”。在這類場景中,“彎道超車”的概率更高,因為開放場景意味著數據的可獲得性更高,“模型能力”占據主導。封閉場景:封閉場景:數據和特定類型的機構深度綁定,基于大模型的“二次數據和特定類型的

66、機構深度綁定,基于大模型的“二次開發”所需要的數據不容易獲得,數據和渠道比模型能力本身更重開發”所需要的數據不容易獲得,數據和渠道比模型能力本身更重要。要。2B 或者 2G 的垂直領域中的很多細分賽道是“封閉場景”,比如醫療、教育、政法、工業等等。在這類場景中,數據是和特定類型的機構深度綁定的,以至于對于新進入者來說數據獲取難度極大,而且難以在短時間內構建起和客戶之間的信任關系,“數據獲取能力和渠道優勢”占據主導,小模型時代的領先者利用大模型實現“自我迭代”的概率更高。當然,當然,即使在同一個賽道中,不同的細分市場也可能分屬于不同類型的即使在同一個賽道中,不同的細分市場也可能分屬于不同類型的場

67、景。場景。比如“課內教育”(比如科大訊飛基于學生學情數據推出個性化學習手冊,該產品是個性化教輔)和“課外教育”(指市場上的各種學習機,而不是線下輔導班,下同)是兩個完全不同的場景:課外教育更偏向于“開放場景”,模型調教所需要的數據來自于學生使用學習機的過程,基于大模型的“二次開發”所需要的數據相對容易獲得,大模型的出現更容易對行業格局產生影響;課內教育更偏向于“封閉場景”,模型調優的數據來自于學校的周考、月考、課堂作業等,新進入者是很難獲得的,再加之渠道方面的劣勢,很難“后來者居上”,大模型的出現很難對行業格局產生影響。表表 8:課外教育更偏向于“開放場景”,課內教育更偏向于“封閉場景”課外教

68、育更偏向于“開放場景”,課內教育更偏向于“封閉場景”課外教育課外教育 課內教育課內教育 典型產品典型產品 AI 學習機 個性化學習手冊(個性化教輔)數據獲取難度數據獲取難度 較小 較大 渠道壁壘渠道壁壘 較低 較高 大模型對行業競爭格局的影響大模型對行業競爭格局的影響 大 小 數據來源:國泰君安證券研究 綜上,我們認為,預訓練大模型確實綜上,我們認為,預訓練大模型確實在一定程度上導致在一定程度上導致了了垂域場景中數垂域場景中數據壁壘據壁壘的降低的降低?;蛟S垂域數據看起來不再像之前那么重要,但依然很重或許垂域數據看起來不再像之前那么重要,但依然很重 行業更新行業更新 請務必閱讀正文之后的免責條款

69、部分請務必閱讀正文之后的免責條款部分 18 of 21 要。要。4.2.對非對非 I IT T巨頭巨頭來說來說,大模型商業價值大模型商業價值或或更多來自“長尾場更多來自“長尾場景”而非“頭部場景”景”而非“頭部場景”對于第二個問題的詳細表述對于第二個問題的詳細表述是:是:對于一般企業來說,哪些場景才是大模對于一般企業來說,哪些場景才是大模型商用后型商用后 AI 更容易新增商業價值的場景?是“頭部場景”還是“長尾更容易新增商業價值的場景?是“頭部場景”還是“長尾場景”場景”?我們認為,是長尾場景。我們認為,是長尾場景。在大模型出現之前,在大模型出現之前,AI技術在長尾場景中技術在長尾場景中的落地

70、的落地異常異常困難困難。這。這并非并非因為因為技術,而是成本。技術,而是成本。此前,業內更傾向于通過模型優化在參數并不大幅增加的情況下實現模型效果的提升。在這種路線下,AI 技術的應用毫無疑問難以實現對長尾場景的下探。原因很簡單,對于專用模型來說,需要針對場景進行模型構建、數據采集,并進行持續迭代。單一長尾場景本身市場空間有限,而 AI 的人才、算力等成本較高,針對某個長尾場景進行模型和數據迭代本身就是不經濟的。由于大模型的出現,可以在大模型基礎上進行模型能力遷移生成小模型,從而降低成本。預計會有很多此前 AI 技術無法落地的長尾場景將能夠被觸達。比如在工業上,大模型可以比如在工業上,大模型可

71、以被被用于智慧排產。用于智慧排產。一個大型工廠可能擁有上百條產線,生產的產品多種多樣。面對全球各地的訂單需求,某個訂單應該安排哪條產線在什么時間去生產?在類似這樣的場景中,可以基于大模型開發出一系列垂域模型,大幅提升效率。圖圖 12:大量長尾場景此前難以大量長尾場景此前難以被被 AI 技術技術觸達觸達的原因在于投入產出比低的原因在于投入產出比低 數據來源:艾瑞咨詢,國泰君安證券研究 4.3.小結小結 通過對本章開始提出的問題,我們根據“市場的大小”、“場景的開放程度”兩個指標構建了下圖中的場景矩陣,進而得出了兩個結論:開放場景中后來者更容易通過被大模型賦能實現“彎道超車”;封閉場景中,更可能是

72、小模型時代的領先者利用大模型實現“自我迭代”。對于非巨頭企業而言,由于大模型出現而“新增”的商業價值或將項項目目體體量量用戶用戶群體群體政府、大企業端政府、大企業端中小企業端中小企業端短頭短頭長尾長尾以平安城市、以平安城市、雪亮工程等為代表雪亮工程等為代表以園區、樓宇、校園、工地等為代表以園區、樓宇、校園、工地等為代表 行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 19 of 21 更多來自“長尾場景”而非“頭部場景”。圖圖 13:我們依據市場的大小我們依據市場的大小和開放程度對和開放程度對 AI 潛在落地場景進行劃分潛在落地場景進行劃分 數據來源:國泰君

73、安證券研究 5.總結總結 本文本文構建一套構建一套“標準標準”來進行“來進行“AI 前端落地場景的發現”。前端落地場景的發現”。具體具體來說分來說分為三個部分為三個部分:第一第一部分,部分,我們我們以微軟對以微軟對 GPT-4的測評作為基礎尋找現階段的測評作為基礎尋找現階段AI落地的落地的“技術邊界”“技術邊界”。在各種局限性當中,我們認為最核心的仍然是 AI 能力的不可解釋性,當某個問題存在標準答案、這個答案無法被找到,且我們對于錯誤難以容忍時,AI 是難以落地的;此外,AI 的知識邊界來自于人類已知的知識邊界,這就意味著 AI 無法進行真正意義上的而創造性工作。第二部分,在第二部分,在技術

74、上可行的前提下,技術上可行的前提下,我們嘗試我們嘗試勾勒勾勒 AI落地的商業價值落地的商業價值邊界。邊界。技術上的可實現并不意味著商業上可行,我們通過“幫客戶賺錢”和“幫客戶省錢”的劃分方式分別討論了 B2B2C 場景和 B2B場景下 AI落地的商業價值。在 B2B2C 場景中,我們認為 AI 商業落地潛力在于其技術差異是否能夠被終端用戶所感知,從而影響消費行為;在 B2B場景中,我們認為 AI 的商業落地潛力取決于原來場景中可被 AI 替代的任務比例。整體上看,我們認為 B2B2C 場景下的“賺錢邏輯”優于 B2B 場景下的“省錢邏輯”。第三部分,第三部分,我們嘗試探討我們嘗試探討 AI 商

75、業價值的歸屬。商業價值的歸屬。在這一部分中,我們根據“商業價值的大小”、“場景的開放程度”兩個指標構建了場景矩陣,進而得出兩個結論:第一,開放場景中后來者更容易通過被大模型賦能實現“彎道超車”;封閉場景中,更可能是小模型時代的領先者利用大模型實現“自我迭代”。第二,對于非巨頭企業而言,由于大模型出現而“新大大小小小小大大數數據據獲獲取取難難度度商業價值大小商業價值大小開開放放場場景景封封閉閉場場景景頭部場景頭部場景長尾場景長尾場景新市場新市場新市場新市場舊市場舊市場ITIT巨頭直接巨頭直接下場下場新玩家容易新玩家容易“后來居上后來居上”舊市場舊市場小模型時代的小模型時代的領先者領先者“自我自我

76、迭代迭代”行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 20 of 21 增”的商業價值或將更多來自“長尾場景”而非“頭部場景”。最后,作為二級市場的投資者,雖然我們可能無法親身投入到 AI 的新一輪技術浪潮中;也希望我們至少做到,給國內義無反顧投身 AGI 的同學們多一點點時間,多一點點寬容和多一點點耐心。我希望引用普朗克的一句名言來結束我們這個初步的不成熟的討論,“Science progresses one funeral at a time.The future depends on some graduate student who is dee

77、ply suspicious of everything I have said.”與各位共勉。6.投資建議投資建議 繼續推薦繼續推薦金山辦公、科大訊飛、杰創智能、凌志軟件金山辦公、科大訊飛、杰創智能、凌志軟件。金山辦公:公司是國產辦公軟件龍頭,全力發力 AI 戰略,加大 AI 人才投入力度,預計在 2023H1 推出 AI 新品,與微軟有直接映射關系??拼笥嶏w:采用“1+N”架構,將大模型落地于教育、醫療、人機交互、辦公等多個行業,大模型將率先賦能訊飛聽見、學習機,5 月 6 日產品級發布。杰創智能:AI技術可以幫助提高公司公共安全產品性能,降低成本,且外銷一帶一路國家。凌志軟件:公司長期服

78、務日本金融市場,目前已有 GPT 相關應用落地(自動生成招股書),也可通過 GPT 實現內部最高 75%降本。表表 9:重點公司估值情況:重點公司估值情況 股票代碼股票代碼 證券名稱證券名稱 總市值總市值(億元)(億元)營業收入(億元)營業收入(億元)PS(倍)(倍)評級評級 20230315 2021A 2022A/E 2023E 2021A 2022 A/E 2023E 688111 金山辦公 2,177.17 32.80 38.85 52.36 66.38 56.04 41.58 增持 002230 科大訊飛 1,486.31 183.14 200.54 275.68 8.12 7.41

79、 5.39 增持 301248 杰創智能 38.39 9.40 7.52 11.30 4.08 5.10 3.40 增持 688588 凌志軟件 68.24 6.53 6.55 7.93 10.46 10.43 8.61 增持 數據來源:wind,國泰君安證券研究 7.風險提示風險提示 AI 技術落地不及預期。技術落地不及預期。由于 AI 大模型的能力源于“涌現”,后續新版本模型將“涌現”出哪些新能力無法準確預估,如果技術迭代速度低于預期,可能會影響 AI 的商業落地節奏。AI 大模型大模型受到受到政策強監政策強監管。管。由于 AI 大模型的能力來源無法解釋,政府、學界、業界對于 AI 被濫用

80、均存在一定程度的擔憂。若 AI 被強監管,甚至 AI 大模型研發被暫停,可能會導致 AI 的商業落地受限。行業更新行業更新 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 21 of 21 本公司具有中國證監會核準本公司具有中國證監會核準的證券投資的證券投資咨詢咨詢業務資格業務資格 分析師聲明分析師聲明 作者具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力,保證報告所采用的數據均來自合規渠道,分析邏輯基于作者的職業理解,本報告清晰準確地反映了作者的研究觀點,力求獨立、客觀和公正,結論不受任何第三方的授意或影響,特此聲明。免責聲明免責聲明 本報告僅供國泰君安證券

81、股份有限公司(以下簡稱“本公司”)的客戶使用。本公司不會因接收人收到本報告而視其為本公司的當然客戶。本報告僅在相關法律許可的情況下發放,并僅為提供信息而發放,概不構成任何廣告。本報告的信息來源于已公開的資料,本公司對該等信息的準確性、完整性或可靠性不作任何保證。本報告所載的資料、意見及推測僅反映本公司于發布本報告當日的判斷,本報告所指的證券或投資標的的價格、價值及投資收入可升可跌。過往表現不應作為日后的表現依據。在不同時期,本公司可發出與本報告所載資料、意見及推測不一致的報告。本公司不保證本報告所含信息保持在最新狀態。同時,本公司對本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關

82、注相應的更新或修改。本報告中所指的投資及服務可能不適合個別客戶,不構成客戶私人咨詢建議。在任何情況下,本報告中的信息或所表述的意見均不構成對任何人的投資建議。在任何情況下,本公司、本公司員工或者關聯機構不承諾投資者一定獲利,不與投資者分享投資收益,也不對任何人因使用本報告中的任何內容所引致的任何損失負任何責任。投資者務必注意,其據此做出的任何投資決策與本公司、本公司員工或者關聯機構無關。本公司利用信息隔離墻控制內部一個或多個領域、部門或關聯機構之間的信息流動。因此,投資者應注意,在法律許可的情況下,本公司及其所屬關聯機構可能會持有報告中提到的公司所發行的證券或期權并進行證券或期權交易,也可能為

83、這些公司提供或者爭取提供投資銀行、財務顧問或者金融產品等相關服務。在法律許可的情況下,本公司的員工可能擔任本報告所提到的公司的董事。市場有風險,投資需謹慎。投資者不應將本報告作為作出投資決策的唯一參考因素,亦不應認為本報告可以取代自己的判斷。在決定投資前,如有需要,投資者務必向專業人士咨詢并謹慎決策。本報告版權僅為本公司所有,未經書面許可,任何機構和個人不得以任何形式翻版、復制、發表或引用。如征得本公司同意進行引用、刊發的,需在允許的范圍內使用,并注明出處為“國泰君安證券研究”,且不得對本報告進行任何有悖原意的引用、刪節和修改。若本公司以外的其他機構(以下簡稱“該機構”)發送本報告,則由該機構

84、獨自為此發送行為負責。通過此途徑獲得本報告的投資者應自行聯系該機構以要求獲悉更詳細信息或進而交易本報告中提及的證券。本報告不構成本公司向該機構之客戶提供的投資建議,本公司、本公司員工或者關聯機構亦不為該機構之客戶因使用本報告或報告所載內容引起的任何損失承擔任何責任。評級說明評級說明 評級評級 說明說明 1.1.投資建議的比較標準投資建議的比較標準 投資評級分為股票評級和行業評級。以報告發布后的 12 個月內的市場表現為比較標準,報告發布日后的 12 個月內的公司股價(或行業指數)的漲跌幅相對同期的滬深 300 指數漲跌幅為基準。股票投資評級股票投資評級 增持 相對滬深 300 指數漲幅 15%

85、以上 謹慎增持 相對滬深 300 指數漲幅介于 5%15%之間 中性 相對滬深 300 指數漲幅介于-5%5%減持 相對滬深 300 指數下跌 5%以上 2.2.投資建議的評級標準投資建議的評級標準 報告發布日后的 12 個月內的公司股價(或行業指數)的漲跌幅相對同期的滬深300 指數的漲跌幅。行業投資評級行業投資評級 增持 明顯強于滬深 300 指數 中性 基本與滬深 300 指數持平 減持 明顯弱于滬深 300 指數 國泰君安證券研究國泰君安證券研究所所 上海上海 深圳深圳 北京北京 地址 上海市靜安區新閘路 669 號博華廣場 20 層 深圳市福田區益田路 6003 號榮超商務中心 B 棟 27 層 北京市西城區金融大街甲 9 號 金融街中心南樓 18 層 郵編 200041 518026 100032 電話(021)38676666(0755)23976888(010)83939888 E-mail:

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(計算機行業尋找AI技術潛在應用場景的方法論:AI大航海時代的數字羅盤-230407(21頁).pdf)為本站 (潘多拉魔盒) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站