1、 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。1 證券研究報告 計算機計算機 GPT&智能終端:大模型定義新入口智能終端:大模型定義新入口 華泰研究華泰研究 計算機計算機 增持增持 (維持維持)研究員 謝春生謝春生 SAC No.S0570519080006 SFC No.BQZ938 +(86)21 2987 2036 聯系人 袁澤世,袁澤世,PhD SAC No.S0570122080053 +(86)21 2897 2228 聯系人 彭鋼彭鋼 SAC No.S0570121070173 +(86)21 2897 2228 行業行業走勢圖走勢圖 資料來源:Wind,華泰研究
2、 2023 年 4 月 06 日中國內地 專題研究專題研究 以機器人為突破口,以機器人為突破口,ChatGPT 等大模型定義等大模型定義智能終端智能終端新新入口入口 2023 年 2 月,微軟提出了 ChatGPT for Robotics,利用 ChatGPT 解決機器人應用程序問題。在此過程中,不要求 LLM(大語言模型)輸出特定于機器人平臺或庫的代碼,而是創建簡單的高級函數庫供 ChatGPT 調用,并在后端將高級函數庫鏈接到各平臺、場景和工具的現有庫和 API。結果表明,ChatGPT 能夠以 zero-shot 的方式解決各種與機器人相關的任務,對于zero-shot 無法解決的問題
3、,用戶也可以采用交互對話的形式對 ChatGPT 實行進一步指導。以人形、協作機器人為突破口,ChatGPT 等 LLM 將成為智能音箱、車載虛擬助手等智能終端設備新入口。人類人類 on-the-loop 指導指導 ChatGPT 操縱機器人操縱機器人 ChatGPT 的引入,使得人類用戶脫離 in-the-loop,轉以 on-the-loop 的形式,通過自然語言等高級語言命令與語言模型交互,實現無縫部署各種平臺和任務,并對 ChatGPT 輸出的質量和安全性進行評估。其中,定義高級函數庫與構建提示是關鍵:前者通過調用機器人平臺 API 賦予 ChatGPT 操縱機器人的能力;后者通過描述
4、約束&需求、環境、當前狀態、目標、方案示例等,更好的指導 ChatGPT 生成結果。微軟還提供專門的 PromptCraft 和 AirSim仿真平臺輔助開發者進行機器人方面的研究。ChatGPT 分三個層次解決不同復雜度的機器人問題分三個層次解決不同復雜度的機器人問題 對于簡單的機器人任務,例如時空推理、無人機飛行和 AirSim 工業檢測等,ChatGPT 能夠以 zero-shot 的方式解決,不需要提供額外的代碼示例。對于較為復雜的任務,例如課程學習和 AirSim 避障,ChatGPT 無法 zero-shot解決問題,人類用戶 on-the-loop 與 ChatGPT 進行交互,
5、可以輔助其完成相關任務。以上兩類任務的完成均依賴 ChatGPT 生成的代碼,而更高層次地,用戶通過文本對話不斷將人類的感知信息輸入到 ChatGPT,ChatGPT 能夠解析觀察流并在“對話系統”中輸出相關操作,不再需要生成代碼。LLM 定義機器人、智能音箱、車載助手等新入口定義機器人、智能音箱、車載助手等新入口 微軟的 ChatGPT for robots 開啟了 ChatGPT 的設備入口屬性。1)機器人入口:谷歌的 PaLM-E 具身多模態模型同樣實現了對機器人的控制;OpenAI從 2017 年即開始在機器人領域布局,2023 年 3 月領投挪威的人形機器人制造商 1X techno
6、logies。2)智能音箱&家居:國外智能家居提供商 Josh.ai提供了與 ChatGPT 結合的使用示例,阿里大模型聯合項目團隊在天貓精靈智能音箱上部署了個性化消費級終端模型。3)車載助手:通用汽車正開發基于 ChatGPT 的虛擬個人 AI 助手,毫末智行預告了 DriveGPT。相關標的相關標的 大模型的“新入口”屬性已經從主流的 PC 和手機端,向更廣泛的智能設備擴散。我們認為,主要的智能設備包括智能終端和智能音箱,相關標的包括:1)智能終端:科大訊飛,螢石網絡,中科創達;2)智能音箱:國光電器,漫步者,惠威科技;3)機器人:石頭科技;4)銀行超級柜臺:新北洋。風險提示:宏觀經濟波動
7、,技術進步不及預期。本報告內容均基于客觀信息整理,不構成投資建議。(15)3213957Apr-22Aug-22Dec-22Apr-23(%)計算機滬深300 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。2 計算機計算機 正文目錄正文目錄 ChatGPT:探索機器人新入口:探索機器人新入口.3 人類 on-the-loop 指導 ChatGPT 操縱機器人.3 定義高級函數庫與構建提示是關鍵.4 微軟提供開源 prompt 和仿真平臺.5 簡單任務:zero-shot 可以直接解決.6 復雜任務:用戶 on-the-loop 交互式對話實現.7 感知-動作循環:代碼層次與對話層
8、次.7 以機器人為突破口,以機器人為突破口,LLM 定義智能終端新入口定義智能終端新入口.9 入口#1:人形、協作等各類機器人.9 入口#2:以智能音箱為代表的智能家居.11 入口#3:車載虛擬個人 AI 助手.13 相關標的.14 風險提示.15 5X9UgViYeYlWsXvUuV8OdNbRoMoOsQmPeRpPsOkPrRqOaQnMvMvPnRxPxNsQsO 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。3 計算機計算機 ChatGPT:探索探索機器人機器人新入口新入口 微軟解鎖微軟解鎖 ChatGPT 處理處理機器人應用程序的能力機器人應用程序的能力,構建高級函數
9、庫是關鍵,構建高級函數庫是關鍵。微軟提出了ChatGPT for Robotics,利用 ChatGPT 解決機器人應用程序問題。在此過程中,不要求 LLM(大語言模型)輸出特定于機器人平臺或庫的代碼,而是創建簡單的高級函數庫供 ChatGPT調用,并在后端將高級函數庫鏈接到各平臺、場景和工具的現有庫和 API。此外,基于ChatGPT 良好的推理和理解能力,能夠很好的理解用戶自然語言形式的意圖,將其轉換為高級函數調用的邏輯鏈。ChatGPT 能夠以能夠以 zero-shot 的方式解決各種與機器人相關的任務的方式解決各種與機器人相關的任務。在微軟的演示中,通過自由形式的自然語言對話、代碼提示
10、、XML 標記和閉環推理等提示(prompt)技術,ChatGPT指導機器人以 zero-shot(零樣本學習)完成了常識性知識推理問答、無人機操控、視覺導航等任務,并實現對話式閉環推理。仿真模擬和人工監督是安全性的重要保障。仿真模擬和人工監督是安全性的重要保障。為確保安全性,在將模型部署到現實世界之前,使用了模擬器評估模型性能。此外,微軟在機器人技術中使用 ChatGPT 并不是一個完全自動化的過程,而是作為一種增強人類能力的工具,即在實際執行代碼前,會在人工監督下確保代碼質量和安全性。ChatGPT 在人類作者提示下完成了在人類作者提示下完成了該該論文創作。論文創作。微軟指出,ChatGP
11、T for Robotics 論文主要是在 ChatGPT 的幫助下完成的,其中人類作者提供必要的 prompt,并修改了和調整了ChatGPT 的輸出結果,顯著地加快了寫作過程。人類人類 on-the-loop 指導指導 ChatGPT 操縱操縱機器人機器人 ChatGPT 將人類從機器人流程中的將人類從機器人流程中的 in-the-loop 變為變為 on-the-loop。目前,機器人 pipeline(流程)需要一個專門的工程師 in-the-loop 編寫代碼來改進流程。而 ChatGPT 的引入,可以替代人類在循環中的位置,人類(技術或非技術均可)用戶可以以 on-the-loop
12、 的形式,通過高級語言命令與語言模型交互,實現無縫部署各種平臺和任務。圖表圖表1:ChatGPT 將人類從機器人將人類從機器人 pipeline 中的中的 in-the-loop 變為變為 on-the-loop 資料來源:ChatGPT for Robotics:Design Principles and Model Abilities,微軟(2023),華泰研究 人類用戶在人類用戶在機器人機器人 pipeline 中評估中評估 ChatGPT 輸出的質量和安全性輸出的質量和安全性。人類在機器人 pipeline中的任務主要包括:1)定義高級機器人函數庫定義高級機器人函數庫。高級機器人函數庫
13、(high-level robot function library)一方面面向機器人平臺,能夠調用和指導機器人相關動作;另一方面面向 ChatGPT,保證庫中函數的命名應能便于 ChatGPT 理解和遵循。2)構建)構建 prompt。Pompt 描述任務目標,并標識允許 ChatGPT 使用的高級函數庫中的函數。此外,還可以包括約束信息,或者告知 ChatGPT 如何組織其響應。3)分析評估)分析評估 ChatGPT 輸出結果并反饋。輸出結果并反饋。用戶以on-the-loop 的形式,通過直接分析或模擬來評估 ChatGPT 輸出的代碼,并就輸出代碼的質量和安全性向 ChatGPT 提供
14、反饋。4)迭代。)迭代。不斷迭代 chatgpt 生成的結果直到符合人類預期,并確保最終的代碼可以部署到機器人上執行。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。4 計算機計算機 圖表圖表2:人類用戶在機器人人類用戶在機器人 pipeline 中評估中評估 ChatGPT 輸出的質量和安全性輸出的質量和安全性 資料來源:ChatGPT for Robotics:Design Principles and Model Abilities,微軟(2023),華泰研究 定義高級函數庫與定義高級函數庫與構建提示構建提示是關鍵是關鍵 定義高級函數庫賦予定義高級函數庫賦予 ChatGPT
15、操縱機器人的能力。操縱機器人的能力。機器人技術是一個多樣化的領域,存在多種平臺、場景和工具,以及各種各樣現成的庫和 API。因此,不需要 LLM 輸出特定于平臺或庫的代碼,只需要定義高級函數庫,將現有的機器人控制相關的庫進行封裝,這樣通過 prompt 調用高級函數即可實現 ChatGPT 對機器人的操作。此外,基于 ChatGPT 的理解和推理能力,還可以實現基于現有 API 開發新的 API 功能。良好的良好的 prompt 策略是策略是 ChatGPT 輸出更好結果的關鍵。輸出更好結果的關鍵。除了提示 ChatGPT 可調用的 API外,良好的上下文 prompt 應包括:1)約束和需求
16、)約束和需求:指定與任務相關的約束或需求。例如指定任務涉及移動對象的重量、大小和形狀。2)環境環境:描述機器人任務所在的環境。例如描述需要避免的障礙物或危險。3 3)當前狀態)當前狀態:描述機器人系統的當前狀態。例如描述機器人和物體的當前位置和方向。4 4)目標和目的)目標和目的:描述任務的目標和目的。例如指出機器人移動方塊的個數和預期的完成時間。5 5)解決方案示例)解決方案示例:演示如何解決類似的任務,作為指導LLM 解決方案策略的一種手段。例如對于涉及用戶交互的任務,可以提供示例,說明機器人應該如何以及何時要求用戶輸入。圖表圖表3:良好的良好的 prompt 示例示例 資料來源:Chat
17、GPT for Robotics:Design Principles and Model Abilities,微軟(2023),華泰研究 指明操作對象:一個家務機器人指明操作對象:一個家務機器人指明任務目標:機器人要做煎蛋卷指明任務目標:機器人要做煎蛋卷指明可操作性物指明可操作性物體:冰箱、碗、體:冰箱、碗、煎鍋等煎鍋等指明指明可調用可調用API向向ChatGPT下下達任務,并要求達任務,并要求ChatGPT根據根據已有的已有的API創建創建更高級的更高級的APIChatGPT執行執行任務,并且根據任務,并且根據已有的已有的API完成完成了對更高級了對更高級API的創建的創建 免責聲明和披露以
18、及分析師聲明是報告的一部分,請務必一起閱讀。5 計算機計算機 圖表圖表4:在在 prompt 中為中為 ChatGPT 提供解決方案示例提供解決方案示例 資料來源:ChatGPT for Robotics:Design Principles and Model Abilities,微軟(2023),華泰研究 用戶能夠以聊天交互的形式讓用戶能夠以聊天交互的形式讓 ChatGPT 自行修改生成結果。自行修改生成結果。即使是設計良好的 prompt 也可能會存在不完備的情況,或者在某些情況下 ChatGPT 不能以 zero-shot 的方式生成正確的響應。此時,用戶可以聊天方式向 ChatGPT
19、發送附加指令,并讓其自行糾正。圖表圖表5:用戶以聊天交互的形式讓用戶以聊天交互的形式讓 ChatGPT 自行糾正自行糾正 資料來源:ChatGPT for Robotics:Design Principles and Model Abilities,微軟(2023),華泰研究 微軟提供開源微軟提供開源 prompt 和仿真平臺和仿真平臺 微軟提供微軟提供 PromptCraft 和和 AirSim 幫助加速模型在機器人應用中的迭代。幫助加速模型在機器人應用中的迭代。PromptCraft 是微軟提供的基于 Github 的合作開源平臺,允許研究人員分享不同機器人任務中的提示工程(prompt
20、engineering)策略。用戶可以上傳示例,對其他人的提交進行評分。此外,PromptCraft 還提供了一個帶有 ChatGPT 封裝的 AirSim 環境,供研究人員在受控的模擬環境中對提示和算法進行原型設計。在在prompt中為中為ChatGPT提供提供解決方案示例解決方案示例告訴告訴ChatGPT必須在每必須在每一步后調整到面向目標一步后調整到面向目標ChatGPT自行更正自行更正ChatGPT自行更正自行更正告訴告訴ChatGPT未使用當前的未使用當前的偏航角偏航角 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。6 計算機計算機 圖表圖表6:微軟提供的開源微軟提供的
21、開源 PromptCraft 和和 AirSim 平臺平臺 資料來源:ChatGPT for Robotics:Design Principles and Model Abilities,微軟(2023),華泰研究 簡單任務:簡單任務:zero-shot 可以直接可以直接解決解決 ChatGPT 能夠以能夠以 zero-shot 的方式解決的方式解決簡單的簡單的機器人任務機器人任務。對于簡單的機器人任務,用戶只需提供 prompt 和函數庫描述,不需要提供具體的代碼示例,ChatGPT 即可 zero-shot解決時空推理、控制真實無人機和無人機工業檢測等問題。1)時空推理:)時空推理:要求
22、ChatGPT控制一個平面機器人,用視覺伺服捕捉籃球位置。2)真實世界無人機飛行真實世界無人機飛行:使用 ChatGPT和 API 控制一個真實的無人機,完成物體尋找任務。3)AirSim 工業檢測:工業檢測:基于 AirSim 模擬器,利用 ChatGPT 控制模擬域無人機進行工業巡檢。圖表圖表7:zero-shot 實現實現控制真實無人機和無人機工業檢測控制真實無人機和無人機工業檢測 資料來源:ChatGPT for Robotics:Design Principles and Model Abilities,微軟(2023),華泰研究 操縱真實的無人機實現物體尋找操縱真實的無人機實現物體
23、尋找操縱虛擬的無人機實現工業巡檢操縱虛擬的無人機實現工業巡檢 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。7 計算機計算機 復雜任務:復雜任務:用戶用戶 on-the-loop 交互式對話交互式對話實現實現 在人類用戶在人類用戶 on-the-loop 交互下,交互下,ChatGPT 能夠完成更復雜的機器人控制任務。能夠完成更復雜的機器人控制任務。對于更復雜的問題,ChatGPT 沒法 zero-shot 完成或者完成效果有限,此時人類用戶可以以文本反饋交互的方式輔助 ChatGPT,完成課程學習、AirSim 避障等任務。1)課程學習:課程學習:教授ChatGPT 簡單的拾取
24、和放置物體技能,并將所學會的技能按邏輯組合用于更復雜的區塊排列任務。2)AirSim 避障:避障:ChatGPT 構建了避障算法的大部分關鍵模塊,但仍需要人工反饋無人機朝向等部分信息。人工反饋均是高級的自然語言,但 ChatGPT 能夠理解并在適當的位置進行代碼修正。圖表圖表8:教授教授 ChatGPT 簡單的拾取和放置物體技能簡單的拾取和放置物體技能 資料來源:ChatGPT for Robotics:Design Principles and Model Abilities,微軟(2023),華泰研究 感知感知-動作循環動作循環:代碼層次與對話層次代碼層次與對話層次 ChatGPT 的對話
25、系統的對話系統能夠解析觀察流并輸出相關操作能夠解析觀察流并輸出相關操作。在具身代理任務中,一方面,模型能夠使用 API 庫在其“代碼”輸出中構建感知-動作循環,利用圖像采集和物體檢測等感知功能,生成機器人導航和控制所需的相關信息。另一方面,用戶通過文本對話不斷將人類的感知信息輸入到 ChatGPT,ChatGPT 能夠解析觀察流并在“對話系統”中輸出相關操作,而不依賴代碼生成。1)具身代理:具身代理:帶帶 API 庫的閉環對象導航庫的閉環對象導航:為 ChatGPT 提供了對計算機視覺模型的訪問,作為其函數庫的一部分。ChatGPT 在其“代碼”輸出中構建感知-動作循環,實現估計相對物體角度、
26、探索未知環境,并導航到用戶指定對象的功能。教授教授ChatGPT如如何移動物體:首何移動物體:首先移動到目標位先移動到目標位置上方,然后慢置上方,然后慢慢放下,最后松慢放下,最后松開物體開物體ChatGPT用學到的用學到的知識“組合”出更知識“組合”出更復雜的能力復雜的能力 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。8 計算機計算機 圖表圖表9:具身代理:帶具身代理:帶 API 庫的閉環對象導航庫的閉環對象導航 資料來源:ChatGPT for Robotics:Design Principles and Model Abilities,微軟(2023),華泰研究 2)具身代
27、理:使用具身代理:使用 ChatGPT 的對話進行閉環視覺語言導航的對話進行閉環視覺語言導航 在模擬場景下,人類用戶將新的狀態觀測值(可見對象的相對極坐標)作為對話文本輸入,ChatGPT 的輸出僅返回向前的運動距離和轉彎角度,實現了用“對話系統”指導機器人一步步導航到感興趣區域。圖表圖表10:使用使用 ChatGPT 的對話進行閉環視覺語言導航的對話進行閉環視覺語言導航 資料來源:ChatGPT for Robotics:Design Principles and Model Abilities,微軟(2023),華泰研究 用代碼的方式實現感知用代碼的方式實現感知-動作循環動作循環用用對話對
28、話的的方式實現感知方式實現感知-動作循環動作循環 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。9 計算機計算機 以機器人為突破口,以機器人為突破口,LLM 定義智能終端新入口定義智能終端新入口 ChatGPT 等等 LLM 將將成為定義智能終端的新入口成為定義智能終端的新入口。ChatGPT 結合了自然語言理解、代碼生成等優點,并具有對話方面的自然性和靈活性。目前,ChatGPT 已在個人電腦(PC)和移動端入口上實現了較為全面的布局,包括辦公軟件(微軟 365 Copilt)、協同軟件(微軟Teams)、移動端搜索引擎(微軟 Bing)、創意軟件(Adobe Firefly)
29、。微軟的研究已經證明,ChatGPT 能夠借助機器人這一入口擴展應用場景。未來,ChatGPT 等 LLM 或將依托更多的現實載體,定義智能終端新入口,擴展其設備入口屬性。入口入口#1:人形、人形、協作協作等等各類各類機器人機器人 谷歌谷歌的的 PaLM-E 具身多模態模型具身多模態模型同樣同樣實現了對機器人的控制。實現了對機器人的控制。谷歌于 2023 年 3 月基于其已有的大語言模型 PaLM,提出了能夠實現具身化和多模態的新模型 PaLM-E,并實現了對機器人的控制(參考華泰研報:GPT 系列:具身化多模態 PaLM-E,2023 年 3 月 14 日)。在機器人的控制流程中,PaLM-
30、E 模型基于人類用戶的目標意圖,生成機器人控制指令,并且能夠接受機器人的反饋信息以對下一步控制指令進行調整和重規劃。與微軟的 ChatGPT for robotics 相比,PaLM-E 更注重模型本身的對多模態輸入的理解以及推理輸出能力,而微軟的成果更注重人類在機器人流程中的 on-the-loop 支持。圖表圖表11:PaLM-E 參與到機器人的控制循環中參與到機器人的控制循環中 資料來源:PaLM-E:An Embodied Multimodal Language Model,Danny Driess 等(2023)、華泰研究 OpenAI 在機器人領域早有布局。在機器人領域早有布局。2
31、017 年 5 月,OpenAI 推出了用于機器人模擬的開源軟件 Roboschool。同月,OpenAI 在機器人中部署了新的單樣本模仿學習(one-shot imitation learning)算法,通過人類在 VR 中向機器人演示如何執行任務,機器人即可從任意起始配置解決相同的任務。2018 年 2 月,OpenAI 發布了 8 個模擬機器人環境和 Hindsight Experience Replay(事后經驗回放,HER)基線實施,并用來訓練在物理機器人上工作的模型。2023 年 3 月 23 日,挪威的機器人制造商 1X technologies 宣布完成 2350 萬美元的A2
32、 輪融資,領投方是 OpenAI 旗下的啟動基金。1X technologies 將利用融資加快其即將推出的雙足機器人模型 NEO 的研究進展,并在挪威和北美規?;a首款商用機器人 EVE。原理圖原理圖實物示意圖實物示意圖 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。10 計算機計算機 圖表圖表12:OpenAI 在機器人上的布局情況在機器人上的布局情況 資料來源:OpenAI 官網、1X technologies 官網、華泰研究 節卡機器人實現了節卡機器人實現了 ChatGPT 與產品的結合和應用演示。與產品的結合和應用演示。節卡機器人是新一代協作型機器人提供商,其工程師將
33、 ChatGPT 與節卡機器人本體、編程、二次開發,以及公司客服支持等板塊結合,實現了部分實用性的應用演示。原理上看,采用語音識別技術將用戶的自然語言實時轉換成文本,節卡機器人對轉換的文本內容進行理解,進而完成語音指令到運動控制的轉換,智能化的實現了目標任務,并且對人類的對抗性干擾具有良好的魯棒性。圖表圖表13:節卡機器人節卡機器人與與 ChatGPT 結合結合實現損壞元器件挑選實現損壞元器件挑選 資料來源:節卡機器人官網、華泰研究 開源軟件開源軟件Roboschool2017年5月,OpenAI推出了用于機器人模擬的開源軟件Roboschool2017年5月,OpenAI在機器人中部署了新的
34、單樣本模仿學習算法單樣本模仿學習算法單樣本模仿學習算法發布模擬環境與發布模擬環境與HER領投領投1X technologies2018年2月,OpenAI發布了8個模擬機器人環境和Hindsight Experience Replay(HER)基線實施2023年3月,OpenAI旗下的啟動基金領投挪威的機器人制造商1X technologies語音告知機器人手臂,對損壞零件進行揀選機器人手臂執行任務,將損壞元器件挑選出來人類對機器人實行對抗性干擾機器人在人類提示下識別出人類干擾,并重新進行任務處理1234 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。11 計算機計算機 入口入口
35、#2:以智能音箱為代表的以智能音箱為代表的智能家居智能家居 智能音箱是重要的家居控制入口智能音箱是重要的家居控制入口,ChatGPT 的理解推理能力將對其賦能的理解推理能力將對其賦能。智能家居通過物聯網技術連接家中的各種設備(如音視頻設備、照明系統、窗簾控制、空調控制、安防系統、數字影院系統、影音服務器、影柜系統、網絡家電等)。其中,智能音箱是重要的家居控制入口。目前的智能音箱等語音產品往往只能實現簡單一問一答功能,或者重復咨詢、確認、溝通的循環中,交互方式過于“理性”和僵化。而 ChatGPT 具有很好的語義理解和推理能力,能夠對用戶下達的長指令進行邏輯分析和規劃執行,并且支持向用戶提供更多
36、建議。因此,ChatGPT 與智能音箱結合后,將賦予其更多“智能”。Josh.ai 公司公司致力于開發致力于開發基于基于 ChatGPT 的的語音集成語音集成。Josh.ai 是國外的智能家居提供商,開發了語音控制家庭自動化系統 Josh 和 Josh Core/Micro/Nano 等智能家居產品。目前,Josh.ai 提供了與 ChatGPT 結合的使用示例,例如控制音樂播放、控制燈具啟閉、回答用戶問題等,交互過程更加智能和自然。Josh.ai 指出潛在用例還包括:1)根據住家的位置和家庭特質提供個性化的回答;2)提供購物、戶外活動、藝術等用戶感興趣的各種服務;3)幫助用戶學習和理解新知識
37、;4)為用戶制定各種活動列表,并支持添加費用、環境等約束條件;5)幫助用戶實現對智能家居的控制。Josh.ai 正在正在與與亞馬遜合作,進一步開發亞馬遜合作,進一步開發家庭智能系統家庭智能系統潛能。潛能。據亞馬遜 CES 2023 大會信息,亞馬遜正在與 Josh.ai 合作,開發 Josh.ai 家庭智能系統的多助手集成潛力。當 Josh.ai 助手控制智能家居或連接設備時,用戶將能夠同時使用 Alexa(亞馬遜公司推出的智能助理)處理各種語音請求,例如查看最新的體育賽事比分和管理購物清單。圖表圖表14:Josh.ai 與與 ChatGPT 結合實現控制與問答功能結合實現控制與問答功能 資料
38、來源:Josh.ai 官網、華泰研究 阿里大模型聯合項目團隊阿里大模型聯合項目團隊在天貓精靈智能音箱上部署了個在天貓精靈智能音箱上部署了個性化消費級終端模型。性化消費級終端模型。阿里團隊以通義大模型為基礎,量身脫口秀演員打造了個性化數字分身“終端模型”,并部署在天貓精靈智能音箱上,實現了:1)不間斷自由語音對話;2)個性化音色、語氣、表達方式的模擬;3)向用戶提供百科、創作靈感等信息和知識。以對話的方式提問以對話的方式提問回答藝術相關的問題回答藝術相關的問題控制智能家居燈開啟控制智能家居燈開啟控制智能家居燈關閉控制智能家居燈關閉 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。12
39、 計算機計算機 個性化個性化應用應用是是大模型研究的重要方向大模型研究的重要方向。智能家居具有“千人千面”的特性,個性化大模型能夠更好的實現對智能家居的“智能”加持。阿里指出個性化大模型在對話場景訓練中關注的重點包括:1)人設、對話風格、邏輯的一致性;2)對話三觀的正確性;3)有偏好的個性化對話實現。通過大規模語言訓練、知識和工具增強、個性化對話增強和人類反饋增強等四個步驟,個性化大模型被賦予了相應的共情能力,能夠更和諧的融入家庭環境。圖表圖表15:阿里阿里個性化大模型個性化大模型訓練訓練步驟步驟 資料來源:阿里官網、華泰研究 通義大模型、通義大模型、TTS 與與 ASR 技術技術實現實現個性
40、化大模型的個性化大模型的知識、情感、記憶和性格四位一體知識、情感、記憶和性格四位一體。阿里團隊以通義大模型系列為模型基礎,融合了 ASR 貓耳算法、自研的聲學模型 KAN-TTS定制方案,實現了個性化模型在知識、情感、記憶和性格上的和諧統一。1)ASR 貓耳算貓耳算法:法:結合深度學習方法與傳統 AEC、多通道立體聲消除回聲,并借助設備中的麥克風陣列實現定向拾音,準確識別說話人位置,將用戶語音精確轉換成文本,同時利用降噪消除非人聲或非主要說話人聲。2)KAN-TTS 定制方案定制方案:基于達摩院自研聲學模型,只需收集 1個小時的個性化錄音,即可在一周內完成錄音、訓練、模型上線全流程,且呈現出的
41、擬人化聲音更自然的接近真實人聲。圖表圖表16:阿里個性化大模型工作流程阿里個性化大模型工作流程 資料來源:阿里官網、華泰研究 01大規模語言訓練基于大模型,對公開信息進行融會學習02知識和工具增強能夠在恰當時機使用搜索、熱點等工具03個性化對話增強通過多輪對話數據和人格標簽泛化,形成角色04人類反饋增強即將開放 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。13 計算機計算機 圖表圖表17:阿里阿里 KAN-TTS 人聲定制方案技術示意圖人聲定制方案技術示意圖 資料來源:阿里官網、華泰研究 國內多家智能家居公司已宣布接入百度文心一言。國內多家智能家居公司已宣布接入百度文心一言。目
42、前,三大家電巨頭美的、海信影像、長虹已經官宣成為百度旗下類 ChatGPT 應用“文心一言”的首批生態合作伙伴,百度自身智能音箱小度也將應用文心一言技術。此外,據各公司年報或招股書,螢石網絡、漫步者、國光電器等均在智能家居和人工智能上進行了布局:1)螢石網絡螢石網絡:公司積累了豐富的視音頻 AI 算法技術,能夠提供算法生成、算法調度等 AI服務,產品方面,智能中控屏 SP4 支持 AI 語音控制,螢石 AI 掃拖一體機 RS2 支持拖把布自動裝卸、干濕分離掃地毯等。2)漫步者)漫步者:針對智能家居日益普及的趨勢,2022 年公司在國內外更新多款智能音箱,并協同互聯網平臺推出搭載 AI 語音助手
43、的 TWS 耳機;推出了全新形態、具備“AI 聽損智能補償”技術的助聽設備。3)國光電器:國光電器:2023 年 2 月 10 日,國光電器在投資者互動平臺上指出,公司是人工智能語音交互硬件的供應商,與百度在多個項目上開展深度合作,其中以智能音響為代表的 AI+IoT產品是公司重點合作方向之一。入口入口#3:車載虛擬個人車載虛擬個人 AI 助手助手 ChatGPT 等等 LLM 在車載場景下在車載場景下能力優勢相較傳統能力優勢相較傳統 AI 助手更明顯。助手更明顯。語音交互是車內簡潔、人性化、安全的交互方式,也是未來主要的車內交互方式,而 ChatGPT 等大模型能夠通過上下文理解能力、思維鏈
44、推理、增強指令等實現持續學習,提供更靈活、更人性化、更精準的車機交互,相比傳統的 AI 助手更能快速適應復雜的車載交互環境。通用汽車正開發基于通用汽車正開發基于 ChatGPT 的虛擬個人的虛擬個人 AI 助手。助手。據 2023 年 3 月的 Semafor 數據,通用汽車公司正在開發一款虛擬個人 AI 助手,該助理使用 ChatGPT 人工智能模型和微軟的Azure 云服務。通用汽車副總裁 Scott Miller 指出,AI 助手可能會超越簡單語音命令,更智能的幫助用戶處理汽車相關問題,例如,輪胎損壞時用戶可以要求汽車解釋如何更換輪胎,或在車內的顯示屏上播放教學視頻;儀表盤上出現診斷燈,
45、司機可以詢問 AI 助理如何處理,或者推薦維修店并進行預約。在此基礎上,通用汽車將在 ChatGPT 模型中添加與汽車相關的層(layer),以便更好的處理與汽車相關的問題。國內國內多個車企宣布接入百度文心一言。多個車企宣布接入百度文心一言。除百度自家的 Apollo 自動駕駛平臺外,集度汽車宣布旗下產品全面融合百度文心一言能力,支持汽車機器人實現自然交流的再進階。毫末智行也宣布將其自動駕駛認知大模型正式升級為采用 RLHF(人類反饋強化學習)技術的“人駕自監督認知大模型”DriveGPT,通過引入真實人駕接管數據,對自動駕駛認知決策模型進行持續優化,并計劃于 2023 年 4 月第八屆 HA
46、OMO AI DAY 上公布進展。此外,長城、吉利、紅旗、零跑、東風日產啟辰、嵐圖、愛馳等多家汽車品牌也已官宣接入“文心一言”。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。14 計算機計算機 圖表圖表18:毫末智行的人駕自監督認知大模型將困難場景的通過率提升毫末智行的人駕自監督認知大模型將困難場景的通過率提升 30%+資料來源:毫末智行官網、華泰研究 相關標的相關標的 大模型的大模型的“新入口”“新入口”屬性已經從主流的屬性已經從主流的 PC 和手機端,向和手機端,向更廣泛的智能設備擴散。更廣泛的智能設備擴散。我們認為,主要的智能設備包括智能終端和智能音箱,相關標的包括:1)智
47、能終端:智能終端:科大訊飛,螢石網絡,中科創達等;2)智能音箱:智能音箱:國光電器,漫步者,惠威科技等。3)機器人:)機器人:石頭科技,柏楚電子;4)銀行超級柜臺:)銀行超級柜臺:新北洋。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。15 計算機計算機 圖表圖表19:提及公司列表提及公司列表 公司代碼公司代碼 公司簡稱公司簡稱 MSFT US 微軟 未上市 OpenAI GOOG US 谷歌 BIDU HK 百度 未上市 Josh.ai BABA US 阿里巴巴 002230 CH 科大訊飛 688475 CH 螢石網絡 300496 CH 中科創達 002045 CH 國光電器
48、 002351 CH 漫步者 002888 CH 惠威科技 未上市 毫末智行 688188 CH 柏楚電子 資料來源:Bloomberg、華泰研究 風險提示風險提示 宏觀經濟波動。宏觀經濟波動。若宏觀經濟波動,產業變革及新技術的落地節奏或將受到影響,宏觀經濟波動還可能對 AI 投入產生負面影響,從而導致整體行業增長不及預期。技術進步技術進步不及預期。不及預期。若 AI 技術和大模型技術進步不及預期,或將對相關的行業落地情況產生不利影響。本報告內容均基于客觀信息整理,不構成投資建議。本報告內容均基于客觀信息整理,不構成投資建議。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。16 計
49、算機計算機 免責免責聲明聲明 分析師聲明分析師聲明 本人,謝春生,茲證明本報告所表達的觀點準確地反映了分析師對標的證券或發行人的個人意見;彼以往、現在或未來并無就其研究報告所提供的具體建議或所表迖的意見直接或間接收取任何報酬。一般聲明及披露一般聲明及披露 本報告由華泰證券股份有限公司(已具備中國證監會批準的證券投資咨詢業務資格,以下簡稱“本公司”)制作。本報告所載資料是僅供接收人的嚴格保密資料。本報告僅供本公司及其客戶和其關聯機構使用。本公司不因接收人收到本報告而視其為客戶。本報告基于本公司認為可靠的、已公開的信息編制,但本公司及其關聯機構(以下統稱為“華泰”)對該等信息的準確性及完整性不作任
50、何保證。本報告所載的意見、評估及預測僅反映報告發布當日的觀點和判斷。在不同時期,華泰可能會發出與本報告所載意見、評估及預測不一致的研究報告。同時,本報告所指的證券或投資標的的價格、價值及投資收入可能會波動。以往表現并不能指引未來,未來回報并不能得到保證,并存在損失本金的可能。華泰不保證本報告所含信息保持在最新狀態。華泰對本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本公司不是 FINRA 的注冊會員,其研究分析師亦沒有注冊為 FINRA 的研究分析師/不具有 FINRA 分析師的注冊資格。華泰力求報告內容客觀、公正,但本報告所載的觀點、結論和建議僅供參考,不
51、構成購買或出售所述證券的要約或招攬。該等觀點、建議并未考慮到個別投資者的具體投資目的、財務狀況以及特定需求,在任何時候均不構成對客戶私人投資建議。投資者應當充分考慮自身特定狀況,并完整理解和使用本報告內容,不應視本報告為做出投資決策的唯一因素。對依據或者使用本報告所造成的一切后果,華泰及作者均不承擔任何法律責任。任何形式的分享證券投資收益或者分擔證券投資損失的書面或口頭承諾均為無效。除非另行說明,本報告中所引用的關于業績的數據代表過往表現,過往的業績表現不應作為日后回報的預示。華泰不承諾也不保證任何預示的回報會得以實現,分析中所做的預測可能是基于相應的假設,任何假設的變化可能會顯著影響所預測的
52、回報。華泰及作者在自身所知情的范圍內,與本報告所指的證券或投資標的不存在法律禁止的利害關系。在法律許可的情況下,華泰可能會持有報告中提到的公司所發行的證券頭寸并進行交易,為該公司提供投資銀行、財務顧問或者金融產品等相關服務或向該公司招攬業務。華泰的銷售人員、交易人員或其他專業人士可能會依據不同假設和標準、采用不同的分析方法而口頭或書面發表與本報告意見及建議不一致的市場評論和/或交易觀點。華泰沒有將此意見及建議向報告所有接收者進行更新的義務。華泰的資產管理部門、自營部門以及其他投資業務部門可能獨立做出與本報告中的意見或建議不一致的投資決策。投資者應當考慮到華泰及/或其相關人員可能存在影響本報告觀
53、點客觀性的潛在利益沖突。投資者請勿將本報告視為投資或其他決定的唯一信賴依據。有關該方面的具體披露請參照本報告尾部。本報告并非意圖發送、發布給在當地法律或監管規則下不允許向其發送、發布的機構或人員,也并非意圖發送、發布給因可得到、使用本報告的行為而使華泰違反或受制于當地法律或監管規則的機構或人員。本報告版權僅為本公司所有。未經本公司書面許可,任何機構或個人不得以翻版、復制、發表、引用或再次分發他人(無論整份或部分)等任何形式侵犯本公司版權。如征得本公司同意進行引用、刊發的,需在允許的范圍內使用,并需在使用前獲取獨立的法律意見,以確定該引用、刊發符合當地適用法規的要求,同時注明出處為“華泰證券研究
54、所”,且不得對本報告進行任何有悖原意的引用、刪節和修改。本公司保留追究相關責任的權利。所有本報告中使用的商標、服務標記及標記均為本公司的商標、服務標記及標記。中國香港中國香港 本報告由華泰證券股份有限公司制作,在香港由華泰金融控股(香港)有限公司向符合證券及期貨條例及其附屬法律規定的機構投資者和專業投資者的客戶進行分發。華泰金融控股(香港)有限公司受香港證券及期貨事務監察委員會監管,是華泰國際金融控股有限公司的全資子公司,后者為華泰證券股份有限公司的全資子公司。在香港獲得本報告的人員若有任何有關本報告的問題,請與華泰金融控股(香港)有限公司聯系。免責聲明和披露以及分析師聲明是報告的一部分,請務
55、必一起閱讀。17 計算機計算機 香港香港-重要監管披露重要監管披露 華泰金融控股(香港)有限公司的雇員或其關聯人士沒有擔任本報告中提及的公司或發行人的高級人員。中科創達(300496 CH)、柏楚電子(688188 CH):華泰金融控股(香港)有限公司、其子公司和/或其關聯公司實益持有標的公司的市場資本值的 1%或以上。有關重要的披露信息,請參華泰金融控股(香港)有限公司的網頁 https:/.hk/stock_disclosure 其他信息請參見下方“美國“美國-重要監管披露”重要監管披露”。美國美國 在美國本報告由華泰證券(美國)有限公司向符合美國監管規定的機構投資者進行發表與分發。華泰證
56、券(美國)有限公司是美國注冊經紀商和美國金融業監管局(FINRA)的注冊會員。對于其在美國分發的研究報告,華泰證券(美國)有限公司根據1934 年證券交易法(修訂版)第 15a-6 條規定以及美國證券交易委員會人員解釋,對本研究報告內容負責。華泰證券(美國)有限公司聯營公司的分析師不具有美國金融監管(FINRA)分析師的注冊資格,可能不屬于華泰證券(美國)有限公司的關聯人員,因此可能不受 FINRA 關于分析師與標的公司溝通、公開露面和所持交易證券的限制。華泰證券(美國)有限公司是華泰國際金融控股有限公司的全資子公司,后者為華泰證券股份有限公司的全資子公司。任何直接從華泰證券(美國)有限公司收
57、到此報告并希望就本報告所述任何證券進行交易的人士,應通過華泰證券(美國)有限公司進行交易。美國美國-重要監管披露重要監管披露 分析師謝春生本人及相關人士并不擔任本報告所提及的標的證券或發行人的高級人員、董事或顧問。分析師及相關人士與本報告所提及的標的證券或發行人并無任何相關財務利益。本披露中所提及的“相關人士”包括 FINRA 定義下分析師的家庭成員。分析師根據華泰證券的整體收入和盈利能力獲得薪酬,包括源自公司投資銀行業務的收入??拼笥嶏w(002230 CH)、中科創達(300496 CH):華泰證券股份有限公司、其子公司和/或其聯營公司在本報告發布日之前的 12 個月內擔任了標的證券公開發行
58、或 144A 條款發行的經辦人或聯席經辦人。中科創達(300496 CH):華泰證券股份有限公司、其子公司和/或其聯營公司在本報告發布日之前 12 個月內曾向標的公司提供投資銀行服務并收取報酬。中科創達(300496 CH)、柏楚電子(688188 CH):華泰證券股份有限公司、其子公司和/或其聯營公司實益持有標的公司某一類普通股證券的比例達 1%或以上。華泰證券股份有限公司、其子公司和/或其聯營公司,及/或不時會以自身或代理形式向客戶出售及購買華泰證券研究所覆蓋公司的證券/衍生工具,包括股票及債券(包括衍生品)華泰證券研究所覆蓋公司的證券/衍生工具,包括股票及債券(包括衍生品)。華泰證券股份
59、有限公司、其子公司和/或其聯營公司,及/或其高級管理層、董事和雇員可能會持有本報告中所提到的任何證券(或任何相關投資)頭寸,并可能不時進行增持或減持該證券(或投資)。因此,投資者應該意識到可能存在利益沖突。評級說明評級說明 投資評級基于分析師對報告發布日后 6 至 12 個月內行業或公司回報潛力(含此期間的股息回報)相對基準表現的預期(A 股市場基準為滬深 300 指數,香港市場基準為恒生指數,美國市場基準為標普 500 指數),具體如下:行業評級行業評級 增持:增持:預計行業股票指數超越基準 中性:中性:預計行業股票指數基本與基準持平 減持:減持:預計行業股票指數明顯弱于基準 公司評級公司評
60、級 買入:買入:預計股價超越基準 15%以上 增持:增持:預計股價超越基準 5%15%持有:持有:預計股價相對基準波動在-15%5%之間 賣出:賣出:預計股價弱于基準 15%以上 暫停評級:暫停評級:已暫停評級、目標價及預測,以遵守適用法規及/或公司政策 無評級:無評級:股票不在常規研究覆蓋范圍內。投資者不應期待華泰提供該等證券及/或公司相關的持續或補充信息 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。18 計算機計算機 法律實體法律實體披露披露 中國中國:華泰證券股份有限公司具有中國證監會核準的“證券投資咨詢”業務資格,經營許可證編號為:91320000704041011J
61、香港香港:華泰金融控股(香港)有限公司具有香港證監會核準的“就證券提供意見”業務資格,經營許可證編號為:AOK809 美國美國:華泰證券(美國)有限公司為美國金融業監管局(FINRA)成員,具有在美國開展經紀交易商業務的資格,經營業務許可編號為:CRD#:298809/SEC#:8-70231 華泰證券股份有限公司華泰證券股份有限公司 南京南京 北京北京 南京市建鄴區江東中路228號華泰證券廣場1號樓/郵政編碼:210019 北京市西城區太平橋大街豐盛胡同28號太平洋保險大廈A座18層/郵政編碼:100032 電話:86 25 83389999/傳真:86 25 83387521 電話:86
62、10 63211166/傳真:86 10 63211275 電子郵件:ht- 電子郵件:ht- 深圳深圳 上海上海 深圳市福田區益田路5999號基金大廈10樓/郵政編碼:518017 上海市浦東新區東方路18號保利廣場E棟23樓/郵政編碼:200120 電話:86 755 82493932/傳真:86 755 82492062 電話:86 21 28972098/傳真:86 21 28972068 電子郵件:ht- 電子郵件:ht- 華泰金融控股(香港)有限公司華泰金融控股(香港)有限公司 香港中環皇后大道中 99 號中環中心 58 樓 5808-12 室 電話:+852-3658-6000/傳真:+852-2169-0770 電子郵件: http:/.hk 華泰證券華泰證券(美國美國)有限公司有限公司 美國紐約公園大道 280 號 21 樓東(紐約 10017)電話:+212-763-8160/傳真:+917-725-9702 電子郵件:Huataihtsc- http:/www.htsc- 版權所有2023年華泰證券股份有限公司