36氪:人工智能行業研究報告2017年V2公開發布版終稿(38頁).pdf

編號:25145 PDF 38頁 3.08MB 下載積分:VIP專享
下載報告請您先登錄!

36氪:人工智能行業研究報告2017年V2公開發布版終稿(38頁).pdf

1、2017年6月 36氪研究院 人工智能行業研究報告 (2017年) 2 報告摘要 人工智能(Artificial Intelligence)是指使用機器代替人類實現認知、識別 、分析、決策等功能,其本質是對人的意識與思維的信息過程的模擬。 在AI發展的不同階段,驅動力各有側重,我們可以將AI的發展劃分為三個 階段:技術驅動階段、數據驅動階段和場景驅動階段。其中技術驅動階段 集中誕生了基礎理論、基本規則和基本開發工具。在此階段,算法和計算 力對AI的發展起到主要推動作用,其中計算力主要包含芯片、超級計算機 、云計算等三個維度。 在市場規模方面,綜合考慮我國人工智能的爆發節點、技術成熟度以及全 球

2、AI市場規模等因素,我們保守估計最遲至2019年我國AI的市場規模將 突破百億元,而2022年這一數字應在700億元左右。 人工智能目前仍處于發展的早期階段,整體看來技術的發展將先于應用層面 ,但技術層面仍存在瓶頸需要突破;應用場景將不斷豐富,它的擴充將會反 過來驅動支撐技術的持續發展,AI的整體市場規模將繼續擴大。 相比應用場景層面的發展,基礎應用層的技術將會是AI中較早發展的部分。 不過,從AI整體發展階段來講,我們認為AI仍處于早期,雖然語音識別、 計算機視覺等感知層的技術目前已經取得了一定成就,但語義識別等認知 層的技術仍不甚完善,即使是像計算機視覺這樣的感知層技術也存在發展 不均衡的

3、問題。 隨著AI支撐技術的不斷發展,AI將持續拓展更多的應用場景;而愈發多樣 化的應用場景需求又會反過來驅動支撐技術,從而帶動整個AI行業的持續 發展。但各應用場景的發展并非均衡,整體看來將從垂直領域AI逐漸過渡 到通用型AI。 總體來說,AI最重要的還是要將技術與應用場景相結合,無法落地的技術 很難得到資本青睞和市場認可,而有閉環、壟斷性的數據,并且其技術能 夠與實際應用場景結合的公司將有望產生難以被替代的商業價值。 36kr-人工智能行業研究報告(2017年) 2017.6 目 錄 Contents 一. 人工智能綜述 AI是使用機器代替人類實現認知、分析、決策等功能的綜合學科 計算力、算

4、法、數據量與應用場景是AI爆發的主要驅動力 國內外巨頭在AI領域紛紛布局 資本扶持下,未來AI的市場規模應在百億元以上 人工智能產業鏈圖 二. 人工智能的技術支持層 AI產業鏈綜述 AI技術支撐層:數據標注、語音識別、語義識別與計算機視覺 三. 人工智能的應用場景層 AI+安防 AI+醫療 AI+金融 AI+家居、AI+教育與其他應用場景 四. 人工智能行業總結 AI行業總結 AI未來發展&投資機會簡析 人工智能綜述 CHAPTER I AI是使用機器代替人類實現認知、分析、決策等功能的綜合學科 計算力、算法、數據量與應用場景是AI爆發的主要驅動力 國內外巨頭在AI領域紛紛布局 資本扶持下,未

5、來AI的市場規模應在百億元以上 人工智能產業鏈圖 5 36kr-人工智能行業研究報告(2017年) 2017.6 人工智能(Artificial Intelligence)是指使用機器代 替人類實現認知、識別、分析、決策等功能,其本質 是對人的意識與思維的信息過程的模擬,是一門綜合 了計算機科學、生理學、哲學的交叉學科。凡是使用 機器代替人類實現認知、識別、分析、決策等功能, 均可認為使用了人工智能技術。 作為一種基礎技術,理論上講人工智能能夠被應用在 各個基礎行業(如AI+金融、AI+醫療、AI+傳統制造 業等),同時也有其如機器人這樣具體應用行業的概 念。 本報告將以2017年上半年為時間

6、節點,對包括發展驅 動力、巨頭布局、投融資情況、預測的市場規模等在 內的人工智能行業到目前為止的整體發展情況做簡要 分析,并對包括數據標記、語音識別、語義識別、計 算機視覺等技術領域以及安防、醫療、金融等應用場 景在內的細分領域及其典型企業進行簡析,探索人工 智能領域未來發展趨勢和可能的投資/創業機會。 行業概述 AI是使用機器代替人類實現認知 、分析、決策等功能的綜合學科 1.1 行業概述 1.2 行業驅動力 1.3 巨頭布局 1.4 行業市場規模 自然語言處理 計算機視覺 語音識別 智慧家居智慧工業 關鍵硬件算法模型 路徑規劃GPUNPU 傳感器深度學習(CNN、RNN等) CPU 基礎應

7、用技術 產品 技術支撐層 基礎應用層 方案集成層 圖片來源:36氪研究院 注釋:結合了物聯網與人工智能的智 能制造行業也是AI的重要應用場景之 一,關于該領域的詳細研究討論請見 36氪研究院系列報告新制造研究報 告。 6 在AI發展的不同階段,驅動力各有側重,我們可以 將AI的發展劃分為三個階段:技術驅動階段、數據 驅動階段和場景驅動階段。 技術驅動階段集中誕生了基礎理論、基本規則和基 本開發工具。在此階段,算法和計算力對AI的發展 起到主要推動作用?,F在主流應用的基于多層網絡 神經的深度算法,一方面不斷加強從海量數據庫中 自行歸納物體特征的能力,一方面不斷加強對新事 物多層特征提取、描述和還

8、原的能力。對算法來說 ,歸納和演繹同樣重要,最終目的是提高識別效率 。最新ImageNet測試結果顯示,AI錯誤率低達 3.5%,而人類對同一數據庫識別錯誤率在5.1%1, 理想情況下,計算機圖像識別能力已超越人類。 技術驅動:算法和計算力是主要 驅動力 行業驅動力 28.20% 25.80% 16.40% 11.70% 7.30% 6.70% 3.50% 0 20 40 60 80 100 120 140 160 0% 5% 10% 15% 20% 25% 30% 2010-2016年 ImageNet 圖像識別錯誤率 2010年 NEC美國 2011年 Xerox 2012年 AlexNe

9、t 2013年 Clarifi 2014年 VGG 2015年 GoogleNet 2016年 ResNet 8層神經網絡 8層神經網絡 19層神經網絡 22層神經網絡 152層神經網絡 來源:公開資料整理 如上圖所示,每年在ImageNet測試中錯誤率最低的 算法模型都不盡相同(從NEC到ResNet),這也反 映了人們對于算法的不斷探究、更迭過程。 1根據公開資料整理 定位測試優化 技術驅動 數據驅動 預測分析精準畫像 場景驅動 決策支持場景模型 1.1 行業概述 1.2 行業驅動力 1.3 巨頭布局 1.4 行業市場規模 36kr-人工智能行業研究報告(2017年) 2017.6 7 提

10、高識別效率除依靠算法之外,也離不開計算力的 支持。計算力可以分三個維度展開:芯片、超級計 算機、云計算。 芯片:人工智能領域作為一個數據密集的領域,傳 統的數據處理技術難以滿足高強度并行數據的處理 需求。為解決此問題,繼CPU之后,相繼出現了 GPU、NPU、FPGA、DSP等“AI”芯片。1999 年 ,Nvidia公司發布了全球首款圖片處理芯片GPU; 2016年,寒武紀發布了全球首款深度學習專用處理 器芯片NPU,芯片的更迭、進步可從根本上提高計 算性能。 計算力的三駕馬車:芯片、超級 計算機、云計算 行業驅動力 Nvidia GPUGeForce 256寒武紀NPU1A 超級計算機:其

11、基本組成組件與個人電腦的概念無 太大差異,但規格與性能則強大許多,是一種超大 型電子計算機。我國自主超級計算機“神威太湖之 光”,其處理器為眾核CPU“申威26010”,整臺 “神威太湖之光”共包含40960塊處理器;打敗李 世石的AlphaGo共包含1202個CPU和176個GPU; 打敗柯潔的升級版AlphaGo使用到了TPU,但數量 只有 4 顆。(未完接下頁) 36kr-人工智能行業研究報告(2017年) 2017.6 1.1 行業概述 1.2 行業驅動力 1.3 巨頭布局 1.4 行業市場規模 8 可以發現,真正用于人工智能的超級計算機芯片還 只是處于CPU、GPU層,如何將更適用于

12、網絡神經 算法的NPU、FPGA等芯片量產化并融合入超級計 算機芯片矩陣,是在人工智能發展的第一階段技 術驅動階段應該重點努力的方向之一。 計算力的三駕馬車:芯片、超級 計算機、云計算 行業驅動力 云計算:與主要應用于密集型計算的超級計算機不 同,云計算依靠其靈活的擴展能力主要應用于社交 網絡、企業IT建設和信息化等數據密集型、I/O密集 型的領域。 我們分析認為,當AI跨越入第二階段數據驅動階 段后,算法和計算力將變成人工智能領域的基礎設 施“水、電、煤”。就目前看來,多項算法開源 平臺已將AI算法引入統一、公用階段,運算力也必 將向同樣的趨勢發展。云計算則是一個初步嘗試, 未來,計算力的發

13、展方向或將是云計算和超級計算 機技術結合,為企業提供既可密集運算又可靈活擴 展的計算服務,將人工智能賦能全行業。 眾核CPU“申威26010神威太湖之光 36kr-人工智能行業研究報告(2017年) 2017.6 1.1 行業概述 1.2 行業驅動力 1.3 巨頭布局 1.4 行業市場規模 9 人工智能發展的第二個階段,算法和計算力已基本 不存在壁壘,數據將成為主要驅動力,推動人工智 能更迭。此階段,大量結構化、可靠的數據被采集 、清洗和積累,甚至變現。例如,大量的數據基礎 上可以精確地描繪消費者畫像,制定個性化營銷方 案,提高成單率,縮短達到預設目標的時間,推動 社會運行效率提升。 到了人工

14、智能發展的第三個階段,場景驅動作為主 要驅動力,不僅可以針對不同用戶做個性化服務, 而且可在不同的場景下執行不同的決策。此階段, 對數據收集的維度和質量的要求更高,并且可實時 根據不同的場景,制定不同的決策方案,推動事件 向良好的態勢發展,幫助決策者更敏銳的洞悉事件 根本,產生更精準更智慧的決策。 數據驅動:描繪個性化畫像; 場景驅動:給予決策支持 行業驅動力 “場景驅動”不僅會驅動人 類決策,也會驅動機器的自 我進化和升級。 “場景驅動”的基礎是經過 治理的數據。 “場景驅動”的“場景“對 應的是有應用價值的場景。 用戶基本信息 LBS數據挖掘 社交網絡數據 其他 用戶畫像建模 標簽A 標簽

15、B 標簽C 來源:36氪研究院 圖示:“場景驅動”三要素 來源:互聯網 36kr-人工智能行業研究報告(2017年) 2017.6 1.1 行業概述 1.2 行業驅動力 1.3 巨頭布局 1.4 行業市場規模 10 公司人工智能領域布局 百度 2016年,百度發布了人工智能平臺級解決方案“天智”,這是繼“天算”“天像”和“天工” 之后的第四大平臺級解決方案。至此,百度云實現了人工智能、智能大數據、智能多媒體和智 能物聯網全方位的智能平臺服務。 2016年8月,投資激光雷達公司VelodyneLiDAR。 2017年以來,百度收購了xPerception、渡鴉科技,參與投資了蔚來汽車、8i等AI

16、公司。 騰訊 2016 年4 月,騰訊成立人工智能實驗室,基于計算機視覺、語音識別、自然語言處理和機器學 習四個垂直領域,圍繞內容、社交、游戲和平臺工具四大特色業務場景,騰訊AI致力于將人工 智能工具以API形式開放出去。 2016年,碳云智能完成近10億元的A輪融資,騰訊為主要投資方之一。 2017年,騰訊買入電動汽車制造商特斯拉(Tesla)5%股權,騰訊成為特斯拉的第五大股東。 阿里 巴巴 阿里云面向人工智能的布局,核心爆點就三個:ET醫療大腦、ET工業大腦和機器學習平臺PAI2.0 2017年3月,阿里宣布開始推動“NASA”計劃,著重發力機器學習、芯片、IoT、操作系統和 生物識別。

17、 Apple 2017年5月,蘋果收購了人工智能公司Lattice Data。該公司使用人工智能推理引擎去處理非結 構化的“暗數據”,將其變成結構化信息,從而發揮更大的作用。 Google 2014年1月,收購Deepmind、收購后,DeepMind仍保持獨立運營的,目標是開發能夠“獨 立思考”的軟件。 2016年9月,收購api.ai,能夠協助谷歌指導開發者持續開發優秀的自然語言界面。 2016年3月與海爾達成戰略合作,共同推動智能家居發展。 Microsoft2017年6月,Element AI完成了1.02億美元A輪融資,微軟是主要投資方之一。 2017年6月,收購了以色列初創公司He

18、xadite,以便將AI支持的安全功能整合到企業版 Windows 10中。 Facebook2015年1月,收購語音指令創業公司Wit.AI,幫助Messenger創建語音輸入模式。 36kr-人工智能行業研究報告(2017年) 2017.6 巨頭布局 國內外巨頭在AI領域的布局 1.1 行業概述 1.2 行業驅動力 1.3 巨頭布局 1.4 行業市場規模 信息來源:根據公開資料整理 人工智能的技術支持層 CHAPTER II AI產業鏈綜述 AI技術支撐層 數據標注 語音識別 語義識別 計算機視覺 12 36kr-人工智能行業研究報告(2017年) 2017.6 正如報告開頭所述,人工智能

19、是指使用機器代替人類 實現認知、識別、分析、決策等功能,是一門綜合了 計算機科學、生理學、哲學的交叉學科。完整的人工 智能產業鏈可以分為技術支撐層、基礎應用層和方案 集成層,或者說應用場景層。 技術支撐層主要由AI芯片、傳感器等硬件和算法模型 (軟件)和兩部分構成。其中傳感器與IoT的感知層相 似,包括GPU、FPGA、NPU等在內的AI芯片負責運 算,算法模型則負責訓練數據。 基礎應用層的技術則是為了讓機器完成對外部世界的 探測,主要由計算機視覺、語音識別等感知層和語義 識別等認知層構成,這些技術是機器能夠做出分析判 斷的基礎。此外,在感知與認知技術之下還有數據標 注作為其底層支撐。 方案集

20、成層是集成了某種或多種基礎應用技術的、面 向如工業、自動駕駛、家居、倉儲物流、金融、醫療 等不同應用場景的產品或方案。 本篇報告將主要圍繞AI中基礎應用層和方案集成層, 即應用場景層進行分析。 人工智能產業鏈綜述 AI產業鏈主要包括技術支撐層、 基礎應用層和方案集成層 2.1 AI產業鏈綜述 2.2 AI技術支撐層 13 產業鏈圖 人工智能產業鏈圖 2017.6 36kr-人工智能行業研究報告(2017年) 技 術 圈 計算機視覺 語義識別 語音識別 語料采集 場 景 圈 家居 金融 醫療 安防 教育 2.1 AI產業鏈綜述 2.2 AI技術支撐層 14 36kr-人工智能行業研究報告(201

21、7年) 2017.6 語音識別是將語音轉換為文本的技術,是自然語言 處理的一個分支。前臺主要步驟分為信號搜集、降 噪和特征提取三步,提取的特征在后臺由經過語音 大數據訓練得到的語音模型對其進行解碼,最終把 語音轉化為文本,實現達到讓機器識別和理解語音 的目的。根據公開資料顯示,目前語音識別的技術 成熟度較高,已達到95%的準確度。然而,需要指 出的是,從95%到99%的準確度帶來的改變才是質 的飛躍,將使人們從偶爾使用語音變到常常使用。 醫療衛寧健康 語音識別過程雖存在難點,但目 前技術已趨于成熟 語音識別技術 - 行業概述 語音識別作為一種一維時域信號,在實際操作中主 要有兩個難點。首先是數

22、據的獲取、清洗。語音識 別需要大量細分領域的標準化語料數據作為支撐, 尤其是各地方言的多樣性更是加大了語料搜集的工 作量。據媒體消息,蘋果iOS 10.3版本中Siri已支持 上海話。 第二個難點是語音特征的提取,目前主要通過具備 多層神經網絡的深度學習來解決,多層的神經網絡 相當于一個特征提取器,可對信號進行逐層深化的 特征描述,最終從部分到整體,從籠統到具象,做 到最大程度地還原信號原始特征。 語音數據庫訓練語音模型 語音信號前端識別降噪特征提取 數據挖掘 信號處理 統計建模 模 型 匹 配 識 別 結 果 圖示:語音識別技術架構 2.1 AI產業鏈綜述 2.2 AI技術支撐層 數據標注

23、語音識別 語義識別 計算機視覺 15 36kr-人工智能行業研究報告(2017年) 2017.6 醫療衛寧健康 語音識別雖市場龐大但已出現領 航者,留給創業公司的機會不多 語音識別技術 - 行業概述 據Research and Markets研究報告顯示,全球智能 語音市場將持續顯著增長,預計到2020年,全球語 音市場規模預計將達191.7億美元。根據Capvision 報告顯示,從語音行業市場份額角度來看,全球范 圍內,由Nuance領跑,國內則是科大訊飛占據主導 地位。 Nuance 31.60% 谷歌 28.40% 蘋果 15.40% 微軟 8.10% 科大訊飛 4.50% IBM 4

24、.10% 其他 8.00% 全球智能語音企業市場份額 科大訊飛 44.20% 百度 27.80% 蘋果 6.90% Nuance 3.00% 小i機器人 2.70% 捷通華聲 2.20% 海天瑞聲 2.00% 中科信利 1.60% 其他 9.60% 中國智能語音企業市場份額 來源:Capvision,36氪研究院 2.1 AI產業鏈綜述 2.2 AI技術支撐層 數據標注 語音識別 語義識別 計算機視覺 16 36kr-人工智能行業研究報告(2017年) 2017.6 科大訊飛創辦于1999年,主要從事智能語音及語言 技術、人工智能技術研究,軟件及芯片產品的開發, 而應用集成則由下游的開發商或客

25、戶自己完成。根 據公開資料顯示,科大訊飛是目前我國少數掌握核 心技術的語音領域企業之一,已于2008年5月在深 圳證券交易所掛牌上市。 醫療衛寧健康 科大訊飛專注于To B的語音識別 技術,目前已領跑中文語音市場 語音識別企業案例- 科大訊飛 科大訊飛擁有六大核心技術,分別是語音識別、語 音合、自然語言處理、語音評測、聲紋識別和手寫 識別。其中更重要的是其同時擁有語音合成和語音 識別,能夠把“聽”和“說”組合起來。此外科大 訊飛還提出訊飛超腦計劃,瞄準語音理解力市場。 圖示:科大訊飛核心技術簡介 來源:科大訊飛官網,36氪研究院 技術說明 語音識別技術讓計算機能夠“聽懂”人類的語音,將語音中包

26、含的文字信息“提取”出來。 語音合成技術讓機器將文字信息轉化為聲音信息,即讓機器像人一樣開口說話。 自然語言處理技術 基礎研究 對自然語言內在規律的研究,主要包括詞典編撰、分詞斷句、詞性分析、語言 模型、語法分析、語義分析、語用分析等。 應用研究 面向不同的應用,研發相關的自然語言處理技術,主要包括拼音輸入法、信息 檢索、信息抽取、自動摘要、機器翻譯、語音合成、語音識別、文本匹配等。 語音評測技術又稱計算機輔助語言學習,機器自動對用戶發音進行評分、檢錯并矯正。 聲紋識別技術 通過語音信號提取相關特征,進而識別出說話人身份等,廣泛應用于信息安全、 電話銀行、智能門禁以及娛樂增值等領域。 手寫識別

27、技術讓計算機能夠“認識”用戶在手寫設備上書寫的文字信息。 1來源于科大訊飛官網 硬件研發軟件研發語音方案研發集合方案后的產品制作 面向C端軟件研發C端用戶使用端用戶使用 訊飛負責開發引 擎、語音合成和 語音識別芯片 圖示:科大訊飛在語音生態鏈中所處的環節 2.1 AI產業鏈綜述 2.2 AI技術支撐層 數據標注 語音識別 語義識別 計算機視覺 17 36kr-人工智能行業研究報告(2017年) 2017.6 科大訊飛以訊飛超腦、AIUI 為內核,積極打造基于 訊飛開放平臺的AI 生態,面對不同場景,推出覆蓋 全行業的語音產品及服務,深耕智慧教育、智慧城 市、智慧汽車、智慧醫療以及智慧家居五個行

28、業, 全方位挖掘G 端、B 端及C 端客戶。 醫療衛寧健康 隨著人工智能熱度高漲,科大訊 飛等企業技術得以規模性落地 語音識別企業案例- 科大訊飛 5.6 7.8 12.5 17.8 25.0 33.2 1.3 1.8 2.8 3.8 4.3 4.8 0 10 20 30 40 201120122013201420152016 科大訊飛2011-2016年營業總收入凈利潤 圖示:科大訊飛主要客戶舉例 隨著全球范圍內人工智能熱度的高漲,語 音識別作為其中重要的技術應用層落地項 目也愈加多元化??拼笥嶏w在智慧教育、 智慧城市、智能家居、智能汽車、機器人 等領域規?;膽?,促進了其營收近幾 年內持

29、續穩定走高,尤其是在教育行業, 科大訊飛構建了智慧考試、智慧校園、智 慧課堂、智慧學習等一體化的智慧教育產 品體系,2017年智慧課堂產品有望成為其 在教育行業收入和毛利的重要增長點。 2.1 AI產業鏈綜述 2.2 AI技術支撐層 數據標注 語音識別 語義識別 計算機視覺 18 從世界范圍來看,Nuance是全球最大的獨立語音識 別公司之一。Nuance于1994年成立于美國麻省伯 靈頓,并于2000年4月在納斯達克上市。Nuance曾 為蘋果、三星提供語音支持服務,在語音識別領域 一度處于壟斷地位,后隨深度算法的普及,各巨頭 逐漸開始自主研發語音識別技術,差距逐漸縮小。 但直到今天,其發布

30、的Dragon Drive(聲龍駕 駛)互聯汽車語音和內容平臺,仍為眾多知名 車企提供著車載語音技術支持,如梅賽德斯-奔馳、 戴姆勒、寶馬、豐田、雷克薩斯、榮威等汽車品牌。 此外,還有重點布局家居領域的語音企業云知聲。 云知聲于2012年6月創辦于北京,目前融資輪次為 B+,是智能語音領域新銳玩家。據官方數據顯示, 云知聲目前已覆蓋了476個城市,覆蓋用戶超過1.8 億,代表客戶有網易易信、錘子手機、樂視超級電 視等。 智能設備 互聯家居 跨平臺信息娛樂 個性化內容 情景感知 車輛傳感器信息 用戶檔案 行為偏好 駕駛歷史 聲紋驗證 圖示:聲龍駕駛平臺 Dragon Drive 個性化 情景化

31、無縫連接 物聯網 智能化 汽車級 自然語言理解 情景化推理 大數據 持續學習 混合解決方案 (本地嵌入及云端服務) 為卓越性能而設計 無縫連接 穩健可靠 Nuance領銜全球市場,云知聲 重點布局家居領域 語音識別企業案例- Nuance云知 聲 36kr-人工智能行業研究報告(2017年) 2017.6 2.1 AI產業鏈綜述 2.2 AI技術支撐層 數據標注 語音識別 語義識別 計算機視覺 19 應用系統 基礎資源 語義識別是自然語言處理(NLP)技術的重要組成部分 。NLP在實際應用中最大的困難還是語義的復雜性 ,此外,深度學習算法也不是語義識別領域的最優 算法。但隨著整個AI行業發展進

32、程加速,將為NLP 帶來長足的進步。 語義識別是人工智能的重要分支之一,解決的是“ 聽得懂”的問題。其最大的作用是改變人機交互模 式,將人機交互由最原始的鼠標、鍵盤交互轉變為 語音對話的方式。此外,我們認為目前的語義識別 行業還未出現絕對壟斷者,新進入的創業公司仍具 備一定機會。 鼠標鍵盤交互 Page PC時代 觸摸交互 App 移動時代 語音交互 API IoT時代 人機交互的發展 智能交互對話聊天深度問答機器翻譯機器人 知識挖掘 詞典語料網頁日志知識庫 基本方法 規則方法統計與機器學習方法 基礎架構 /平臺 圖示:NLP通用架構示意圖 形態分析組塊分析語義表示對話理解句子生成 分詞/詞性

33、主干分析語義計算觀點提取摘要生成 專名識別儲存分析邏輯推理情感分析篇章生成 用戶行為 預測 用戶建模 詞法 語言分析 文 本 理 解 句法語義篇章 語音生成 解決“聽得懂”的語義識別領域 中,新進入者仍具有一定機會 語義識別技術 - 行業概述 36kr-人工智能行業研究報告(2017年) 2017.6 2.1 AI產業鏈綜述 2.2 AI技術支撐層 數據標注 語音識別 語義識別 計算機視覺 20 我們認為,基于語音識別和語義識別的智能語音交 互技術在車載場景中存在剛需,也會成為最先爆發 的領域之一。并且,隨著車聯網的縱深化發展,相 關硬件趨于免費,依靠語音交互天然流量入口,做 個性化增值服務將

34、是未來車載領域的主要盈利點。 圖示:語音交互各場景主要玩家 智能家居智能車載虛擬助理無人駕駛 機器人 智能客服 從1996年至今,國內至今仍在運營的人工智能公司接 近400家1。從下圖可看出,自然語言處理(NLP)無 論在創業熱度、獲投數量還是獲投金額都處于細分領 域的前三。據 Global Market Insights數據,預計到 2024年市場規模達到110億美元。 96 92 77 38 26 15 10 0 20 40 60 80 100 120 人工智能主要細分領域公司數量 單位:/個 58 53 48 22 18 12 8 0 20 40 60 80 人工智能主要細分領域獲投數量

35、 單位:個 28 20 16 8 7 6 0 20 40 60 80 人工智能主要細分領域獲投金額 單位:億元人民幣 來源:36氪研究院 語義識別技術擁有多樣性的應用 領域以及行業參與者 語義識別技術 - 行業概述 1數據來自36氪研究院 36kr-人工智能行業研究報告(2017年) 2017.6 2.1 AI產業鏈綜述 2.2 AI技術支撐層 數據標注 語音識別 語義識別 計算機視覺 21 36kr-人工智能行業研究報告(2017年) 2017.6 科技巨頭尤其是微軟早在2008年就已開始布局語義 技術領域。對于巨頭來說,自主研發耗時久、投入 高,同時效果也是未知的,直接收購是多數巨頭選 擇

36、的最快方式。 醫療衛寧健康 科技巨頭樂衷于收購,小而美的 企業更偏好細分場景 語義識別技術 - 行業概述 公司語義識別領域布局 微軟2008年,收購語義搜索公司Powerset,開始步入智能語音交互領域 2014年,微軟推出全球首款語音助手Cortana 2016年6月,收購語義分析公司Wand Labs,以提升Cortana智能語音體驗 2017年1月,收購了Maluuba,強化了Cortana語義和文本理解能力 蘋果2010年,收購Siri語音助手;2014年4月,收購Novauris;2015年10月,收購VocallQ 百度2017年2月,收購渡鴉科技,渡鴉團隊并入度秘事業部 關于語義

37、識別領域的創業公司,國內代表企業有出 門智能360、出門問問、三角獸、驀然認知等。其中, 三角獸的智能語音交互功能已被應用在Rokid、錘子 手機、威馬汽車等產品上。此外,由于自然語境和 細分行業語境下,同一名詞可能具備不同含義,因 此除了行業通用型的語義識別公司之外,還存在一 些深耕細分場景的公司,例如律師行業國外有基于 IBM Watson的ROSS,國內有無訟、法律谷等。 來源:公開資料收集 2.1 AI產業鏈綜述 2.2 AI技術支撐層 數據標注 語音識別 語義識別 計算機視覺 22 36kr-人工智能行業研究報告(2017年) 2017.6 計算機視覺(computer vision

38、,簡稱CV)是指用 計算機來模擬人的視覺系統,實現人的視覺功能, 以適應、理解外界環境和控制自身運動。主要解決 的是物體識別、物體形狀和方位確認以及物體運動 判斷這三個問題。計算機視覺識別系統通常需要三 個過程:目標檢測、目標識別、行為識別,分別解 決了“去背景”、“是什么”、“干什么”的問題。 醫療衛寧健康 計算機視覺主要研究如何使機器 具備“看”的能力 計算機視覺 - 行業概述 計算機視覺在技術流程上,首先要得到實時數據, 此步驟可通過一系列傳感器獲取,少部分數據可直 接在具備MEMS功能的傳感器端完成處理,大部分 數據會繼續傳輸至大腦平臺,大腦由運算單元和算 法構成,在此處進行運算并給出

39、決策支持。 目標檢測 圖像預處理 圖像分割 目標識別行為識別 模型建立 行為預斷 特征提取 目標分類 判斷匹配 攝像頭類 單目攝像頭 雙目攝像頭 TOF攝像頭 雷達類 激光雷達 紅外雷達 毫米波雷達 圖像獲取 圖像傳感器 產生數據 運算單元 硬件云端 CPU GPU NPU TPU 云計算 霧計算 流計算 結果輸出 決策支持 算法開源平臺 CNN RNN GNN Google Facebook IBM 百度 圖示:計算機視覺技術流程 2.1 AI產業鏈綜述 2.2 AI技術支撐層 數據標注 語音識別 語義識別 計算機視覺 23 36kr-人工智能行業研究報告(2017年) 2017.6 計算機

40、視覺應用場景可分為兩大類:圖像識別和人 臉識別,每類又可繼續劃分為動、靜共四個類別, 基本覆蓋了目前計算機視覺的各項應用場景。其中 動態人臉識別技術是目前創業熱度最高的細分領域, 尤其是金融和安防場景,是其重點布局場景。 醫療衛寧健康 動態人臉識別是最熱領域,金融 和安防是最熱場景 計算機視覺 - 行業概述 國內,計算機視覺領域的企業最早出現在1997年, 2014年出現創業高潮,企業平均年齡在3.9歲1。下 表格為該領域目前存續的具備代表性的創業公司。 公司名稱成立時間融資信息核心業務合作企業未來發展預期 商湯科技2014 2017年4月,獲賽領資 本戰略投資6000萬美 元投資 人臉識別

41、華為、小米、英偉達、 京東、銀聯、科大訊飛 等 繼續深入金融、商 業、安防、互聯網 +等領域 曠視科技2011 2016年12月,獲鴻海 集團、建銀國際C輪1 億美元投資 人臉識別 螞蟻金服、萬科、美圖 秀秀、世紀佳緣等 或將進軍機器人視 覺技術領域 格林深瞳2013 2014年6月,獲紅杉資 本A輪數千萬美元投資 人臉識別 北京新天地、中國農業 銀行等 或將進軍無人駕駛 行業 依圖科技2012 2017年5月,獲高瓴資 本,云鋒基金等C輪3.8 億人民幣 人臉識別、 車輛識別 招商銀行、浦發銀行、 貴州省/福建省交通廳、 江蘇省/廈門市公安廳等 做強金融和安防領 域的人像和車輛識 別技術 觸

42、景無限2010 2017年3月,獲清控銀 杏、正和島A+輪5000 萬人民幣投資 計算機視覺 圖像識別人臉識別 動態靜態動態靜態 輔助駕駛 鑒黃/暴 工業視覺 監控分析 以圖搜圖 商品識別 醫療影像診斷 文字識別 金融/安防 物業物業/社保社保 金融 教育 人像美顏/娛樂 聚類分析 安防 圖像編輯 1數據來源于36氪研究院 2.1 AI產業鏈綜述 2.2 AI技術支撐層 數據標注 語音識別 語義識別 計算機視覺 24 36kr-人工智能行業研究報告(2017年) 2017.6 計算機視覺作為一種人工智能的基礎技術應用,使 用場景多樣,市場潛力巨大。其中人臉識別領域在 2016年已接近百億規模,

43、中國市場在全球范圍扮演 著十分重要的角色。 醫療衛寧健康 各細分領域成熟度相差大,其中 人臉識別未來幾年市場潛力巨大 計算機視覺 - 行業概述 0 50 100 150 200 250 300 350 400 450 500 2014201520162017E2018E2019E2020E 人臉識別市場規模(億元人民幣) 中國全球 來源:Capvision,36氪研究院 由此可見,計算機視覺各細分領域的成熟度目前相 差較大。人臉識別、指紋識別等所在的生物特征識 別領域相對來說技術成熟度、工業化程度較高。在 物體和場景識別方面,由于識別的物體種類繁雜, 表現形態多樣,技術成熟度較低。 對于計算機

44、視覺而言,其主要瓶頸在于受圖片質量、 光照環境的影響,現有圖像識別技術較難解決圖像 殘缺、光線過爆、過暗的圖像。此外,受制于被標 記數據的體量和數量,若無大量、優質的細分應用 場景數據,該特定應用場景的算法迭代很難實現突 破。 2.1 AI產業鏈綜述 2.2 AI技術支撐層 數據標注 語音識別 語義識別 計算機視覺 25 36kr-人工智能行業研究報告(2017年) 2017.6 商湯科技創辦于2014年11月,位于北京,2017年4 月完成了賽領資本領投的戰略投資6000萬美元。商 湯科技專注于核心算法開發,通過視覺技術賦予計 算機視覺感知和認知的能力,業務覆蓋金融、商業、 安防、互聯網+等

45、行業,意圖為企業提供低門檻的計 算機視覺技術,打造“商湯驅動”的人工智能商業 生態。 醫療衛寧健康 專注計算機視覺算法研發,推動 視覺技術融入各行各業 計算機視覺企業案例 商湯科技 商湯科技的核心能力在于其能夠自主開發原創深度 學習模型,其自有的高性能算法庫相對行業內開源 平臺庫,較大程度提高了算法效率,帶來2-5倍的性 能提升1。性能的提升直接導致的是極大地降低了計 算機視覺硬件門檻,例如一般情況下雙目、深度攝 像頭才具備視頻處理能力,但利用商湯科技的算法 模型,單目攝像頭也具備此能力。此外,商湯科技 自身構建了具備200塊GPU鏈接能力的DeepLink超 算平臺,過去耗時1個月的運算,現

46、在只需5-6個小 時即可完成。硬件門檻降低+計算能力提升,使得大 部分企業快速接入計算機視覺技術成為現實。 智慧金融 個人遠程身份 認證解決方案 紙質票據電子 化解決方案 智慧商業 刷臉門禁考勤 系統 智能場地化迎 賓機、廣告機 智慧安防 智能人群分析 解決方案 智能人臉布控 解決方案 互聯網+ 人臉美顏 視頻美化 以圖搜圖 人物相冊分類 圖示:商湯科技業務一覽 1數據來自于商湯科技官網 2.1 AI產業鏈綜述 2.2 AI技術支撐層 數據標注 語音識別 語義識別 計算機視覺 26 36kr-人工智能行業研究報告(2017年) 2017.6 作為算法層企業,商湯科技通過與京東、小米、新 浪微博

47、等應用層級公司合作,使得自己的算法可以 很好地融合多類細分領域的特點,快速移植復制到 各行各業。除此之外,商湯還在技術層與多家企業 合作,例如,商湯科技與科大訊飛合作研發具備人 臉+語音雙重識別的產品;與英偉達合作研發適用于 深度學習的GPU芯片,該芯片可實時處理雙路視頻, 為智慧視頻提供支持。 醫療衛寧健康 以開放的心態,打造“商湯驅動 ”的人工智能商業生態 計算機視覺企業案例 商湯科技 商湯科技誕生于香港中文大學的多媒體實驗室,團 隊成員主要由兩部分構成,其一是來自MIT、斯坦福、 香港大學、清華大學等高校及其實驗室的科研人員; 其二是來自谷歌、百度、微軟、阿里巴巴等產業界 的商業人員。商

48、湯科技意圖將實驗室最新成果與商 業變現之間的時空差距縮到最低限度。 2017年4月, 商湯科技宣布完成了新一輪的戰略融資,將進一步 加速商業化布局。 智慧金融 其他 互聯網+ 智慧商業智慧安防 圖示:商湯科技客戶實例 2.1 AI產業鏈綜述 2.2 AI技術支撐層 數據標注 語音識別 語義識別 計算機視覺 27 36kr-人工智能行業研究報告(2017年) 2017.6 除商湯科技這類依靠算法作為計算機視覺解決方案 的流派之外,還存在觸景無限這類專注于前端嵌入 式硬件并搭載軟件的打法。觸景無限成立于2010年, 提供嵌入式智能感知平臺視覺卡,并于2017年 3月完成A+輪5000萬元人民幣融資

49、。 觸景無限視覺卡基于英偉達、英特爾等嵌入式芯片, 融合了人臉識別、物體識別、雙目測距、GPS、TOF、 IMU等多種傳感器、數據處理平臺和壓縮算法模型, 提供的嵌入式智能感知平臺,具備體積小、功耗低、 實時圖像處理、處理能力高、多目攝像頭支持、通 用API接口等特點。例如基于深度學習的人臉識別技 術運行在視覺卡上能達到每幀100ms的速度(分辨 率為1080P時的檢測+識別速度),在1:1人證比對 的情況下識別率大于99%,在1:50000的情況下識別 率大于90%。通過該視覺卡,信息處理可以直接在 前端完成,幫助前端硬件完成“感”與“知”的融 合。 在具體產品方面,截止2017年6月,觸景無限視覺 卡已完成兩代視覺卡的研發,其中一代V10X系列已 于2016年底實現量產,二代V20X系列亦于日前發布。 相較于一代,二代基于Intel-Movidius芯片研發, 芯片體積更?。ㄒ辉矌糯笮。?,功耗更低(低至2 瓦),處理速度更強(約1Tflops)。兩代視覺卡產 品均可用于安防、無人機、機器人、智能家居、智 能汽車輔助駕駛等領域

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(36氪:人工智能行業研究報告2017年V2公開發布版終稿(38頁).pdf)為本站 (菜菜呀) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站