1、人工智能、機器學習和數據將推動未來生產力的發展人工智能、機器學習和數據將推動未來生產力的發展高盛人工智能是信息時代的尖端技術。在最新的人工智能是信息時代的尖端技術。在最新的“創新簡介創新簡介”系列文件中,我系列文件中,我們研究機器學習和深度學習的進步如何與更強大的計算和不斷擴大的數據庫相們研究機器學習和深度學習的進步如何與更強大的計算和不斷擴大的數據庫相結合,為跨行業的公司帶來人工智能變革。人工智能服務的發展有可能開辟新結合,為跨行業的公司帶來人工智能變革。人工智能服務的發展有可能開辟新的市場的市場,破壞云計算的競爭環境破壞云計算的競爭環境。 我們相信我們相信,如何更好地利用人工智能將成為如何
2、更好地利用人工智能將成為未來幾年公司競爭優勢的決定因素,并將帶來生產力的復蘇。未來幾年公司競爭優勢的決定因素,并將帶來生產力的復蘇。目錄目錄投資組合經理總結投資組合經理總結.什么是人工智能?什么是人工智能?.價值創造的關鍵驅動力價值創造的關鍵驅動力.推動生產力的未來推動生產力的未來.人工智能和生產力的悖論:專訪人工智能和生產力的悖論:專訪 Jan Hatzius.生態生態 云服務云服務 開源人工智能投資周期的受益者開源人工智能投資周期的受益者.農業農業.金融金融.醫療保健醫療保健.能源能源.推動者推動者.附錄附錄.投資組合經理總結投資組合經理總結人工智能(AI)是信息時代的尖端技術。從人類告訴
3、計算機如何操作到計算機學著如何自主操作是計算機運作領域一次巨大的飛躍, 對每一個行業都有著重要的意義。雖然現在可能被視為人工智能寒冬前最新一輪的承諾和失望,這些投資和新技術將至少留給我們機器學習所生產的有形的經濟效益。與此同時,人工智能和自動駕駛已經上升到了流行文化的前沿,甚至是政治話題,但是我們過去一年以來的研究讓我們相信,這不是一個錯誤的開始,而是一個拐點。本報告將深入探討這個拐點,從明顯的更多更快的計算以及數據爆炸到更微妙的深度學習、顯著進步專業硬件和開源的興起。其中一個更令人興奮的人工智能方面的拐點是, “現實世界”的使用案例比比皆是。而深度學習使得計算機視覺和自然語言處理等技術不斷進
4、步,大幅提升了蘋果的 Siri,亞馬遜的 Alexa 的質量和谷歌的圖片識別,人工智能不僅僅是技術的技術。大數據集與強大的技術相結合創造了價值,也獲得了競爭優勢。例如, 在醫療保健中, 圖像識別技術可以提高癌癥診斷的準確性。 在農業中,農民和種子生產者可以利用深度學習技術來提高作物產量。在藥物方面,深度學習用于藥物發現。 在能源領域, 勘探效率和設備可用性逐步提高。 在金融服務中,通過打開了新的數據集,成本降低收益增加,分析比以前更快。人工智能的運用善且處于非常早期的階段,必要的技術通過基于云的服務,我們相信創新的浪潮的創新將滾滾而來,創造出各行各業新的贏家和輸家。人工智能的廣泛適用性也讓我們
5、得出這樣的結論:它是一個針移動技術,為全球經濟和生產力提供驅動力,并結束美國生產率增長的停滯期。根據高盛首席經濟學家 Jan Hatzius 的研究, 我們的框架目前停滯在資本深化及其對美國生產力的相關影響。我們認為,人工智能技術驅動對生產力的改進將與 20 世紀 90年代相似,帶動企業投入更多的資本和勞動密集型項目,來加快發展,提高盈利能力和擴大股權估值。啟示啟示雖然我們看到人工智能影響每一個公司,行業和細分經濟的時間,其中有四個最為顯著的對投資者的啟示。生產力生產力。 人工智能和機器學習有可能掀起一個循環的生產率增長從而有利于經濟增長, 企業盈利, 資本回報和資產估值。 根據高盛首席經濟學
6、家 Jan Hatzius“原則上,人工智能看起來確實像可能用數據捕獲得更為準確,相較于人工智能所能達到的最后一撥創新浪潮去降低高附加值生產類型的成本和勞動力投入。 例如在商業部門的為了節約成本的創新是統計學家比起增加iPhone應用程序的多樣性和可用性而言更好地去捕獲。在商業部門里,人工智能對成本結構有深遠基礎的影響,我相信它將被統計學家所接受,并且會顯示在整體生產力數據中。高級技術高級技術。 人工智能的速度和機器學習的價值有可能扭轉在構建數據中心和網絡時更便宜的商品硬件的趨勢。我們認為這可能推動硬件,軟件和服務支出的市場份額大幅度轉變。例如,在標準數據中心瞬時計算上運行的 AWS 工作負載
7、只需要 0.0065 美元每小時,而對于為人工智能優化的 GPU 成本為 0.900 美元每小時。競爭優勢競爭優勢。 我們看到了人工智能和機器學習重新整理每個行業的競爭秩序的潛力。 管理團隊未能投資和傳遞這些技術風險給受益于戰略情報、生產所得以及創造的資本效率的競爭者。在第 41 頁開始的小插曲中,我們將研究如何在醫療保健,能源,零售,金融和農業領域發展這些競爭優勢。創建新公司創建新公司。我們在過去 10 年人工智能和機器學習領域創立的企業中確定了 150 多家私人公司(附錄 69-75)。雖然我們相信,人工智能大部分的價值將會積累于大公司的資源,數據和投資能力,我們期望風險資本家,企業家和技
8、術專家將繼續推動創建新的公司,反過來,驅動實質創新和價值創造至少是并購雖然我們當然不會排除人工智能中的“谷歌或 Facebook”的出現。在下面的內容中,我們深入探討了人工智能的技術,歷史,機器學習的生態系統,以及這些技術在行業和領先公司的應用。什么是人工智能?什么是人工智能?人工智能是使智能機器和計算機程序能夠以通常需要人類智能的方式學習和解決問題的科學和工程。通常,這些包括自然語言處理和翻譯,視覺感知和模式識別以及決策,但應用程序的數量和復雜性正在迅速擴大。在本報告中,我們將大部分分析集中在作為人工智能一個分支的機器學習,以及作為機器學習的一個分支的深度學習。我們強調兩個要點:1.簡單來說
9、,機器學習機器學習是從例子和經驗(即數據集)學習而不是依賴于硬編碼和預定義規則的算法。換句話說,不是開發者告訴程序如何區分蘋果和橙子,算法被數據“訓練”并且自己學習如何區分蘋果和橙子。2.深度學習深度學習的主要進展是當前 AI 拐點背后的驅動力之一。深度學習是機器學習的一個子集。在大多數傳統的機器學習方法中,特征(即可以預測的輸入或屬性)由人設計。特征工程是一個瓶頸,需要大量的專業知識。在無監督深度學習中,重要特征不是由人類預定義的,而是由算法學習和創建的。重要特征不是由人類預定義的,而是由算法學習和創建的。要明確的是,我們還沒有專注于那種真正的,強大的,或通常的人工智能,那種為了復制獨立的人
10、類智力,這往往是人工智能通俗和流行的文化釋義。雖然有一定的潛在的突破,如谷歌 DeepMind 的 alphago 系統,不僅擊敗了圍棋世界冠軍,也用了沒有人用的下棋方式,我們專注于更直接的經濟實體的發展領域中的人工智能。為何人工智能發展在加速?為何人工智能發展在加速?在深入學習能力的重大飛躍一直是目前人工智能拐點的背后催化劑之一。 神經網絡, 深層學習背后的技術框架, 已經存在了幾十年, 但在過去的五到十年中,有三件事情發生了變化。1.數據數據。越來越多無處不在的連接設備、機器和系統在全球范圍內創造了非結構化數據量的巨大增長。神經網絡變得更加有效隨著他們有了更多的數據,這意味著隨著數據量增加
11、的問題,機器學習可以解決使用的數據增加。移動,物聯網,和成熟的低成本數據存儲和處理技術(通常在云中)創造了可用數據集的數量,規模和結構的大規模增長。例如,特斯拉已經聚集 78,000 萬英里的駕駛數據,加上另一個每十小時百萬英里通過其連接的汽車,而蟑螂合唱團(由思科月 2016 美元 14 億收購)有一個平臺供電的機器對多個汽車制造商和電信公司進行通信。Verizon 公司在八月也有類似的投資,宣布將收購 Fleetmatics,通過無線網絡云軟件連接在車輛遠程傳感器越來越快。5G 的推出只會加快數據生成和發送的速度。年度數據生成有望在 2020 年前達到 44 澤字節(萬億 GB),根據 I
12、DC 的數字宇宙報告,超過五年的復合增長率達到了 141%,這表明我們正開始將這些技術應用。圖 1:年度數據生成有望在 2020 年前達到 44 澤字節(萬億 GB)2.更快的硬件更快的硬件。圖形處理單元(GPU)的再利用,低成本的計算能力的通用性, 特別是通過云服務,并建立神經網絡模型大大提高了速度和精度可以產生神經網絡的結果。GPU 及其并行體系結構更快地訓練了機器學習系統與傳統的中央處理單元(CPU)為基礎的數據中心架構。再利用圖形芯片的網絡可以讓迭代速度更快,在更短的時間內進行更準確的培訓。在同一時間,專業硅的發展,如正在使用現場可編程門陣列的微軟和百度, 受過訓練的深度學習系統允許更
13、快的推論。 更廣泛地說, 超級計算機的原始計算能力自 1993 以來呈指數級增長 (圖2)。2016,一個高端的 NVIDIA 顯卡,對于游戲 PC 具有足夠的計算能力已列為 2002 年前世界上最強大的超級計算機。圖 2:超級計算機的原始計算能力自 1993 以來呈指數級增長業績成本也大幅下降。NVIDIA 的 GPU(GTX 1080)提供 9tflops 表現為大約 700 美元,這意味著它的每一個 GFLOPS 價格大約 8 美分。1961 年結合足夠的 IBM 17 世紀 20 年代到提供一個單一的 GFLOPS 需要超過 9 兆美元 (經通脹調整)。圖 3:每單位計算的價格隨著時間
14、的推移急劇下降3.更好和更廣泛的可用算法更好和更廣泛的可用算法。更好的輸入(計算和數據)驅動更多的算法研發,以支持深度學習用例。開源框架,如伯克利的咖啡,谷歌的 tensorflow,和火炬(用于臉譜網)允許開發者通過依靠測試的基礎庫復合個人的貢獻度。拿TensorFlow 舉例,在不到一年的時間里,已成為 GitHub 上最大最活躍的開發商合作網站。 雖然不是所有的人工智能都發生在一個廣泛可用的開源框架下,(蘋果在這一領域的秘密是眾所周知的),他們的可用性肯定加快了更先進的開源工具的發展??纯粗苓吙纯粗苓呺m然本報告的重點是人工智能,以及公司如何往這條路發展,重要的是要意識到人工智能已經影響我
15、們的生活的程度。在線搜索在線搜索。 就在一年前, 谷歌透露, 它已經開始相當數量的搜索 rankbrain,一個人工智能系統, 與鏈接和內容一起成為谷歌搜索算法中三個最重要的信號之一。推薦引擎推薦引擎。Netflix、Amazon 和潘多拉都利用人工智能來推薦電影、產品突出和歌曲播放。5 月,亞馬遜的開放源碼 DSSTNE,深度可伸縮的稀疏張量網絡引擎,簡稱“命運”,它使用生產產品的建議,以便它可以超越語言理解和目標識別。面部識別面部識別。谷歌(facenet)和臉譜網(DeepFace)已投入巨資來發展必需的技術確定接近百分之百的準確度來識別照片中的面孔。一月,蘋果進一步收購 Emotien
16、t,人工智能啟動讀取面部表情來判斷情緒狀態。顯然,這些技術遠遠超過標記照片。雖然有無數的個人助理的消費者例子,比如蘋果的 Siri,信貸和保險風險評分,甚至天氣預報,在接下來的內容中我們考察企業利用這些技術來加速增長,降低成本以及控制風險。這些技術和應用的速度本身也在發展,充其量是一個快照的時間,為公司和投資者在他們的競爭者中一路領先提供了方向。什么是人工智能?什么是人工智能?人工智能是描述計算機模擬智能行為的科學。 它需要使計算機表現出人的行為特征,包括知識,推理,常識,學習和決策。什么是機器學習什么是機器學習?機器學習是人工智能的一個分支, 它使計算機能夠從數據中學習而不需要顯式編程。為了
17、提供簡單的背景,一臺計算機可以以編程來識別照片中的火車,但如果它看到只有一個對象的照片,類似火車(如博物館內建一個舊火車,玩具火車),一臺機器可能會錯誤地識別它作為一列火車。在這種情況下, 機器學習將使計算機學習一大組火車的例子和對象,使其能夠更好地識別實際列車(從而實現人工智能水平)。機器學習有許多現實世界的應用。例如,Netflix 使用機器學習算法來生成個性化的建議,為用戶提供基于其海量用戶行為數據,Zendesk 使用客戶交互數據來預測客戶可能滿意的傾向。什么是神經網絡什么是神經網絡?人工智能/機器學習的背景下的神經網絡描述了一種類型的計算機體系結構, 人工智能/機器學習程序可以建立在
18、模擬人類大腦的結構上。它由連接在一起的節點組成,可以解決更復雜的問題并學習,就像人腦中的神經元一樣。圖 4:神經網絡多個隱藏層將是深度學習的特點什么是深度學習什么是深度學習?深度學習是一種機器學習, 需要訓練一個層次結構的 “深層”的大型神經網絡,每個層解決問題的不同方面,使系統能夠解決更復雜的問題。使用上面給出的火車例子,深學習系統將包含不同層級,每一層標識不同的列車特性。例如,底層將識別對象是否有窗口。如果答案是肯定的,下一層將尋找輪子。 下一步將尋找矩形車, 等等, 直到層集體確定圖片作為火車或拒絕假設。深度學習作為一種提高機器學習能力的方法已經越來越受歡迎, 技術的進步開始允許大神經網
19、絡的訓練。什么是監督學習?什么是無監督學習什么是監督學習?什么是無監督學習?監督和無監督學習是機器學習的兩種類型。在監督學習中,系統給出了一組“正確答案”的例子,根據這些例子,系統將根據正確的答案學習并正確地預測輸出。 監督學習的實際應用包括垃圾郵件檢測(例如,系統可能有一堆標記為“垃圾郵件”的電子郵件,學會正確地識別垃圾郵件)和手寫識別。在無監督學習中系統沒有給出正確的答案,但有未標記的例子,留在自己的發現模式。一個例子包括將客戶按一定的特征(例如購買頻率)進行分組基于從一組大客戶數據發現的模式。機器學習有哪幾種?機器學習有哪幾種?l 分類分類。將電子郵件分類為垃圾郵件,識別欺詐,面部識別,
20、語音識別等。l 聚類聚類。比較圖像,文本或語音找到類似的項目,確定集群的異常行為。l 預測預測?;?Web 活動和其他元數據預測客戶或員工流失的可能性;基于可穿戴數據預測健康問題。什么是一般的什么是一般的,強大的或真正的人工智能強大的或真正的人工智能?一般的,強大的,或真正的人工智能的術語用于機器智能,充分復制人類的智慧,包括自主學習和決策。雖然全腦仿真技術服務于通常意義的人工智能目標, 所需的計算能力的金額仍然遠遠超出了目前的技術,這使一般的人工智能在很大程度上仍然停留在理論階段。價值創造的關鍵驅動力價值創造的關鍵驅動力我們相信,人工智能主題相關的利潤池創建(和銷毀)分析最好首先通過四個關
21、鍵輸入:人才,數據,基礎設施和硅。這些投入也有雙重障礙。人才人才人工智能(特別是深度學習)很難。我們與風投和公司在空間里的對話,造成了大型互聯網和云計算廠商中的人才短缺和人才之間的競爭,如圖 5。人工智能人才有極大的需求,并購化仍然獲得必需的人才的一種常用手段。隨著技術和工具的成熟,人才可能成為一個瓶頸。然而,我們相信人才將遷移到有趣的,差異化的數據集。 由于這一點由于這一點, 我們相信大差異化的數據集是最有可能的驅動增長我們相信大差異化的數據集是最有可能的驅動增長和利潤提高,我們邁入了以人工智能為中心的世界。和利潤提高,我們邁入了以人工智能為中心的世界。圖 5:并購推動人工智能人才稀缺化數據
22、數據數據是人工智能的關鍵輸入。深入學習的有效性與較大的數據集特別相關,較大的數據集防止模型變得過度擬合。例如,麻省醫院放射科和哈佛醫學院的研究人員使用卷積神經網絡來識別 CT 圖像,根據訓練數據大小評估神經網絡的準確性。隨著訓練規模越來越大,精度提高(圖 6)。圖 6:醫學成像(部分身體圖像識別)培訓規模與精度相關:0=最不準確,100=最準確現在大多數學習是監督或半監督, 這意味著所有或一些用于訓練模型的數據必須被人所標記。無監督機器學習是目前人工智能的“圣杯”,因為原始的未標記數據可以用來訓練模型。廣泛采用深度學習可能會與大數據集的增長(這是發生在移動和物聯網)和無監督機器學習的進展相掛鉤
23、。然而,我們相信大分化的數據集(電子健康記錄,組學數據、地質數據、氣象數據等)將有可能成為下一個十年的利潤池創建的一個核心驅動力。信息量在全球范圍內預計將以 36%的年復合成長率增長,根據 IDC 的預測到 2020 將達到 44 澤字節(440 億 GB)。越來越多的連接設備(消費者和工業),機到機通信和遠程傳感器的結合,用來創建大數據集,從而理解和訓練自適應算法。數據的可用性在過去十年也急劇增加,普查,勞動,天氣,甚至基因組等大量數據在線免費。我們也看到衛星圖像的可用性,這需要大量的計算和充分分析。美國地質調查局 Landsat 7 衛星和 Landsat 8 衛星每 8 天勘測整個地球圖
24、像,美國地質調查局讓這些圖像免費,即使壓縮后超高清晰度的圖像也大約有 1GB 那么大。其他公司,如軌道洞察在聚合圖像數據,并在多個行業創造商業解決方案?;A配件基礎配件硬件和基礎軟件對人工智能而言是必要的。 我們認為支持人工智能的基礎配件將迅速商品化。這種觀點是基于以下兩點提出的:1)云計算供應商很好地拓展他們的產品,以進入人工智能基礎配件領域,2)開源(TensorFlow、火花,等等)已經成為人工智能軟件創新的主要驅動力。為了鼓勵人工智能,我們相信大型云廠商將繼續增強開放源代碼基礎配件的能力,限制潛在的利潤池創建。圖 7:互聯網巨頭(如谷歌)正在通過開源技術推動人工智能(如Tensorfl
25、ow)深度學習的 GPU 再利用已經成為我們當前的“人工智能的春天”的關鍵驅動因素。在人工智能/機器學習生態系統,有兩個主要的應用程序,確定每個需要不同資源設置的神經網絡的性能。首先是一個訓練算法的構造和使用。訓練算法利用一個大的 (通常是更大的, 更好的) 數據集發現相關性, 并建立一個模型,給定一個新的輸入就可以確定輸出的概率。培訓是資源密集型的,最現代化的培訓是基于 GPU 的供電系統的。訓練的模型和算法的使用稱為推理。推理需要極少的計算能力,通常通過更小的,增量的數據輸入集。而一些 GPU 優化推理(例如 NVIDIA 的 P4 系列和M4 系列)給出推理的單一目的性,專業的硅因專門的
26、應用程序而開發,稱為FPGAs(現場可編程門陣列)和 ASIC(專用集成電路)。這種集成電路最初是為原型的 CPU 開發的, 但越來越多地用于人工智能推理。谷歌的張量處理單元,是一個 ASIC 專用的人工智能和機器學習的例子。 微軟也一直使用 FPGA 芯片推理。英特爾 2015 年收購 FPGA 的制造商Altera 公司,2020 年之前,三分之一的數據中心可以利用 FPGA 做專業用途。賽靈思率先在上世紀 80 年代商業使用 FPGA,指出了云計算和大數據中心是公司增長和前進的重要途徑,也宣布了與百度的戰略客戶關系。數據中心中在 Xilinx 公司的目前收入中約占 5%。圖 8:人工智能
27、變革:1950 年-現在推動生產力的未來推動生產力的未來在過去十年的緩慢增長和上世紀 90 年代中后期顯著增長后,美國的勞動生產率增長近年來停滯。我們相信,機器學習和人工智能的發展已經戲劇性地改變了全球產業的潛在生產力,在某種程度上類似于上世紀 90 年代的互聯網技術大范圍運用的影響。在所有行業中,我們看到了自動化讓勞動小時約減少了在所有行業中,我們看到了自動化讓勞動小時約減少了 0.5% - 1.5%,人,人工智能工智能/機器學習技術提高了效率,機器學習技術提高了效率,2025 年前能達到年前能達到+ 51-154 個基點的生產個基點的生產率增長率增長。我們希望 A 人工智能/機器學習隨著時
28、間的推移提高生產力的分子和分母, 我們認為最重要的早期影響是低工資的自動化工作驅動類似水平的產出增長的自動化向較少的勞動時間發展。 人工智能/機器學習驅動改善 97 個基點就意味著 2025 年技術對生產力增長的貢獻為 1.61%,或者比 1995-2004 年高 11個基點(圖 9、10)。圖 9:生產力分析百萬美元,假定名義名義 GDP 增長超過 2019科技和生產力增長科技和生產力增長上世紀 90 年代的科技繁榮讓我們看到了生產力的兩個主要組成部分的異常擴增,資本深化以及多因素生產率(MFP),與上升的股票估值密切相關。資本深化資本深化。高盛經濟學家 Jan Hatzius 提供了最近的
29、反周期趨勢資本深化(每勞動小時的資本存量),歷史上往往在擴張時期沒有資本存量的時候勞動時間增加 (見 Jan 的報告: “生產率悖論 v2.0 重游” , 發表于 2016 年 2 月 9 日) 。在上世紀九十年代,資本深化明顯增加,突出了典型的資本投資增加超過經濟增長的勞動力市場。多因素生產率(多因素生產率(MFP)。2013 年 3 月,由 David Byrne 等人進行的聯邦儲備研究表明,上世紀九十年代技術同時擴散到 IT 生產和一般業務流程有助于創造三倍的增長(每勞動時間的產出),從 1995 年到 2004 年期間 IT 生產部門貢獻了最多的年平均增長達 49的年生產率增長(圖 1
30、0)。圖 10:90 年代后期:生產部門貢獻了近一半的生產力增長失去價值,在科技繁榮中增長千年停滯千年停滯。在過去十年中,與 IT 應用(計算機硬件,軟件和電信)相關的資本深化增長停滯不前。相對于更廣泛的市場資本,IT 資本對這一組成部分的總體增長的貢獻比在科技熱潮期間甚至在之前的平均貢獻更小。 總勞動時間一直在增加,但資本強度對生產力的貢獻大大低于 20 世紀 90 年代。引入越來越復雜的消費性機器學習和人工智能可能是使資本強度回到之前的催化劑, 在我們看來,顯著提高勞動生產率,類似于我們在 20 世紀 90 年代看到的循環。我們在 MFP 方面更加樂觀。 高盛經濟學家已經強調(生產力悖論
31、v2.0 重新審視 2016 年 9 月 2 日),ICT 價格的向上偏差和對未貨幣化產出(免費在線內容,后端流程等)的投入增加,增加了對實際 GDP 和生產率增長的低估。臉譜網和谷歌這樣的互聯網巨頭的演變表明: 復雜的投入勞動力和資本不一定轉化為標準生產力指標中傳統消費品的貨幣化。人工智能人工智能/機器學習誘導生產力從而可能影響投資機器學習誘導生產力從而可能影響投資我們認為,人工智能/機器學習提高生產力的潛在影響之一可能是公司分配資本的方式的轉變。 自 2011 年中期以來,股息和股票回購的增長已顯著超過資本支出增長, 因為管理團隊對基建項目投資仍處于經濟衰退之后的不情愿的態度。生產力的提高
32、有可能重振管理的信心,鼓勵公司類似于 20 世紀 90 年代那樣投資生產資本, 其中由我們的高盛資本開支跟蹤器衡量的年度資本開支增長一直超過由耶魯教授羅伯特 希勒教授的標準普爾 500 分析得到的年分紅增長 (圖11)。我們進一步相信,投資者會在生產力提高的情況下重視這種轉變。在資本支出投資和相關生產率增長期間,經周期調整的市盈率經歷了顯著的通貨膨脹,而目前的估值剛剛達到了衰退前的水平(圖 12)。人工智能和生產力的悖論:專訪人工智能和生產力的悖論:專訪 Jan Hatzius高盛互聯網研究分析師 Health Terry 和首席經濟學家 Jan Hatzius 討論了人工智能和機器學習對提高
33、滯后勞動生產率的作用。Health Terry:在過去的十年中,什么導致了生產力增長的不足?:在過去的十年中,什么導致了生產力增長的不足?Jan Hatzius:一個好的起點是 20 世紀 90 年代,在那時我們有一個相當規模的的生產力加速,主要是技術驅動??萍疾块T的規模越來越大,科技產出增長速度非???,這足以使經濟整體加速增長。最近,或在過去的 10 年左右,我們已經看到了生產增長率又一次減速, 低至 20 世紀 70 年代和 80 年代的水平, 甚至可能更低。我認為不止一個驅動力,但我認為有三個因素阻礙了生產力增長。一個是周期性的影響。我們在經濟衰退中仍有一些后遺癥,資本積累速度相對緩慢,
34、投資水平相對較低,就業增長相對較快。由于生產力是衡量每工作小時的產出,當勞動力市場正在迅速提高你可以有較低的生產率時意味著有點反常。另一個因素可能是技術進步的總體速度有所放緩。我們有理由相信,上世紀90 年代,隨著互聯網的引入,技術進步的時間相對比較快,我認為現在有點慢了,這也是有根據的。第三點是, 在過去十年中發生的技術進步, 如以移動和消費者為中心的技術,是在數量上統計人員難以捕捉到的。原因是,在過去十年左右的時間里許多新技術的質量改進是很難定量的。 統計學家們并沒有在許多處于前沿的領域進行顯著的質量改進。所以我會指出三點。有周期性的影響,還可能是一些技術進步放緩,此外極有可能在生產力統計
35、時候的測量誤差增加。Terry:回首:回首 20 世紀世紀 90 年代的生產力繁榮,技術發揮了什么作用?年代的生產力繁榮,技術發揮了什么作用?Hatzius:推動這一切的主要是通用技術,如半導體和計算機,它們比 20世紀 70 年代或 20 世紀 80 年代所占的經濟份額大得多, 因為那時候技術進步非常迅速,統計學家們很好地測量了這些技術。在上世紀 90 年代,統計學家們做了很多努力來較快地捕捉質量提高;處理器的速度,更大的內存,電腦硬件更好的屬性,這導致在技術部門測量的貢獻大幅增加。技術部門從上世紀 90 年代早期開始加速生產增長,持續到新世紀頭十年中期。Terry:我們已經在過去的:我們已
36、經在過去的 10 到到 15 年里看到了很多技術的發展。為什么年里看到了很多技術的發展。為什么沒有產生像沒有產生像 iPhone、臉譜網和云計算這樣的技術對生產力類似的影響?、臉譜網和云計算這樣的技術對生產力類似的影響?Hatzius:我們沒有一個完整的答案,但我認為答案的一個重要部分是衡量質量改善的統計能力的提升, 新產品對經濟統計的影響是有限的。 衡量名義 GDP比較容易,基本上就是增加收入的問題。幾乎所有的東西都有測量誤差,但是我沒有真正一級關注,因為在衡量名義 GDP 方面,測量變得越來越差。通過采用調整后的物價指數來緊縮把名義 GDP 轉換成實際 GDP 是很難的。你看,例如,在軟件
37、行業,如果你相信官方的數字,用 1000 美元的經費能買到的現在的軟件和上世紀 90 年代能買到的一樣。軟件行業的貨幣沒有升值。這很難令人相信。甚至都通不過氣味測試。由于捕獲這些質量改進存在困難,事實上,技術部門由通用硬件越來越多地轉向專用硬件,軟件和數碼產品也會導致低估和估算誤差。Terry:人工智能和機器學習等技術的發展對生產力有什么影響?:人工智能和機器學習等技術的發展對生產力有什么影響?Hatzius:原則上,它似乎在某種程度上比統計數據更好地捕捉到上一波創新,人工智能降低了成本,減少了勞動力投入到高附加值生產的需要。在商業部門的成本節約創新是統計學家設立起來為了更好地捕獲信息, 例如
38、增加的應用程序的多樣性和可用性的 iPhone。在人工智能對商業部門的成本結構有廣泛影響的程度上,我有理由相信,它將被統計學家所接受,并且會出現在整體生產力數據中。我只想警告一點,那就是美國的經濟非常大。即使在一個經濟部門中很重要,甚至是壓倒性的力量,在你劃分 18 萬億美元(這是美國名義 GDP 水平)時通??雌饋聿荒敲粗匾?,所以百分比貢獻可能不從底層的角度來思考。但原則上,這是可以產生顯著影響的事情。Terry:你談到了對成本的影響,那怎么影響定價?:你談到了對成本的影響,那怎么影響定價? 這是否會成為我們在這是否會成為我們在某些經濟部門看到的更廣泛的通貨緊縮力量的貢獻者?某些經濟部門看到
39、的更廣泛的通貨緊縮力量的貢獻者?Hatzius:我當然認為,在生產力提高方面,第一階段的影響往往是降低成本和降低價格。保持一切不變的意思是降低整體經濟的通貨膨脹。通常這不是你想保持一切不變的正確假設。 有經濟決策者和有聯邦儲備委員會, 如果影響很大,那么美聯儲將采取更容易的貨幣政策, 使得不再在受人工智能影響的地區工作的人在別處能找到工作。 美聯儲這樣做可能有非通貨膨脹的運行空間。 從長遠來看,我們一般不認為成本節約的創新會導致失業率上升或通脹大幅下降。 在短期內可能是后果,但在長期來看,當政策作出反應時,經濟最終會出現類似的失業和通貨膨脹水平。Terry:這些主題出現這些主題出現:人工智能工
40、作或機器人接管勞動人工智能工作或機器人接管勞動,你認為在一段時你認為在一段時間內是不合法嗎?間內是不合法嗎?Hatzius:這些恐懼已經存在多年了,我認為我們可以說的一點是,到目前為止,他們還沒有真正得到證實。如果我們回到 19 世紀初,人們擔心機械化的紡紗機,這種想法會使大量的人失去工作。 在短期內,這種中斷可以產生重大影響。歷史上的技術進步導致了更高的失業率。但情況并非如此。我最好的猜測不是最終會有更高的失業率,因為最終人們會找到需要人類和人類勞動的東西。我的預期是,這可能是動蕩的影響,但我不認為這會讓我們失業率更高。Terry:在過去十年中在過去十年中,我們看到企業利潤越來越多地歸于回購
41、和股利我們看到企業利潤越來越多地歸于回購和股利,超超過了資本投資過了資本投資。 從宏觀經濟的角度來看從宏觀經濟的角度來看,是否存在一個閾值是否存在一個閾值,生產率需要推動生產率需要推動投資和資本嗎?投資和資本嗎?Hatzius:投資和生產力是聯系在一起的,因果關系是雙向的。 近年來,我們的投資水平相對較低,主要是周期性原因,因為經濟仍然有大量的剩余產能,在大衰退后資本存量不足。 沒有強大的經濟激勵來投資新產業。 我認為在慢慢修復,我們已經看到投資率在上升。在未來幾年中,商業投資對生產率增長的貢獻比 2010 年和 2011 年有所增加。另一個方面,生產率增長是投資的主要驅動因素, 這取決于在前
42、沿領域中的新發現。如果保持下去,那么還將有一個激勵性的投資。Terry:當我們看到生產率在歷史上有所增長時當我們看到生產率在歷史上有所增長時,通常如何影響企業利潤?通常如何影響企業利潤?當公司尋求競爭優勢或者我們實際上看到盈利能力的持續增長時,成本是否只當公司尋求競爭優勢或者我們實際上看到盈利能力的持續增長時,成本是否只轉移到收益表的另一部分?轉移到收益表的另一部分?Hatzius: 我對歷史證據的看法是, 最初生產率提高回落到公司的最低水平,但因為更多的參與者最終這些高回報遭到淘汰。 它可以持續一段時間,但在長期,如果市場機制運作,它將被競爭淘汰。Terry:在我們看到技術驅動的改進和效率的
43、程度上在我們看到技術驅動的改進和效率的程度上,你傾向于認為資產估你傾向于認為資產估值有什么影響?值有什么影響? 在在 90 年代,我們看到了一個與你正在談論的生產力相關的市年代,我們看到了一個與你正在談論的生產力相關的市場反應,這樣的東西有可能重復,讓我們看到這種生產力改善人工智能和機器場反應,這樣的東西有可能重復,讓我們看到這種生產力改善人工智能和機器學習?學習?Hatzius:就整體經濟而言,我認為如果你有證據表明生產力持續再加速,而且如果你發現近年來出現的許多恐懼,是由于于這種生產率的低速增長速度,我想你可能會看到股票價值的重估。特別是,保持一切相同,我們發現生產率增長更快的時期也意味著
44、資產估值更高的時期。 如果我們看看 20 世紀 90 年代,情況確實如此。發展到這個時期的盡頭確實會有大泡沫,后果相當痛苦。這些事情可能是暫時的,但我認為我們通常會看到重估。生態系統:云服務,開源是未來人工智能投資周期的主要受益者生態系統:云服務,開源是未來人工智能投資周期的主要受益者我們相信,利用人工智能技術的能力將成為決定未來幾年在所有主要行業我們相信,利用人工智能技術的能力將成為決定未來幾年在所有主要行業的競爭優勢的主要因素之一。雖然該戰略會因公司規模和行業而不同,管理團的競爭優勢的主要因素之一。雖然該戰略會因公司規模和行業而不同,管理團隊不專注于在人工智能領先,受益于產品創新和勞動效率
45、,資本杠桿風險不作隊不專注于在人工智能領先,受益于產品創新和勞動效率,資本杠桿風險不作考慮。因此,我們認為,企業需要投資這些新技術以保持競爭力,將拉動對人考慮。因此,我們認為,企業需要投資這些新技術以保持競爭力,將拉動對人工智能的人才、服務和硬件需求的增長。工智能的人才、服務和硬件需求的增長。作為對比,上世紀 90 年代的科技驅動的生產力繁榮推動了相應的繁榮。在技術上增加資本支出使得業務增加來衡量這筆資本支出。軟件、硬件和網絡公司不可避免地進行行業整合。下圖突出顯示軟件行業的這個模式。通貨膨脹調整后的市值在 2 億美元到 50 億美元間的公公軟件公司的數量在 1995-1999 年期間增長了近
46、兩倍,在新世紀頭個十年中期鞏固之前。圖 13:在快速增長的同時實現生態系統生產力的繁榮圖 14:風險資本投資在這十年有曲折變化我們看到潛在的與即將到來的人工智能驅動生產力的周期相關的熱潮, 隨著企業投資人工智能,價值創造在跨軟件,硬件,數據和服務供應商實現。正如圖14 強調的一樣,VC 資金進入人工智能相關的初創企業在這十年有較大的變化。企業人工智能投資未來繁榮的潛力也開始推動整合。 特別是云平臺已經在智能人才投入巨資,與谷歌、亞馬遜、微軟和 Salesforce 自 2014 年來聯合進行 17 個人工智能相關收購(圖 5)。我們在與歷史技術時期比較中也看到了一些人工智能和機器學習技術的發展
47、的好處。在過去的 50 年主要技術周期中,計算(穆爾定律)是抑制劑和進步的推動者。例如,在系統架構中,我們目擊了從大型機系統開始的演變之后,就將其轉交給了客戶端服務器模型, 并且最近已經開始被云/移動模式取代的時代。這種演變的驅動因素是計算以及存儲容量的提高, 它的每個轉變都伴隨著應用程序的變化,包括各種新的編程語言的出現和演變(見圖表 15)和可能的應用類型。在上下文中,AI 概念已經存在了幾十年,比如 20 世紀 60 年代出現的概念神經網絡,雖然它的計算能力不足以允許直到最近幾年的任何實際使用情況。我們相信我們在早期的 AI 平臺,類似于初始商業化的大型機在 20 世紀 50 年代和智能
48、手機和 21 世紀的云的商業化。還有平臺曲線彎曲成(我們認為發生的)一個爆炸應用程序,工具和服務啟動器的情況,我們將在下面更詳細地討論。圖 15:AI 進展可以與系統中的歷史技術演變相比較,雖然我們相信還在早期發展和采納階段,但是架構和編程語言的采用已經初見端倪。推動者正在沿著三個平面發展:推動者正在沿著三個平面發展:DIYDIY,服務和,服務和 AI-aaSAI-aaS如下面章節所述,我們開始看到領導者和投資出現在這三個平面:1.自我實現自我實現 - 具有才能和差異化數據的企業可能在機器學習能力上大量投資。 為了支持這些努力,我們正在目睹一個新的“AI 堆?!钡某霈F。 AI 堆棧具有類似的組
49、件:歷史計算堆棧:硅,存儲,基礎設施軟件,數據處理引擎,編程語言和工具。 因為通過下面,我們將發現 AI 堆棧的輸入主要是開源(來自提供者)的組合,如 Databricks,Cloudera,Hortonworks 和 Skymind)和服務提供云平臺如微軟,谷歌,亞馬遜和百度。2.咨詢服務咨詢服務 - 許多組織將有獨特的數據庫為內部使用,以及為客戶和合作伙伴構建 AI 服務。 因為 AI 人才是目前稀缺的資源,專業服務提供商正在出現以幫助彌合差距。 IBM,結合垂直和域特定服務專業知識以及其沃森集團內的技術專長。早期的領導者在這個市場。 較新的模型也正在出現。 Kaggle,作為示例,連接組
50、織與成千上萬的數據科學家,以幫助解決人工智能的相關問題。3. AI-a-a-serviceAI-a-a-service(AI-aaSAI-aaS) - 在我們稱為 AI-aaS 的類別里,我們看到很大的潛力和最新的市場創造。 AI-aaS 很可能在多個方面有所發展,但核心思想是: 深度學習系統,許多企業將改為接受經過培訓的深度學習系統而不是培訓自己。 AI-aaS 的一個例子是用圖像和谷歌 API 啟動 Clarifai。由于谷歌的大集合的圖像和 AI 人才,公司不太可能能夠訓練圖像識別模型比 Google 更準確。相反,開發人員使用圖像應用程序中的識別將每次調用 Vision API 圖像在
51、應用程序中需要識別。類似的 AI-aaS 產品可能是由具有獨特水平的 SaaS 供應商(如S)開發數據集(如銷售數據),面向數據和人才的創業公司是稀缺的(醫學成像是一個例子),和有公司可能對供應商,客戶或合作伙伴有價值的差異化數據。DIYDIY:云平臺和開源可能是人工智能的精選:云平臺和開源可能是人工智能的精選機器學習(特別是深度學習)仍然處于創新者或者說是早期,市場的采用者細分市場與人工智能的快速進展相比。 基于與公司和 VC 在空間討論,我們認為人工智能/機器學習被大量使用, 由互聯網公司, 以行業為中心的服務提供商 (如Broad 研究所)和更大的財富 500 強組織的尾巴(新興用例突出
52、顯示在我們的工業小插曲)。今天采用方面的最大障礙是數據和人才。但是,隨著企業的到來,更好地通過物聯網的數據收集和內部生成機器, 以及客戶數據和外部數據服務提供商的數量增長,數據采用障礙可能變得不那么令人生畏。 另外,作為人工智能/機器學習,學習技能差距擴大,大學畢業生結合相關技能,通過人工智能/機器學習,人工智能/機器學習咨詢公司的培訓,以及使過程自動化的更好的工具,可能出現填補空白。這是網絡,是我們相信大多數大型企業(或較小的,以數據為中心的企業)可能最終至少進行實驗人工智能和深度學習。由于在空間創新的步伐和技術發展的前景還不甚明朗, 機器學習的渠道仍然非常分散。然而,新興的“AI 堆?!迸c
53、大型機,客戶端服務器和當前時代分析中的分析具有相似之處和開發堆棧。正如下面“堆棧演化”圖中所強調的那樣棧的組件從工具到語言,到存儲仍然存在于當下。AI 堆棧和現有技術變化之間的主要區別在于:大部分機器學習的渠道嚴重依賴由云平臺供應商提供的開源技術和服務。 這種轉變的驅動力是多重的,但包括按需計算和存儲處理大量數據。微軟,亞馬遜和谷歌等云服務提供商的投資機器學習服務,以大開源為標準的開源,企業買家為了避免供應商鎖定并降低成本。編碼的演變以及它如何翻譯成 AIBlue =專有供應商,Orange =開源,Green =云服務(注意:一些供應商,如 IBM 和 Microsoft 包括專有和云服務G
54、PU 重用的深度學習是我們當前“AI 春天”的主要驅動因素之一。在人工智能/機器學習生態系統中,有兩個主要應用程序確定神經網絡的性能,每個神經網絡需要不同的資源設置。 第一個是構建和使用訓練算法。 訓練算法利用大的(通常是更大,更好的)數據集來找到相關性并建立一個模型,該模型可以在給定新輸入的情況下確定輸出的概率。培訓是非常資源密集型的,大多數現代培訓是在 GPU 供電的系統上完成的。一旦他們已經被訓練,使用模型和算法被稱為推斷。推斷需要少得多的計算能力,并且通常梳理通過更小的增量數據輸入集。給定推斷的單一目的性質,專門為該應用開發專用硅,稱為 FPGA(現場可編程門陣列)和 ASIC(專用集
55、成電路)。這種類型的集成電路最初是為原型 CPU 開發的,但是越來越多地被用于人工智能的推理。Google 的 Tensor 處理單元是專為人工智能和機器學習專門構建的 ASIC 的一個示例。 微軟也一直在使用 FPGA 芯片進行推理。 I 英特爾于 2015年收購了 FPGA 制造商 Altera,因為到 2020 年,三分之一的數據中心可以利用FPGA 實現特殊用途。公司看點公司看點:NVIDIA,Xilinx,Google,Intel(通過 Nervana)鑒于在內部和內部建立真正的 AI 或 ML 能力的成本 ,以及來自公共云提供商的改進選項,我們認為相對較少的企業將選擇構建內部部署解
56、決方案。這為Databricks(在云中提供 Spark 以及支持機器學習過程的一些工具)以及主要云平臺提供商等提供商創建了一個開放環境。來自主要平臺提供商的產品具有可比性,但存在一些關鍵差異,一個解決方案或另一個更適用于特定的使用情況。盡管有許多供應商提供基于 GPU 的云產品, 但我們的分析集中在那些具有最大擴展能力的產品,以及那些在與用戶的對話中被頻繁引用的產品。除了下面討論的內容,Nvidia 還列出了其 GPU 云計算合作伙伴: Aliyun, Outscale, Peer 1 Hosting, Penguin Computing, RapidSwitch,Rescale 和 IBM
57、 SoftLayer。亞馬遜亞馬遜 AWSAWS。亞馬遜的 P2 似乎(至少是在紙上)最主要的公共云提供商提供的最強大的基于GPU 的實例。最大的包括 64個CPU核心, 16個 Tesla K80 GPU,732 GiB 內存,預留實例價格為 6.80 美元/小時。P2.16xlarge 包括我們可以找到的最近的競爭對手提供的 4 倍的 GPU。除了原始實例,AWS 還提供 AmazonMachine Learning,一種用于生成 ML 模型并在云中執行訓練和推理功能的托管服務。亞馬遜 ML 包括 AWS 集成,數據可視化,模型評估和解釋工具,建模 API,常用用例的預構建算法,數據轉換和
58、用于批處理和實時預測的 API。微軟微軟 AzureAzure。微軟推出了新的 N 系列作為其最強大的基于 GPU 的實例。雖然目前只提供預覽,廣告內容包括 24 核,4 Nvidia Tesla K80 GPU,224 GB 的內存和 1.4TB SSD 磁盤。定價范圍大致取決于所選擇的操作系統,從 2.25 美金每小時的 Linux 到 11.66 美金每小時的 SQL Server。 Azure 機器學習也被作為Cortana 智力的保護下的管理服務營銷套件,具有類似于 AWS 的功能和工具。GoogleGoogle 云端平臺云端平臺(GCPGCP)。Google 目前正在針對 Clou
59、d ML 產品推出測試版。盡管技術規格不像 Azure 或 AWS 中的實例那樣容易公布, 但我們的客戶對話表明Google 的平臺(如果不是特別是 Cloud ML 實例)是高度先進的,為機器學習和人工智能使用提供了一個引人注目的平臺。 Google 利用其與 DeepMind 合作的技術及其在 TensorFlow 中的專業技術,提供全面的橫向解決方案,如圖像識別和翻譯解決方案。阿里巴巴阿里巴巴。2016 年 1 月,阿里巴巴的 AliCloud 宣布與 Nvidia 合作,推出中國第一個 GPU 加速的基于云的平臺。更多詳細信息缺乏,雖然公司和 Nvidia都承認這種伙伴關系,并將使用
60、Nvidia 的 Tesla K80 GPU。圖 16:多個云供應商已經針對使用 GPU 加速的機器學習應用程序引入了實例來自 Amazon AWS 和 Microsoft Azure 的人工智能/機器學習優化實例的技術規格和定價特別是對于深度學習,大量的數據提高了機器學習模型的性能。許多行業的數據增長已經達到了拐點。 例如, 在計算生物學中, 今天的可用數據量據 Broad研究所估計為 200 帕比特以上,并且比消費者網絡數據增長得更快。 Petabyte規模數據通常在以下兩種環境之一中進行評分:Hadoop 集群(在 HDFS 中)或云對象存儲服務(如 Amazon S3)。諸如戴爾 EM
61、C 部門(例如 Isilon)等供應商的橫向擴展存儲解決方案也可能在某些環境中使用。但是,我們認為開源或基于云的存儲服務可能會捕獲創建的大量增量數據。 這主要是由于這些選項相對于本地專有備選方案的低成本以及在云中靈活地擴展和縮小使用的能力。公司看點公司看點:Cloudera,Hortonworks,MapR,亞馬遜(S3),谷歌(谷歌云存儲),微軟,IBM(云對象存儲),戴爾/ EMC(Isilon,云對象存儲)消息,流處理和數據轉換是機器學習管道的關鍵組件。訓練模型時,在準備并饋送到神經網絡或其他機器學習框架之前,將數據流傳輸到存儲系統中。一旦創建了模型,來自傳感器,網絡或其他來源的“實時”
62、數據被流式傳輸并準備好由模型進行分析,然后實時分析數據(圖 17)。歷史上,ETL 供應商(例如Informatica 和 IBM)和消息傳遞供應商(例如 TIBCO)是流和流處理技術的提供者。 在過去五年里,情況發生了變化。在我們研究期間觀察到的大多數機器學習環境中,開源解決方案(如 Kafka,Storm 和 Spark)得到了大量使用。此外,還使用了諸如 Amazon Kinesis 和 Google Pub/Sub 之類的消息傳遞服務。即使對于神經網絡,數據需要準備。 例如,圖像和文本被標準化為相同的大小和顏色(圖像)或格式(文本)。 對于這些任務,可以編寫自定義代碼,或者可以使用 S
63、kyminds 的 DataVec 等工具。公司看點公司看點:Confluent(卡夫卡)、Databricks(Spark),Cloudera(火花流),Hortonworks(風暴,Spark Streaming)、亞馬遜(運動),谷歌(云DataFlow)、Skymind(datavec),IBM(流)、微軟(Azure 數據流)。圖 17:機器學習在生產中各種開源技術和云技術的應用管道數據庫/數據處理市場歷來是最大和最有利可圖的軟件之一。 例如, 2015 年,Gartner 估計數據庫市場規模為 359 億美元。標準普爾(OCL)中規模最大的公司之一(市值大于 1600 億美元)從其
64、數據庫產品中獲得了大部分利潤。在人工智能中, 正在使用一組新的技術。 首先, 神經網絡已經成為關鍵的數據處理技術。正如我們在“什么是人工智能”部分中解釋的,神經網絡通過節點處理輸入數據以創建輸出。 例如, 輸入可能是電子郵件或圖像, 輸出可能是 “垃圾郵件” 或 “cat” 。到目前為止,神經網絡的創建主要是通過使用各種框架(如 Google TensorFlow或 Caffe)的定制開發。云服務,如谷歌云機器學習也涌現,使開發人員和數據科學家能夠在云中構建神經網絡。Spark 作為處理技術的使用是我們與風險投資公司和公司討論中的一個常見主題。Spark 仍然是增長最快的開源項目之一(目前擁有
65、超過 10 萬個 Github的明星) , 并且已經收到了來自 IBM, Cloudera, Hortonworks 和 Databricks (其中有大部分是項目提交者)的大量投資。公司看點公司看點:Cloudera(Spark)、Hortonworks(Spark),Databricks(Databricks),谷歌(谷歌云機學習),微軟(Azure 機器學習),Amazon(亞馬遜機器學習),IBM(沃森)人工智能和機器學習仍處于早期階段。 這意味著定制開發仍然是創建生產應用程序和工作流的主要途徑。機器學習和數據科學的語言是 Python 和 R.Python 還沒有被貨幣化。 在 R
66、生態系統中, 微軟 (收購了 Revolution Analytics)和 RStudio(開源提供商)是主要的供應商。圖 18:機器學習管道的主要開源項目支持公司和適用性風險投資適用的項目在分析的歷史中,出現了工具,使企業能夠從數據中提取價值,而不依賴于定制開發。 高級統計工具(如 SAS 研究所和 SPSS),BI 解決方案(如Microstrategy 和 Business Objects),報告解決方案(例如 Crystal Reports)以及最近的數據可視化提供商 (如 Tableau) 已經通過提高業務分析師的生產力,供支持商業用途的數據科學家使用。機器學習工具開始出現,加速了數
67、據科學家的生產力。一個例子是微軟的Azure 機器學習解決方案,它為數據科學家創建一個拖放界面來創建機器學習工作流程。來自 SAS 的數據科學家關注的工具還提供工具,以支持開發和部署各種機器學習庫。公司看點公司看點:SAS(SAS Enterprise Miner)、畫面、微軟(Azure 機器學習) ,亞馬遜(亞馬遜機器學習),谷歌(云機學習),Databricks。咨詢服務:貨幣化的技能差距咨詢服務:貨幣化的技能差距正如我們在本報告中提到的,人才仍然是機器學習采用的主要障礙之一。這創造了系統集成商的重大機會,如 IBM、埃森哲和德勤。應用機器學習也提供了傳統的技術供應商和大型咨詢企業的機會
68、(如 IBM 或者 Teradata),去更有效地利用開源技術(通過咨詢解決方案)。在下面的圖 19 中,我們描繪了機器學習人才的競爭。IBM,華為,埃森哲和德勤是最積極地雇用機器學習人才的公司。值得注意的是,由于機器學習人才仍然稀缺,較小的初創咨詢公司很可能實現規?;?。 在云計算中出現了類似的模式,出現了較小的咨詢公司,如 Appirio,Bluewolf 和 Fruition Partners(最終被大型 IT 咨詢提供商收購)。圖 19:IT 服務提供商的機器學習招聘LinkedIn 招聘與“機器學習”其他業務模式也正在出現,以縮小技能差距。 作為一個例子,Kaggle 通過托管比賽來實
69、現機器學習。 數據科學家可以贏得獎金, 練習 “真實世界” 數據集,構建機器學習組合。企業能夠獲得人才來解決問題,而不必大量投資于機器學習團隊。AI-aasAI-aas:可能是創造新市場的最大驅動力:可能是創造新市場的最大驅動力雖然我們預計許多公司將投資于 DIY 的人工智能,創造增長,我們看到在AI-aaS 最有活力和新業務創造的潛力。因為大型, 獨特的數據集是相對有限的,稀缺的人工智能人才可能合并到這樣的數據集,在我們看來,這似乎不太可能,大量的企業在五年內建立自己的神經網絡。 我們認為更可能的情況是,大量的AI 服務提供商出現:1)可以訪問唯一的數據集; 2)由于訪問獨特的數據集,吸引了
70、創造人工智能服務增值服務所必需的人才。AI-aaS 產品通常通過 API 提供。 最基本的例子是一個開發者想要添加圖像識別功能到其應用程序。開發者不是通過水平 AI-aaS 提供者(例如 Clarifai,Google 或 Microsoft)訪問 Image API,而是獲取大量數據集的圖像并訓練模型。當在應用中使用語音識別時,對云中的 API 進行調用,并且通過訓練的機器學習模型來對圖像進行分類。圖 20:ai-as-a-service(AI-AAS)景觀機器學習 API 正在開發以解決水平和垂直用例我們看到 AI-aaS 的市場至少沿著三個方面發展,如下面強調的和上面的圖表 20 所示。
71、廣泛的水平廣泛的水平 AI-aaSAI-aaS(圖像,語音,文本等)(圖像,語音,文本等)谷歌和微軟都提供用于語音,翻譯和圖片識別的 API,每月每千次 API 調用只需 0.25 美元(圖 21)。開發人員可以利用這些 API 將 AI 功能嵌入到他們的應用程序中。對于核心水平 AI(如 NLP 和圖像識別),我們認為大型云平臺提供商處于最佳位置,因為他們擁有大數據集,能夠實現更準確的 AI 服務,并能夠根據實際消費者數十億用戶來優化其結果。公司看點公司看點: 谷歌, 微軟手表, 臉譜網, IBM, Amazon, Clarifai, it.ai, Valossa圖 21:水平 AI-AAS
72、 產品的供給定價云平臺的 AI AAS 產品樣本狹義的狹義的 AI-AASAI-AAS(客戶流失,員工保留等)(客戶流失,員工保留等)對于更重要的水平,如 CRM(領先評分),人力資源(人才保留)和制造(預測性維護),我們認為 SaaS 供應商定位良好,因為 SaaS 供應商可以獲得大量的差異化數據。Workday,S,Zendesk,Oracle,SAP 和 IBM 是最終可以競爭狹義 AI-aaS 用例的供應商。 我們談到的大多數 SaaS 供應商都投資于數據基準測試和分析產品,認為他們的數據是長期進入的壁壘。Salesforce 已經成為機器學習人才最積極的收購者,在過去 18 個月發生
73、 4項人工智能相關收購(圖 5)。公司看點公司看點:IBM、SAP、Oracle、Salesforce、Workday,Zendesk,HubSpot,Shopify,Ultimate Software,ServiceNow垂直特異垂直特異 AI-AASAI-AAS(醫療成像,欺詐預測,天氣預報等)(醫療成像,欺詐預測,天氣預報等)垂直特定的 AI 即服務可能推動更多的多樣性。 大型行業巨頭可以匯總數據,構建機器學習模型,并向合作伙伴,客戶和供應商銷售模型。初創公司可以在特定用例的垂直領域(如醫療成像)構建獨特的數據集,并使醫院網絡能夠訪問API。零售或廣告領域的行業聯盟可以匯集數據,以更好地
74、與更大的競爭對手競爭(例如,零售商可以匯集數據,更好地與亞馬遜的推薦引擎競爭)。IBM 一直是醫療保健領域開發垂直特定 AI-aaS 能力的早期領導者。在過去兩年里,IBM 已經花費超過 40 億美元收購了一些醫療保健技術和數據公司。 這些收購的結果是大量的醫療保健數據 (IBM 在其健康云中有超過 3 億患者記錄) 。通過這些醫療保健數據(以及通過合作伙伴收集的其他數據)及其收集的沃森技術,IBM 開始提供針對腫瘤學,臨床試驗和基因組學使用案例的服務。 在醫療保健垂直行業,其他創業公司也采用類似的方法(如下面的圖 22 所示)來解決醫學成像,藥物發現和診斷中的難點。圖 22:醫療保健中的垂直
75、 AI-aaS中國人工智能的現狀中國人工智能的現狀據艾瑞咨詢,該國的人工智能市場估計將從 2015 年的 12 億人民幣增長到2020 年的 91 億人民幣。 2015 年,中國的人工智能(AI)大約流入了 14 億元人民幣(同比增長 76)。在政府政策方面,中國國家發展和改革委員會(國家發展和改革委員會)與其他相關政府機構一起,于 2016 年 5 月 18 日發布了“互聯網+人工智能”三年實施方案。實施計劃闡述了六個支持人工智能發展的具體領域,包括資本融資,系統標準化,知識產權保護,人力資本開發,國際合作和實施安排。該計劃的目標是到 2018 年在中國建立基礎設施和創新平臺,行業系統,創新
76、服務體系和人工智能的基本行業標準化。發改委預計,中國人工智能行業將與國際發展同步,引領全球市場人工智能技術的應用。中國已經采取了重大舉措,提及“深度學習”或“深層神經網絡”的期刊文章數量,中國在 2014 年超過了美國(圖 23)。中國的人工智能研究能力也令人印象深刻(圖 24),因為具有世界領先的語音和視覺識別技術。2015 年 11 月由百度開發的 Deep Speech 2 能夠達到 97的準確性,被 MIT Tech Review 評為2016 年前十大突破性技術之一。 此外, 早在 2014 年, 香港中文大學開發的 DeepID在 LFW(野生標簽面孔)中的面部識別準確度達到了 9
77、9.15。圖 23:提到“深度學習”或“深層神經網絡”的期刊論文圖表 24:引用“深度學習”或“深層神經網絡”至少一次的期刊論文中國互聯網巨頭百度、阿里巴巴和騰訊(BAT)是中國人工智能市場中的領先者,而數百家初創企業也在滲透該行業,并在各種 AI 領域和應用領域建立服務模式。目前,在中國人工智能領域涵蓋:1)基本服務,如數據資源和計算平臺;2)硬件產品,如工業機器人和服務機器人;3)智能服務,如智能客戶服務和商業智能;4)技術能力,如視覺識別和機器學習。根據艾瑞咨詢,語音和視覺識別目前分別貢獻了中國人工智能市場總量的60和 12.5。 在中國的人工智能相關公司中, 71專注于開發應用程序。
78、其余的 55正在研究計算機視覺,13在自然語言處理,9在基礎機器學習。在我們看來,在人工智能前沿的關鍵參與者可能繼續在美國和中國。機器人:用戶界面的未來機器人:用戶界面的未來機器人是潛在的范式轉移。在以機器人為中心的世界中,用戶體驗從基于點擊的轉換到對話(文本或語音),以及從網絡或面向消息或面向語音平臺的交互轉換。換句話說,用戶不需要打開三個不同的應用程序來預訂旅行,購買衣服和參與客戶服務,而是可以同時通過信使參與與提供幫助的機器人的交談。因此,我們看到電子商務,客戶支持,員工工作流程和生產力方受到廣泛影響。過去 12-18 個月的一個關鍵驅動因素是大型云和互聯網公司創建和開源機器學習框架。2
79、015 年下半年,谷歌公司推出了 TensorFlow,一個機器學習算法庫,亞馬遜和微軟也一直活躍,發布云服務來支持自己的機器學習項目。我們預計這種趨向民主化的機器學習將繼續促進智能機器人的發展,因為主要參與者(亞馬遜, 谷歌, 蘋果, 微軟) 期望在他們各自的生態系統整合對話界面 (Alexa,谷歌助理,Siri,Cortana)。 繼今年三星收購 Viv 之后,我們預計將在三星的設備和智能手機生態系統中進一步整合基于 Viv AI 的數字助理。自然語言處理(自然語言處理(NLPNLP)。機器人的承諾是植根于他們的智能和過程自然語言的潛力。因此,機器人興趣的興起與機器學習的興趣和創新的興起與
80、自然語言處理(NLP)的人工智能領域的技術,或計算機理解,操縱和從語言的意義的推導相關。與類似于基于硬編碼規則集構建的 CTRL + F 函數操作的字處理器相反,NLP 利用機器學習算法來基于大量訓練數據來學習規則,然后可以將其應用于新的文本集。機器學習的核心原則適用于 NLP 系統所獲取的數據越多,其應用程序就越準確和更廣泛。雖然 NLP 的早期應用已經用于文本挖掘(例如,法律文件,保險政策和社交媒體的分析)和自動問答應用中,但是神經網絡和深度學習模型的進步正在允許NLP 系統變得越來越聰明并且管理困擾人類語言的歧義。谷歌在 TensorFlow,SyntaxNet 中實現的 NLP 的開源
81、基礎利用神經網絡來消除左到右處理中的模糊性,只有在發現了其他更高等級的假設時才丟棄潛在的假設。因此,根據谷歌的說法,SyntaxNet 模型是一些在 TensorFlow 框架內曾經訓練過的最復雜的模型。消息平臺消息平臺。 機器人的興起與諸如 Facebook Messenger,WhatsApp 以及企業中的 Slack 和 HipChat 等消息應用的快速增長同步。 消息應用程序提供了一種媒介,通過它,機器人可以與 iOS,Android 和網絡上的用戶進行交互。此外,更大的消息應用正在發展成支持多種交互類型的平臺。在 Slack 上,企業用戶可能與團隊合作,監控應用程序,創建待辦事項列表
82、或從同一接口監控費用。在Facebook Messenger 上,用戶可以與朋友聊天,提出品牌的支持問題,或從同一界面叫 Uber。最近的聊天機器人收購或亞馬遜(Angel.ai CEO)和 Google(API.ai)的部分收購,每一個都專注于會話界面技術,突出了公司和投資者在聊天和自然語言過程能力的聯合中看到的機會 。根據 Pitchbook 的數據,自 2013 年以來,私人消息公司在人工智能/ 機器學習,電子商務,SaaS 和網絡安全方面投入約 120億美元的累計風險投資資金,而在 8 年前則約為 20 億美元。圖 25:跨信息風控基金(百萬美元)在一些受益者正在出現的情況下機器人激增
83、。 第一組受益者是消息平臺臉譜網,Slack,微信等。機器人增加了參與度,并創造了在這些平臺上推動商業的機會。第二類是硬件和基礎設施提供商,其范圍從 GPU 提供商(NVIDIA)到開源供應商,數據平臺供應商和云服務提供商,如亞馬遜,谷歌和微軟,亞馬遜處于一個獨特的位置,因為它的能力可以滿足電子商務需求。 其他正在利用BOT 功能的軟件提供商包括 Zendesk 和 S 等軟件提供商,他們將機器人視為自動化企業客戶服務的潛在手段。圖 26:Slack,FB Messenger 用戶的增長企業和消費者信息平臺的興起個人數字助理個人數字助理: 許多公司已經使用復雜的算法, 機器學習和大數據軟件來創
84、建基于過去一段時間的行為和客戶數據的推薦引擎。這些引擎影響購買行為,但是大部分相同的技術被用于個人數字助理的工程中, 或者具有基于語音命令來完成或自動化簡單任務的能力的機器人。使用語音識別軟件將推薦引擎的復雜預測和推斷功能合并,產生了蘋果的Siri,亞馬遜的 Alexa,谷歌助手和微軟的 Cortana。利用機器學習和云基礎設施,這些應用程序在收集關于用戶的更多信息時改進:語音模式,興趣,人口統計,消費習慣,日程,職業,喜歡和不喜歡。大多數(如果不是全部)這些信息通??梢酝ㄟ^軟件監控一個人使用智能手機或連接設備(Amazon Echo,GoogleHome)來收集。隨著這些數字個人助理訪問更多
85、的數據,分析應該允許他們區分來自不同用戶的類似請求, 變得越來越個性化。 例如, 指令 “給我看最好的相機”對不同的消費者可能意味著不同的東西。 與用戶數據相結合的強大的分析引擎可以幫助確定用戶是否喜歡最便宜的攝像機,最高評價的攝像機,或者等于對于該個人“最佳”的特征的某種其他組合。我們看到數據聚合和分析的持續創新推動了人工智能數字助理的改進。 我們還期望像亞馬遜和谷歌這樣的系列創新者繼續消除購買過程中的摩擦點(Echo,Echo Dot),并進一步完善日常任務(谷歌首頁)。用例用例農業農業到到 20252025 年市場值將達到年市場值將達到 200200 億美元億美元我們認為,機器學習有可能
86、增加作物產量,減少化肥和灌溉成本,同時有助于早期發現作物/牲畜疾病,降低與收獲后分揀相關的勞動力成本,提高市場產品和蛋白質的質量。當我們看到用于收集土壤,天氣,航空/衛星圖像,甚至聽覺數據的傳感器的擴散,我們認為,從深度學習算法對這些 PB 級數據集產生的洞察將提前告知(有時)種植時間,灌溉,施肥和家畜護理,并導致在農業范圍內增加土地,設備和人類生產力。如果數字農業中使用的所有已識別的技術將被優化或完全由機器學習/人工智能提供,我們假設該價值創造的 25累積到機器學習/人工智能鏈中的供應商,這意味著 TAM 為 600 億美元,到 2050 年將會有一個 1.2 萬億美元的農作物市場。 假設在
87、該時間段內 TEM 線性變化, 意味著到 2025年大約 200 億美元的 TAM。什么是機會?什么是機會?有的生產和產量損失可以通過在農業中的機器學習應用減少勞動力費用。 在美國玉米生產中,我們的研究團隊已經確定了從精確肥料到壓實減少的技術,他們相信這些技術可以在 2050 年將玉米產量提高 70。重要的是,他們的研究中確定的每一個創新都是通過機器學習和人工智能實現的(圖 27)。我們已經確定了農業中的幾個具體領域, 在這些領域我們特別受益于機器學習和人工智能技術的應用。例如,農民商業網絡是一個組織,其匯總關于種子性能,農藝實踐,投入品價格,產量基準和其他農民提交的數據的數據,以利用深度分析
88、來提高產量。利用傳感器,天氣,土壤,甚至無人機/衛星圖像數據,機器學習可以根據當前和預期的天氣模式,作物輪作對土壤質量的影響,幫助農民優化施肥,灌溉和其他決定,幫助確定最佳做法。對空間圖像的分析可以比人類觀察更快更有效地幫助確定作物疾病,例如大豆銹病,早期處理可以防止收成損失。相同的模式識別技術可以用于在家畜動物中識別疾病和跛足 (影響運動性和整體健康的腿/腳/蹄的感染或損傷)。最后,我們看到了使用視覺圖像和自動分揀設施來替代人類檢查員沿著產品和肉類產品的分級和分類線的應用。圖 27:確定用于提高作物產量的所有涉及機器學習和人工智能應用的創新美國玉米產量驅動因素什么是難點?什么是難點?農作物產
89、量受次優施肥,灌溉和農藥的抑制。農作物產量受次優施肥,灌溉和農藥的抑制。在高盛研究報告精確農場:用數字農業欺騙馬爾薩斯(2016 年 7 月 13 日)中,發現了幾個問題,可以通過收集適當的數據和執行適當的分析來解決。這是至關重要的,因為在 2050 年,為預計世界人口提供飼料需要增加 70的作物產量。增加人工成本增加人工成本。 農業歷史上轉向技術創新以抵消勞動力成本, 我們認為機器學習是這一演變的下一步,特別是在收獲后/屠宰分揀過程中,其中大多數對產品和肉類產品的目視檢查仍然由人類工作者完成。根據勞工統計局的數據,在美國,53k 個人被雇用為“分級和分揀機,農產品”,每年的勞動力成本約為 1
90、3億美元。根據 BLS 數據,“農藥處理者,噴霧器和施藥器”在農業中代表另外13 億美元的勞動力成本。由于動物疾病造成的損失由于動物疾病造成的損失。我們估計,由于乳牛中可預防的跛足,全球乳品業的年損失超過 110 億美元。學術研究表明,在乳汁流失,生育力下降和治療成本之間,跛足使乳牛場成本每年達到 175 美元,每年每 100 頭奶牛發生 23.5 例,這意味著當全球有 2.5 億美元的奶牛時,成本將超過 110 億美元。目前的經營方式是什么?目前的經營方式是什么?絕大多數農場都很小,但大多數農田是由大型農場控制的。 根據聯合國糧農組織的數據,全球 72的農場面積小于 1 公頃,而只有 1的農
91、場大于 50 公頃,這些大型農場控制著 65的全球農業用地。超過 10 公頃的農場絕大多數存在于像美洲和歐洲這樣更發達的地區(兩者之間的 73),而亞洲占小于 10 公頃的農場的達 85。 因此,世界上大多數農田都能獲得基礎設施和經濟發展,使得能夠使用精確農業技術,只要這些技術在財務上可行的。圖 28:小農場是發展中國家的常態圖 29:發達國家的農業經營的規模即使在經濟發達國家,精確農業仍處于早期階段。比如,灌溉仍然通過溢流或其他形式的表面灌溉進行,這是最低效率和最低技術先進的方法之一。在作物種植的主要領域,目前的技術包括:l 肥料:天氣和現場監測和毯子應用。l 種植:多種子的播種,變率播種和
92、作物輪作種植。l 農藥/除草劑:衛星和無人機圖像已在目標區域的一些大規模作業中使用。使用毛毯應用的小型操作。l 灌溉:淹沒式和其他表面灌溉,中央樞軸噴頭,灌滴系統和混合灑水/滴灌系統。l 收獲/分類:玉米和小麥等作物的大部分收獲已經實現了大型農場機械化。一些分類已實現自動化(按大小和特色)。隨著美國建立農民商業網絡(FBN),我們還看到農業數據民主化的到來。FBN 是一個獨立的業務, 農民可以匿名訂閱并提交農場數據。 在分析過程中, FBN使用聚合農場數據為單個成員農民利用產量,時間,天氣和其他數據生成預測報告。在畜牧業和乳制品業中,目前的技術包括普遍應用抗生素或其他預防性藥物,接種疫苗,撲滅
93、病動物,以及化學平衡的飼料添加劑。此外,黃牛作業也采用足浴預防和治療蹄疾病及感染。圖 30:在美國,近一半的灌溉農田是通過洪水或其他表面灌溉灌溉的這是最低效的和最低技術的方法之一人工智能和機器學習如何助力?人工智能和機器學習如何助力?機器學習使用大型數據集來優化單個或一組最終目標的能力有利于解決農業中的問題,如作物產量,疾病預防和成本效率。在收獲后分揀和農藥應用中, 我們認為 M 機器學習/人工智能可以降低成本,提高效率,在美國境內創造 30 億美元的年度勞動力儲蓄。根據我們的估計,全球數字可能會超過這一數字的兩倍。最后,我們認為,機器學習/人工智能應用可以改善育種和健康狀況,單單從影響動物兩
94、種常見疾病出發,奶牛養殖價值創造可以達到約 110 億美元(在收回失去的潛在收入和絕對成本降低之間),以及20 億美元的家禽生產。提高作物產量提高作物產量。 人們已經在利用幾乎所有行星可用的農業用地, 聯合國預計到 2050 年全球人口將達到 97 億。因此,有必要提高作物產量,以滿足未來全球對糧食的需求。機器學習可用于分析來自無人機和衛星圖像,天氣模式,土壤樣品和濕度傳感器的數據,以幫助確定種子種植,受精,灌溉,噴灑和收獲的最佳方法。圖 31:機器學習幾乎在每一個精準農業報告(2016 年 7 月 13 日出版)提到的創新中都起著重要的作用玉米產量通過技術的潛在改善收獲后分揀勞動收獲后分揀勞
95、動。 我們看到一個簡單的案例研究,日本黃瓜農夫應用谷歌的 TensorFlow ML 技術自動化排序他的黃瓜的過程。這個過程以往需要大量手動/視覺檢查的人工成本。 使用簡單,廉價的硬件,包括樹莓派處理器和普通網絡攝像頭,農民能夠利用 TensorFlow 訓練一個算法,可以將黃瓜分成 9 類,具有相對較高的準確性,幾乎消除了與分揀相關的人工成本。 我們認為類似的應用可以擴大規模,用于具有高分揀需求和成本的農產品,如番茄和土豆。家禽群疾病檢測家禽群疾病檢測: 在一項學術研究中, 研究人員收集和分析了雞的聲音文件,假設他們的聲音會因生病或痛苦而改變。 在收集數據和訓練神經網絡模式識別算法后, 研究
96、人員能夠正確識別感染了兩種最常見的致死性疾病之一的雞,在疾病2 天后精確度為 66,8 天后精確度為 100 的疾?。▓D 32)。在損失發生之前盡早正確診斷動物并治療可以減少行業專家估計的由疾病導致的 20 億美元的損失。圖 32:實驗表明,機器學習可以通過聽覺數據分析正確識別其他不可檢測的疾病,減少由于某些可治愈疾病造成的損失量化機會量化機會基于產量,作物投入成本節省,乳品/畜牧成本節約,分揀和勞動力節約的潛在增長,我們認為機器學習可產生超過 1 萬億美元的價值。在農業中,我們認為機器學習/人工智能可以幫助提高作物產量的 70的增長。在 Jerry Revich 的精確農業(精確農業:數字農
97、業欺詐馬爾薩斯,2016年 7 月 13 日發布)中,數字農業的 TAM 被確定為 2,400 億美元,假設各種技術供應商的價值增長為 30??紤]到數字農業中使用的所有已識別的技術將被優化或完全由機器學習/人工智能提供,我們假設該價值創造的 25累積到機器學習/人工智能鏈中的供應商,這意味著在作物種植應用中 TAM 達 600 億美元。在蛋白質農業中,我們認為機器學習(精確育種機制,疾病預防/治療)的應用可以產生另外一個 200 億美元。圖 33:來自先進技術的全球作物產量的潛在增長可以在作物農業中產生超過 8000 億美元的增值美國東部時間,通過技術提高全球農作物價值(單位,百萬美元)美東時
98、間圖 34:人工智能和機器學習可以減少潛在的超過 110 億美元的虧損美國東部時間,奶牛跛足的損失(單位:百萬美元)誰會占下風?誰會占下風?我們認為機器學習有可能根據灌溉,化肥,勞動力和疾病預防/治療的成本節約,以較低的單位成本擴大作物,乳制品和牲畜的全球供應。我們預期化肥和農藥/除草劑/殺菌劑以及獸醫藥品的全球市場會受惡性影響, 因為機器學習應用限制了農業中的浪費和改進預防方法(限制了治療方法的需要)。我們相信,這種影響大部分是長期的(5 年以上),因為這些技術大部分仍然處于早期發展階段,早期采用者的成本相對于其他潛在的改進機制有時候讓人望而卻步。農民經營網絡農民經營網絡我們與聯合創始人兼首
99、席執行官我們與聯合創始人兼首席執行官 AmolAmol DeshpandeDeshpande 以及以及 FBNFBN 工程團隊的成員工程團隊的成員進行了交談進行了交談。 FBNFBN 是一個由是一個由 2,8002,800 多名成員農民組成的網絡多名成員農民組成的網絡,覆蓋覆蓋 10001000 萬英畝萬英畝的農田,匯總從農民和農場設備上傳的數據,使農場數據民主化,并使成員農的農田,匯總從農民和農場設備上傳的數據,使農場數據民主化,并使成員農民能夠利用它進行定價,種子選擇和產量優化民能夠利用它進行定價,種子選擇和產量優化 。問題問題農業中的不對稱信息導致農民做出關于種子選擇,肥料選擇/應用和其
100、他業務的重要方面的決定, 而沒有廣泛了解哪些選擇在近年來在其所在地區產生了最高產量,或者甚至價格是否與其他農民看到的一致。農民也受到供應商的偏見。FBNFBN 解決辦法解決辦法數據的匯總和分析數據的匯總和分析:農民每年支付 500 美元(多年折扣),以獲得 FBN 會員資格。 農民可以從他們的設備和系統上傳數據,包括種子類型數據,土壤數據,收獲/產量數據,以及地理位置和海拔數據等。FBN 還聚合來自其他公共來源的數據,包括政府和天氣數據。FBN 使用機器學習來分析,清理和分析數據,以便為個體農民提供參考,為個體農場量身定制,幫助他們選擇最佳投入和農場管理策略,以實現產量和生產力的最大化。融資融
101、資:FBN 也開始了對自助金融服務的試驗,利用來自實際農場的歷史和預測數據來確定信用度。沒有運行信用檢查,FBN 是否能夠達到 97%以上的回報率。采購采購:從化學品開始,FBN 開始為網絡農民提供采購服務。鑒于 FBN 獲得大量投入定價數據集,可以代表數千名農民以更大規模進行采購,該公司相信它可以更好地定價和降低投入成本,同時在每次交易中獲得 9%的傭金。早幾個月的平均票面規模為 45000 美元。圖 35:FBN 的初始目標是利用數據和機器學習提前告知農民做出決定數據聚合與使用周期圖 36:最終目標是取代采購,銷售和金融從業者金融服務金融服務到到 20252025 年每年節省成本年每年節省
102、成本 3434 億至億至 430430 億美元,并創造新的收入機會億美元,并創造新的收入機會機器學習和人工智能在金融服務領域具有廣泛的應用,因為存在強大的,豐富的數據集,通知投資決策和信用風險特性,說明了有利于使用算法提高數據效率的環境。 機器學習技術在人類驅動等效時間的一小部分時間內利用模式識別的能力為獨特數據的采購和分析提供了機會,從而更準確地為投資決策提供信息。此外,商業銀行提供廣泛,全面的專有財務數據為人工智能/機器學習在減少一般銀行部門成本方面提供了機會。保守地說,我們相信機器學習和人工智能可以在 2025 年之前每年獲得大約 34-430 億美元的成本節省和新的收入機會, 并且這個
103、數字會進一步上升,因為這些技術可以使得更快,更復雜的數據得以利用和執行。什么是機會?什么是機會?投資潛力最大化投資潛力最大化。我們認為,具有相對技術杠桿的資金管理公司(即量化對沖基金)最適合利用機器學習技術利用競爭性利潤機會。將深度學習算法與應用程序加速器相連接的最新進展提高了識別數據乃至圖像集趨勢的速度和效率, 為希望在信息和執行杠桿中獲得競爭優勢的公司提供了明確的前進方向。在數據方面,我們認為人工智能/機器學習可以為分析投資決策提供重要的優勢,為降低成本和打入新的利潤池創造機會。在執行方面,2015 年交易的 1.7萬億美元以上的股票股票突顯了大量機會,交易公司利用微小的延遲窗口,其中最新
104、的安全價格存在于原始交易所,但不是整合的市場系統,我們認為人工智能/機器學習可以產生有意義的差異。我們相信,通過利用具有成本效益的硬件加速器和模式識別功能,人工智能/機器學習可以對數據質量分析,采購和執行速度產生重大影響,2015 年前每年從更好的知情投資決策以及第十場的快速反應中獲得 190 億至 280 億的收益。降低信用風險降低信用風險。 對于傳統的貸款機構,我們相信機器學習和人工智能潛在地降低信用風險,識別處于風險中的賬戶,并執行可以減少這些機構的資產負債表和貸款損失準備金的信用額度減少或抵消。 即使在退稅率相對較低的環境下,根據聯邦儲備委員會, 每年增加的消費信貸額度也導致了約 60
105、0 億美元的消費信貸相關費用,到 2025 年,可以使用人工智能/機器學習將其減少 19%。降低合規性和監管成本。對于金融服務公司,如社區銀行和大型投資銀行,我們估計合規相關員工成本每年高達 180 億美元。 雖然許多公司在過去幾年中的合規成本增加了 50或更多,但我們認為人工智能/機器學習有可能降低行業的成本負擔。包括降低信用風險,我們認為人工智能/機器學習可以在 2025 年前為金融服務部門每年提供約 150 億美元的成本削減機會。什么是難點?什么是難點?今天,企業面臨著資源分配困境,即在不斷發展的技術中平衡員工薪酬和資本投資,目的是擴大“好數據”的使用,以產生資本回報和壓縮成本。以下是我
106、們認為阻礙公司有效利用數據的三個難點:執行速度執行速度。資產管理者,特別是在技術市場運動交易的高頻交易者(HFT)的主要難點是,在高流動性和快節奏的市場保持競爭力,毫秒級決定了回報潛力的巨大差異。 例如,在 2014 年,等待時間套利窗口的中位數長度幾乎是一個整數秒,并顯著減少了面臨套利或 HFT 策略的資金管理者的急劇增長。數據訪問數據訪問。在基本面方面,由于測量限制,地緣政治限制和分析成本約束,我們認為各種有用的數據是不可靠的或不可實現的。 高技術壁壘阻礙了資產管理者獲得新穎,及時和更準確的數據的競爭優勢。成本的二元性成本的二元性。我們認為,過去十年中數據清理,分析和執行的勞動成本為資產管
107、理運營利潤率保持在 40以下起到了重要作用。此外,程序化加速硬件的啟動非重復工程(NRE)成本歷史上為利用技術來提高競爭力提供了成本障礙。諸如現場可編程門陣列(FPGA)等更低成本選擇的可用性和靈活性的提高為人工智能/機器學習過程提供了更多可利用的途徑。目前的經營方式是什么?目前的經營方式是什么?人力資本驅動成本人力資本驅動成本, 風險管理結構風險管理結構。 對于今天的許多大型資產管理公司來說,創造收入的員工成本占創造收入的 1/3 到 1/2 之間, 因為員工負責篩選強大的數據集, 管理評論和研究觀點, 做出有利于客戶的知情投資決策。 為了同樣的效果,傳統貸款機構的貸款官員通常負責批準和監督
108、信貸周轉箱和可能出現的違約的定期貸款,其總體責任是盡量減少固定的貸款損失。在投資和社區銀行,不斷變化的監管環境增加了需要人力資本的合規工作的資本支出。市場依賴于預定的主要來源數據發布來衡量綜合市場依賴于預定的主要來源數據發布來衡量綜合 ROICROIC。由于大數據訪問的低障礙和通過在線渠道的相關一次性市場事件的低延遲傳播, 投資者分配大量的勞動力和資本以有效地清理數據集,獲得專有邊緣,并對快速變化的情況做出快速反應。然而,無論這些專有優勢如何,資金管理者最終都依賴于主要源數據發布(例如每周 EIA 石油庫存數據,公司收益報告)來衡量預測隨后的市場變動以及所產生的 ROIC。人工智能人工智能/
109、/機器學習如何助力?機器學習如何助力?機器學習的應用可以快速監控和處理健壯的數據集, 以尋求分析或執行特定的最終目標,特別適合高頻交易公司,傳統資產管理和傳統貸款機構。執行速度執行速度。具有 HFT 焦點的資產管理者面臨來自競爭對手日益增長的壓力,因為不斷發展的技術采用減少了對技術和一次性基本市場催化劑的反應時間。 延遲套利是資金用于在市場之前僅僅幾分之一秒獲得交易信息的一種做法, 通過增加諸如 ASIC 和 FPGA 之類的硬件加速器來減輕。企業能夠以兩種不同的方式減少延遲。首先,他們能夠在交易所共同定位交易服務器,減少物理距離,并更快地獲取相關貿易數據。第二,這些公司能夠從原始交易進貨中獲
110、取數據,并比傳統數據合并過程更快地檢索全國最佳出價/報價(NBBO)價格(圖 37)。公司可以在具有明顯優勢的市場之前接收數據,并且我們相信機器學習算法具有在延遲時間段更快速和準確地識別和執行價格擴展的潛力。圖 37:延遲套利提供早期 NBBO 訪問人工智能和機器學習促進數據捕獲和執行數據訪問數據訪問。 隨著技術演進促進傳統資產管理者獲取大數據,企業越來越試圖在行業中找到競爭優勢。數據分析公司進入市場以捕捉未開發的機會。例如,一些公司正在利用來自衛星的數據,捕獲關于股票,商品價格,甚至全面經濟的信息的區域的圖像。對于像 Cargometrics 和 Orbital Insight 這樣的公司,
111、這些圖像包括運輸模式,以通知商品價格以存儲停車場,并分別通知零售商的客戶增長率。 有幾家公司正在建造自己的火箭并預訂未來的小型衛星以進行有效載荷發射,而 SpaceFlight 等公司則通過與世界各地的發射載波提供商合作來保證發射。利用機器學習/人工智能的數據分析公司利用諸如卷積神經網絡(CNN)的算法的圖像識別能力來擦洗用于世界特定區域中的特定特征的圖像數據。 以這種方式,他們能夠更快速和準確地定制敏感,偏遠和密集區域的數據,并打包它以通知具體的市場趨勢。 風險投資公司 Deep Knowledge Ventures 是對大數據的行業承諾的最好例證,最值得注意的是,在 2014 年它向其董事
112、會指定一個名為VITAL 的數據分析算法。圖 38:衛星數據周期人工智能和機器學習創建優勢,優于傳統的數據收集OrbitalOrbital InsightInsight(軌道透視):在衛星圖像分析中開創性地使用(軌道透視):在衛星圖像分析中開創性地使用 AIAI我們與我們與 OrbitalOrbital InsightInsight(一家位于加利福尼亞州帕洛阿爾托市的數據分析一家位于加利福尼亞州帕洛阿爾托市的數據分析公司)進行了交流,該公司匯總了來自公司)進行了交流,該公司匯總了來自 8 8 個衛星提供商的衛星圖像數據,并使個衛星提供商的衛星圖像數據,并使用人工智能技術加快資產管理者的市場適用
113、性。用人工智能技術加快資產管理者的市場適用性。問題問題:資產管理公司面臨著日益激烈的競爭環境,因為技術進步普及了數據的獲取,并加速了市場對一次性事件的反應。當企業尋求利用市場低效率的方法時,許多相關的數據源仍然沒有被利用(即衛星圖像,航運運動),或者無法有效地商業化而用于市場。OrbitalOrbital InsightInsight 解決方法解決方法:軌道使用衛星數據來分離圖像,指示特定的市場趨勢。 無論是聚合油桶蓋上的陰影形狀以通知商品價格還是量化主要零售商的零售流量模式,該公司的分析解決方案利用了大量數據集,通常在傳統收集指標無法覆蓋的領域,并且訓練機器學習算法,來快速打包與所需解決方案
114、相關的數據。雖然該公司指出,圖像數據本身是公開可供購買的,但它利用專有機器學習的能力超越了僅僅是學術用例, 這對于創建有關數據對投資者的影響的差異化洞察是至關重要的。該公司表示當今利用衛星圖像的困難, 因為衛星到任何特定的位置的訪問從15-30 天不等。 這需要將圖像的相對捕獲時間的變異性以及控制變量中的其他相關偏移歸一化。然而,最近與 Planet Labs 的合作關系使得公司能夠獲取數據集,為下一年世界各地提供每日圖像,因為納米衛星隊將進入軌道。Orbital 通過 50-60 專有神經網絡分類器來強調它的價值主張,其基本上是在“訓練集合”上訓練的算法,來尋找和識別興趣點和關于興趣點的特定
115、特性。該公司估計,他們的深度學習算法現在達到了 90-95的精度,通過使用可靠的數據集(即 EIA 油儲存數據)進行比較來驗證人工智能預測。云與人工智能的交匯減少了瓶頸云與人工智能的交匯減少了瓶頸: 隨著 Orbital 擴展規模獲得越來越多的圖像數據,它正在利用亞馬遜網絡服務(AWS)云平臺臨時存儲數據,同時也被分析??紤]到圖像的潛在存儲障礙,特別是與 Planet Labs 合作,該公司表示,它將依靠 AI 系統快速高效地更新數據, 并在項目完成后平衡圖像庫存的一致流入/流出。圖 39:微型分析通知零售趨勢圖 40:石油存儲水平信用風險降低信用風險降低。 沖銷阻礙了商業銀行資產負債表和現金
116、流, 我們估計每年約有 600 億美元與消費信貸有關?;?Khandani 等人的報告(通過機器學習算法的消費者信用風險模型,MIT,2010 年 6 月 10 日),我們認為人工智能/機器學習有可能迅速識別循環信用額度(RLOC)中的風險,并讓數據顯示的可能拖欠的賬戶執行限額減少或抵銷。研究表明,他們的機器學習模型能夠預測 RLOC 中的信用違約率,線性回歸為 85%,突出了機器學習應用于洗錢和信用數據。我們進一步認為,除了使用典型指標外,機器學習可以幫助貸款人員確定信用度,從而對非循環消費貸款做出類似貢獻。在欺詐檢測方面,諸如 AIG 和 Stripe 這樣的私人支付公司正在使用機器學習
117、進展來更好地通知和確定欺詐活動索賠和交易中的模式。減少合規成本減少合規成本。在合規方面,小型社區銀行和大型投資銀行都在加大支出,對行業面臨的新法規保持警惕。根據摩根大通最近的年度報告,公司在 2011 年至 2015 年期間將合規支出增加了 50, 達到 90 億美元。 同樣, 花旗集團在 2014年表示,合規員工人數增長到 3 萬,占員工總數的 12以上。我們認為人工智能/機器學習可以在減少執行某些任務所需的員工開銷方面產生有意義的影響。對于 Digital Reasoning,一家位于納什維爾的私人分析公司,開發機器學習技術,以提供主動合規分析,完成任務,如篩選員工的電子郵件可能不合規的內
118、容,并檢測違規,如市場操縱等未經授權的交易交叉違規。數據訪問和 ROI。為了說明利用人工智能/機器學習獲得全面的專有數據對ROI 潛力的潛在影響,我們對石油期貨投資和 2011 - 2016 年隔離的前端石油期貨合約價格進行了分析。使用合同價格數據,我們發現在 EIA 石油儲存數據發布(星期三,每周)當天,石油期貨市場的波動率增加了 14。鑒于從采油 ML 容器,鉆機,船運和生產設施的高清圖像數據獲得的價值和觀察, 沒有地理或地緣政治約束,我們認為金融服務行業有機會利用數據驅動的市場事件使用機器學習。 石油期貨市場數據釋放的波動是一個例子,說明如何使用更好的數據來為投資決策提供信息,并提供更好
119、的回報潛力。量化機會量化機會我們估計人工智能我們估計人工智能/ /機器學習有可能在機器學習有可能在 20252025 年之前為金融服務行業每年節年之前為金融服務行業每年節約大約約大約 340-430340-430 億美元的成本和創造新的收入機會,隨著相關技術在復雜性和億美元的成本和創造新的收入機會,隨著相關技術在復雜性和復雜性方面不斷發展,這個數字會進一步增大。復雜性方面不斷發展,這個數字會進一步增大。我們量化人工智能/機器學習每年在未開發的延遲套利機會中貢獻了 65 億美元到 150 億美元,130 億美元來自更高效的數據訪問導致的資產管理器運營成本降低,每年約 20 億美元來自合規性成本降
120、低,以及每年約 130 億美元來自傳統貸款機構的年度減免。潛伏套利潛伏套利。 為了量化美國股票市場的潛在套利潛力,我們利用了 Elaine Wah的學術研究(如何普及和盈利是美國證券交易所的延遲套利機會,密歇根大學,2016 年 2 月 8 日)。根據研究人員,2014 年 495 SP 500 股票的總延遲套利利潤為 30.3 億美元,每個股票每天有大約 69 個套利機會。根據這個分析,我們發現這樣的利潤相當于每股交易的 3/10,而推算到 2016 年總估計美國股票交易量時,盈利水平為 65 億美元。假設股票數量增長與 2014-2016 年水平保持不變(10的年復合增長率),這意味著到
121、2025 年年收入 150 億美元。圖 41:潛伏套利利潤到 2025 年為 65 億-150 億美元,取決于股權總量的復合年增長率資產管理成本降低資產管理成本降低。 波士頓咨詢集團指出, 資產管理公司營業利潤占凈收入的百分比在近年來保持在 39,2007 年達到 41,2014 年利潤達到 1020 億美元。我們認為,引入人工智能/機器學習數據訪問和分析(如我們的小衛星案例研究所強調的) 將緩慢地使得對沖基金和其他資產管理者以比數據采購成本的增長更快的速度減少勞動力需求。所有其他條件相同時,我們預計未來十年資產管理行業的運營成本將下降 5,或每年增加 13 億美元。這意味著該行業在 2025
122、年之前每年可以節省 130 億美元的成本, 并且在假設對沖基金利潤在未來幾年保持基本持平??紤]到資產管理者利用人力資本的水平,我們認為人工智能/機器學習可以使運營利潤高于我們在 2007 年看到的水平。圖 42:資產經理營業利潤率占凈收入的百分比停滯不前我們期望邊際效應能通過人工智能/機器學習增加傳統貸款人風險降低傳統貸款人風險降低。在 Khandani 等人關于機器學習和消費者信用風險的文獻之前,研究人員表示,他們的循環式消費信貸違約的機器學習模型意味著收費成本節約了 6%到 23%??紤]到機器學習在我們看來只能用于貸款的前端,我們仍然更接近這個范圍的保守末端(隱含成本約為 8),我們在機器
123、學習應用中增加了非循環貸款, 而并非在整個付款時間表加入循環信貸情況。 然而, 到 2025年,隨著技術在外部年代越來越復雜,我們的隱含成本節約增加到 19。假設每個類別中的違約概率相等,四分之一的退款來自循環信用,另外四分之三來自非循環(NR)信用協議?;谶@些假設,我們預計到 2025 年,人工智能/機器學習每年為傳統貸款機構節省成本約 130 億美元。圖 43:消費信貸持續增長商業銀行沖銷已穩定在 600 億美元圖 44:機器學習可以減少貸款損失我們估計到 2025 年每年成本減少 130 億美元減少合規成本減少合規成本。 我們估計社區銀行和大型投資銀行每年總共支付約 180 億美元的合
124、規相關員工成本。 根據美國聯邦儲備委員會對 21 世紀社區銀行業的研究,社區銀行(資產不到 100 億美元的銀行)在 2015 年支付了超過 30 億美元,而我們估計最大的 10 家投資銀行的支付額不到 140 億美元。我們假設每個合規員工的平均工資為每年 69,000 美元, 并認為人工智能/機器學習可以減少合規員工成本的 10,因為銀行合規工作的一部分由機器學習驅動?;谶@些假設,我們認為到 2025 年,人工智能/機器學習可以為銀行公司的合規成本削減貢獻約 20億美元。誰會占下風?誰會占下風?有資本限制和傳統資產管理實踐的公司可能會受到干擾, 因為適應性公司更多地投資于競爭性人工智能/機
125、器學習交易硬件和新的專有數據庫。由于這些公司在縮小市場無效率差距方面減少了延遲, 因此對于僅依靠人力資本進行研究的公司和技術市場運動/一次性基本市場催化劑交易的公司可能沒有太多空間發展。在批準貸款(即信用評分)時,具有繁重信用審批流程或依賴于少量信用度量標準的公司可能會受到開始使用人工智能/機器學習的競爭對手的影響。由于機器學習算法減少/消除了前沿公司的風險信用額度,這些客戶可能越來越多地嘗試從沒有機器學習應用的傳統機構接受貸款,這些公司的違約率將更高。醫療保健醫療保健到到 20252025 年每年節約成本年每年節約成本 540540 億美元億美元機器學習在醫療保健領域具有廣泛的應用,如豐富的
126、,定義明確的數據集應用, 隨時間的監測的需要以及結果的廣泛的可變性, 為藥物發現, 測試分析, 治療優化和患者監測服務。 隨著機器學習和人工智能的整合,有機會顯著推動藥顯著推動藥物發現和開發過程,每年減少物發現和開發過程,每年減少 260260 億美元的成本,同時使得全球醫療信息價值億美元的成本,同時使得全球醫療信息價值超過超過 280280 億美元億美元。什么是機會?什么是機會?藥物發現和開發藥物發現和開發。 通過在整個開發過程中結合機器學習過程而產生的潛在效率增益不僅可以加快時間范圍, 還可以通過增加到達后期試驗的藥物的成功概率(POS)來提高研發支出的回報。Medicxi Venture
127、s 的合伙人 David Grainger認為,避免假陽性發現率,根據他的一個主要的統計驅動現象,可以將后期試驗的風險降低一半。此外,在早期藥物發現中稱為高通量篩選的當前虛擬篩選方法非常容易受到這種類型的統計誤差的影響。 減少昂貴的第三階段試驗的風險可以產生數十億的儲蓄,并影響超過 900 億美元的研發支出在最大的制藥公司的回報,釋放資源以尋找更好的潛在機會。雖然與晚期試驗相關的大量成本經常集中在臨床試驗設計元素中, 但我們相信在整個人工智能/機器學習實施的后期階段也可以實現顯著的效率增益,以優化關于選擇標準,大小和研究長度的決策。醫生醫生/ /醫院效率醫院效率。部分由于監管和分割的驅動,美國
128、的醫療保健系統歷史上一直在采用新技術較為緩慢。除了系統的挑戰,新發現與醫生和診所提供新藥物或治療方法之間的時間往往較長,且不一致。根據透明度市場研究公司的數據,到 2023 年,全球市場預計將達到約 300億美元,其中美國政府作為“美國復蘇和再投資法案”的一部分,最近的授權推動了電子健康記錄。獨立醫院的長期衰落創造了一個數據聚合的機會,利用在歷史上不可能達到的規模的數據改進。 這反過來使得機器學習算法和人工智能能力提高在醫療保健的各個領域的速度,成本和準確性。圖 45:供應商整合社區醫院衛生系統圖 46:電子健康記錄市場全球擴張谷歌的 DeepMind 部門總部設在倫敦, 正在與英國國家衛生服
129、務 (NHS) 合作,建立一個旨在監測腎臟疾病患者的應用程序,以及一個以前被稱為“患者救援”的平臺,旨在支持診斷決策。任何人工智能/機器學習系統的關鍵輸入是大量的數據, 因此 DeepMind 和 NHS 達成了一個數據共享協議,為 DeepMind 提供了連續的新數據流和歷史記錄,用于訓練算法。這種對臨床數據的實時分析只有在大量數據的情況下才可能實現,盡管 DeepMind 提供的有效無限訪問患者數據遠遠超出了腎臟疾病范圍。什么是難點?什么是難點?藥物發現和開發藥物發現和開發。 醫療保健中的一個重要的難點是藥物發現和開發的時間和成本。根據塔夫茨藥物開發研究中心的數據,新療法平均需要大約 97
130、 個月才能從發現到達到 FDA 的批準。雖然專注可以減少時間,但是成本也繼續穩步增長。德勤發現,在 12 家大型制藥公司中,開發批準資產的成本自 2010 年以來增長了33,每年約為 16 億美元。研發回報研發回報。 生物制藥的研發生產力仍然是一個爭論不休的話題。雖然開發成功藥物的成本增加了,由于報銷的不利因素,較少的患者和競爭,收入依舊無法被回報改善。雖然我們預計 2010-2020 年與 2000-2010 年的回報率會有所改善,但變化是微不足道的。此外,最重要的回報阻礙之一仍然是失敗的資產,特別是到達后期階段,我們估計年度成本超過 400 億美元。圖 47:20 年和 10 年總回報率總
131、回報比率(累積收入除以 GAAP 研發支出)醫生醫生/ /醫院效率醫院效率。當新的藥物和治療之間的批準,醫生開始實現患者的需求時,獨特的醫療挑戰仍明顯滯后。因此,許多在醫療保健領域工作的機器學習和人工智能專家繼續鼓勵主要提供商將現代機器學習工具集成到他們的工作流程中,這些工具可以充分利用了今天收集和發布的大量醫療數據。存在機器學習和 AI 的機會,減少發現和應用之間的時間,還能優化治療。例如,2009 年北美放射學會對肝膽(肝,膽囊)放射學的研究發現,23的第二意見是診斷要有變化,機器學習公司側重于醫學成像的問題有機會得到解決。此外,像 Deep Genomics 這樣的公司,使用機器學習來識
132、別基因組水平的疾病,提供更有針對性和有效的治療。圖 48:大型生物制藥 10 年研發支出 VS FDA 批準目前的經營方式是什么?目前的經營方式是什么?目前的藥物發現和開發業務是一個廣泛的研究,測試和批準的過程,可持續10 年以上。來自塔夫茨藥物研究中心的上市時間分析報告,藥物從第一階段推進到 FDA 批準,平均需要 96.8 個月。新治療的發現是一個獨特的挑戰,不僅是因為所需的時間長度,而且還因為各個發展階段的 POS 低值。藥物發現最初開始于識別了目標。 一旦識別了目標,高通量篩選(HTS)通常用于“發現”。 高通量篩選(HTS)是由機器人進行的自動化的,昂貴的過程,機器人試圖通過進行數百
133、萬次測試來確定這些“點擊”,以查看哪些化合物顯示出目標的潛力。然后,過渡到先導生成,其中它們被優化以找到先導化合物,然后在進行臨床前藥物開發之前對其進行更廣泛的優化。 該整個過程可以在藥物達到階段 1 之前持續 1-3 年,在該段時間里僅具有 20的成功概率。l 第一階段:強調安全;健康志愿者(POS 20%)。l 第二階段:關注有效性;有某些疾病或條件的志愿者(POS 40%)l 第三階段:收集關于不同人群,劑量和組合的安全性和有效性的進一步信息。范圍從幾百到數千志愿者(POS 60%)。圖 49:藥物發現和研發時間線人工智能和機器學習如何助力?人工智能和機器學習如何助力?機器學習和人工智能
134、在醫療保健行業中的優勢和用例范圍很廣。 不僅是由數據而非人類的理解或直覺驅動的決策,決策和預測能夠考慮超出人類能力的因素。 深度學習特別展示了獨特的潛力,因為它可以利用在不同任務中學到的知識提高其他任務的績效。減少藥物發現失敗并增加減少藥物發現失敗并增加 POSPOS。 大量資本投入造成巨大的機會成本,去探索被認為具有大約 20成功概率(POS)達到一期試驗的治療。因此,迄今人工智能/機器學習幾乎完全在學術界應用,努力開發有效和準確的虛擬篩選方法,以取代昂貴和耗時的高通量篩選過程。谷歌和斯坦福研究人員最近利用深度學習努力開發虛擬篩選技術, 以取代或增加傳統的高通量篩選(HTS)過程,并提高篩選
135、的速度和成功率。通過應用深度學習,研究人員能夠跨越多個目標多個實驗,促進信息共享?!拔覀兊膶嶒灡砻魑覀兊膶嶒灡砻?, 深層神經網絡優于所有其他方法深層神經網絡優于所有其他方法特別是, 深層網絡大大超越了現有的商業解決方案。在許目標上,它實現了接近完美的預測,這讓它適合用于虛擬篩選裝置??傊?,深度學習提供了建立虛擬篩選作為藥物設計管道中的標準步驟的機會?!保∕assively Multitask Networks for Drug Discovery,2015 年 2 月 6 日)默克在 2012 年主辦了一項 Kaggle 挑戰,旨在確定虛擬篩選的統計技術,并開始測試深度學習和人工智能的應用,特
136、別是通過與公司 Atomwise 合作啟動人工智能藥物發現。Atomwise 最近利用人工智能技術進行了培訓,像化學家一樣分析藥物,以了解如何安全地將現有的藥物重新用于治療埃博拉病毒。該分析評估了 7,000 種現有藥物,在不到一天的時間內進行。 根據公司的統計,以往這項分析需要花費數月或數年才能完成。提高醫生提高醫生/ /醫院效率醫院效率。應用機器學習的早期成功已經讓我們看到了診斷的改善(Enlitic,DeepMind 健康),分析放射學結果(斑馬醫學視覺,Bay 實驗室) ,基因組醫學(深基因組學),甚至使用人工智能治療抑郁癥,焦慮, 和 PTSD(Ginger.io)。由于健康數據的數
137、字化和數據聚合,健康數據變得更易于訪問,人工智能/機器學習不僅可以減少與過程任務相關的成本,而且還可以通過歷史上不同數據集通信改善算法。最終,人工智能/機器學習超出人類能力的考慮問題的能力使得供應商以更高的效率診斷和治療。麻省理工學院麻省理工學院- -哈佛大學哈佛大學 BroadBroad 研究所:在基因組學和抗癌中使用研究所:在基因組學和抗癌中使用 AI/MLAI/ML麻省理工學院-哈佛大學 Broad 研究所,一個非營利的生物醫學和基因組研究中心坐落在馬薩諸塞州的劍橋,處于學術界和工業的交叉點。通過與哈佛和麻省理工學院的合作,該中心促進了跨不同領域的合作研究,旨在發布其研究結果或將其授權給
138、生物技術或制藥公司。 根據 BroadBroad InstituteInstitute 首席數據官,心臟首席數據官,心臟病學家和病學家和 GoogleGoogle VenturesVentures 合作伙伴合作伙伴 AnthonyAnthony PhilippakisPhilippakis 的說法,最終,該中心的目標是產生人們可以用來推進其科學議程的結果。我們接下來強調以下幾個關鍵要點:機會,挑戰機會,挑戰。Broad 研究所現在在其基因組研究的某些領域運行人機測試。到目前為止,匹配算法沒有錯誤,并且還減少了一組人的工作量。然而,數據或結果可能涉及倫理或政治問題時人類依然需要參與。雖然不缺少人
139、工智能/機器學習用于挽救生命或發現生命的案例,但是根據Philippakis 先生找到合適的商業模式來支持最終目標是主要的挑戰。 目前,醫生要求每天根據記住的事實和首字母縮略詞來確定治療路徑, 做出改變生命的決定,這是在臨床護理中人工智能/機器學習的重要應用的一個領域。然而,因為償還決策支持工具和激勵開放這種人工智能/機器學習一體化所需的衛生數據還沒有趕上,依然存在很大的障礙。技術堆棧技術堆棧。Broad 是 Google Cloud 的大用戶,擁有大量的平臺開放源代碼,因為該研究所的團隊旨在在 Spark 框架中構建內容。 盡管這些技術仍然處于轉型階段,但是云供應商的發展很快,因為他們是唯一
140、能夠匹配增長水平的公司。此外, 根據 Philippakis 先生的說法,許多云供應商正在為基因組學建立專門的團隊,盡管進化仍然處于“ML-as-a-Service”產品的學習曲線的開始階段。數據,數據,數據數據,數據,數據。Broad 研究所每月生成大約一個 PB 的數據,每 8 個月的倍增一次。因此,該研究所正在與像 Cycle Computing 這樣的公司合作,以擺脫傳統的數據處理方法。結構化數據帶來了重要的后續機會,該研究所還推動其他數據和分析標準發展, 如基因組分析工具包 (GATK) , 提供了各種各樣的工具,專注于變異發現和基因分型。理想情況下,Broad 的科學家將分析基因組
141、數據與 EHR(電子健康記錄),以了解特定細胞系和癌癥之間的關系, 但是目前 EHR 世界中存在有限的激勵機制無法開放和共享,因為大多數激勵機制存在數據披露風險。也就是說,Philippakis 先生看到 Broad 在未來的一個大多數開放的基因組數據的世界,而不像其他的旨在囤積數據。量化機會量化機會藥物發現失敗的成本藥物發現失敗的成本。 我們通過實施機器學習和人工智能, 在以下假設下分析將藥物開發發現相關風險減半的影響:l 核準資產的平均年度開發成本為 16 億美元,包括與失敗資產相關的成本(德勤)。l 來自失敗資產的300億美元年度成本可以平均分配給分析隊列報告的批準資產數量,或 43(德
142、勤)。FDA 在 2015 年報告了 60 個批準,這意味著,根據每個批準的資產失敗成本(2015 年約 6.98 億美元),將近 420 億美元分配給失敗的資產。我們認為機器學習和人工智能可以將發展過程的風險減半,到到 20252025 年全球制藥行業每年可節年全球制藥行業每年可節約約 260260 億美元億美元。圖 51:人工智能和機器學習可以減少 260 億美元的開發成本加速從轉向電子健康記錄的收益增長。僅在美國,衛生信息技術人員今天的年度薪酬就約為 70 億美元。 由于人口老齡化和政府向數字化轉型需要部分驅動,根據 BLS,健康信息技術人員的工作前景預計將在 2014-2024 年間達
143、到高于平均水平的增長,在所有其他職業中增長 15%vs.增長 7%。然而,考慮到自動化和替代通過軟件在職業內的許多任務, 我們認為機器學習和人工智能可能取代幾乎所有這些工作。健康信息技術人員根據 BLS 確保報銷和研究的患者健康數據的質量的準確性, 可訪問性和安全性, 同時利用技術來分析患者數據, 以提高護理和控制成本。醫療行業中人工智能/機器學習的擴散可能會對這類職業產生嚴重影響,我們根據人均衛生支出和全球支出份額估計,人工智能/機器學習可以通過以下方式在2025 年前減少全球年度成本超過 280 億美元。圖 52:人工智能和機器學習可能取代幾乎所有衛生信息科技(HIT)的位置誰會占下風?誰
144、會占下風?我們相信機器學習和人工智能有潛力大幅度改變大藥房景觀和醫療系統更廣泛, 基于成本節約和 POS 改善,使得整個藥物發現和開發以及提供者和設施的效率改進。我們期望,長期內,機器學習和人工智能技術的激增,增加藥物開發中的競爭,因為時間縮短和失敗資產的損失下降。此外,效率提高和自動化可能會讓醫療專業和公司占了下風,這些醫療專業和公司對解釋結果和診斷與實際交付護理或執行手術(例如放射科醫生,提供第二意見的專家,以及行政或支持人員)指數過多。我們認為,大多數的影響是長期的, 因為許多技仍然處于早期開發階段,并且早期采用者的成本相對于其他改進機制讓人望而卻步。存在的挑戰存在的挑戰雖然人工智能/機
145、器學習在醫療保健領域的機會跨越了許多子行業,但仍然存在障礙。l 成本成本。作為人工智能/機器學習的必要成本可能是令人望而卻步的,特別是在醫療保健中,護理成本仍然是焦點。確保機器學習算法,利用好的數據的投資,需要大量資本和專門技術,單憑計算能力非常昂貴。l 可解釋性可解釋性。組合多個數據集的算法可以產生一些黑盒。以前一直受到嚴格監管的醫療保健行業可能會推遲人工智能/機器學習應用的進步。l 人才人才。障礙也可能來源于能夠應用人工智能/機器學習和解釋結果的人才集中。2013 年,谷歌支付超過 4 億美元收購 DeepMind 科技;根據新聞報道,一個團隊大概有十幾個成員。 這種人才的合并以及由此產生
146、的成本可能會令人望而卻步。l 數據數據。雖然政府規定美國電子記錄數字化,但將紙密集型系統轉變為完全電子化的過程仍然存在挑戰。 此外, 雖然許多已經達到 “有意義的使用” 的標準,但是重要的患者數據的碎片化和可獲得性的缺乏可獲得性可能阻礙進展。l零售零售到到 20252025 年每年節省成本年每年節省成本 540540 億美元,年收入億美元,年收入 410410 億美元億美元雖然離線到在線轉換已經證明了許多傳統零售類別的挑戰, 但電子商務的出現也為零售商帶來了大量的客戶數據。然而,最重要的問題仍然存在。企業如何利用他們手頭的數據來更好地為客戶提供服務并賺更多錢?成功的早期跡象為廣告技術的激增,使
147、零售商能夠更有效地定位網絡上的客戶。今天,零售商利用歷史上不同的數據集,不僅優化廣告,還優化庫存管理,需求預測,客戶管理和趨勢外推。我們看到人工智能/機器學習通過預測需求,提高每年價值為 540 億美元的勞動效率,同時優化定價,并在 2025 年之前在全球范圍內實現 410 億美元的服裝和鞋類的年度銷售提升。什么是機會?什么是機會?零售作為一個部門正在導航重大的長期趨勢,因為千禧一代成為主要購買者, 消費者習慣與在線購買。雖然零售商迄今為止在不同程度上取得了不同程度的成功,但是人工智能/機器學習為全渠道和純粹電子商務零售商提供了一個機會, 從購買轉移在線和技術改進時積累的大量客戶和產品數據中獲
148、得預測。在我們的研究中,我們確定了跨越零售價值鏈的人工智能/機器學習的關鍵領域的機會。雖然推薦引擎不是電子商務中的新現象,但傳統技術面臨著一定的局限性,我們認為人工智能/機器學習可以超越,為銷售和內容數據提供更深入,更準確的見解。此外,自然語言處理(NLP)人工智能系統實現更直觀和相關的商業搜索以及對話。此外,將人工智能/機器學習整合到批發和零售采購的早期階段以及后期銷售階段,可以通過更精確的需求預測和以優化定價改進銷售,從而提高勞動力和庫存效率。圖 53:全球電子商務圖 54:電子商務滲透2015 年整體普及率 8%什么是難點?什么是難點?預測需求和趨勢預測需求和趨勢。 零售業中最大的挑戰之
149、一是適當地引導趨勢和衡量需求水平。 特別是在服裝行業,設計師和買家通常在商品上貨架兩年前確定未來時尚趨勢。當前的預測模型是有限的,在自動化,解釋需求驅動程序和歷史數據的限制等領域不足。存貨管理存貨管理。 庫存管理仍然是一個問題,因為各個系統的復雜程度和協調水平在價值鏈中的成員之間往往是不同的。效果是昂貴的,因為庫存過剩和缺貨可能對零售銷售產生顯著影響。 截至 2015 年春季的一年里,超過 630 億美元的零售銷售損失歸因于缺貨,超過 470 億美元是由于庫存過剩(銷售發生在零售商虧損的價格點),根據 IHL 集團的一項研究。門店數量和規模門店數量和規模。無論是總量或人均的零售面積,仍然是零售
150、商的摩擦點。2015 年,美國的零售面積達到 76 億平方英尺,人均 23.5 平方英尺,2005 年分別為 67 億平方英尺和 22.8 平方米(圖 55)。隨著電子商務繼續滲透傳統類別,如電子和服裝,新的類別如 CPG 為更大的股份轉移提供了機會,進一步加劇了剩余零售空間的影響。圖 55:美國人均零售空間目前的經營方式是什么?目前的經營方式是什么?當前的經營方式的特點是一個廣泛的價值鏈,可以分為 4 個部分:生產,倉儲,分銷和零售。雖然這四個步驟提供了一般意義上的一個過程,但是在這每一個桶內,通??梢哉业礁郊拥牟襟E或中間體。其結果是,從制造到銷售的系統合并,可能導致庫存過剩,缺貨和資源分配
151、效率低下,特別是在旺季。也就是說,物流和庫存管理過程在近幾十年來有了顯著改善, 因為已經采用了更多的技術和系統, 比如即時制造系統。像 UPS 這樣的第三方物流供應商也采用了高級分析來優化路線和包裹管理這是我們在未來看到 AI 潛力的另一個領域。然而,目前的經營方式仍然存在挑戰,特別是在時尚,服裝和鞋類等類別中,預測消費者將需要什么,什么價格仍然有難度。人工智能人工智能/ /機器學習將如何助力?機器學習將如何助力?推薦引擎推薦引擎。人工智能/機器學習有潛力通過利用銷售,客戶和內容方面的巨大數據集來深化推薦引擎功能。早期電子商務的第一個機會是推薦引擎,盡管大多數功能主要基于產品屬性,但對客戶的偏
152、好知之甚少。諸如協作過濾的技術通過利用客戶偏好和品味中的已知相似性來提供對未知偏好的預測。然而,諸如數據稀疏性或新的用戶/項目“冷啟動”問題的限制和可擴展性仍然是當用戶快速增長并且計算資源的消耗水平變得不切實際時的問題。像Zalando和 StitchFix 這樣的公司已經開始通過機器學習將銷售和內容數據與消費者偏好相結合,因為 Zalando 認為客戶關系將最終推動銷售??蛻糁С挚蛻糁С?。自然語言處理(NLP)和圖像識別也給零售業提供了機會,以改善客戶支持度并擴展傳統搜索的參數。最近的收購,如 Etsy 收購黑鳥技術公司,使用人工智能的圖像識別和 NLP 提供更大的搜索性能的公司, 表明電子
153、商務公司正在尋求方法提高結果的相關性,并更好地利用他們的平臺。NLP 還為企業提供了提供對話用戶體驗和商業的機會。最近的 Alphabet 收購 API.ai,公司如 Angel.ai 正在創建人工智能系統,圍繞自然語言處理,通過語音和消息傳遞來獲取客戶支持。簡而言之,NLP 和圖像識別技術通過模擬人類的理解和利用歷史上無法獲得的產品屬性(例如,視覺)來提供更相關的結果和服務。需求預測和價格優化需求預測和價格優化。 機器學習和人工智能技術有潛力整合客戶接觸點的數據和內容,從而更準確地預測新項目和需求。在可以快速進入和退出的服裝等類別的行業中預測需求已經成為零售行業長期存在的挑戰, 特別是考慮到
154、某些類別的設計和生產。通過利用人工智能/機器學習,零售商可以識別模式,更好地了解促銷和價格彈性在本地的影響,并將學習納入營銷和生產過程。像亞馬遜這樣的公司已經朝這個方向邁出了一步,在 2013 年末收到了“預期包裹運輸”專利。雖然原始文件沒有提到機器學習,但顯然這種類型的系統最終可以通過深度學習實現考慮季節性需求,天氣,人口統計的獨特的用戶購物模式。圖 56:人工智能/機器學習用傳統方法預測頭對頭關鍵優勢:單算法,利用多項目歷史,跨過程優化dunnhumby: 跨越定價、促銷和忠誠度整合人工智能跨越定價、促銷和忠誠度整合人工智能/機器學習機器學習dunnhumby 是全資英國子公司, 樂購跨國
155、的雜貨店, 通過和品牌和零售商打交道優化零售經驗。 該公司擁有超過 2000 人, 專注于全球范圍內的數據分析,以提供庫存管理,價格優化,促銷和個性化的意見。從歷史上看,預測銷售是一個相當靜態的分析,根據歷史數據和反動的調整進行。今天,dunnhumby 將人工智能/機器學習與整個價值鏈整合,精度不僅在銷售預測,也在庫存管理和價格優化。最終,更好地預測零售業價值鏈的多米諾效應與分層人工智能/機器學習增量驅動效率在庫存和定價可能降低成本降低成本,幫助零售商如 Tesco 提高銷量提高銷量。l 銷售預測銷售預測。銷售預測歷來是非常規則驅動,dunnhumby 創造的機器學習方法引入到預測過程會有更
156、加準確的通知模型。l 360 度客戶視圖度客戶視圖。優質客戶數據是最重要的發展客戶的 360 度視圖?,F在圖像占所有新數據的 80%左右,因此從圖像中提取有用數據的能力是商品化的關鍵。通過建立一個 360 度視圖,零售商正在尋找更有效的渠道來確定目標客戶。l 花費和保存優化花費和保存優化。對于許多零售商來說,一個關鍵的促銷工具是“花錢和節省”的報價。零售商通過調整折扣和消費門檻已經看到顯著的性能改進。應用機器學習技術,優化這些開銷和節省閾值,再加上準確的客戶定位可以提高整個促銷方案的質量。收購團隊和技術一直是零售業發展人工智能/機器學習技術的關鍵。具體而言,在 2013KSS 和 2010 標
157、準分析的零售并購中,隨著合資和 2014 年沙盤中50%的股權,已經交付數據科學、人工智能的人才和解決方案,集成在dunnhumby 的產出之中。解釋性仍然是一個機器學習解決方案模型的摩擦點解釋性仍然是一個機器學習解決方案模型的摩擦點, 因為隨著數據層合并模型會變得越來越不透明。結果,經常有關鍵的決策者和可解釋性的模型成功率之間的權衡。如果一個相對合理的成功率可以通過一個簡單的模型得到改進,分析師傾向于提供簡單的解決方案給客戶, 如果給定了一個潛在的更復雜的人工智能/ 機器學習解決方案。圖 57:客戶數據科學核心到方法圖 58:PriceStrat 幫助模型和執行定價量化機會量化機會降低勞動力
158、成本來提高需求預測降低勞動力成本來提高需求預測。在美國的企業目前每年花費近 60 億美元的勞動力成本分析過去的購買趨勢, 銷售記錄, 價格以及商品質量的測定與產量。根據勞動統計局的規定,基于合同協議選擇、訂購和授權支付。另一方面,批發和零售買家的任務是利用歷史數據,專業經驗,專業知識,以確定哪些購物者在未來兩年有興趣。而電子商務的不斷滲透,增加了此任務的可用的數據量,將這些數據轉化為應用的挑戰仍然存在, 提高的不僅僅是廣告定位也是預測趨勢和傾向。我們相信,這種類型的考慮非常適合人工智能/機器學習的能力,去結合定量的可視化數據預測需求和優化購買決策。估計人工智能估計人工智能/機器學習在機器學習在
159、 2025 年年前全球范圍內可以較少每年零售業勞動力成本前全球范圍內可以較少每年零售業勞動力成本 54 億。億。圖 59:與批發和零售買家相關的勞動力成本優化定價優化定價。HBS 和 Rue La La 的聯合研究優化每日定價,估計平均收入增長大約為 9.7, 由機器學習過程的集成相關的 90置信區間為2.3, 17.8。鑒于閃存銷售模式和銷售量的一些細微差別, 我們將潛在的改進從平均值減少了200 個基點到 7.7, 并假設通過結合人工智能/機器學習基于預測需求優化定價的可變問題,可以有 2.3-7.7的改進。在零售業,特別是服裝和鞋類中,動態定價的挑戰之一是缺乏新風格,顏色等歷史數據來預測
160、需求。應用機器學習,能夠同時分析數百個產品和屬性, 最終運用比傳統預測更廣泛的數據集合更好地評估和優先觀察。因此,我們看到人工智能我們看到人工智能/機器學習驅動的價格優化機會,機器學習驅動的價格優化機會,到到2025 年全球服裝和鞋類電子商務平均的年銷售額增長將達到年全球服裝和鞋類電子商務平均的年銷售額增長將達到 410 億美元。億美元。圖 60:人工智能/機器學習 價格優化可以產生顯著提升服裝電子商務誰會占下風?誰會占下風?隨著在零售價值鏈中的人工智能/機器學習的整合帶來一系列成就,對公司和員工而言,整個庫存管理,生產和目標的效率顯著提高。我們認為過度制造的零售商可能會占下風,因為人工智能/
161、機器學習驅動的價值鏈的效率提高可以幫助資產缺乏的零售商進一步完善他們的需求預測和庫存管理, 領先于其強大的競爭對手。我們也看到更嚴格的庫存管理讓不以價格為目標的零售商占了下風, 他們從過度購買或過度生產的大型零售商和品牌那里得到好處。 有了更準確的生產和需求預測,為降價的零售商提供了從生產超支和取消訂單中受益的機會,并預測失誤的幾率可以顯著降低?;仡?,2015 年春季銷售中超過 4700 億美元因存貨積壓而損失(IHL)。圖 61:平方英尺增長與銷售/平均平方英尺增長圖 62:最近的商店關閉/公告選擇零售商能源能源在在 2025 年前累計節約年前累計節約 1400 億美元億美元石油和天然氣工業
162、是非常資本密集型的,并且操作通常在極端條件下進行。設備可靠性極為重要,因為設備和過程的故障會極大地影響項目的經濟性。為了避免故障,工業通常對設備進行過度工程設計,并采用多層冗余,從而提高了每個工作或項目所需的資本。在人工智能/機器學習設計更可靠設備的范圍內,可以降低工業的資本支出和運營支出要求。 效益可以相當大, 我們估計石油和天然我們估計石油和天然氣行業的資本支出氣行業的資本支出,運營支出和庫存管理能減少運營支出和庫存管理能減少 1,可以在可以在 10 年內節省大年內節省大約約1400 億美元億美元。在能源行業,我們認為一家公司特別適合采用 A 人工智能/機器學習, 不僅降低自身的運營成本,
163、而且還幫助客戶降低成本它就是斯倫貝謝(SLB)。什么是機會?什么是機會?我們相信人工智能/機器學習可以幫助石油和天然氣產業的整個價值鏈。項目規劃項目規劃。 世界各地的大型能源項目可能花費數百億美元,可能有 3 到 5年的交付周期。 管理層基于一系列宏觀假設批準這些項目,涉及石油價格以及他們的主要產品、服務的需求和供應。 人工智能/機器學習的應用可以更好地告知管理層項目的可行性,公司可以做出更好的決策,減少所進行的不經濟的項目的數量。此外,人工智能/機器學習應用可以幫助(1)更準確地確定項目成本,通過整合行業/公司在這些項目中的過去經驗,以及(2)使項目成本與計劃保持一致,更好地執行公司的項目。
164、提高設備可靠性提高設備可靠性。 計劃外設備停機和非生產性損失時間是項目成本增加愛的一些最大驅動因素。石油服務行業高度關注提高設備可靠性,人工智能/機器學習可以在這方面提供幫助。該行業尤其針對海底防噴器(Blow OutPreventers),這些通常是鉆機上最易發生故障的物品,每個故障都可能使深水行業的成本至少增加 1000 萬到 1500 萬美元(見下面的案例研究)。類似地,壓力泵泵發生故障,為了最大限度地減少損失時間,服務公司帶來的泵浦數量是技術上需要的泵數量的兩倍。提高設備可靠性不僅會降低設備維護成本,還會降低服務公司為每個工作部署的資本。改進了油氣資源的識別改進了油氣資源的識別, 定位
165、和開發定位和開發。 發現石油和天然氣儲量及其開采產生大量數據。 當行業進行地質地震分析以確定油氣儲量的位置時生成數據。類似地,鉆井和測試井時產生數據。最后,當場被開發和生產時,生成大量的生產數據。 將地質數據、生產相關數據和硬件安裝相關數據相結合可以產生用于最佳利用儲量的信息,一個項目的經驗可以應用于更經濟的未來項目設計。增加下游行業的正常運行時間增加下游行業的正常運行時間。 計劃和計劃外停機會顯著地影響下游行業的盈利能力。在天然氣管道中,壓縮機的正常運行時間對于維持良好的流動是非常重要的,同時管道的最佳“檢查”可以減少意外停機的時間和泄漏。類似地,煉油和石油化工行業的計劃內和計劃外停機有很高
166、的機會成本。即使使用率提高1,也可以節省一大部分成本。什么是難點?什么是難點?能源工業在各個層面高度分散能源工業在各個層面高度分散。在美國,頁巖資源的開采涉及近 400 個行業,許多其他上游公司都在世界不同地區開展工作。在石油服務行業中,三大公司(斯倫貝謝,哈里伯頓和貝克休斯)主導著大多數技術驅動型企業,但是在鉆井平臺和壓力泵送等更為商品化的服務領域有很多參與者。 中游的煉油和石油化工業務也是分散的。碎片化帶來了挑戰,因為關鍵數據掌握在許多玩家的手中。因此,一家公司可能無法訪問地質游戲、某種類型的設備或過程的所有數據。此外,一些有權訪問關鍵數據的公司可能不愿意共享它, 即使他們自己可能沒有財力
167、或技術知識來利用它。獲取訪問數據獲取訪問數據。此外,該行業的數據跨越了地理的界限,因為石油和天然氣儲備分布在世界各地,而且往往數據掌握在國家石油公司(NOC)的手中,這意味著數據的獲取可能受到監管的限制。此外,數據跨越各種時間段,因為最早的井是在 1880 年鉆探的。最后,當在整個價值鏈中數據分析可能是最有用的。但一般來說,能源公司主要涉及業務的一個方面,可能無法訪問價值鏈中的所有項目,這將優化分析。數據的可用性數據的可用性。另一個痛點是關鍵數據的可用性,因為在過去,工業可能沒有將傳感器放置在烴鏈的關鍵部分,這將有助于人工智能/機器學習的應用。舉個例子,雖然工業可能具有 BOP 崩潰的頻率以及
168、在其操作壽命期間遇到壓力的關鍵數據,但是其可能沒有關于 BOP 內的各種線圈和電子部件上的溫度,電流和電壓讀數的數據。該行業現在開始將這樣的傳感器放在新產品上,而公司將需要一段時間才能獲得更多的數據。目前的經營方式是什么?目前的經營方式是什么?該行業仍在使用傳統方法開采石油和天然氣, 并且使用改進的但不是真正革命性的方法和技術。 影響行業的關鍵問題是, 該行業正在各種各樣的孤島中前行,并且業務的各個部分之間的整合和凝聚力有限。例如,石油和天然氣儲備(EPs)的所有者設計整個項目,然后在不同的服務提供商之間劃分工作。EPs 有最多的信息,但他們不太了解什么服務公司可以提供服務,并且往往他們與服務
169、公司保持距離,覺得過度依賴他們可能會導致未來的成本增加以及 IP 的泄漏。為了讓能源行業真正從人工智能/機器學習中獲益,數據將需要在 EPs 和服務部門之間實現更廣泛的共享,需要一個更協作的模式。在海上空間,由于國際石油公司已經在努力降低成本,一些 IOC(國際石油公司)在與一體化綜合服務公司如斯倫貝謝(SLB)和 FMC 技術(FTI,NR)的合作方面發揮了領導作用。人工智能人工智能/機器學習如何助力?機器學習如何助力?人工智能/機器學習從以下方式:l 從歷史信息中獲取知識提高產品的可靠性。人工智能/機器學習也可以減少產品開發,田間試驗和商業化的時間。l 更好地定位石油和天然氣儲量,通過削減
170、時間和成本開鑿,使得油田開發成本降低。l 降低生產成本,通過改善設備正常運行時間和降低維修費用。l 提高海洋和陸地鉆機正常運行時間,提高了鉆進效率,減少了鉆井天數。l 基于數據分析的人工智能/機器學習可以降低維修相關的下游行業的停機時間。量化機會量化機會在 2016,我們預計高盛覆蓋石油和天然氣公司的固定資產投入近 4000 億美元。此外,石油和天然氣行業應該花了 775 美元億美元的運營成本(不含煉化銷售成本和 DD&A),持有存貨約 2000 億美元。我們估計人工智能/機器學習應用可以降低 1%的資本支出和運營成本,行業通過更好的庫存管理降低 1%的庫存,10 年整個行業可以生下來的錢將達
171、到1400 億美元。我們提出以下幾個案例研究,指出成本可以減少的地方。圖 63: 高盛涵蓋能源公司每年的資本支出+運營成本+存貨達 1.4 萬億美元圖 64:我們看到 10 年里通過削減 1%的資本支出、運營成本和庫存節省了1400 億美元降低壓力泵隊成本降低壓力泵隊成本。 該行業的壓力抽運車隊經歷了極大的設備磨損, 設備維護通常約是成本的 10-15。在過去 5 年中,壓力泵平均已經有 300 億美元的年度收入的業務,該行業每年花費近 36 億美元來維持壓力泵設備,這個數字不包括設備升級等主要資本成本。斯倫貝謝是美國第二大壓力泵,最近開始了一項計劃,集中管理其水力壓裂船隊的部署和運輸。該公司
172、現場在它的壓力泵浦泵上安裝了先進的傳感器,這些數據收集于其總部設在休斯頓的遠程監控中心。采用高級數據分析,斯倫貝謝能夠預測主要組件故障的發生。這使得它在泵失效之前將其從操作中移除。這大大降低了維護成本,也提供了現場需要的備用設備。 斯倫貝謝估計,這一項應用斯倫貝謝估計,這一項應用在六個月內節省了其中一臺在六個月內節省了其中一臺 PP(壓力泵)車隊約(壓力泵)車隊約 400 萬美元萬美元。圖 65:每 PP 艦隊平均資本部署可減少 25%圖 66:工業可以減少 35 億美元的 PP 艦隊的總資本部署通過通過“未來鉆機未來鉆機”改善鉆井時間改善鉆井時間。 當深水井正在鉆探時,石油和天然氣工業每天花
173、費 70 萬至 100 萬美元, 而水平頁巖井的每日鉆井成本可能約為 6 萬美元。因此,該行業可以從其鉆井計劃中每天節省一筆可觀數目的成本。鉆井時間可以通過三種方式減少:l 提高設備的正常運行時間,特別是在問題項目如國際收支(尤其是海底)和頂驅。l 根據井的實際情況選擇合適的井底鉆具組合。l 優化鉆井性能,通過建立一個在地面設備和底部鉆具組合之間的“閉環信息系統”。自動化系統和減少“船員素質”產生可重復的良好性能。行業正在積極減少國際收支 (吹閥) 和頂部驅動的停機時間, 通過篩選數據,尋找領先的信號,預測即將到來的問題。同樣, 先前鉆井的數據分析可以幫助石油公司為特定井設計最佳鉆井液和鉆頭。
174、此外,通過在鉆頭附近的傳感器與鉆機面板上的控制之間建立閉環系統,可以設計“智能鉆機”,其自動調節“鉆壓”和施加在鉆機上的扭矩,根據井下條件最有效地鉆井。人工智能/機器學習可以幫助持續改進可重復的性能。鉆井的關鍵問題之一是“人為干預”的影響,業內人士發現,即使在類似的井,鉆井性能的顯著變化取決于船員的質量。自動化可以減少“人為干預”對鉆井性能的影響。National Oilwell Varco(NOV),斯倫貝謝和 Nabors 工業正在研究新一代鉆井概念。下面的展示顯示,National Oilwell Varco 的自動化系統可以將井底的鉆井時間平均減少 30。更重要的是,NOV 的自動化系
175、統將鉆井時間縮短到 2.5 至 3.0 天,而傳統鉆井方法則為 2.5 至 5.5 天。斯倫貝謝是構建“平臺的未來”,并希望它的第一個原型在今年年底之前出來。圖 67:通過機器學習“閉環鉆井自動化”提高可重復鉆井性能NOV 報道了自動化鉆井系統高水平的可重復的改進提高煉油廠的正常運行時間提高煉油廠的正常運行時間。 美國煉油工業的安裝基數約為 1800 萬桶/日,平均利用率約為 90,占該行業計劃和計劃外維護的時間的 10%。平均而言,煉油利潤率約為 10 美元,意味著該行業每桶生產線下的價格為 10 美元。我們估計,如果通過更好的數據分析,行業可以將維護相關停機時間從 10減少到9,精煉商將實
176、現每年 6.57 億美元的額外利潤,在十年內約為 66 億美元。圖 68:煉油廠維修相關的停機時間從 10%減少到 9%,可以在 10 年內節省美國煉油廠 66 億美元美國煉油廠的平均利潤率因為平均 10%的停機時間放棄每年 66 億美元誰會占下風?誰會占下風?小型或不太復雜的能源公司或者有資本約束和有限的技術訣竅的公司將受到最不利的影響,因為更好的公司采用人工智能/機器學習來降低成本。這對石油及石油服務業同樣如此。 關鍵的贏家是那些在過去投資于從他們的資產中獲取數據的人,并且有遠見去儲存它。這些公司,不僅有財務能力,采用人工智能/機器學習技術來處理數據,也有文化層面的技術使用和創新來分析技術
177、。石油和天然氣行業可能會因為那些關鍵數據庫與技術實力而進一步鞏固。2016 年 11 月 1 日,通用電氣石油天然氣和貝克休斯宣布了一項“創造新的全流數字產業服務的公司” 協議。 通用電氣的首席執行官 Jeff Immelt 說: “本次交易加快了我們拓展數字框架的石油和天然氣行業的能力。 油田服務平臺把以數字為基礎的產品提供給我們的客戶是必不可少的。我們期望 Predix 成為一個行業標準以及提高客戶結果?!痹谖覀兛磥?,運用人工智能運用人工智能/機器學習的一個大贏家是機器學習的一個大贏家是 SLB,我們相信它有最大寬度的數據,繼今年早些時候收購 CAM。而數據訪問是一個關鍵區別,斯倫貝謝因為
178、具有利用信息技術與文化被進一步區分開。 本公司已成立兩個小組來做大數據和機器學習分析,一個在帕洛阿爾托,一個在劍橋。本公司一直從事一項數字化油田開發,今后將會非常有用。斯倫貝謝的成功和可能的市場份額可能會導致小型服務業的縮水。 美國石油服務業有許多小企業,并有可能在與斯倫貝謝的直接競爭中打亂小企業的順序。我們看到許多小型壓力泵有長期的壓力,雖然可能會有一些短期的周期性隆升。此外,美國的土地鉆探情況在未來會發生變化,正如斯倫貝謝所說的“鉆機的未來”那樣。推動者推動者人工智能創新:谷歌、亞馬遜人工智能創新:谷歌、亞馬遜谷歌的谷歌的 Alphabet 在做什么?在做什么?在過去的二十年里, 谷歌搜索
179、算法一直在迅速發展。 從1998年的PageRank到 2015 年的 rankbrain,公司已經從基于使用人工智能驅動的查詢匹配系統,不斷適應谷歌所特有的 15%的搜索。在云計算中,2015 年公司的開源機器學習軟件庫TensorFlow已補充了公司5月發布的可能涉及的平臺定制的硬件加速器的進展公告;定制的 ASIC 稱為張量處理單元(TPU)。該公司在過去三年中也一直積極致力于人工智能相關的收購。最引人注目的是 DeepMind,它不僅提高了 Alphabet 的神經網絡功能,也參與了各種人工智能驅動的項目。為什么重要?為什么重要?谷歌是在搜索中使用算法的先驅。本公司在應用自然語言處理方
180、面繼續領先, 以配合人們的對所需的在線目的地的搜索意圖,在這部分業務不斷增加競爭優勢。該公司的開源應用與 TensorFlow 一起為云基礎的平臺創造先例,并允許研究社區更好地利用公司的資源深化人工智能來促進智能一體化事業。與此同時,谷歌正在通過運用其專有的優勢如張量處理單元的開源世界,提供競爭優勢,即使其機器學習庫是開源的。公司用 DeepMind 增強了端到端的加固效果;強調通過 alphago 的計算機程序在 2015 年底擊敗了職業棋手。谷歌是一個主要的例子,讓人工智能進入更廣泛的研究領域,同時也通過軟件和硬件的專有優勢創新。亞馬遜在人工智能方面在做什么?亞馬遜在人工智能方面在做什么?
181、亞馬遜在內部和云中使用人工智能。 在 2015 年 4 月, 公司宣布亞馬遜 ML,機器學習服務,提供了對云數據的使用,而無需以前的客戶體驗。緊跟谷歌的開源活動, 亞馬遜在今年五月通過開源 DSSTNE, 開發基于深度學習模型的數據庫。在內部,公司使用機器學習來提高搜索從而提高端到端的客戶體驗,定制產品建議,語音識別,并提高產品質量。為什么重要?為什么重要?亞馬遜是全球最大的 AWS 云服務提供商,也可以說是云上最復雜的人工智能平臺。通過亞馬遜的機器學習,亞馬遜是人工智能服務生態系統的先驅,讓以前沒有機器學習經驗的公司擁有復雜的推理能力。無需定制復雜的應用需求,AWS 的客戶可以在模型訓練、潛
182、力評價和優化上利用機器學習的數據。亞馬遜在推薦引擎上的機器學習內部使用創造了競爭優勢, 在匹配客戶的意圖和愿望,為公司創造商業機會占了上風。它更有效地利用收集到的數據,簡化客戶購買,讓電子商務體驗有了更多的互動。隨著開源 DSSTNE,亞馬遜已經加入了其他科技巨頭的行列,來加強人工智能的技術進展。人工智能創新:人工智能創新:AAPL, MSFT蘋果的蘋果的 AAPL 在人工智能方面做什么呢?在人工智能方面做什么呢?蘋果在過去一年左右的時間里是最活躍的一個人工智能收購方, 涉及的公司有 Vocal 的 IQ,Perceptio,Emotient,Turi,和 tuplejump。幾乎同時發生的I
183、Q和Perceptio的收購, 公司聘請了Johnathan Cohen, 他當時負責NVIDIA的 CUDA 的軟件庫和 GPU 加速的軟件開發。最近,據報道公司聘請 RuslanSalakhutdinov 作為人工智能領域的負責人, 可能標志著蘋果的人工智能策略的轉變。在此之前,蘋果基于人工智能的首要成果是 Siri,它是第一個運用嵌入式移動技術的虛擬助理,語音識別技術在 2014 年引進了神經網絡系統。為什么重要?為什么重要?在過去一年左右的時間里,蘋果一直相對專注于機器學習的進步;彭博商業周刊十月報道, 2015 年蘋果研究人員沒有發表任何人工智能相關的論文。 然而,這種策略隨著一些新
184、的人工智能相關的招聘和收購開始轉變。 根據美國科技記者Steven Levy 的反饋,強調公司這段時間一直活躍于人工智能。特別是,蘋果收購 Turi 凸顯了公司推動對非結構化數據和推理的規模建設以及開放更廣泛的人工智能研究社區。 此次收購輔以較小的基于收購的應用反映了蘋果的承諾,用新技術創新其產品。微軟的微軟的 MSFT 在人工智能方面做什么呢?在人工智能方面做什么呢?據首席執行官薩提亞納德拉,微軟是“民主化的人工智能?!惫镜娜斯ぶ悄苎芯考瘓F,擁有員工 5000 多名,主要集中在改變人類與技術互動上。微軟在嵌入新的人工智能綜合能力為核心的服務方面非?;钴S,在會話計算進展(如Cortana)
185、和自然語言處理 (編) 中取得進展。 公司還建立了云(Azure) 的 GPU和 FPGA, 提供機器學習的力量和速度等更高級別的人工智能服務, 如語音連接、圖像識別、自然語言處理。為什么重要?為什么重要?兩個詞:“民主化的人工智能?!蔽④泟撛炝诉@個詞,解釋了許多領導人工智能的創新者, 整個行業的公司都開放研究計劃甚至數據庫來打造更大的人工智能社區。微軟在過去的一年中一直活躍在人工智能領域,正式宣布產品發布和研究計劃,在 2016 年 9 月下旬宣布成立一個新的人工智能和研究小組。微軟 FPGA 的業績凸顯了人工智能可以給一般企業或個人帶來的影響; 它可以在不到十分之一秒內把整個維基百科(30
186、 億字和 500 萬篇文章)翻譯出來。和個人助理如 Cortana,Siri,Alexa 或其它之間的競爭,將人工智能進一步發展為廣泛應用的產品開發,來吸引客戶。人工智能創新:人工智能創新:FB, CRM臉譜網的臉譜網的 FB 在人工智能方面做什么呢?在人工智能方面做什么呢?在臉譜網人工智能研究(FAIR,2013)中,臉譜網的戰略專注于開發技術的背景下更廣泛的研究社區。集團尤其推動監督代表性學習的進展,即以對抗網絡通過觀察世界而不是人類干預學習算法。應用機器學習(AML)側重于研究FB 的產品,時間表是季度或月而不是幾年,根據集團掌門人 Joaquin Candela所說。該公司是利用機器學
187、習能力來垂直發展各種產品,包括面部識別、機器翻譯、高語境語言/文本學習。為什么重要?為什么重要?臉譜網發布了多個出版物出版的的無監督學習研究, 一個重要的領域是機器學習超越了學習“正確的答案”,專注于獨立模式的識別。非監督學習已經有潛力去除更多大數據相關的人體部件,臉譜網在 YannLeCun 的領導下在這方面成為領先。5 月引入的 FBLearner Flow,簡化了端到端的 UI 研究工作、實驗、觀察和比較輸出。這樣,公司的人工智能舉措和應用不限于 AML 員工而被廣泛使用在臉譜網的各門學科。這使得臉譜網能夠在其研究領域以外運用人工智能的進展。Salesforce 的的 CRM 在人工智能
188、方面做什么呢?在人工智能方面做什么呢?在 2014 和 2015 年,Salesforce 開始解釋他們的 Apex 開發平臺如何用于Salesforce1 云機器學習的任務執行。自那時以來,該公司已集中更多的資源收購多個人工智能相關的公司,包括 MinHash,predictionio 和超念者。九月,Salesforce 引入愛因斯坦, 一個基于云的人工智能的平臺。 這一舉措使得人工智能與銷售云,營銷云,服務云,社區云,物聯網云,和應用程序云相結合。為什么重要?為什么重要?Salesforce 的愛因斯坦提高企業使用數據的潛力。 在銷售云, 該公司希望通過預測領先得分,機會洞察和自動捕捉,
189、使組織能夠優化銷售。營銷和服務云將提供預測分析客戶,提供預測的觀眾,以幫助確定有針對性的營銷技術, 并通過以趨勢和用戶歷史為基礎的自動化案例分類更快地提供客戶服務。 Salesforce 把機器學習與云細致入微地結合使用, 顯示出該技術應用在核心競爭力的潛力。人工智能創新:人工智能創新:NVDA, INTC英偉達的英偉達的 NVDA 在人工智能方面做什么呢?在人工智能方面做什么呢?NVIDIA 公司已經從一個基本的視頻游戲的 GPU 生產者向機器學習應用強大的硬件生產者轉化。該公司 2015 年底表示,GPU 加速的神經網絡訓練比傳統的 CPU 快 10-20 倍。而英特爾已經偏向 FPGA
190、投資作為 GPU 的替代,GPU機器學習應用允許更多計算密集型的訓練。這與 FPGAs 提供更快,更少的計算密集型的推理和任務執行不同。 截至 2016 年 6 月, NVIDIA 過去五年里的 GPU市場份額已從全球的一半多到近四分之三。為什么重要?為什么重要?GPU 加速的深度學習的很多項目在人工智能創新公司和學術機構是出于前沿的。NVIDIA 的大量存在意味著它可以隨著人工智能成為近年來大企業更重要的話題獲利。NVIDIA 產品使用的一個例子是俄羅斯的 ntechlab,使用 GPU 加速的深層學習框架來識別個體的火車面部識別模型, 并利用這些 GPU 在 AWS 進行推理。另外,多個高
191、校使用 NVIDIA Tesla 加速器模擬抗體可能的突變,演化埃博拉病毒,進一步規劃預防流感。英特爾的英特爾的 INTC 在人工智能方面做什么呢?在人工智能方面做什么呢?英特爾的戰略獨特性在于在其用例的多樣性。在 2016 年中期,公司推出了第二代 Xeon Phi 產品家族,最著名的是高性能計算(HPC),它允許人工智能在較大的網絡服務器和云上的拓展。 除了 FPGA 的大量投資的硬件進步, 在很大程度上是由于其推理的速度和靈活的可編程性。 英特爾收購人工智能的著名例子包括 Nervana 系統(深度學習)和 Altera 公司,這給公司帶來了 FPGA 創新。為什么重要?為什么重要?英特
192、爾的重點是 FPGA 以及 NVIDIA 的 GPU 重心。FPGA 提供更快的推理速度來處理大型數據集,這是公司如微軟測試大數據分析的邊界使用時需要的。在物聯網(IoT)的背景下,該公司還宣布了一個主動學習技術與可穿戴芯片的集成,特別是通過至強夸克。物聯網和人工智能的結合有助于將機器學習解決方案帶入數據收集機制供企業和個人日常使用。人工智能創新:人工智能創新:Uber, IBM優步在人工智能方面做什么呢?優步在人工智能方面做什么呢?Uber 使用機器學習來優化 UberX ETA 和街接頭位置的精度。這通過使用來自先前騎乘的數百萬個數據點來檢測正常交通模式并允許相應地進行 ETA /接頭點調
193、整來完成。2016 年 9 月,Uber 在卡內基梅隆大學(Uber 聘用)的研究,與大型汽車制造商合作推出了在賓夕法尼亞州匹茲堡的自駕駕駛試點項目。這樣的一個協議是與沃爾沃 3 億美元的合作, 其中研究和開發協調為試點計劃提供了機會。 然而, 公司還沒有止步在汽車上。 尤伯杯收購奧托, 自主卡車的啟動,使得科羅拉多在十月完成 50000 瓶啤酒的交付。為什么重要?為什么重要?Uber 機器學習巨頭 Danny Lange 在接受 GeekWire 采訪時說,他的團隊正在使這項技術無縫地提供給公司中的其他團隊, 那些沒有機器學習背景的公司來使用API。這使得公司的不同部分以簡化的方式利用機器學
194、習基礎設施, Uber在 UberX,UberPool,UberEats 和自主車輛中的人工智能使用就是例證。IBM 在人工智能方面做什么呢?在人工智能方面做什么呢?IBM 研究機構在全球有大約 3000 名研究人員, 過去十年擁有超過 1400 項認知計算的專利,1200 項下代云專利,7200 項硅納米科學專利。IBM Watson利用自然語言處理,機器學習技術來識別模式,提供對非結構化數據的理解,代表了 80%的數據。其他 Watson 產品包括虛擬代理,自動化客戶服務體驗與響應分析,以及資源管理器一個分析和連接大量的不同的數據集的工具。為什么重要?為什么重要?IBM 一直是該領域的先驅
195、,包括 20 世紀 90 年代的 DeepBlue 或 2011 年的 Watson。 在 Watson 的應用包括醫療保健中的患者治療分析, 基于推特的股票推薦,零售的消費者行為分析和打擊網絡安全威脅。 根據 Fortune(發表于2016 年 10 月 26 日) , 通用將 Watson 加入機動車, 將 Watson 功能與 OnStar系統相結合。人工智能創新:人工智能創新:BIDU百度的百度的 BIDU 在人工智能方面做什么呢?在人工智能方面做什么呢?在百度的人工智能研究是由 2016 年 9 月引進的百度大腦所促進的。 它由三個元素組成:1)人工神經網絡算法,基于超過數百億的樣本
196、的大量的參數訓練。2)成百上千服務器上的計算能力的服務器和的集群 GPU(圖形處理單元)操作的高性能計算(HPC);HPC 實現了更大規模的可擴展的深度學習算法。百度是宣布這一架構的第一個組織,與加州大學洛杉磯分校一同合作。3)標記的數據,其中百度收集了數以萬億計的網頁,包括百億的視頻/音頻/圖像內容塊,幾十億的搜索查詢還有數百億的定位查詢。為一個特定的模型訓練要求非常高,包括計算功率和 4T 的數據。為什么重要?為什么重要?人工智能橫跨百度的產品線提高用戶體驗和用戶粘性, 并為每個用戶推動高品質的內容定制。構建運行深度學習實驗標記數據的內部平臺,不同的網絡搜索和廣告,通過CTR 預測實現更高的點擊率,這對廣告有直接影響,因此影響百度現在的收入。此外,基于人工智能的技術導致了更高的點擊率和每點擊成本(CPC)的改進,從而在貨幣化上得到改進。附錄附錄圖 69:接觸人工智能和機器學習的公司圖 70:接觸人工智能和機器學習的公司圖 71:接觸人工智能和機器學習的公司圖 72:接觸人工智能和機器學習的公司圖 73:接觸人工智能和機器學習的公司圖 74:接觸人工智能和機器學習的公司圖 75:接觸人工智能和機器學習的公司