《SAS:借助自然語言處理傾聽所有聲音-需要了解的有關人機交互的所有信息(24頁).pdf》由會員分享,可在線閱讀,更多相關《SAS:借助自然語言處理傾聽所有聲音-需要了解的有關人機交互的所有信息(24頁).pdf(24頁珍藏版)》請在三個皮匠報告上搜索。
1、借助自然語言處理,傾聽所有聲音您需要了解的有關人機交互的所有信息目錄對話的藝術37溝通的科學11自然語言處理的 實際效果16自然語言處理的 9 個最佳實踐19說相同的語言對話的藝術機器如何學習理解人類語言的細微差別 并進行解釋?使用自然語言處理。非結構化文本是最大的人工生成數據源,它每分鐘都在呈指數級增長。各種技術時時刻刻都在我們觸手可及之處,比如我們能夠通過文本、即時消息、電子郵件和社交媒體進行快速交流,而交流范圍也從客觀陳述的事實到思想和觀點,以及對企業或組織有益或無益經驗的評論?;ヂ摼W使信息獲取比以往任何時候都更加容易,數字記錄現在已成為常態,不再是例外。了解非結構化文本 每個數據源都包
2、含大量的非結構化文本。與結構化信息不同,人類語言不能整齊地排列在行和列中??紤]將文本消息對話放入行和列中。每個字或值都不能整齊地放入一個框中,這些框也不能很好地與某些非重復值對齊。用筆書寫或通過鍵盤輸入的任何內容均被視為自由格式或非結構化文本。想象一下通過計算機對非結構化文本進行分析。未進行自然語言處理的信息將對機器毫無意義。借助自然語言處理,機器可以快速、不斷地對不斷增長的文本數據進行篩選,以識別主要思想或主題,發現新興趨勢,分析情感并識別字詞間的相關性。一群人類分析員會對成堆的網絡數據、電子郵件、面試記錄、數字記錄和社交媒體站點進行梳理,但是由于要篩選的信息量巨大,很難手動識別關鍵字并檢測
3、模式??梢允褂米匀徽Z言處理對機器進行教授和引導,以人類無法匹敵的規模和速度來分析非結構化文本。反過來,這使得人們可以專注于機器無法完成的更高層次的戰略性任務,例如應用推理、理解影響和實施行動 計劃。對話的藝術自然語言處理非結構化文本是最大的人類生成數據源每分鐘創建的文本1.56 億1,600 萬240 萬電子郵件文本搜索510,000470,000帖子推文4TOC借助 SAS 視覺文本分析將自然語言處理、機器學習和語言規則結合在一起與機器人對話除了分析非結構化文本數據之外,人們現在還可以通過與機器人對話來獲得信息或完成任務。詢問機器人(例如 Alexa 或 Siri)天氣情況、播放特定歌曲、訂
4、購物品或安排約會表面看起來似乎很簡單、很直觀,但實際上卻是通過復雜的技術在后臺運作。聊天機器人旨在通過模仿人類對話的語音界面來提供自然的對話流。通過該流程可以簡化信息訪問或自動完成任務。聊天機器人能夠成功模仿人類對話,很大程度上取決于其自然語言處理算法的準確性以及支持該機器人框架的人類領域知識的深度。隨著機器學習的進步和計算能力的提高,聊天機器人變得越來越智能,除了進行簡單呼叫和響應類型交互之外還具有許多其他功能。SAS 允許用戶通過聊天機器人界面訪問高級分析功能。其結果是,聊天機器人可以使用多種 AI 功能,例如用于預測供需的預測方法、用于識別對象和事件的計算機視覺、或基于對上下文元素的理解
5、,對意圖進行精確匹配的自然語言處理。溝通的藝術人類的溝通是一門藝術,無論口頭溝通還是書面溝通。直接看我們說出或寫出的內容,對話因素和語境并不總是表現得很明顯。一直以來,人類語言的獨特性都是一門流動藝術,因為其中富含了歷史、文化、環境和生活經驗等各種信息,無論技術有多么先進,如果沒有人類進行重要的指導,那么機器很難復制出這種獨特的品質。人工智能(AI)系統可以有效地增強人類分析非結構化文本的能力,增強智能聊天機器人的功能,或將語音轉換為文本,但是該系統高度依賴于經過適當培訓以使用自然語言處理來理解和解釋人類語言。對話的藝術自然語言處理5TOC借助 SAS 視覺文本分析將自然語言處理、機器學習和語
6、言規則結合在一起說同一種語言人工智能、自然語言處理和人類專業知識如何協同工作,以幫助人類和機器進行溝通,并發現數據的意義。數字數據的爆炸式增長以及計算能力的迅速增強,令人工智能(AI)市場興奮不已。人們對于 AI 在分析方面能發揮什么作用觀點不一,但是隨著機器執行分析并報告結果,核心問題可歸結為人類如何與計算機進行溝通。我們人類不會像機器那樣用 1 和 0 來表達我們的思想和發現。我們使用了數十萬年來進化來的各種語言和方言的復雜性。因此,我們必須教授機器我們說話的方式和我們所表達的含義,以便它們能夠以相同的方式與我們溝通。AI 和自然語言處理人工智能這一科學領域旨在訓練計算機通過學習和自動化來
7、模仿人類任務。通過 AI,機器可以從經驗中學習、適應新的輸入并在無人工干預的情況下完成特定任務。自然語言處理(NLG)是人工智能的一個分支,專注于人類語言的理解、解釋和模仿。NLP 從包括計算機科學和計算語言學在內的多學科提取內容,致力于填補人類交流與機器理解之間的差距?;?NLP,自然語言理解和自然語言生成的進步為前沿應用程序的開發做出了貢獻。使用 NLP 處理非結構化文本后,自然語言理解(NLU)可以幫助機器理解其正在閱讀的內容。NLU 超越了對語言結構上的理解,并訓練機器來解釋意圖、利用上下文、解決歧義并向系統發出命令以回答問題、顯示特定數據或執行特定任務。當命令傳遞給自然語言生成(N
8、LG)組件時,它甚至可以在指定的域或任務內自行生成正確格式的人類語言。NLU 與 NLG 的結合,讓計算機看起來好像真正地理解了人類的語言,但是如果要求系統執行其他任務(不是經訓練的待執行任務集),那么這種幻覺便會破滅。自然語言理解旨在解決歧義并確定上下文,而自然語言生成(NLG)的目標是以會話形式自動生成令人難以置信規模的內容。NLG 使用自然語言處理的基礎來幫助機器檢查任何類型的信息(包括文檔)、確定信息的整體上下文,并自動生成報告、描述、說明或交互式對話。自然語言生成通常用于自動生成大量個性化內容(例如表單電子郵件、消費品描述、操作性能摘要、易于使用的分析結果)以及智能聊天機器人響應。人
9、類專業技術和語言學不同語言和方言中的俗語、俚語和諷刺語,使人類很難感知和學習語言的許多細微差別,但是語言中的這些紛繁難懂之處也必須教授給機器。雖然一個人不可能精通每種語言的精髓,但一群人協作卻可以實現。同樣,自然語言處理可以幫助計算機理解、解釋和駕馭人類語言。并非所有事物都可以或應該實現自動化,但是因為自然語言是人類獨有語言,因此需要人類的專業知識來提供大量幫助。說相同的語言自然語言處理7TOC借助 SAS 視覺文本分析將自然語言處理、機器學習和語言規則結合在一起人類的專業知識是以語言學的形式出現,語言學是對語言的科學研究,包括分析語言結構、含義和語境。熟悉語法、語義和語用的區別的語言學家對于
10、開發 NLP 功能至關重要,以便這些功能可以以人們期望 AI 系統執行的規模和速度運行。SAS 在全球擁有一支由語言專家組成的團隊,他們在開發 NLP 功能方面提供人類專業技術。當前具有開箱即用 NLP 功能的語言包括:阿拉伯語、漢語、克羅地亞語、捷克語、丹麥語、荷蘭語、英語、波斯語、芬蘭語、法語、德語、希臘語、希伯來語、匈牙利語、印地語、印度尼西亞語、意大利語、日語、哈薩克語、韓語、挪威語、波蘭語、葡萄牙語、羅馬尼亞語、俄語、斯洛伐克語、斯洛文尼亞語、西班牙語、瑞典語、他加祿語、泰語、土耳其語和越南語。AI 和人類專業技術最佳實踐是將自然語言處理、機器學習和人類輸入相結合來分析非結構化文本數
11、據。人類專業技術為準確分析提供指導,而機器學習可以幫助分析輕松實現擴展。文本處理的基本階段包括解析、發現和組織、提取和解釋。使用自然語言處理分析數據時,機器必須首先將非結構化文本數據拆分為可理解的有用單元。這是解析的第一步,稱為詞語切分。如果使用語音輸入,機器必須先將語音轉換為文本,再進行進一步處理。阿拉伯語中文克羅地亞語捷克語丹麥語荷蘭語英語波斯語芬蘭語法語德語希臘語希伯來語匈牙利語印地語印度尼西亞語意大利語日語哈薩克語韓語挪威語波蘭語葡萄牙語羅馬尼亞語俄語斯洛伐克語斯洛文尼亞語西班牙語瑞典語他加祿語泰語土耳其語越南語NLP 的全球語言支持說相同的語言自然語言處理8TOC借助 SAS 視覺文
12、本分析將自然語言處理、機器學習和語言規則結合在一起然后,自然語言處理進行進一步的解析,應用語言分析從文本中提取特征,例如詞根詞、詞性變體、句子邊界、詞性、名詞組、句法結構等。用于識別人類語言中有意義的片段和關系的所有這些處理均可以使用基于機器學習的模型或基于語言規則的模型來執行。但是,使用這兩種方法的混合模型通常表現最佳。除了機器學習,通過循環神經網絡建模(特別是長短期記憶和門控循環單元)進行深度學習的應用還可用于時間序列預測、文本生成、語音轉文本和其他 NLP 任務??梢砸哉Z言規則的形式添加人類主題專業知識,以提高模型的準確性。機器學習可以通過利用半監督學習來基于人工輸入實現標記數據到訓練數
13、據的自動化,從而幫助減少人工模型的構建工作。自然語言處理的下一個階段側重于不同層次的分析。發現和組織數據的過程將重點放在整個文檔或文檔級別的可用信息上,并且可以生成新的信息,例如網絡、群集、主題以及文檔級別的情感和類別。提取和解釋數據的過程將重點放在子文檔級別的信息,并通過將文檔中包含的信息轉換為更具機器可讀性的狀態以使其均有可訪問性。這些過程創建了實體信息、信息片段之間的詳細關系,甚至是意義元素的解釋。生成交互收集導出轉換預處理和解析預測專家和解釋發現和組織nlpnlpnlp/nlunlpnlp/nlg文本處理的基本階段自然語言處理NLGNLUNLP自然語言生成自然語言理解說相同的語言自然語
14、言處理9TOC借助 SAS 視覺文本分析將自然語言處理、機器學習和語言規則結合在一起SAS 為所有受支持的語言提供了將機器學習與 NLP 功能(例如標記化和語法)結合使用的能力。雖然機器學習是構建 NLP 模型不可或缺的一部分,但將這些機器學習模型部署為基于規則的系統可以提供更高的透明度、更輕松的監控,以及更快的處理速度。例如,分析人員可能選擇使用語言規則方法來構建透明的高性能文本分類模型,以便對電子郵件消息進行快速分類,并自動將這些消息實時發送到相關聯系人。手動創建語言規則非常耗時,但是機器學習可以從大量分類數據中提取最相關的關鍵字和序列,并應用語言規則模型。這是一種功能強大的主動學習方法,
15、分析人員可以同時使用這兩種方法(語言規則和機器學習)。特定于域的用戶定義規則與機器學習方法相輔相成,可快速提高整體精度和調用能力。這些模型被作為透明的語言規則模型來實施,這在需要定期追溯和審計的組織中通常是 首選。自然語言處理的輸出、機器學習和人類的輸入種類繁多,從主題發現到實體提取再到分類或情感分析。這些過程之后可被用于檢測新興趨勢、進行預測分析、提供運營洞察或創建與信息交互的會話系統,例如聊天機器人。機器學習創建的預測模型使用自然語言處理的輸出來自動生成洞察。無論目標如何,人類和機器都必須使用自然語言處理技術才能說出同一種語言,并最終在被分析的數據中找到含義。自然語言處理(NLP)發現 上
16、下文 主動學習NLP 和機器學習非結構化文本數據機器學習人類輸入主題發現、信息提取、分類、情感分析新興趨勢、預測分析、運營洞察、自動總結、語義搜索、聊天機器人說相同的語言自然語言處理10TOC借助 SAS 視覺文本分析將自然語言處理、機器學習和語言規則結合在一起溝通的科學自然語言處理如何將字詞轉換成數字后再次轉換回字詞。通過自然語言處理,我們能夠利用計算機處理的能力和速度瀏覽非結構化文本中大量的人類字詞、反饋和觀點,從而更好地了解我們周圍的世界。在傳統的人類對話環境中,一家為數百萬客戶提供服務的企業不可能有效地與每一位客戶進行交談并傾聽他們的意見。由于我們經常通過數字方式進行交流,因此我們能夠
17、利用人工智能來快速識別最重要的內容,其速度超過了人類識別的速度。這有助于按照相關人員的需要為其提供正確的信息。但是,盡管機器在處理數據和分析趨勢方面的速度更快,但人類在解釋重要性方面幾乎總是更加準確。從字詞到數字再到字詞 對于訓練和推斷,機器學習算法希望其輸入是數字向量,而不是純文本。這意味著,為了讓計算機處理非結構化文本,必須首先將該文本轉換為數值表示形式。處理數值表示形式,然后將輸出轉換回人類可以理解的文本表示形式。這是教機器如何理解自然語言的科學依據。從字詞到數字的過程迂回曲折,包括將標點符號、字符和數值的字符串分解成有意義的分析單元,確定重要的特征和不重要的慣例,將相關部分連接在一起為
18、大量非結構化文本提供洞察,以及以一種易于理解的方式將這些洞察呈現給人類,讓他們能夠做出數據驅動的決策。運用算法教機器閱讀和解釋人類語言的科學依據精細而又復雜。從業務角度來看,NLP 功能可以分為五個一般領域:預處理;解析數據;分析趨勢(發現和組織);提取信息;以及開發會話系統(解釋和生成)。預處理當文檔集合包含非常龐大的文檔,或者集合包含多種文檔類型時,從數據中消除一些噪音或對非句子數據進行規范化以使內容更加清晰,可以使下游模型更易于構建、維護和更準確地應用。拆分:識別文檔的相關部分,或將每個文檔拆分成獨立的部分,可以集中分析重要部分或使相關概念變得清晰。刪除重復:刪除相關文檔集或對其進行分組
19、可以消除冗余并減少對基于統計的分析的影響。規范化:澄清或清除非標準或非句子數據可以在解析和其他下游分析中獲得更好的結果。分層:另一款工具,用于幫助將工作集中在語料庫的特定區域,或者提供應用模型的數據的子部分。解析數據在分析大量數據之前,將數據分解成多個區塊并提供人工框架供機器進行大規模分析至關重要。解析將文本分為字詞、短語、標點符號和其他含義元素。SAS 使用多種方法來解析任務,這些任務也可能因語言而異,包括正則表達式、監督學習模型以及人類制定的規則和字典。這些操作大多數是基于規則的,利用溝通的科學自然語言處理12TOC借助 SAS 視覺文本分析將自然語言處理、機器學習和語言規則結合在一起特定
20、語言的語言專業知識。SAS 為所有受支持的語言提供開箱即用的解析操作 功能。詞語切分:將字符序列(例如句子或文檔)切分成單獨的句子、字詞或語素,然后用作詞性標注的輸入。詞干提?。簩⒆衷~轉換回其基本形式?!安还軇e人怎么說,文字和思想的確能改變世界?!薄癗o matter what people tell you ,words and ideas can change the world .”輸入輸出-Robin Williams-Robin WilliamsShe knew the plan needed to change.代詞He got change at the store.動詞文章名詞
21、動詞介詞has,had,havent have 拼寫錯誤分析:將拼寫錯誤的字詞與包含正確拼寫文本在內的一組變體進行關聯?;诰庉嬀嚯x和上下文,可以使用字典進行增強。詞性標記:根據字詞的定義和上下文對其進行語法分類。隨著深度學習的進步,可以通過循環神經網絡幫助實現詞性標注的自動化。句子邊界歧義消除:確定句子的開始和結束位置。為了處理不明確的情況,例如縮寫、句子邊界不明確的語言或文本,無監督的機器學習算法可以增強基于正則表達式的方法。o 貸款過程很簡單,我在幾分鐘之內便獲得了批準。我不喜歡我的信息被共享,這兩天里我收到 30 封 垃圾郵件和不間斷的推銷電話。相關性解析:通過應用深度學習算法,分配句
22、子中字詞之間的句法關系。輸入:我想要風景最秀麗的露營地。輸出:溝通的科學自然語言處理I want the most scenic campsite.代詞限定詞副詞形容詞名詞標點動詞 子句分析:結合監督機器學習和語言規則來識別子句邊界。o 食物很棒,但是服務太糟糕了。13TOC借助 SAS 視覺文本分析將自然語言處理、機器學習和語言規則結合在一起分析趨勢在發現過程中,自然語言處理和無監督機器學習可以通過自動提取在一組文檔中相互關聯的術語和主題來幫助揭示數據趨勢。人類設計的分類系統還可以組織數據,以發現文檔中的趨勢和模式。奇異值分解:提供文檔中字詞出現次數或字詞出現頻率的矩陣。潛在狄利克雷分布:允
23、許未觀察到的組解釋觀察結果集,以說明為什么數據的某些部分是相似的。分類:通過基于規則的分類規則或監督機器學習,可以將文檔、句子、段落歸為一類。情感(文檔級別):一種將文檔分類為正性、負性和中性存儲桶的類型。詞嵌入:創建將詞匯放置在空間中的數字坐標,將使用方式類似的詞聚集在一起。溝通的科學自然語言處理14TOC借助 SAS 視覺文本分析將自然語言處理、機器學習和語言規則結合在一起功能提取0.10.30.20.20.1 框架 1 框架 20.40.20.3 框架 N0.5 功能 1 功能 2 功能 M聲學模型0.30.10.20.60.4 框架 1 框架 20.20.40 框架 N0.1ABZ語言
24、模型“HELLO WORLD”0.9HELLO WORLD0.4HELLO WORD0.2HOLLOW WORLD語音轉文本溝通的科學自然語言處理提取和解釋信息信息提取會從非結構化或半結構化文本數據類型中自動拉取結構化信息,以創建新的結構化文本數據。這包括諸如實體識別、關系提取和指代消解等任務。摘要解釋了較大文本的含義,以確定重要的組成部分,并為同一消息制定較短的版本,或者將一組相關文檔壓縮為聚合報告。名詞組:識別有助于區分上下文中特定含義的中心名詞和相關實詞。o 細心的門衛在聽到這件事后立即關上了大門。實體識別:提取文本元素并將其分類為預定義的組,例如人員姓名、組織、位置、時間表述方式、數量
25、、百分比等。規則生成:使用半監督機器學習從選定的詞匯自動創建實體識別規則.情感分析(子文檔級別):識別文本中的主觀信息并將其標記為正面、負面或中性,并將該信息與某個實體進行關聯。文本摘要:在單個長文檔或一組相關文檔中自動提供重要概念的摘要。15TOC借助 SAS 視覺文本分析將自然語言處理、機器學習和語言規則結合在一起溝通的科學自然語言處理NLP 建模方法 2019 SAS Institute Inc.,美國北卡羅來納州 Cary 市。保留所有權利。110353_G99466US.0619提取和解釋信息開發會話系統名詞組(區塊)聊天機器人 基于規則、監督機器學習和/或深度學習語音轉文本 基于規
26、則、監督機器學習和/或深度學習分析趨勢解析預處理奇異值分解基于規則和/或監督機器學習基于規則、監督機器學習和/或深度學習無監督機器學習無監督機器學習監督機器學習、無監督機器學習和/或深度學習基于規則、監督機器學習和/或深度學習基于規則、監督機器學習和/或深度學習基于規則、監督機器學習和/或深度學習基于規則、監督機器學習和/或深度學習基于規則、監督機器學習和/或深度學習基于規則、監督機器學習和/或深度學習基于規則、監督機器學習和/或深度學習基于規則、監督機器學習、無監督機器學習和/或深度學習拆分 基于規則和/或監督機器學習刪除重復 基于規則和/或無監督機器學習正規化 基于規則、監督機器學習和/或
27、深度學習分層 基于規則和/或無監督機器學誤拼分析詞性標記句子邊界歧義消除潛在狄利克雷分布詞嵌入分類情感分析(文檔級別)實體識別規則生成情感分析(子文檔級別)文本摘要詞語切分 基于規則、監督機器學習和/或無監督機器學習詞干提取 基于規則、監督機器學習和/或深度學習依賴關系解析 基于規則、監督機器學習和/或深度學習子句分析 基于規則、監督機器學習和/或深度學習開發會話系統自然語言處理功能旨在簡化人類與計算機之間的交互,這一交互過程通常被稱為對話式 AI。會話式 AI 主要專注于自然語言理解和自然語言生成的應用。聊天機器人:使用聊天機器人,計算機可以通過口頭或書面語言理解并響應人類輸入??梢詫λ鼈冞M
28、行編程以響應簡單的關鍵字或提示,或者處理關于特定主題的復雜會話。聊天機器人的復雜程度各不相同,從使用關鍵字匹配的信息檢索到主動學習功能,后者會根據先前的會話提供深入的響應和量身定制的建議。語音轉文本:語音轉文本功能可以識別口語,然后將語音轉換為文本格式。翻譯成文本后,可以使用自然語言處理提取信息和分析該文本內的模式。在該過程中,首先會提取特征,然后機器會將音頻文件分解成為短幀進行分析。接下來,通過聲學模型預測語音及其所代表的字母之間的對齊方式。然后將聲學模型產生的值輸入到語言模型中,以便該語言模型使用 NLP 將這些值轉換成字詞和短語。16TOC借助 SAS 視覺文本分析將自然語言處理、機器學
29、習和語言規則結合在一起自然語言處理的實際效果多個行業如何通過自然語言處理提供更好的產品和服務并提高效率。人們希望被傾聽。無論是報告服務問題的客戶,尋求醫療幫助的患者,還是與政府代表聯系的公民,人們越來越多地以數字形式進行聯系,因為技術使溝通變得更加 便捷。無論接觸點如何發生(面對面、通過電話、電子郵件、社交媒體或是網絡聊天),重要信息正在涌入您的組織,您需要及時了解正在發生的事情,以便做出正確的決策。自然語言處理的實際效果:提供更好的產品和服務 自然語言處理在用于分析公司及其客戶之間的通信流時非常有效。該分析提供了實時洞察,可用于提高所交付產品和服務的整體質量。例如,一家乳品公司希望使用呼叫中
30、心數據來了解產品質量和客戶流失率,但在面對涌入的大量數據時,卻不知所措。公司使用自然語言處理來幫助從數據中提取關系并進行分類,隨后很快發現了一種趨勢,人們都在抱怨“奶上有浮油”和“看起來不 對勁”。公司通過快速識別并深入研究問題意識到,在機器校準中出現了人為錯誤,并且該錯誤導致一批牛奶未經過均質處理。該錯誤是使用自然語言處理發現的,使得公司能夠在生產更多非均質牛奶之前對該錯誤進行糾正。NLP 還指出,特定的促銷策略正在導致更大的客戶流失。公司提供了六個月的免費送貨服務,但情感分析顯示,在最初的六個月免費送貨后,向客戶收取送貨費讓客戶感到非常不滿。事實證明,提供送貨服務折扣而不是在有限的時間內提
31、供免費送貨服務,可以提高客戶保留率以及對公司產品和服務的總體滿意度。在另一個示例中,一家為超過 100 萬客戶提供服務的電信公司需要一種更加主動的方法,以四種不同的語言處理 10,000 多個日常服務呼叫。IT 部和業務用戶聚在一起確定用戶需求,定義相關關鍵字并開發了每日報告儀表板以反映領導需求。應用自然語言處理幾乎可以與呼叫中心的人類文檔同時顯示關系并提供解決方案。這樣,呼叫中心的員工便可以獲得第一通呼叫的正確答案以滿足客戶的需求。除了呼叫中心反饋,還創建了每日報告儀表板,以使用社交媒體分析來評估客戶趨勢和反饋。這使企業通訊團隊可以更好地了解客戶,從而有針對性地制定更加準確的營銷計劃。提高組
32、織效率 自然語言處理還可以用于完善內部流程并提高運營效率。這種效率可以通過以下形式來實現:更改培訓標準、更集中的數據訪問甚至使用智能聊天機器人來進行分析。例如,一家旨在通過提供高于同行的服務質量來更好地滿足客戶需求,最終贏得客戶信任的銀行,推出了一個在線門戶網站,使客戶可以通過網絡聊天與人類代理進行 溝通。該銀行平均每個月通過門戶網站進行 25 萬次網絡聊天會話,并在每次網絡聊天之后進行一次客戶滿意度調查。通過人工分析,該銀行每個月只能進行 200 次網絡聊天。自然語言處理有助于將這項工作擴展到所有每月 25 萬次網絡聊天,并提供了洞通過傾聽來理解自然語言處理18TOC借助 SAS 視覺文本分
33、析將自然語言處理、機器學習和語言規則結合在一起察,以幫助確定代理處理得較好的主題以及需要改進的領域。通過該數據,團隊負責人可以查看每個代理的表現,并評估他們的優缺點,從而制定有針對性的培訓。此外,NLP 應用程序還顯示,在后續調查中,表現出情緒高昂的網絡聊天并不總是獲得積極的滿意度得分。盡管這種差異可能會讓代理感到沮喪,但 NLP 發現,在許多情況下,滿意度得分較低的原因是因為相關問題超出了代理的控制范圍。例如,如果客戶想要立即取消直接借記,代理可以在網絡聊天期間更新系統,但是內部系統需要額外的一天時間來處理取消,這使客戶感到惱火和不滿。通過此類反饋,負責人可以了解客戶滿意度低下的根本原因,并
34、調整流程以解決問題并提高客戶滿 意度。在另一個示例中,大型太陽能發電廠的設施經理需要一款工具,以便在遠離計算機時監控太陽能電池板。通過移動界面載入的聊天機器人旨在分析來自太陽能電池板的實時流數據。設施經理現在可以使用智能手機要求聊天機器人報告設備狀態,提供每個電池板的能量生成情況并制定每天、每月或每季節的能量輸出摘要。借助移動聊天界面,技術人員擴展了自身的能力,他們可以在外出重啟電池板或在極端天氣條件下監視電池板狀況時查詢應用程序了解情況。這樣一來,分析便觸手可及,員工可以在需要時訪問所需信息。通過傾聽來理解對于人類來說,每天聆聽 10,000 個客戶來電并滿足每位客戶的需求是不可能的。將呼叫
35、者轉接到不同的組,試圖找到正確的答案,這一過程會給客戶帶來不悅的體驗。要想給您的員工提供及時解決問題的正確工具,獲得自然語言處理的支持是不二之選。機器可以處理大量呼叫中的細節問題,提供實時洞察,并基于兩個人之間自然對話流的節奏來建議下一個最佳行動。這意味著技術可以通過在第一時間找到正確答案來實際改善人類的體驗,而不必犧牲與客戶的個人聯系和關系。通過傾聽來理解自然語言處理19TOC借助 SAS 視覺文本分析將自然語言處理、機器學習和語言規則結合在一起自然語言處理的 9 個最佳實踐大規模構建和部署 NLP 模型的技巧在 AI 系統的設計和實現過程中,自然語言處理是促進理解和加強人機協作的橋梁。自然
36、語言處理需要人類和機器的大量智能和能力才能有效實施。切實管理不斷增長的非結構化文本量以及有效構建和管理各種 NLP 模型的能力,在很大程度上取決于擁有靈活的體系結構和可以擴展以滿足運營需求的強大處理能力,同時還要確保所有數據和數據的治理和安全。除了自然語言處理外,SAS 還提供四個其他核心 AI 功能:機器學習和深度學習;計算機視覺;預測,以及優化。但是,僅靠實施核心功能力還不足以從算法中獲取價值。要想超越單一功能,不僅要創建整個 AI 系統,還要使其投入運營,這就需要使用分析生命周期。最基本的 AI 元素是數據。分析的輸出與輸入幾乎匹配,因此全面的數據管理是成功的必要組成部分??梢暬瘜τ诎l現
37、數據和分析、創建直觀的儀表板以及輕松地將結果傳達給各利益相關者來說至關重要。發現是 AI 技術的發展方向,在此過程中會使用分析 數據管理可視化 部署 決策支持機器和深度學習計算機視覺預測優化 自然語言處理數據發現部署智能語言自然語言處理來將數據轉換為智能。核心 AI 功能可以獨立使用,也可以與其他 AI 技術結合使用,以基于數據類型和業務需求發現洞察。將 AI 模型部署到生產中就是實現價值的時候。借助 SAS,您擁有了強大的模型管理功能,無論您要部署一個模型還是數千個模型,均可輕松實現。通過統一的平臺,模型可以進行一次構建并部署到任何地方而無需重新編碼,從而節省了大量時間和精力。SAS 的自然
38、語言處理SAS 的自然語言處理功能也受整個分析生命周期的支持。SAS 攝取、清理和轉換數據以進行分析,通過本地或遠程文件系統、關系數據庫和云存儲輕松接收多種文件格式。SAS 平臺提供多線程并行處理,以在支持云的開放式架構上進行內存分析。REST API 允許靈活的集成,用戶可以選擇使用 SAS、Python、R、Java、Scala 或 Lua 進行編碼。數據,模型沿襲和治理允許用戶在分析生命周期內維護對數據管理和分析的訪問和控制。21TOC借助 SAS 視覺文本分析將自然語言處理、機器學習和語言規則結合在一起追溯和監控可視化選擇的編程語言開放架構和 REST API云準備基于內存分析多線程并
39、行處理分析生命周期SAS 平臺上的 NLP 本地文件系統 遠程文件系統 云存儲 關系數據庫 多個文件格式 音頻文件 詞語切分 詞干提取 詞性標記 摘要 主題發現 分類 情感分析 信息提取 語音轉文本 聊天機器人 數據庫中 Hadoop 中 流傳輸 模型生命周期管理 決策管理 透明度和可解釋性數據發現部署SAS 平臺上的 NLP 功能受中央處理單元(CPU)和圖形處理單元(GPU)的支持。SAS 還提供了分析存儲(ASTORE)功能,它是用于表示特定模型或算法中的評分邏輯的二進制文件。通過這種緊湊的資產,可以輕松移動分數代碼并將其集成到現有應用程序框架中。ASTORE 是使用模型開發訓練階段的結
40、果創建的,可以輕松地從一個主機傳輸到另一個主機。NLP 模型可以通過完整的生命周期管理部署在數據庫、Hadoop 和流中。智能語言自然語言處理構建和部署 NLP 模型的最佳實踐 SAS 平臺提供了大規模構建和部署自然語言處理模型所需的架構。作為基于文本的 AI 平臺的領導者,SAS 創建了一份快速清單,列明了構建和部署 NLP 模型時需要考慮的事項。22TOC借助 SAS 視覺文本分析將自然語言處理、機器學習和語言規則結合在一起1.確定并明確說明您的 NLP 應用程序的目標。2.收集技術和業務用戶,以確定關鍵詞匯和儀表板要求。3.確定給定數據類型或行業所需的任何監管指南。4.創建標準分類法。5
41、.為您要測量準確性的分類法中的那些項目提供黃金數據集。6.確定是否需要利用深度學習和圖形處理單元。7.確定需要分析的數據源和節奏。8.創建用于構建模型的最佳實踐管道。9.制定用于模型管理的安全和治理流程。智能語言自然語言處理人和機器智能之間的通信鏈接自然語言處理是人類與機器之間的通信鏈接。它需要人類和機器雙方支持才能有效工作。NLP 有效改善我們的生活和工作方式。如果沒有人與技術之間的合作,進展就會變得緩慢和困難??纯茨慕M織,想想看您收集的非結構化文本或音頻數據以及可能它可能包含的啟示。這些數據反映了您所服務的客戶的反饋,并且有可能幫助您提供更好的體驗、改善護理質量和提高人類參與度。您的非結
42、構化文本數據中包含了許多震撼的故事,而找到它們的最佳方法就是運用自然語言處理功能。最佳實踐清單23TOC借助 SAS 視覺文本分析將自然語言處理、機器學習和語言規則結合在一起關注我們:借助 SAS 可視化文本分析在您的非結構化文本中找到您所需的信息SAS 和 SAS Institute Inc.的所有其他產品或服務的名稱是 SAS Institute Inc.在美國和其他國家/地區的注冊商標或商標。表示在美國注冊。其他品牌和產品名稱是其各公司的商標。版權所有 2020 年 SAS Institute Inc.保留所有權利。111187_G119277.0120與當地 SAS 機構聯系,請訪問: