《亞馬遜云科技:2024生成式AI優勢:創始人指南之利用數據脫穎而出白皮書(20頁).pdf》由會員分享,可在線閱讀,更多相關《亞馬遜云科技:2024生成式AI優勢:創始人指南之利用數據脫穎而出白皮書(20頁).pdf(20頁珍藏版)》請在三個皮匠報告上搜索。
1、生成式 AI 優勢:創始人指南之利用數據脫穎而出2目錄概覽創始人指南之利用數據脫穎而出.3 生成式人工智能簡要介紹.4將數據置于生成式人工智能方案的中心.5 第 1 節利用數據打造特色生成式人工智能應用程序.7 第 2 節為生成式人工智能奠定數據基礎.11 第 3 節讓思維突破技術范疇創造競爭優勢.14 總結以全新方式挖潛數據創造更多價值.19 詞匯表.203概覽創始人指南之利用數據脫穎而出 生成式人工智能(AI)橫空出世,展現出了顛覆我們溝通、創造和運營方式的巨大潛力,令世人矚目。而生成式人工智能刮起的這股旋風很大程度上得益于 ChatGPT 和 YouChat 等面向消費者的應用程序的推出
2、。這些開創性的聊天機器人展示出與人類相仿的創造力和對話能力,著實令人震撼。不過,生成式人工智能真正的用武之地,可遠不止通識型聊天機器人。各行各業中的初創企業才剛剛開始撥開生成式人工智能的層層面紗,一步一步試探著生成式人工智能協助他們創新的方法。他們渴望嘗試種種可能性,并且都有充分的理由來這么做。高盛的研究表明,生成式人工智能有望在 10 年內將全球國內生產總值(GDP)提高近 7 萬億美元,將生產力增速提高 1.5 個百分點。同時,該技術對投資者也有巨大的吸引力,根據 Pitchbook 的統計,生成式人工智能初創企業在 2023 年籌集了 270 億美元的資金。隨著技術逐漸成熟,新一輪的創新
3、型初創企業和科技公司紛紛快速推出各種新一代生成式人工智能功能,以滿足客戶和企業不斷增長的需求。這種持續創新帶來了生成式人工智能應用場景的快速增長。鑒于這些研究成果,初創企業創始人和數據領導者紛紛希望快速推進自己的生成式人工智能應用程序,也就不足為奇了。他們不僅想知道如何走好下一步,還想了解如何在這個新興領域搶占競爭優勢并吸引投資者。充分發揮生成式人工智能潛力的關鍵在于初創企業自己的數據。有了生成式人工智能,數據就能成為企業的競爭優勢。4簡要介紹 概括而言,生成式人工智能可以定義為一種用于生成新內容和新想法的人工智能。例如,生成式人工智能應用程序可以撰寫故事、生成代碼、設計數字圖像。這些應用程序
4、還可以自動執行繁瑣的任務,例如從冗長的文檔提取出簡短的摘要等。雖然我們無法詳盡列出生成式人工智能的所有用途,但可以看到的是,客戶已將生成式人工智能應用程序用于以下常見領域:通過聊天機器人、虛擬助理、個性化或內容審核等功能改善客戶體驗 通過對話式搜索、內容創建、文本摘要或代碼創建來提高員工的工作效率 加速各類創意內容(如藝術、音樂或動畫)的制作 通過智能文檔處理、預測性維護、質量把控和視覺檢測,或者通過數據增強,來簡化業務運營人工智能機器學習神經網絡生成式模型5生成式人工智能與所有人工智能一樣,生成式人工智能也是由機器學習(ML)模型提供支持,而且使用的是基于海量數據進行預訓練的超大型模型。這些
5、模型通常稱為基礎模型(FM)。值得注意的是,基礎模型的核心是利用機器學習的新進展。像生成式預訓練轉換器(GPT)模型這一類的基礎模型,通常被稱為大型語言模型(LLM),專門用于基于語言的任務,例如摘要、文本生成和開放式問答。大型語言模型之所以特別,是因為它們包含大量使它們能夠學習高級概念的參數。將數據置于生成式人工智能方案的中心 我們很早就知道,數據是企業的戰略資產。然而,根據 Accenture 的一項研究,即使對數據基礎設施進行了投資,也只有三分之一(32)的公司能夠從數據中實現切實且可衡量的價值。生成式人工智能有助于改善這種狀況。生成式人工智能讓您能夠以全新的方式利用自己的數據,并從中挖
6、掘出更多的價值。通過這種技術,您可以更迅速地基于自己的數據進行創新,在新型應用程序中充分利用這些數據,還能讓傳統上難以處理的數據(例如非結構化數據)充分發揮價值。我們已經看到一些客戶將數據與生成式人工智能相結合,改善了業務成果和客戶體驗。例如,Intuit 構建了 Intuit Assist,這是一款新型的生成式人工智能助手,通過使用小型企業、消費金融和稅務等領域的相關上下文數據集,為客戶提供個性化的金融洞察。Clearhead 是一家初創企業,能夠提供創新的員工援助計劃(EAP),該計劃力圖讓用戶能夠更輕松地在其健康平臺上找到合適的治療師,從而更好地獲取心理健康支持,其中也包括改進數字化治療
7、師聊天機器人的應對能力。Clearhead 在 Amazon Bedrock 上使用 Amazon Titan 來增強聊天機器人提供的個性化體驗,能夠更好地結合具體情境進行討論,使治療師搜索更準確,并降低生成式人工智能的成本,帶來更可預測的響應。6生成式人工智能這些應用程序令人振奮,而這些只是生成式人工智能給初創企業及其客戶所帶來價值的冰山一角。生成式人工智能還將以哪些方式改變我們的世界,人們仍在拭目以待。您是不是感覺自己進入到一個未知的領域,對于該如何實現生成式人工智能的巨大潛力感到茫然?實際上,使用生成式人工智能實現商業價值的方式與使用任何其它技術沒有太大區別。這取決于您是否制定了足夠強大
8、的數據戰略,以及您是否在該戰略中明確了如何使用數據作為競爭優勢。您可能已經制定了數據戰略,也可能剛剛開始制定。無論屬于哪種情況,現在都是將生成式人工智能納入戰略的絕佳時機,如此方能讓您實現更多商業價值。通過利用自己的數據實現差異化,您將把握前所未有的機會,獲得可持續的競爭優勢。在本白皮書中,我們為創始人及其團隊提供了洞見和后續行動建議,助力初創企業更充分地利用數據,打造出獨有的生成式人工智能應用程序。要在這一領域進行創新和競爭,您需要制定全面的數據戰略,還要將技術、業務優先事項、應用場景、員工和治理防護機制等全部考慮在內??偠灾?,該戰略代表了一種看待數據的現代化方法,可確保您從生成式人工智能
9、應用程序中實現商業價值。利用您的數據打造特色生成式人工智能應用程序1妥善奠定數據基礎,通過生成式人工智能充分發揮當前數據的價值2讓思維突破技術范疇,通過生成式人工智能 創造競爭優勢3我們將從三個重點領域出發,為您剖析如何制定這種現代化數據戰略:7第 1 節利用數據打造特色生成式人工智能應用程序您的應用程序是一般通用型的,還是能夠深入了解您的初創企業和客戶?這兩者之間的差別就在于您是否恰當使用了自己的數據。因此,您必須確定如何妥善利用自己的數據來精準把握自身業務的獨特性,并將這些獨特之處加以推廣。對于大多數初創企業而言,部署生成式人工智能應用程序的起點都是開箱即用的基礎模型(FM)。僅有少數初創
10、企業會選擇構建自己的基礎模型,來支持其生成式人工智能應用程序,但這需要大量計算資源和高度專業的員工。雖然開箱即用的基礎模型功能足夠強大,但從設計的角度看,這些模型都是一般通用型的。它們的名字已經說明了這一點:“基礎”模型。這意味著這些模型沒有根據您的業務需求進行調整,因為這些基礎模型無法訪問初創企業的新數據,或者無法執行特定領域的任務,因而無法滿足用戶請求。要利用生成式人工智能應用程序滿足您的客戶體驗要求、內部知識、品牌風格和道德標準,您的數據是關鍵。例如,如果您是一家在線旅行社,想要通過生成式人工智能應用程序為客戶提供更好的旅行建議,那么您可能需要利用特定于客戶的個人數據,例如過去的旅行、網
11、頁瀏覽歷史記錄和旅行偏好等等數據。您還需要訪問有關相似旅行者的慣性和旅行清單的匯總數據,以便提供更好的建議。通過使用自己的數據,您就能為客戶帶來個性化且獨特的體驗。此外,開箱即用的基礎模型人人都可得而用之,因此只有使用自己的數據對其進行定制,您的生成式人工智能應用程序才能凸顯出自己的不同之處。假設您還使用開箱即用的基礎模型為您的在線旅行社起草營銷文案,您的競爭對手可能也在使用相同的模型做同樣的事情。這些模型在很大程度上使用的是同一個通用知識庫生成內容。因此,如果不進行定制,可能會導致您和您的競爭對手創建出來的內容大同小異。定制化創造出來的競爭優勢是可持續的。有幾種方法可以定制基礎模型,其中包括
12、微調和上下文 學習等。8第 1 節客戶聚焦作為全球交通數據和分析提供商,INRIX 正在構建以 Amazon Bedrock 為核心的新解決方案。解決方案用于實時提供最新信息,以便交通和安全工程師能夠了解到街道上所出現的情況,事件發生的地點、時間和原因,以及如何應對。這款新的 Amazon Bedrock 解決方案使用檢索增強型生成(RAG),利用超速和車禍事件等歷史數據以及擁堵狀態和當前天氣狀況等新近數據,來增強輸送給底層基礎模型的提示。INRIX 通過使用自己的數據來增強 Amazon Bedrock 中的基礎模型,可以快速回答客戶提出的復雜問題,例如應如何改變道路才能緩解交通擁堵、盡可能
13、減少事故,如何確定新零售商店的理想位置,甚至如何緩解下一場音樂會的交通和停車問題等等。9第 1 節生成式人工智能數據新興模式微調使用開箱即用的基礎模型時,您必須利用自己的數據來定制模型,從而滿足您獨特的業務需求。對于領域密集型應用程序,例如技術支持坐席或企業特有的內容創作,微調是一個不錯的選擇。借助 Amazon Bedrock,您可以安全地使用自己的數據定制基礎模型,并使用其它內置工具來構建了解您的業務、數據和客戶的應用程序。設想一下,一位服務于領先電子商務初創企業的內容營銷經理,需要為即將推出的新手袋系列制作有針對性的全新廣告和活動文案。為此,他們向 Amazon Bedrock 提供了一
14、些帶標簽的示例,這些示例存儲在 Amazon Simple Storage Service(Amazon S3)上的數據湖中,其中包含了他們在過去的活動中表現出色的標語,以及相關的產品描述。Amazon Bedrock 針對客戶另外各克隆了一套基礎模型,只有該客戶才能訪問到自己的基礎模型副本進行模型訓練。訓練結束后,Amazon Bedrock 會自動為新款手袋生成有效的社交媒體帖文、展示廣告和網頁文案。模型微調使用特定領域的數據進一步 訓練預訓練模型知識領域豐富的客服坐席示例:技術支持聊天機器人上下文學習使用特定領域的私有上下文數據 指導預訓練模型僅局限于某些領域 的虛擬坐席示例:客服、賬單
15、服務訓練自己的模型利用特定數據訓練出深度了解 特定領域的應用程序分子序列、編程語言 示例:基于特定領域的 數據訓練模型10第 1 節上下文學習基礎模型是在某個時刻訓練的,每次數據集更改時都對其進行微調是不切實際的。一旦完成訓練,基礎模型就不會再攝取新的知識或數據了。如果需要額外的上下文來解決問題,基礎模型也無法找到實時信息,因此也使用不到這樣的實時信息。為了提高響應的相關性且更符合上下文,不妨通過上下文學習為基礎模型提供數據,這種技術通過提示工程或檢索增強型生成(RAG),引導基礎模型獲取特定領域的上下文數據。許多企業都使用檢索增強型生成作為進行上下文學習的主要方法。檢索增強型生成有便于您的基
16、礎模型使用到初創企業的新數據,從而提供更準確、更相關的響應。檢索增強型生成通常使用向量嵌入(即,以數字形式表示的字詞、短語或圖像)。嵌入會對源文本或圖像的語義含義進行編碼,這樣基礎模型就能夠更輕松地發現相似向量之間的關系并改善對提示的響應。雖然您可以單獨使用上述每種技術,但結合使用微調和檢索增強型生成,將會更有助于您利用數據打造出頗具特色的生成式人工智能應用程序。搜索相關信息知識來源為增強上下文而獲取的相關信息生成的文字回應提示+查詢12查詢3提示+查詢+增強版上下文大型語言模型端點5411您的數據是使用生成式人工智能應用程序創造價值的關鍵。因此,使用高質量、相關、易于訪問且可供使用的數據來定
17、制模型,也就變得尤為重要。要滿足這些基準要求,首先要有強大的數據基礎。該基礎應包括一組面面俱到、集為一體的數據服務,適用于所有工作負載、應用場景和數據類型,還要包括一些數據治理工具。下面簡要概述了該數據基礎:面面俱到對于生成式人工智能,您需要存儲各種類型的數據,包括非結構化數據、結構化數據、流數據和向量數據,這些數據可用于構建和定制模型,以及為提示添加上下文(無論是否使用檢索增強生成)。一套面面俱到的數據服務,將讓存儲所有這些數據以及大規模查詢和分析這些數據成為可能。通常,一套面面俱到的生成式人工智能數據服務都會包括一個耐久性和可擴展性都較高的數據湖。該數據湖用于存儲您構建和定制基礎模型所需的
18、特定領域數據。多年來,亞馬遜云科技一直在通過 Amazon S3、Amazon Glue 和 Amazon Lake Formation 等服務,為客戶奠定堅實的數據湖基礎,用以存儲結構化和非結構化數據。我們的客戶已使用 Amazon S3 創建了數十萬個數據湖。生成式人工智能的數據基礎還包括用于檢索增強型生成的高性能知識存儲庫。亞馬遜云科技根據您的應用場景提供了多種選項。例如,NoSQL 數據庫可存儲對話狀態和歷史記錄,因此聊天機器人可以記住之前的響應。事務型數據庫可存儲上下文和客戶信息,從而能夠創建出更加個性化的響應。您還可以使用像 Amazon Kendra 這樣的知識存儲庫,連接到多個
19、結構化和非結構化內容存儲庫,為您的基礎模型提供基于文檔的知識來源?;蛘?,您也可以使用具有向量搜索功能的數據庫,這些數據庫是專為高效存儲和檢索嵌入而設計的。在現有使用的數據庫中使用向量搜索的功能具有一定的優勢。例如,無需克服苦學新編程工具、API 和 SDK 這一重困難。您也可以確信,您的現有數據庫已在生產環境中經過驗證,能夠滿足可擴展性、可用性、存儲和計算方面的要求。而且,當您的向量和業務數據存儲在同一個位置時,您的應用程序可以更快地運行,無需擔心數據同步或數據移動。亞馬遜云科技為許多常用數據存儲提供了向量搜索功能,讓客戶可以在構建生成式人工智能應用程序時享受更大的靈活性。第 2 節為生成式人
20、工智能奠定數據基礎12第 2 節面面俱到的數據基礎同時涵蓋了數據分析和數據存儲。您可以使用數據倉庫來定制需要最新運營數據的基礎模型和應用場景,例如構建基礎模型或其它大型語言模型,通過自然語言查詢提供有關業務數據的洞察。Amazon Redshift 是一款高速 PB 級數據倉庫,其性價比是其它云數據倉庫的六倍。1 Amazon Redshift 可與您的許多數據來源集成,包括 Amazon S3 和 Amazon Aurora,因此您將能更全面地詮釋自己的數據。集為一體數據整合使您能夠全面了解自己的業務,并確保您的生成式人工智能應用程序可以隨時訪問您的數據。通過亞馬遜云科技服務之間的直接集成,
21、我們可以減少和消除常見應用場景中的提取、轉換和加載(ETL)流程,這樣團隊就可以更快地行動。您還可以使用 Amazon Glue(我們的可擴展型無服務器 ETL 和數據整合服務),更輕松地挖掘、準備、移動和整合來自多個來源的數據,以便進行分析和機器學習。亞馬遜云科技可連接到數百種數據來源,包括軟件即服務、本地和其它云端數據來源,以及來自 300 多家數據提供商的第三方數據來源?!叭绻麩o法有效地整合數據、便捷地訪問數據,公司就無法對生成式人工智能進行微調,也就無法將這項技術用于更多可能更具變革性的用途?!盬hat every CEO should know about generative AI
22、,McKinsey Digital,2023 年1 Amazon Redshift 性價比13第 2 節數據受到安全保護和妥善治理 在構建生成式人工智能應用程序的整個生命周期中,您的數據都需要受到安全保護和正確治理。亞馬遜云科技提供了多種工具來確保數據質量、隱私和訪問權限管控,因此您可以將高質量且合規的數據用于生成式人工智能應用程序。使用 Amazon Bedrock,您的所有數據都使用您自己的密鑰管理服務(KMS)密鑰進行靜態加密,這樣您就能完全掌控存儲和訪問數據及定制模型的方式。借助 Amazon PrivateLink,您可以只通過亞馬遜云科技網絡,將您存儲在亞馬遜云科技云端的數據傳輸到
23、 Amazon Bedrock,而無需使用公共互聯網。您可以在自己的虛擬私有云(VPC)上定制私有基礎模型,這樣您的數據就不會泄露,也不會用來訓練或定制可供其它初創企業使用的模型。Amazon Titan 基礎模型可檢測出然后刪除您用于定制的數據中的有害內容,拒絕用戶輸入內容中的不當內容,并過濾掉包含不當內容(例如褻瀆或仇恨言論)的模型輸出。在本白皮書前面的部分中,我們也討論了定制基礎模型在反映您的特定品牌和增強客戶體驗,以及根除不準確或不相關內容方面的重要性。盡管量身定制對于應對這些挑戰很重要,但以人工監督和反饋的形式進行數據治理也很重要。您需要進行人工干預,來確保所生成的內容能夠反映出您希
24、望向世界展示的形象。例如,通過真人反饋方法進行強化學習,您將能夠訓練基礎模型在真人專家的指導下作出決策和采取行動。這些專家會尋找潛在的癥結,例如數據中的偏見、數據質量問題和數據缺口,并且保障基礎模型符合您的品牌形象、公司準則、道德和政策。14技術固然是生成式人工智能發展的強大推動力,但對于一個要將數據作為戰略性資產嵌入初創企業方方面面的數據戰略而言,技術只是其中的一個環節。在亞馬遜云科技,我們以一種更開闊的現代化視角看待數據戰略。一個端到端的數據戰略應包括技術、思維方式、人員和流程方面的考慮。綜合考慮所有這些方面,才能將數據融入業務和運營的各個方面,為您的團隊打造數據驅動型公司鋪平道路。思維思
25、維方式是指公司思考和處理數據的方式。初創企業的思維方式反映在信念、價值觀和行為上,這三個方面共同塑造了公司的數據驅動型文化以及與該文化相一致的應用場景。傳統上,創始人在制定數據戰略時所持的思維方式是,數據是構建解決方案的平臺和手段。這種觀點始終造成 IT 投資與期望獲得的業務成效改善不匹配。隨著人們對生成式人工智能的興趣與日俱增,我們發現越來越人都持有這種思維。這種觀點的盛行是可以理解的,因為創始人希望將生成式人工智能利用起來,以期保持競爭力。但是,他們首先必須清楚這些應用程序如何幫他們解決問題,或如何使他們的業務脫穎而出。這就需要將生成式人工智能視為一種不斷演變,且能夠帶來實際價值的數據產品
26、。運用這種思維方式,初創企業就會將重點放在客戶身上,而不是放在解決方案上,這樣您就能夠縮小數據計劃與業務成果之間的關鍵差距。第 3 節讓思維突破技術范疇 創造競爭優勢“將數據作為資產的初創企業,利用數據推動持續創新并從數據中挖掘切實可行的洞察,以便增強客戶體驗并滿足不斷產生的客戶需求?!盇ccelerating business value with a modern data strategy,亞馬遜云科技,2023 年15第 3 節飛輪理念我們通過飛輪方法協助客戶將數據驅動型產品變為現實,滿足客戶的應用場景需求。這種方法能夠讓您以更快的速度抓住高價值商機或客戶,并打造出把握這些機會的數據產
27、品或體驗。一旦飛輪開始旋轉,您就能夠繼續發現更多新應用場景并提供更多產品或體驗。飛輪有助于加速轉型并創造增量價值。我們將其總結為“大處著眼,小處著手,快速擴展”,并通過以下示例對此進行簡要說明:1.互動:與業務和技術 領導層交流,制定出有吸引力的“放眼大局”愿景4.擴展:按照 912 個月的 優先項目路線圖 擴大規模2.創建:針對具有挑戰性的 業務應用場景,開展生產就緒型 高速產品開發3.積累:在實施云端數據 基礎的同時,積累開發數據 產品的經驗飛輪轉起來實現新的 商業價值舉個例子,在線美容零售商 BEAUTY BAY 盡力提供卓越的客戶體驗,并讓其年輕受眾隨時了解最新時尚趨勢。該公司與亞馬遜
28、云科技合作伙伴 BJSS 合作開展數字化轉型,對其業務的許多方面產生了影響。他們共同對 IT 資產開展 Amazon Well-Architected 審查,對訂單管理系統進行了改進,并在亞馬遜云科技上構建了云原生數據平臺。BJSS 使用“一切皆代碼”方法和 Amazon CDK(一種開源軟件開發框架,使用您熟悉的編程語言來定義云應用程序資源)來構建數據平臺。通過這種方法,平臺更加靈活、更易用、維護成本更低、部署速度也更快,從而改善了 IT 團隊的創新能力。16第 3 節為員工賦能生成式人工智能(以及一般意義上的人工智能),可以幫助您的團隊更快、更有目的性地利用數據。這種轉變終將使您的初創企業
29、實現更高的效率和生產力,以及更好的員工和客戶體驗。例如,Marketing Evolution 在亞馬遜云科技云端構建了一個創新型測量和歸因解決方案。為了減少耗時的手動流程,Marketing Evolution 開始使用 Amazon Glue,這是一種無服務器數據集成服務,可讓您更輕松地挖掘、準備、遷移并集成來自多方來源的數據,以展開分析、機器學習和應用程序開發。通過這些舉措,Marketing Evolution 得以削減成本并提高解決方案的效率,加快獲得結果的速度并提高了客戶的投資回報率。Protium 使用 Amazon Aurora 開發了 Turiya,這是其內部貸款和風險管控堆
30、棧,也是這家初創企業業務的核心。得益于采用亞馬遜云科技的平臺,Protium 通過 Turiya 得以面向更大的用戶群擴展和定制信貸服務。通過基于工作流的模型,團隊可以在其平臺上加快產品和服務的發布。此外,Protium 現在可以跨渠道進行集成和擴展,同時以經濟實惠的方式保持高可用性、性能和合規性。人工智能和機器學習領域的新興職位生成式人工智能工程師:專門開發生成式人工智能模型和系統,并確保落實,職責范圍 包括針對特定應用程序設計、訓練、微調和優化模型數據策管人:負責采購、收集、整理各種各樣具有代表性且標注正確的高質量 數據集生成式人工智能顧問:提供有關在 各行各業使用生成式人工智能技術的相關
31、專家指導和建議生成式人工智能美術人員:探索生成式人工智能技術用于創意工作中的可能性,從而創作出獨特的創新型藝術作品、音樂作品或視覺設計人工智能政策與法規專家:制定政策、指導方針和法規,規范生成式人工智能系統的負責任開發、部署和使用17第 3 節生成式人工智能有助于讓更多員工能夠利用數據進行創新。為了防止出現障礙和瓶頸,企業必須制定適當的策略,讓員工能夠更輕松地挖掘、使用、共享和管理數據。傳統上,初創企業內的數據傳播幾乎完全由 IT 部門控制,而端到端數據戰略將這一責任轉移到了邊緣,交給了生成和使用數據的團隊。我們常常將這種模式稱為現代化數據社區,目前已經有許多客戶紛紛開始采用這一模式,助力更多
32、員工作出數據驅動型決策,推動個別領域的業務職能變革。全新的技能和職位生成式人工智能將會催生出許許多多全新的職位,并且將對現有人員提出更高的要求。根據世界經濟論壇發布的Future of Jobs Report 2023,大多數需求增長迅猛的職位都是與技術相關的,包括人工智能和機器學習專家,以及數據分析師、數據科學家和信息安全分析師等等。然而,目前人工智能、機器學習和云專業人才的數量極其有限。初創企業通常缺乏一支技能高超的多元化員工隊伍,因此無法充分貫徹自己的數據戰略。為了確保不斷向前邁進,初創企業需要投資于提升現有員工的技能,包括財務或營銷等團隊的員工,而不是僅僅局限于 IT 部門。對這些團隊
33、的員工進行培訓,使其具備與數據交互的能力,進而避免遇到瓶頸,讓他們在正需之時能夠使用到所需的數據產品,用于制定業務決策。提升員工技能是數據戰略的重要一環。這些舉措是一項投資,而不是某些創始人可能認為的無用負擔。同樣,借助人工智能/機器學習,您可以更輕松地為技術能力水平各異的員工提供相應的工具,讓員工都能夠分析數據、汲取洞察和構造敘述。例如,我們的全新生成式人工智能助手 Amazon Q,可協助您在 Amazon QuickSight 中使用自然語言生成總覽板,并根據總覽板數據創建引人入勝的視覺故事。Amazon Q 還可以協助您使用自然語言創建數據集成管線。例如,您可以要求 Amazon Q“
34、從 S3 讀取 JSON 文件,根據accountid進行聯接并加載到 DynamoDB”,Amazon Q 將返回一個端到端的數據整合任務來執行此操作。借助 Amazon Q,數據分析師、數據科學家和數據工程師還可以使用 Amazon Redshift 中的生成式人工智能文本轉 SQL 功能,來查詢數據倉庫中的數據,從而提高工作效率。18第 3 節創建新流程或優化現有流程 跟上創新步伐生成式人工智能讓人們開始思考“負責任的人工智能”的重要性,并為數據治理增添了新的維度。您仍然必須考慮數據共享、安全和隱私等問題,而且現在您還需要考慮與偏見、道德和虛假信息有關的問題。在上一部分中,我們提到了一些
35、有助于緩解與生成式人工智能相關的常見風險的工具。值得注意的是,如初創企業創始人所知,數據治理的關鍵與其說是工具選擇,不如說是戰略制定。數據治理的架構需要支持更廣泛的數據和人工智能戰略,還需要根據應用場景和業務優先事項逐步實施。我們經常聽到創始人抱怨,他們很難體現數據治理計劃的商業價值。我們的建議是,創始人可以從一個更廣闊的視角看待企業的數據戰略并將其與業務優先事項對應起來,這樣就能夠更好地展現該戰略的價值。完善的數據戰略很重要,因為這樣就能確保數據治理政策與組織結構保持一致。要使用生成式人工智能進行創新和快速行動,您的團隊就需要隨時都能使用到所需的數據,還需要在符合安全、共享和隱私政策的范圍內
36、運作。您需要在不容商榷的原則與自主權和速度之間取得平衡。當您將數據治理視為制定更全面數據戰略的推動因素時,就可以實現這種平衡。19總結以全新方式挖潛數據 創造更多價值 我們才剛剛開始探索生成式人工智能的種種可能性,但已經可以感受到這種技術將對幾乎所有應用領域、行業和初創企業帶來多么大的變化。生成式人工智能提供激動人心的新穎方式,讓您可以充分挖潛現有數據并從中獲得更多價值。初創企業可以借此開發出新的數據產品和體驗,從而提高客戶滿意度,最終讓您的品牌脫穎而出。我們知道,幾乎每位創始人都想發掘生成式人工智能的潛力,我們也同樣知道,采取正確的后續行動對您取得成功至關重要。與其使用通用型應用程序,不如將
37、重心放在公司的獨特之處上,并根據這條思路來指導企業決策。貴公司的獨特之處就在于您的數據中。要充分利用您的數據并將其作為戰略資產,您就需要制定一項數據戰略,該戰略不僅要涵蓋所使用的技術,還要涵蓋思維方式、人員和流程。無論是關于如何構建和定制生成式人工智能應用程序,還是如何賦予團隊創新能力,該戰略的每個層面都要牢牢地將您的數據作為競爭優勢。詳細了解如何奠定數據基礎,從而通過生成式人工智能搶占競爭優勢 了解亞馬遜云科技如何助力初創企業輕松構建、擴展并實現生成式人工智能的商業價值 20詞匯表生成式人工智能是這樣一種人工智能,它通過機器學習技術,在經過大量公開數據的訓練之后,使用所學到的模式來創建文本、
38、代碼、圖像和視頻等新內容?;A模型(FM)指基于大量非結構化、未標注數據訓練出來的深度學習模型,可直接用于處理各種任務,也可以通過定制調整,使其適合處理特定任務。大型語言模型(LLM)屬于基礎模型中的一類,可以處理大量非結構化文本并學習字詞與字詞之間或一部分與另一部分字詞之間的關系。正因如此,大型語言模型才能夠生成出自然語言文本,執行諸如摘要或知識提取之類的任務。檢索增強型生成(RAG)指通過使用上下文和特定領域的數據(例如通過向量數據庫)增強提示,從而增加 LLM 的上下文知識并減少事實錯誤或幻覺的過程。量身定制指通過在較小的已標注數據集上進行短時間訓練,以此來調整預訓練的基礎模型,使其在特定任務中表現得更好的過程。這種額外的訓練使模型能夠學習和適應較小數據集中的細微差別、術語和特定模式。提示工程是指設計、完善和優化輸入提示,從而指導基礎模型產生所需(即準確的)輸出的過程。2024,Amazon Web Services,Inc.或其關聯公司。保留所有權利。