當前位置:首頁 > 報告詳情

計算機行業GPT系列:具身化多模態PaLM~E-230314(17頁).pdf

上傳人: sec****ies 編號:118311 2023-03-14 17頁 2.73MB

下載:
word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要介紹了谷歌最新推出的多模態大語言模型PaLM-E。PaLM-E引入了具身化和多模態概念,通過將多模態信息編碼為與語言相似的形式,嵌入已有的PaLM模型,實現多模態的聯合訓練。PaLM-E的核心思想在于,通過將圖像、文字、具身數據聯合訓練,并引入多模態輸入,增強了模型對現實中對象的理解,實現了機器人處理具身推理任務。PaLM-E解決了機器學習的grounding問題,即如何將抽象的符號或概念與真實世界的物體或事件聯系起來的問題。PaLM-E的訓練數據集包含數十個子訓練集,涉及視覺、語言和具身數據。PaLM-E在任務與運動規劃、桌面環境操作和移動操作等具身任務中,能在部分仿真任務上取得優于SOTA的結果,并成功指導現實中機器人完成長期任務。PaLM-E同樣在視覺/語言任務上取得較好效果。
PaLM-E如何解決機器學習的grounding問題? PaLM-E在哪些實驗中表現出了良好的遷移和泛化能力? PaLM-E在通用視覺語言任務和通用語言任務上的表現如何?
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站