當前位置:首頁 > 報告詳情

講習班-大語言模型的多語言能力增強-上海人工智能實驗室.pdf

上傳人: 山海 編號:627097 2025-04-21 60頁 3.81MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要介紹了大語言模型(LLM)的多語言能力增強方法。首先,作者指出LLM在非英語語言上的表現不佳,主要原因是預訓練詞表未適配多語言需求,以及預訓練數據中覆蓋的語言不多。接著,作者詳細介紹了詞表構建、數據處理、模型訓練等方法來增強LLM的多語言能力。其中,詞表構建方面,提出了基于模型分詞和使用模型對合成路徑進行打分的方法;數據處理方面,提出了數據篩選和質量調整模型;模型訓練方面,提出了微調(Fine-Tuning)和持續預訓練(Continual Pretraining)等方法。最后,作者指出LLM在多語言翻譯和文檔級機器翻譯等應用中的潛力,以及LLM在壓縮視角下的文本壓縮和知識壓縮等新方向。
如何提高LLM的多語言能力? 數據處理對LLM多語言性能有何影響? 如何利用LLM進行多語言翻譯?
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站