《中國外文局翻譯院:2024計算機輔助翻譯技術發展與應用藍皮書(34頁).pdf》由會員分享,可在線閱讀,更多相關《中國外文局翻譯院:2024計算機輔助翻譯技術發展與應用藍皮書(34頁).pdf(34頁珍藏版)》請在三個皮匠報告上搜索。
1、 目錄目錄 卷首語.6 一、翻譯行業數字化、智能化升級是時代之需.7(一)翻譯是國際傳播的“最后一公里”.7(二)新技術為翻譯行業帶來發展新動力.7(三)人機協作構建翻譯工作新模式.8 二、計算機輔助翻譯概述.9(一)核心概念.9(二)發展歷程.10 1.萌芽期(1967-1983).10 2.穩定發展期(1984-1992).11 3.迅猛發展期(1993-2002).11 4.蓬勃發展期(2003 年至今).12(三)系統架構.12 1.用戶交互層.13 2.功能服務層.13 3.數據管理層.14 4.底層技術支撐層.14 5.基礎設施層.15 (四)產品形式.15 1.桌面應用.15 2
2、.在線/云端解決方案.15 3.插件或集成式工具.15 4.定制化企業級系統.15 三、計算機輔助翻譯發展現狀.16(一)助力降本增效,獲得行業認可.16(二)功能日趨完善,滿足多重需求.17(三)應用場景豐富,適用更多領域.18(四)融合人工智能,持續提升質效.19 四、計算機輔助翻譯在行業中的應用.20(一)計算機輔助翻譯應用概述.20(二)計算機輔助翻譯應用案例.22 1.助力本地化工作開展,拓展國際市場.22 2.提升多語種翻譯效能,賦能協同管理.23 3.實現翻譯流程自動化,促進業務增長.24 4.推動各領域翻譯提效,驅動行業發展.25 五、計算機輔助翻譯發展面臨的挑戰.27(一)我
3、國自研產品與海外產品存在差距.27(二)非通用語種資源建設亟待加強.28(三)用戶體驗仍有提升空間.29(四)數據安全需引起更多重視.29(五)計算機輔助翻譯教學與行業脫節.30 六、計算機輔助翻譯發展趨勢和建議.31(一)趨勢展望.31 1.人工智能驅動個性化翻譯.31 2.云技術與協同翻譯深度融合.31 3.技術堆棧的多元化與集成化.31 4.翻譯質量評估與自動優化.32(二)發展建議.32 1.加強國產自研,打造國產翻譯技術服務生態體系.32 2.推動標準建設,引導和規范翻譯技術發展應用.32 3.統籌匯聚語料,為翻譯技術發展提供數據支撐.33 4.提升技術素養,加快計算機輔助翻譯普及應
4、用.33 5.深化融合發展,挖掘翻譯技術發展更多可能性.33 結束語.34 參考文獻.35 06 卷首語卷首語 科技興則民族興,科技強則國家強。習近平總書記多次強調“科技是第一生產力”,并對加快建設科技強國,實現高水平科技自立自強作出具體部署。當前,信息技術飛速進步,對翻譯行業起著巨大的推動作用,同時也開辟了新的“賽道”。以計算機輔助翻譯為代表的翻譯技術深刻改變著傳統翻譯行業的工作模式和流程,在翻譯實踐中發揮的重要作用日益凸顯。計算機輔助翻譯是利用計算機技術輔助人類進行翻譯的一種模式,它利用計算機特有的自動化和智能化處理能力來提高翻譯效率和質量。面對新形勢,2024 計算機輔助翻譯技術發展與應
5、用藍皮書(以下簡稱“藍皮書”)系統梳理計算機輔助翻譯技術的發展歷程、系統架構、產品形式和應用情況,以期為讀者提供客觀、全面、權威的信息,為推動計算機輔助翻譯技術與各行業的深度融合提供有益借鑒,為計算機輔助翻譯技術的進步發展提供有力支撐,為促進國際傳播、對外交往、文化交流、行業數字化升級等工作注入新的活力。藍皮書在 2024 中國翻譯協會年會“新時代翻譯技術創新發展論壇”上,由中國外文局翻譯院、中國翻譯協會翻譯技術委員會、RWS 集團聯合發布。希望以此次發布為契機,進一步推動行業和產業各方對計算機輔助翻譯技術的研究應用,為計算機輔助翻譯技術升級創新提供更加全面、系統、科學的理論支持和技術保障。藍
6、皮書由中國外文局翻譯院智能翻譯實驗室和 RWS 集團主編,得到了來自政產學研各界專家學者的指導和關注,兼具權威性和可讀性。希望能對計算機輔助翻譯技術創新發展和行業應用有所啟發,促進翻譯行業科學健康發展。藍皮書編寫團隊 2024 年 3 月 計算機輔助翻譯技術發展與應用藍皮書 07 一、翻譯行業數字化、智能化升級是時代之需一、翻譯行業數字化、智能化升級是時代之需 在文化軟實力和國際話語權競爭空前激烈、新一輪科技革命和產業變革重構全球創新版圖的今天,翻譯行業要順應發展潮流、響應時代之需,全面加強數字化發展布局,探索技術賦能翻譯行業健康發展新路徑。(一)翻譯是國際傳播的“最后一公里”(一)翻譯是國際
7、傳播的“最后一公里”黨的十八大以來,以習近平同志為核心的黨中央高度重視國際傳播工作。在黨的二十大報告中,總書記指出要“加強國際傳播能力建設,全面提升國際傳播效能,形成同我國綜合國力和國際地位相匹配的國際話語權”,從黨和國家事業發展全局的戰略高度,進一步明確了國際傳播工作的時代使命和目標任務。2023 年 10 月召開的全國宣傳思想文化工作會議正式提出習近平文化思想,強調要“著力加強國際傳播能力建設、促進文明交流互鑒,充分激發全民族文化創新創造活力”,為新時代國際傳播工作提出了新任務、新要求。在當今開放、多元、復雜的國際環境下,迫切需要以高度的文化自信,創新話語體系,講好中國故事,傳播好中國聲音
8、,讓中國故事、中國聲音得到國際社會的理解與認同。習近平總書記強調,通過準確傳神的翻譯介紹,讓世界更好認識新時代的中國,對推進中外文明交流互鑒很有意義。翻譯作為跨語言、跨文化溝通的橋梁紐帶,在推動構建中國話語和中國敘事體系、增強我國國際傳播能力和國家軟實力等方面發揮著重要作用。向世界闡釋推介具有中國特色、體現中國精神、蘊藏中國智慧的優秀文化,推動我國在現代化建設中廣泛吸收和借鑒人類文明的優秀成果,是新時代翻譯工作的首要職責使命。(二)新技術為翻譯行業帶來發展新動力(二)新技術為翻譯行業帶來發展新動力 近年來,新一代信息技術對各行各業產生巨大影響,各種新應用、新業態不斷涌現。面對新形勢,黨的二十大
9、對“加快實施創新驅動發展戰略”作出部署,強調要“加快實現高水平科技自立自強”,“增強計算機輔助翻譯技術發展與應用藍皮書 08 自主創新能力”。習近平總書記指出,“以信息技術、人工智能為代表的新興科技快速發展,大大拓展了時間、空間和人們認知范圍,人類正在進入一個人機物三元融合的萬物智能時代”。加快發展新一代人工智能是我們贏得全球科技競爭主動權的重要戰略抓手,也是推動我國科技跨越發展、產業優化升級、生產力整體躍升的重要戰略資源。2022 年以來,生成式人工智能技術迅猛發展,在智能問答、多模態翻譯等方面取得重大突破。把握新科技革命浪潮,加快翻譯領域新技術研發和應用推廣,對推動我國翻譯行業高質量發展、
10、促進國家翻譯能力建設和國際傳播能力建設具有重要意義。面對翻譯行業發展新形勢、新任務,行業各方應攜手推動計算機輔助翻譯、機器翻譯、翻譯語料庫和術語庫等基礎設施的智能化革新,打造融合最新技術發展、符合實踐需求的智能翻譯管理平臺,促進新技術在翻譯實踐中的應用落地,不斷提升我國翻譯行業技術應用水平。(三)人機協作構建翻譯工作新模式(三)人機協作構建翻譯工作新模式 在新技術迅猛發展的今天,科技賦能國家翻譯能力建設已是時代之需。根據中國翻譯協會發布的 2024中國翻譯行業發展報告,在參與調研的翻譯企業中,2023 年有 52.9%的項目使用了機器翻譯。在許多大規模翻譯項目中,計算機輔助翻譯等技術的應用有效
11、提升了翻譯質量和效率。在全國翻譯專業學位研究生教育指導委員會發布的2023 年翻譯碩士專業學位授權點專項核驗指標體系中,“翻譯技術應用”被納入“課程教學”的核驗內容。翻譯人才培養單位更加注重培養具有良好翻譯技術能力的復合型人才,開始加強對翻譯技術實操能力的訓練。隨著翻譯行業人機協作發展模式愈發明確,行業各方應切實深化政產學研用主體聯動,促進跨領域、跨學科融合發展,充分發揮生成式人工智能等新技術在助力跨語言國際交流等方面的重要作用,加強以中文為核心的行業基礎設施建設,將科技創新的“最大變量”轉化為推動發展的“最大增量”,讓科學技術的智慧之光與人類主體的理性之光在新時代翻譯行業交相輝映,加速推動翻
12、譯產業的數字化、智能化升級轉型,探索中國翻譯事業現代化的新篇章。計算機輔助翻譯技術發展與應用藍皮書 09 二、計算機輔助翻譯概述二、計算機輔助翻譯概述 計算機輔助翻譯(Computer-Aided/Assisted Translation,CAT)在廣義上涵蓋了所有能夠協助譯員完成翻譯工作的計算機工具,包括但不限于文字處理、格式轉換以及電子詞典等。在狹義上,計算機輔助翻譯特指那些專為提升翻譯效率、優化翻譯流程而設計的專業計算機輔助翻譯軟件/系統。計算機輔助翻譯的核心之一是翻譯記憶技術。與機器翻譯不同,計算機輔助翻譯并非直接將源語言轉換為目標語言,而是輔助譯員開展翻譯工作。譯員可借助計算機輔助翻
13、譯軟件/系統積累術語、建立和完善記憶庫等,從而在后續翻譯工作中提高翻譯質量和效率。(一)核心概念(一)核心概念 計算機輔助翻譯技術涉及多個核心功能,這些功能模塊共同協作達到計算機輔助翻譯的效果。翻譯記憶(翻譯記憶(Translation Memory):):翻譯記憶是計算機輔助翻譯軟件/系統的關鍵組成部分,通過建立數據庫來存儲和檢索已翻譯過的句子或片段。當譯員遇到相同或相似文本時,翻譯記憶系統會自動檢索并提供翻譯建議,從而避免重復工作,提高翻譯效率。語料對齊(語料對齊(Alignment):):語料對齊是將雙語或多語材料以詞句或段落為單位自動切分為翻譯單位、并依序匹配源語和目標語的人機交互半自
14、動過程,其本質是建立源語與目標語詞、短語、句、段等相同語言單位間的對應關系。語料對齊是依據現有翻譯資源建立翻譯記憶庫的過程。術語管理(術語管理(Terminology Management):):術語管理是計算機輔助翻譯的重要環節,它允許譯員集中管理和維護專業術語。通過術語管理,譯員可確保整個翻譯項目中術語的一致性和準確性,避免術語混淆或誤用。機器翻譯(機器翻譯(Machine Translation):):機器翻譯是計算機輔助翻譯的一項重要功能,它可以利用先進的自然語言處理算法和大量語料數據自動將源語言文本翻譯成目標語言。雖然機器翻譯無法完全替代人工翻譯,但它可以作為一個快速、初步的翻譯工具
15、,為譯員提供參考和輔助。計算機輔助翻譯技術發展與應用藍皮書 10 譯后編輯(譯后編輯(Post-editing):):譯后編輯是機器翻譯后的重要步驟,包含審查和修改機器翻譯結果等步驟。譯員需要仔細檢查機器翻譯的輸出內容,修正其中的錯誤、不準確或不符合目標語言習慣的表達,以確保最終譯文的準確性和流暢性。質量保證(質量保證(Quality Assurance):):質量保證是計算機輔助翻譯的一項重要功能,它能夠對譯文進行自動檢查,識別并指出可能存在的錯誤或疏漏之處。檢查內容包括數字、空格、標記、術語一致性、漏譯句段等。通過檢查,譯員可以及時發現并糾正錯誤,確保譯文質量。流程管理(流程管理(Proc
16、ess Management):流程管理可以提升翻譯流程的自動化和標準化水平。典型的計算機輔助翻譯流程包括文檔預處理、切分與分析、翻譯與編輯、質量保證、審校、后處理與導出等。項目管理(項目管理(Project Management):):項目管理是確保翻譯流程高效、有序進行的關鍵環節。它涵蓋了從項目啟動到交付的所有階段,包括需求分析、任務分配、進度規劃、資源管理(如翻譯團隊、翻譯記憶庫、術語庫等)、質量控制和最終交付。計算機輔助翻譯軟件/系統通常會提供內置或集成的項目管理模塊,幫助項目經理跟蹤各個翻譯任務的狀態、監控任務進度,以及協調多語言、多譯員之間的工作。(二)發展歷程(二)發展歷程 計算
17、機輔助翻譯發展主要經歷了萌芽期、穩定發展期、迅猛發展期和蓬勃發展期四個階段。1.萌芽期(萌芽期(1967-1983)1966年,美國科學院自動語言處理咨詢委員會(Automatic Language Processing Advisory Committee,ALPAC)發布的報告全面否定了機器翻譯的可行性,并建議停止對機器翻譯項目的資金支持,使得機器翻譯研究遭到重創,人們轉而開始尋求以其他方式提升翻譯效率,研究可應用于機器翻譯的語言和計算解決方案,這在一定程度上促進了基于語料庫和統計學的翻譯技術研究,為計算機輔助翻譯奠定了基礎。計算機輔助翻譯技術發展與應用藍皮書 11 翻譯記憶的概念最早出現
18、于 1979 年,當時被稱為文本檢索翻譯(Translation by Text Retrieval)。多層次的計算機輔助翻譯系統的設想出現于 1983 年,在這一設想下,計算機輔助翻譯系統具有三層意義,分別為基本文字處理與術語管理、術語檢索和參考譯文以及更加成熟的翻譯工具,其中包括全自動機器翻譯。借助成熟的翻譯工具,譯員可以修訂機器翻譯譯文并反饋結果給系統。2.穩定發展期(穩定發展期(1984-1992)20 世紀 80 年代中期出現的翻譯支持系統(TSS)通常被認為是第一代計算機輔助翻譯系統。但當時的市場尚未準備好使用這類工具,國外的大多數譯者仍在使用打字機。1984 年,世界上最早的兩家
19、計算機輔助翻譯公司塔多思(TRADOS GmbH)和 STAR 集團(STAR Group)成立。1990 年,塔多思發布了首版 MultiTerm,最初是用作 DOS 下的術語管理工具,也是塔多思的主要應用程序之一。1991 年,STAR 集團推出了供內部使用的計算機輔助翻譯系統 Star Transit。3.迅猛發展期(迅猛發展期(1993-2002)經歷了初步穩定發展后,翻譯行業涉及的業務領域逐漸增多,翻譯技術和工具的應用更加多樣化。1993年,法國 Atril 公司發布了首款基于 Microsoft Windows 的計算機輔助翻譯系統 Dj Vu。1994 年,塔多思開發了可在 Mi
20、crosoft Windows 中運行的 Translators Workbench。此后,市場上計算機輔助翻譯軟件/系統數量越來越多,語料對齊、機器翻譯及項目管理等功能逐步完善,減少了譯員在非核心翻譯工作上的投入。隨著國際企業進入中國市場,翻譯技術與工具開始在中國發展和應用。1999 年,第一個國產計算機輔助翻譯系統雅信 CAT 上市,標志著中國自主研發的計算機輔助翻譯技術走向商用。此后,北京賽迪翻譯技術有限公司、華建機器翻譯有限公司、傳神語聯網網絡科技股份有限公司、北京中科朗瑞軟件技術有限公司等相繼推出自研計算機輔助翻譯軟件/系統,計算機輔助翻譯進入了迅猛發展期。計算機輔助翻譯技術發展與應
21、用藍皮書 12 4.蓬勃發展期(蓬勃發展期(2003 年至今)年至今)計算機輔助翻譯技術進一步發展,各種新版工具相繼出現,功能逐步完善,翻譯記憶系統也不斷升級并被廣泛接受。進入 21 世紀后,計算機輔助翻譯軟件/系統的界面和功能進一步完善。眾多軟件/系統開始采用獨立操作界面(不再作為文字處理軟件的插件),支持在 Microsoft Windows、macOS、Linux 等多種計算機操作系統中使用,可以兼容幾十種文件格式,并能在翻譯完成后保持文件版式不變。2006 年,計算機輔助翻譯取得巨大進步,具備了自動質量檢查、譯文匹配、用戶界面本地化等新功能。此外,各種項目整合與翻譯管理解決方案相繼出現
22、。2009 年國產計算機輔助翻譯軟件雪人 1.0 版本發布,同年 Lingotek 推出了軟件即服務協作翻譯技術。2010 年起,各種翻譯任務通過眾包、協作的形式進行。期間出現了一些具有項目管理、項目實時分享等功能的新版計算機輔助翻譯軟件/系統,如 Across Language Server Service Pack 5.1、memoQ 4.0、Atril TEAMserver 2.0、Wordfast Classic 6.0 等。2012 年以后,大數據、云計算時代的到來催生了許多云翻譯平臺,傳統 C/S 架構的計算機輔助翻譯軟件/系統移植到云端(B/S 架構),在云端進行協作翻譯并同步保
23、存翻譯記憶庫和術語庫。隨著人工智能的迅猛發展,計算機輔助翻譯的智能提示、上下文信息搜索、實時錯誤檢測與修正等功能不斷完善,術語管理和知識庫建設也更加便捷。(三)系統架構(三)系統架構 計算機輔助翻譯軟件/系統通常包含以下關鍵層次(圖 1),以優化翻譯流程、減少重復勞動、提高翻譯質量,并適應不斷變化的技術需求和發展趨勢。計算機輔助翻譯技術發展與應用藍皮書 14 術語庫管理:術語庫管理:創建和維護術語庫,確保術語翻譯的便捷性、準確性和統一性。機器翻譯:機器翻譯:為用戶提供初步翻譯建議或完成部分自動化翻譯任務。質量保證:質量保證:通過數字檢查、標記檢查、術語檢查、一致性檢查以及拼寫和語法檢查等,提升
24、翻譯質量。資產管理:資產管理:對翻譯記憶庫、語言處理規則和項目模板等關鍵資源的集中維護和管理,確保翻譯一致性、提高工作效率,提升項目管理的便捷化和標準化水平。用戶管理:用戶管理:對譯員、審校人員和其他參與者進行角色賦權、身份認證、工作量統計、績效評估及個性化設置等方面的集中控制和管理,以實現對項目成員的有效組織和激勵,提升協作效率,確保翻譯過程順暢、可控。3.數據管理層數據管理層 數據庫系統:數據庫系統:用于存儲和管理翻譯記憶庫、術語庫、用戶設置、項目信息等數據,實現版本控制和權限管理。資源索引與檢索引擎:資源索引與檢索引擎:快速精準地從大量翻譯記憶數據中提取匹配項,降低譯員工作負擔。實時更新
25、與增量索引:實時更新與增量索引:隨著翻譯內容的更新和增加,動態更新索引系統,確保最新翻譯結果及時納入檢索體系。4.底層技術支撐層底層技術支撐層 預處理與后處理:預處理與后處理:對原始文檔進行格式識別、結構分析、拆分、標記、通過翻譯記憶庫預翻譯等預處理,對翻譯結果進行內容重組、合并、格式還原等后處理。API 接口與集成:接口與集成:提供標準化應用程序接口,便于與其他業務系統如翻譯管理系統(TMS)、內容管理系統(CMS)、客戶關系管理系統(CRM)等進行數據交換和功能整合。計算機輔助翻譯技術發展與應用藍皮書 15 5.基礎設施層基礎設施層 硬件環境:硬件環境:服務器、網絡設備及終端設備等硬件設施
26、,確保計算機輔助翻譯軟件/系統穩定運行。云服務:云服務:部署在云端的計算機輔助翻譯軟件/系統還需有云平臺計算能力、存儲容量、安全策略以及高可用性保障等方面支持。(四)產品形式(四)產品形式 計算機輔助翻譯軟件/系統的產品形式主要包含桌面應用、在線/云端解決方案、插件或集成式工具以及定制化企業級系統四類:1.桌面應用桌面應用 為用戶提供獨立安裝在本地計算機上的計算機輔助翻譯軟件/系統,支持離線工作。2.在線在線/云端解決方案云端解決方案 提供基于 Web 瀏覽器的在線翻譯環境,方便團隊協作,實現遠程同步翻譯和實時更新等。3.插件或集成式工具插件或集成式工具 針對特定軟件或需求開發的插件,集成于內
27、容生成、存儲和接收系統或運營、管理和治理平臺。4.定制化企業級系統定制化企業級系統 根據企業個性化需求定制的大型翻譯管理系統,不僅包含計算機輔助翻譯軟件/系統,還可整合流程自動化、多語言資源管理、組織/用戶管理、客戶和供應商管理等功能。說明:以上內容主要介紹計算機輔助翻譯的基本架構和常見產品形式,實際產品和服務正隨著市場需求和技術的進步不斷演進。計算機輔助翻譯技術發展與應用藍皮書 18 圖 4.使用 CAT 工具處理的文件格式(三)應用場景豐富,適用更多領域(三)應用場景豐富,適用更多領域 隨著全球化向縱深發展,各國在經貿、文化、教育等領域的交流更加頻繁,翻譯場景也更加多樣。得益于語音識別、圖
28、像識別等技術的進步,計算機輔助翻譯不再局限于文本,而是擴展到圖像、音頻、視頻等多種媒介。由于計算機輔助翻譯的翻譯記憶和術語管理等功能可以有效保證譯文術語和風格一致,因此被廣泛應用于新聞報道、學術會議和游戲/軟件/網站/多媒體本地化等場景,有效避免了重復錯誤和重復翻譯,極大提升了用戶在會議、游戲等場景的翻譯體驗。除了筆譯,計算機輔助翻譯也逐漸應用至口譯工作中,諸如 InterpretBank 等計算機輔助翻譯軟件/系統可以在口譯工作中為專業口譯員提供全流程支持,減少口譯員工作量的同時還可以提高整體口譯質量。此外,多模態翻譯技術逐步實現了對多媒體內容和時間碼的自動識別、翻譯和同步更新,極大拓寬了翻
29、譯技術應用場景。計算機輔助翻譯技術發展與應用藍皮書 19(四)融合人工智能,持續提升質效(四)融合人工智能,持續提升質效 近年來,人工智能技術發展迅猛,“人工智能+”的發展態勢愈發明顯,有效推動了計算機輔助翻譯產業向更高質高效的方向發展。隨著深度學習技術不斷優化完善,神經網絡機器翻譯系統更加成熟。在人工智能技術加持下,生成式預訓練語言模型可以更準確地理解和捕捉語境。計算機輔助翻譯軟件/系統與神經網絡機器翻譯系統和人工智能大語言模型深度融合,不僅可以自動選擇更合適的譯文風格并確保譯文術語和風格的一致性,提供更流暢自然的翻譯結果,提高譯文質量,而且還能通過智能審校功能進一步提升審校工作效率,降低審
30、校人員工作強度。此外,譯員可以通過人工智能助手獲得幫助,更快、更好地解決遇到的問題,有效降低計算機輔助翻譯軟件/系統的學習和使用成本,提升工作效率。計算機輔助翻譯技術發展與應用藍皮書 20 四、計算機輔助翻譯在行業中的應用四、計算機輔助翻譯在行業中的應用 當前,在全球化向縱深發展和信息技術革命加速演進的多重因素影響下,翻譯行業蓬勃發展。計算機輔助翻譯軟件/系統可以助力翻譯任務提質、降本、增效,在翻譯行業的應用不斷深化,有力推動了行業數字化和智能化轉型,為全球經濟、科技、文化交流注入新的活力。(一)計算機輔助翻譯應用概述(一)計算機輔助翻譯應用概述 傳統翻譯工作以人工翻譯為主,提供高質量翻譯服務
31、。隨著社會進步與行業發展,傳統翻譯模式已很難滿足翻譯需求。例如,為更好拓展海外市場,眾多跨國企業實施產品和服務本地化戰略。本地化涉及的內容不僅僅是文本,通常還包括數字化產品或服務。如果單純依靠人工,會面臨成本高、周期長等問題。計算機輔助翻譯的文件格式解析、翻譯記憶、術語管理和質量檢查等功能則可以有效保障本地化工作質量,在效率和成本上更具優勢,滿足更多樣化翻譯需求。隨著技術的進步,計算機輔助翻譯在翻譯行業的應用越來越普遍。根據關于計算機輔助翻譯使用情況的調研問卷反饋的數據,所有受訪翻譯企業管理/決策者表示曾使用計算機輔助翻譯軟件/系統開展工作,其中近 80%受訪者以較高頻率使用計算機輔助翻譯軟件
32、/系統(圖 5)。計算機輔助翻譯技術發展與應用藍皮書 22(二)計算機輔助翻譯應用案例(二)計算機輔助翻譯應用案例1 計算機輔助翻譯在拓展國際市場、賦能協同管理、促進業務增長、驅動行業發展等方面發揮著重要作用。1.助力本地化工作開展,拓展國際市場助力本地化工作開展,拓展國際市場 20 世紀 80 年代,社會學家羅蘭羅伯遜(Roland Robertson)在哈佛商業評論(Harvard Business Review)中提出“全球本土化(Glocalization)”概念,即把全球化(Globalization)和本地化(Localization)相結合,意為“全球和國際產品在使用和銷售時適應
33、當地環境”。根據 RWS 集團發布的“全球溝通零距離”2023 年報告,88%的受訪者認為展示文化洞察力對于品牌全球化發展非常重要,71%的受訪者表示更信任進行了在線業務本地化的品牌。這充分表明了開展本地化工作的重要性,而翻譯正是本地化的關鍵要素之一。小米科技有限責任公司(以下簡稱“小米”)在短短 5、6 年間開拓了 100 多個海外市場,其翻譯團隊需要把網站、市場材料、產品文檔、用戶界面和用戶指南等內容本地化為 70 多種語言,每年翻譯總量約1000 萬字。面對全球增長與產品拓展帶來的巨大本地化挑戰,小米自 2020 年起開始使用計算機輔助翻譯工具,并將其與翻譯管理系統集成,利用翻譯記憶和術
34、語管理功能避免重復工作并提高譯文一致性,使用技術驅動的翻譯流程為本地化項目賦能,有效提升了翻譯生產效率以及流程自動化水平和可視化程度。同時,小米還在構建業務門戶網站,旨在讓所有員工和合作伙伴在使用技術術語、品牌名稱及其他術語時都能從術語庫受益??ò退够鶎嶒炇遥↘aspersky Lab)是一家國際知名信息安全軟件提供商,業務范圍覆蓋全球近 200 個國家/地區,需要將登錄頁、網站橫幅、表格等網站內容以及白皮書、指南、數據表、電子郵件和社交媒體更新等營銷內容翻譯和本地化至 39 種語言。隨著在線業務迅速增長,卡巴斯基實驗室的翻譯工作壓力直線攀升。為更好開展本地化工作,縮短項目運轉周期,更快啟動銷
35、售活動,卡巴斯基實驗室開始使用計算 1 本章案例由 RWS 集團提供 計算機輔助翻譯技術發展與應用藍皮書 23 機輔助翻譯工具和翻譯管理平臺,通過翻譯記憶、術語管理、項目管理和流程自動化等功能,高效實施翻譯項目,節省約 58%成本。其中,每字詞的平均翻譯價格下降了近 46%。2.提升多語種翻譯效能,賦能協同管理提升多語種翻譯效能,賦能協同管理 國際工程和國際貿易的翻譯項目中,通常要將文件翻譯為十幾種甚至幾十種語言,且對翻譯質量、交付時間等要求較為嚴格。在這種情況下,傳統的“單兵作戰”翻譯模式顯然無法滿足項目需求,多人協作逐漸成為主流,這就對團隊的項目管理等能力提出了更高要求。德國曼恩集團(MA
36、N Group)是歐洲運輸工程領域知名工業公司,是世界主要卡車、公交車、柴油發動機、渦輪機和特殊用途傳動裝置等制造商之一。為確保工程制造嚴謹性和企業規范有序運行,便于進行車輛診斷、處理遠程信息以及管理車隊線上系統和車載系統,需保證集團公司、下屬子公司、認證經銷商、維修廠、獨立制造廠以及客戶機構(航運公司和公共汽車公司)等各渠道掌握的操作手冊、維護與維修指南、報價與發票憑證、銷售演示等海量文件的信息內容一致。需要將德語源文件翻譯成 35 種不同語言,并集成到內容管理系統中。例如用于卡車售后服務或故障診斷的多語種文件,不僅要以電子版形式供用戶在服務門戶網站或車載解決方案中查閱,還要制成打印版本存放
37、于車輛文檔中。曼恩集團的翻譯部門很早就開始使用計算機輔助翻譯工具以及翻譯管理平臺,依托自動翻譯工作流、集中化翻譯記憶庫、統一的術語管理和標準化翻譯流程等功能,輕松實現 35 種語言的全球信息傳遞。借助計算機輔助翻譯技術,曼恩集團在一年內處理了 11000 個翻譯項目,總量達 2800 萬字詞,其中約 1500萬字詞內容可直接在翻譯記憶庫提取,新增或更新的源語言內容僅約 1300 萬字詞。同時,自使用該技術以來,曼恩集團的術語翻譯始終保持一致,而在過去分散翻譯的模式下,譯文一致性無法保證。Crazy Factory 是瑞士著名穿孔首飾、珠寶和其他飾品購物網站,每月有超一百萬客戶訪問平臺、瀏覽商品
38、。隨著業務的不斷拓展,該網站要將商品描述、郵件截圖及社交媒體廣告等各種資料翻譯成近 40 種語言,這對網站翻譯項目管理提出了很高要求。為了更好管理和實施翻譯項目,Crazy Factory 利用計算機輔助翻譯工具和服務器解決方案,幫助翻譯團隊更好協同配合,共同完成翻譯任務,提高翻譯質量和效率平均初譯合格率從 75%提升到 95%,并將項目經理從繁重的任務中解脫出來。計算機輔助翻譯技術發展與應用藍皮書 24 3.實現翻譯流程自動化,促進業務增長實現翻譯流程自動化,促進業務增長 國際知名語言服務和市場研究機構 Nimdzi Insights 發布的Nimdzi 2023 年語言技術圖譜(Nimdz
39、i Language Technology Atlas 2023)列舉了近 1000 種語言技術工具,涵蓋 10 個類別。為提升工作效率,用戶可以將這些語言技術工具與內容生成、存儲和接收系統或運營、管理和治理平臺集成。盡管在自動化翻譯流程中用到的語言技術數量不多,可如果在集成時與其它系統產生沖突,出現接口失效,不僅不能提升翻譯效率,反而會起到反作用。此外,在實際工作中用戶通常需要將翻譯內容交付多個平臺或渠道,如何實現各元素無縫集成和順暢工作流對計算機輔助翻譯軟件/系統的“協同工作能力”提出了很高要求。圖 7.企業信息全球化的工作流程管理 寶拉珍選(Paulas Choice)是一款全球護膚品牌
40、,提供自營產品、護膚品研究和在線購物等服務。該公司隸屬于聯合利華高端產品部門,在全球 20 多個國家/地區積極開展在線銷售,并在六個歐洲國家(荷蘭、德國、英國、法國、丹麥和比利時)通過實體店銷售產品。隨著品牌在歐洲市場的快速發展,為應對電商網站多語種內容建設需求,寶拉珍選亟需一個能與其客戶關系管理平臺集成、可以實現翻譯流程自動化、同時兼具翻譯記憶功能的翻譯系統以縮短翻譯周期并降低成本。寶拉珍選僅用兩天就在其丹麥語網站成功部署了計算機輔助翻譯工具和翻譯管理系統。此后,寶拉珍選翻譯工作的自動化程度顯著提高。在計算機輔助翻譯工具和翻譯管理系統的幫助下,寶拉珍選在丹麥的銷售額強勢飆升,四個月內達到三位
41、數增長。計算機輔助翻譯技術發展與應用藍皮書 25 4.推動各領域翻譯提效,驅動行業發展推動各領域翻譯提效,驅動行業發展 根據 RWS 集團發布的 翻譯技術洞察 2023,2022 年翻譯行業整體工作量呈上升趨勢,自由譯員、翻譯企業和專職譯員的客戶數量以及需翻譯的文件數量和字數較上年均增長 30%以上,翻譯企業和專職譯員需翻譯的文件數量更是分別增長了 45%和 48%。然而,行業譯員數量卻并未增長,從業 10 年以上的譯員人數較 2020 年還減少了約 10%。在這種情況下,利用技術驅動翻譯行業數智化升級已迫在眉睫。法律翻譯是翻譯行業具有挑戰性的垂直領域之一。在法律翻譯場景中,原文和譯文之間的細
42、微差別都可能失之毫厘、謬以千里,此外,法律文本對譯文風格和術語一致性也有極高要求。Castrn&Snellman是一家總部設在芬蘭的律師事務所,主要提供商務法律服務。由于該事務所擁有許多跨國企業客戶,所以約有一半的工作都有翻譯需求。由于法律翻譯對術語和文風的嚴苛要求,專業翻譯團隊往往需要耗費大量時間和精力才能確保譯文質量和術語一致性。隨著工作量不斷增加,尤其是在一些大型翻譯項目中,傳統翻譯模式逐漸無法滿足業務需求。為了應對翻譯需求,同時更好進行團隊管理、避免重復工作,該事務所開始使用計算機輔助翻譯工具和協同平臺賦能翻譯工作。翻譯記憶庫和術語庫可以直接提供經過審核的譯文,既保障翻譯質量,又提升工
43、作效率。協同平臺可以讓所有譯員都能實時共享翻譯記憶庫和術語資源。此外,遇到緊急任務時,整個翻譯團隊可以使用在線編輯器同時處理同一文檔,實時更新翻譯進度。某意大利大型銀行常使用英語和意大利語開展工作,例如使用英語和歐洲中央銀行(ECB)溝通,使用英語和意大利語為金融市場和監管機構提供信息。然而,該銀行并沒有專職譯員,翻譯任務通常由擅長英語和意大利語的各部門員工完成。如果不涉及敏感信息,還可將任務外包給翻譯企業。該銀行使用外部資源進行翻譯的文件多為銀行財務報表等,一些文件的內容重合度甚至達 50%以上,且每隔一段時間文件就會更新,需要重新翻譯,增加了許多無謂的翻譯成本。引入計算機輔助翻譯工具后,在
44、翻譯記憶庫等功能的加持下,該銀行可以更充分利用現有譯文,僅一個部門即可節省約 3 萬歐元翻譯成本。同時,該銀行還將部門名稱、企業標語、產品名稱、服務名稱、常用術語和禁忌術語等收錄至術語庫,確保譯文術語統一。此外,計算機輔助翻譯工具中集成的機器翻譯功能也極大提升了工作效率,一名員工僅需兩天就能完成 8 萬字的緊急任務。計算機輔助翻譯技術發展與應用藍皮書 26 圣馬力諾共和國是聯合國、歐洲委員會、國際貨幣基金組織成員國,在公共行政領域有旺盛的翻譯需求。由于政府翻譯任務有較高保密要求,因此所有翻譯任務均由該國政府的官方翻譯團隊完成,無法將翻譯工作外包給自由譯員或翻譯企業。由四名成員組成的翻譯團隊需要
45、在歐洲委員會和聯合國會議上承擔翻譯工作、與國際貨幣基金組織通信,還需要翻譯國家衛生保健方面的文檔等。面對龐大的翻譯工作量,該國政府翻譯團隊積極使用計算機輔助翻譯技術,實現了快速創建和管理翻譯項目,所有譯員還可共用翻譯記憶庫和術語庫,翻譯速度提高了 60%至 70%,有效提升了譯員個人和團隊工作效率。計算機輔助翻譯技術發展與應用藍皮書 27 五、計算機輔助翻譯發展面臨的挑戰五、計算機輔助翻譯發展面臨的挑戰 盡管計算機輔助翻譯軟件/系統日趨成熟,各類功能不斷完善,可以有效助力翻譯項目、本地化業務等工作提質增效,但仍面臨我國自研產品與海外產品存在差距、非通用語種資源建設不足、用戶體驗不盡完美、數據安
46、全存在隱患、教學與行業脫節等方面挑戰。(一)我國自研產品與海外產品存在差距(一)我國自研產品與海外產品存在差距 根據關于計算機輔助翻譯使用情況的調研問卷反饋的數據,受訪者對國內市場上計算機輔助翻譯產品使用排名前五的分別是 Trados、memoQ、YiCAT、譯馬網和 Dj Vu,其中僅有 2 款國產產品(YiCAT 和譯馬網),且評分與第一名還有一定差距(圖 8)。國外計算機輔助翻譯軟件/系統以其先進的技術、穩定的性能和豐富的功能贏得了譯員更多青睞。相比之下,我國自研的計算機輔助翻譯軟件/系統由于起步較晚,在技術和功能上還存在一定差距。目前金融、電信、電力、石油、交通、航空航天、教育、醫療等
47、領域單位及黨政機關對計算機輔助翻譯軟件/系統的需求日趨增長。國內一些機構對國產計算機輔助翻譯軟件/系統的需求也較為迫切,國內翻譯技術企業應進一步加大技術研發力度,推出功能更加完善的國產計算機輔助翻譯軟件/系統。計算機輔助翻譯技術發展與應用藍皮書 28 圖 8.國內用戶 CAT 產品使用排名(二)非通用語種資源建設亟待加強(二)非通用語種資源建設亟待加強 根據2024 中國翻譯行業發展報告,我國翻譯企業業務主要涉及英語、德語、法語、俄語、日語和阿拉伯語等外語語種。隨著“一帶一路”倡議的深入實施,我國與“一帶一路”沿線國家交往日益密切,而現有術語庫等工具的內容主要以漢語和英語為主。根據關于計算機輔
48、助翻譯使用情況的調研問卷反饋的數據,有近 30%受訪者認為現有非通用語種資源難以滿足翻譯需求(圖 9)。數據資源是推動計算機輔助翻譯等技術發展的關鍵要素,非通用語種內容資源的建設和共享是需要行業各方攜手破解的難題。計算機輔助翻譯技術發展與應用藍皮書 29 圖 9.CAT 軟件/系統改進建議(三)用戶體驗仍有提升空間(三)用戶體驗仍有提升空間 隨著計算機輔助翻譯軟件/系統的廣泛應用,人們對用戶體驗的關注度越來越高,而現有計算機輔助翻譯軟件/系統還不能完全滿足翻譯實踐需求和譯員使用習慣。根據關于計算機輔助翻譯使用情況的調研問卷反饋的數據,分別有約 60%的受訪者認為計算機輔助翻譯軟件/系統應“優化
49、操作界面,提高友好性和易用性”、“完善翻譯記憶庫和智能匹配功能”(圖 9)。(四)數據安全需引起更多重視(四)數據安全需引起更多重視 計算機輔助翻譯在翻譯項目中的應用不斷深化,而很多翻譯項目包含敏感信息或商業機密,如何保障數據安全和用戶隱私成為行業關注的重點。例如,用戶在云端服務器存儲的術語庫和翻譯記憶庫可能會遭受黑客或病毒攻擊導致數據泄露,在線計算機輔助翻譯平臺上的機器翻譯功能存在濫用用戶語料進行機器學習和模型訓練的潛在風險等。計算機輔助翻譯技術發展與應用藍皮書 31 六、計算機輔助翻譯發展趨勢和建議六、計算機輔助翻譯發展趨勢和建議 面對多樣化翻譯需求,計算機輔助翻譯軟件/系統在翻譯效率、格
50、式統一、多人協作、質量保證以及語言資產管理等方面具有不可替代的優勢,將在翻譯實踐和項目管理中發揮越來越重要的作用。(一)趨勢展望(一)趨勢展望 技術發展日新月異,計算機輔助翻譯正在經歷巨大變革。未來幾年,計算機輔助翻譯技術將呈現以下發展趨勢:1.人工智能驅動個性化翻譯人工智能驅動個性化翻譯 計算機輔助翻譯軟件/系統將與神經網絡機器翻譯、生成式人工智能等技術融合,結合譯員風格、項目特性以及目標受眾特征,提供個性化翻譯建議和優化方案。大語言模型與翻譯記憶庫、術語庫、企業知識庫等深度融合,為用戶提供更高質量的大語言模型自動翻譯功能。同時,人工智能將深度參與翻譯決策過程,通過機器翻譯引擎智能推薦和機器
51、翻譯自動譯后編輯,大幅提升翻譯效率和譯文一致性。2.云技術與協同翻譯深度融合云技術與協同翻譯深度融合 通過與云計算技術深度融合,計算機輔助翻譯軟件/系統將實現大規模數據的存儲和共享,方便用戶遠程協作,實時更新翻譯內容和進度。同時,云平臺趨向輕量化、SaaS 化和生態化發展,將帶來更強的資源調度能力和更靈活的服務模式,實現翻譯項目管理、資源分配、資產管理和用戶權限管理的高度集成。3.技術堆棧的多元化與集成化技術堆棧的多元化與集成化 隨著技術生態日益豐富,未來計算機輔助翻譯技術堆棧將更加多元化,涵蓋自然語言處理、深度學習、云計算、大數據分析、區塊鏈等諸多前沿技術。同時,各類技術的集成化應用將變得愈
52、發重要,這種集成化不僅體現在技術層面,也體現在業務流程層面,即實現從項目管理、翻譯實踐、質量控制到成果發布的全流程無縫銜接,構建高度自動化、智能化的翻譯生態系統。計算機輔助翻譯技術發展與應用藍皮書 32 4.翻譯質量評估與自動優化翻譯質量評估與自動優化 依托人工智能驅動的質量保證和質量評估功能,計算機輔助翻譯軟件/系統將不僅能對翻譯結果進行拼寫、語法、術語一致性等基礎檢查,還能生成客觀量化的評估結果,并利用深度學習模型進行語義層面的質量評估和自動優化,為用戶提供更深層次的指導和反饋。(二)發展建議(二)發展建議 在計算機輔助翻譯技術未來發展過程中,建議進一步加強國產自研力度、推動相關標準建設、
53、統籌匯聚語料資源、提升翻譯人才技術素養、深化翻譯與技術融合發展,更好推動我國翻譯行業的數字化、智能化升級轉型。1.加強國產自研,打造國產翻譯技術服務生態體系加強國產自研,打造國產翻譯技術服務生態體系 國外計算機輔助翻譯軟件/系統研發起步較早,經歷多次翻譯技術發展浪潮,積累了豐富的技術資源和經驗。國內計算機輔助翻譯軟件/系統研發雖然起步較晚,但在國內一批優秀翻譯技術企業持續投入研發和創新的努力下,國產計算機輔助翻譯軟件/系統在眾多方面也取得了不錯進展,如復雜文件格式處理、翻譯項目管理、機器翻譯譯后編輯、大語言模型技術融合應用等。中國翻譯協會、中國外文局翻譯院等行業協會和機構應進一步加強頂層設計,
54、著力深化翻譯實踐與技術研發方的跨領域協同協作,構建自主研發的核心翻譯技術,打造國產翻譯技術服務生態體系,助力對外話語體系構建,服務于我國國際傳播工作大局,提升我國國際話語權。2.推動標準建設,引導和規范翻譯技術發展應用推動標準建設,引導和規范翻譯技術發展應用 翻譯技術已成為促進翻譯行業發展的巨大推動力。由于其發展速度很快,行業更需要加強管理和監控。翻譯技術標準規范的研制推廣對于翻譯技術的科學健康發展和應用必不可少。為更好發揮計算機輔助翻譯技術效能,應聚焦制約其發展的難點、痛點問題,結合最新技術發展動態,著力建設并不斷完善計算機輔助翻譯質量評價、人機協作模式、數據安全、技術倫理等方面的標準規范,
55、并推動形成層級分明、覆蓋面廣、科學合理的標準體系框架,促進翻譯技術科學規范發展,助力形成良好的行業生態。計算機輔助翻譯技術發展與應用藍皮書 33 3.統籌匯聚語料,為翻譯技術發展提供數據支撐統籌匯聚語料,為翻譯技術發展提供數據支撐 在計算機輔助翻譯技術發展日趨成熟的背景下,語料數據的規模和質量成為影響計算機輔助翻譯軟件/系統性能和使用體驗的關鍵因素。中國翻譯協會、中國外文局翻譯院等行業協會和機構應當充分發揮行業引領作用,聯合國際傳播、翻譯實踐、人才培養、技術研發等各領域主體,打破數據資源孤島局面,統籌匯聚各方優勢語料數據,推動各方資源共建共享,建設高質量、大規模、多語言、細領域的語料庫、術語庫
56、和知識庫,為進一步提升計算機輔助翻譯軟件/系統性能、實現翻譯流程一體化及全球資源調配提供內容資源支撐。4.提升技術素養,加快計算機輔助翻譯普及應用提升技術素養,加快計算機輔助翻譯普及應用 譯員技術素養的欠缺在一定程度上制約了計算機輔助翻譯技術的深度應用和進一步發展。翻譯人才培養單位應根據時代發展需求革新翻譯技術教育,加強計算機輔助翻譯理論和實踐課程的師資和硬件配備,培養具備現代翻譯技術能力的綜合性翻譯人才。與此同時,中國翻譯協會、中國外文局翻譯院等行業協會和機構可以借助短視頻、圖文海報等新媒體手段,結合視頻課程、線上教學、論壇沙龍、研修培訓等形式,開展更深層次的計算機輔助翻譯推廣與普及活動,組
57、織針對譯員、教師、學生等不同層面的計算機輔助翻譯技能培訓,擴大計算機輔助翻譯技術輻射范圍。此外,可以通過舉辦翻譯技術賽事活動,以賽促學、以賽促教、以賽促建,提升翻譯人才技術素養,不斷推動計算機輔助翻譯技術迭代升級,更好服務國家翻譯能力建設。5.深化融合發展,挖掘翻譯技術發展更多可能性深化融合發展,挖掘翻譯技術發展更多可能性 隨著生成式人工智能的興起,以 ChatGPT、文心一言、訊飛星火等為代表的大語言模型發展迅猛,為翻譯技術注入新的活力。這些模型能夠更好地理解上下文語境,生成更流暢、自然的譯文,同時還具備知識問答、對話交互等多種能力,有望進一步拓展計算機輔助翻譯軟件/系統的應用場景,并實現更
58、智能的術語管理、質量檢查和譯后編輯等功能。未來,隨著大語言模型的不斷優化與迭代,計算機輔助翻譯技術研發方應把握技術潮流和發展機遇,通過技術融合應用加速推動翻譯行業的數字化、智能化升級轉型,為跨語言交流與全球化發展提供更加高效、智能的解決方案。計算機輔助翻譯技術發展與應用藍皮書 34 結束語結束語 隨著全球化的深入推進,世界多元文明相互激蕩。翻譯作為跨語言、跨文化溝通的橋梁紐帶,使命光榮,責任重大。在聯結中外、溝通世界的過程中,計算機輔助翻譯等翻譯技術的應用,讓高效、無障礙的溝通交流逐步成為現實??茖W技術日新月異,蓬勃發展的新技術不斷拓展著人類的想象空間。在新技術的融合創新中,計算機輔助翻譯必將
59、在技術浪潮中乘風破浪,為深化文明交流互鑒作出更大貢獻。計算機輔助翻譯技術發展與應用藍皮書 35 參考文獻參考文獻 1 Nimdzi Insights.Nimdzi Language Technology Atlas 2023R.2023.2 全國翻譯專業學位研究生教育指導委員會.2023 年翻譯碩士專業學位授權點專項核驗指標體系.2023.3 全國專業學位研究生教育指導委員會.專業學位研究生核心課程指南(一)(試行)M.北京:高等教育出版社,2020.4 RWS 集團.“全球溝通零距離”2023 年報告R.2023.5 RWS 集團.翻譯技術洞察 2023R.2023.6 王華樹.翻譯技術研究M.北京:外語教學與研究出版社,2023.7 王華樹.計算機輔助翻譯概論M.北京:知識產權出版社,2019.8 王華樹,楊潤麗.計算機輔助翻譯(CAT)技術在現代翻譯中的應用探析J.語言教育,2015(1).9 楊光.區域整合與公共治理M.北京:社會科學文獻出版社,2021.10 中國翻譯協會.2024 中國翻譯行業發展報告R.2024.