《中國中文信息學會:中文信息處理發展報告(2021)(472頁).pdf》由會員分享,可在線閱讀,更多相關《中國中文信息學會:中文信息處理發展報告(2021)(472頁).pdf(472頁珍藏版)》請在三個皮匠報告上搜索。
1、 中文信息處理發展報告中文信息處理發展報告 (2 2021021) 中國中文信息學會 中國北京 2021.12 1 前 言 中文信息處理發展報告 (2021)是中國中文信息學會召集領域專家對中文信息處理學科方向和前沿技術的階段性梳理。本發展報告的定位是深度科普,旨在向政府、企業、 媒體等對中文信息處理感興趣的社會各界人士簡要介紹相關領域的基本概念和應用方向,向高等院校、科研院所和高新技術企業中從事相關工作的專業人士介紹相關領域的前沿技術和發展趨勢。 中文信息處理發展報告 (2021)繼續沿用中文信息處理發展報告 (2016)的編撰思路:對近年來本專業領域內的學科方向進行系統總結梳理,對未來一段
2、時期的前沿技術趨勢進行展望。按照各個專業委員會發展歷程,結構安排上分為漢字字形信息、速記、計算語言學、少數民族語言文字信息處理、機器翻譯、信息檢索技術、語音信息技術、社會媒體處理、知識圖譜領域、醫療健康與生物信息、網絡空間大搜索技術、隱私計算、開源情報技術、自然語言生成與智能寫作、情感計算等 15 個專業領域分別進行表述。各個專業領域統一從研究背景與意義、領域發展現狀與關鍵科學問題、領域關鍵技術進展及趨勢、領域產業發展現狀及趨勢、總結及展望等 5 個部分進行總結梳理和趨勢展望。因此,本發展報告既可作為中文信息處理領域的總體發展研究報告使用,亦可作為每個專業領域獨立的發展研究報告單獨使用。 本發
3、展報告的每個專業領域部分由各個專業技術委員會組織本專業領域內專家和學術團隊協同撰寫完成,由學會秘書處組織相關專家負責對初稿反饋意見,最后校核、編排、統一成文。 3 目 錄 第一章第一章 漢字字形信息研究進展、現狀及趨勢漢字字形信息研究進展、現狀及趨勢 4 4 第二章第二章 速記研究進展、現狀及趨勢速記研究進展、現狀及趨勢 2020 第三章第三章 計算語言學研究進展、現狀及趨勢計算語言學研究進展、現狀及趨勢 2727 第四章第四章 少數民族語言文字信息處理研究進展、現狀及趨勢少數民族語言文字信息處理研究進展、現狀及趨勢 6161 第五章第五章 機器翻譯研究進展、現狀及趨勢機器翻譯研究進展、現狀及
4、趨勢 7575 第六章第六章 信息檢索技術研究進展、現狀及趨勢信息檢索技術研究進展、現狀及趨勢 110110 第七章第七章 語音信號技術研究進展、現狀及趨勢語音信號技術研究進展、現狀及趨勢 169169 第八章第八章 社社會會媒體媒體處處理理研究進展、現狀及趨勢研究進展、現狀及趨勢 211211 第九章第九章 知識圖譜領域研究發展、現狀及趨勢知識圖譜領域研究發展、現狀及趨勢 266266 第十章第十章 醫療信息處理技術研究進展、現狀及趨勢醫療信息處理技術研究進展、現狀及趨勢 299299 第十一章第十一章 網絡空間大搜索技術研究進展、現狀及趨勢網絡空間大搜索技術研究進展、現狀及趨勢 31431
5、4 第十二章第十二章 隱私計算研究進展、現狀及趨勢隱私計算研究進展、現狀及趨勢 350350 第十三章第十三章 開源情報技術研究進展、現狀及趨勢開源情報技術研究進展、現狀及趨勢 373373 第十四章第十四章 自然語言生成與智能寫作研究進展、現狀及趨勢自然語言生成與智能寫作研究進展、現狀及趨勢 397397 第十五章第十五章 情感計算研究進展、現狀及趨勢情感計算研究進展、現狀及趨勢 460460 4 第一章第一章 漢字字形信息研究進展、現狀及趨勢漢字字形信息研究進展、現狀及趨勢 1.1.1.1. 研究背景與意義研究背景與意義 漢字是中華文化的基因和核心,是中華文明得以傳承和發展的載體,而計算機
6、中文字體是漢字書寫文明在信息化時代的全新表現形式,也是中文信息處理的基礎。 在漢字發展歷程中,隨著不同時代對信息傳播的需求變化以及工具的變革,漢字字形也在不斷發生變化,并逐漸被賦予了審美功能。從篆、隸、草、楷、行等古老書體類別,到雕版印刷時期的宋體、受西方影響而產生的黑體,再到民國時期的仿宋體以及豐富多樣的美術字,都是漢字字形變化的成果。 中文字體最早進入電腦,始于漢字照排系統的研制。1974 年 8 月,國家重點科技攻關項目“漢字信息處理系統工程”(簡稱“748 工程”)設立,北大教授王選帶領科研團隊研制出了漢字激光照排系統,并發明了針對漢字的高倍率字形信息壓縮技術和高速還原技術,這些成果使
7、漢字排版印刷告別了“鉛與火”的歷史,開啟了漢字進入數字化時代的新篇章。 如今,計算機中文字體已成為中國人進行信息溝通、情感傳遞、文化表達的必要載體,被廣泛應用于出版、印刷、包裝、廣告、教育、辦公、游戲動漫、互聯網、移動終端等社會生活的各個領域。不同領域的用戶特性、傳播媒介的屬性,都對漢字字形的創新提出了需求和挑戰,從事漢字字形設計與研究的專業隊伍不斷壯大,中文字體種類日漸豐富; 與此同時, 在媒體的傳播與推動下, 熱愛漢字、 關注漢字字形的群體不斷擴大,漢字字形信息已經從一個小眾領域逐漸走向大眾視野。 1.2.1.2. 領域發展現狀與關鍵科學問題領域發展現狀與關鍵科學問題 中文字庫是藝術和技術
8、的完美結合,其中每個漢字是設計師或書寫者一筆一畫設計或書寫出來的,在傳情達意的同時,表達視覺審美含義,同時字庫內部也包含控制字形還原的代碼,中文字庫兼具美術作品屬性和軟件屬性。 1.2.1. 字體美術作品著作權得到認可字體美術作品著作權得到認可 中國中文信息學會一直多方呼吁加強字庫知識產權的保護,2011 年學會發起了“弘揚中華文化,保護計算機中文字體”的倡議, 2012 年、2014 年學會先后給國家相關部 5 門發函,呼吁對字體加以保護。近年來,在中文字體領域,法律界已經普遍認為:具有藝術美感的獨創性的單字, 構成了著作權法規定的美術類作品, 應當受到法律保護。 2014年 4 月 22
9、日,最高人民法院公布了2013 年中國法院 50 件典型知識產權案例 ,將字體單字著作權確權案件列入其中,具有獨創性的單字享有美術作品著作權得到了最高人民法院認可。 在各方共同努力下,近年來,法院通過判決、調解、和解等形式支持字體著作權保護的案例越來越多。 1.2.2. 中文字符集標準和漢字字形規范的形成中文字符集標準和漢字字形規范的形成 1.2.2.1.1.2.2.1. 中文字符集標準中文字符集標準 計算機要準確處理各種字符集合,就需要進行字符編碼,以便計算機能夠識別和存儲各種文字。字庫中包含的字符是依據不同字符集標準進行收納。常見的中文字符集標準有 GB2312-80信息交換用漢字編碼字符
10、集 基本集 、GBK漢字內碼擴展規范 、GB18030-2000信息技術 漢字編碼字符集 基本集的擴充 、GB18030-2005信息技術 中文編碼字符集以及國際標準 ISO/IEC 10646 等。 1980 年, 國家標準 GB2312-80 信息交換用漢字編碼字符集 基本集 發布, 由 6763個常用漢字和 682 個全角的非漢字字符組成。 1995 年,國家技術監督局為中文 Windows 95 制定了漢字內碼擴展規范GBK,共收錄包含 21003 個漢字,涵蓋了常用的簡體和繁體漢字。 2000 年,信息產業部和國家質量技術監督局聯合發布 GB18030-2000 編碼標準,全名是信息
11、技術 信息交換用漢字編碼字符集 基本集的擴充 。GB18030-2000 規定了常用非漢字符號和 27533 個漢字。 GB18030-2000 是 GBK 的取代版本,它的主要特點是在 GBK 基礎上增加了 CJK 統一漢字擴充 A 的漢字。 GB18030-2000 是全文強制性標準,市場上銷售的產品必須符合。 2005 年,GB18030-2005信息技術 中文編碼字符集發布。在 GB18030-2000 的基礎上增加了 CJK 統一漢字擴充 B 的漢字,共 42711 個,并增加了多種我國少數民族文字的編碼。其中 GB18030-2000 部分為強制性標準。 2010 年,GB1300
12、0-2010信息技術 通用多八位編碼字符集(UCS)第一部分:體系結構與基本多文種平面 標準發布, 該標準等同采用國際標準 ISO/IEC 10646: 2003,共收錄漢字 71427 個。 最新的國際標準 ISO/IEC 10646:2020,收錄漢字達 93888 個,在 ISO/IEC 10646: 6 2003 的基礎上增加了 CJK 統一漢字擴充 C、D、E、F、G。 1.2.2.2.1.2.2.2. 漢字字形規范漢字字形規范 為了貫徹中華人民共和國國家通用語言文字法 ,提升國家通用語言文字的規范化、標準化、信息化水平,滿足信息時代語言生活和社會發展的需要, 2013 年國務院公布
13、了由教育部、國家語言文字工作委員會組織制定的通用規范漢字表 。 通用規范漢字表 共收錄漢字 8105 個, 其中 163 個漢字在 國家標準 GB18030-2005 以外 (CJK 統一漢字追加 3 字、擴 C 區 44 字、擴 D 區 8 字、擴 E 區 108 字) 。 當前市場上不規范不統一的字形時常顯現,如簡體字庫制作成繁體筆形,少筆畫、多筆畫等不同程度的字形規范問題。 通用規范漢字表 規定了漢字的寫法, 是中文字體設計的依據。 1.2.3. 關鍵科學問題關鍵科學問題 中文字庫是藝術設計與計算機科學相結合的產物,和其他軟件一樣需要關注開發、 分發以及終端應用三個主要階段。在數字信息時
14、代的今天,穩定高效的開發流程、覆蓋廣闊的分發以及豐富簡明的應用,都是推進我國漢字字形信息行業發展的重要因素。 1.2.3.1.1.2.3.1. 字庫開發字庫開發 字體設計生產是字體開發的重要環節,具體的是將各類字體設計稿、書寫字稿,轉換成相應的矢量輪廓數據,然后按照 OpenType 規范組織數據(字形和編碼) ,最終生成標準的 TTF/OTF 字庫,以滿足各種應用軟件和操作系統對字體的使用需求。一方面,行業企業自主開發了各自的字體設計工具和平臺,基于漢字部件快速檢索技術和網絡協同技術,為多人協同開發字體開發提供有力的支撐,保證了大字符量中文字體的開發速度。另一方面,隨著人工智能技術不斷成熟,
15、通過不斷的探索研究,目前已經在字體輔助設計方面取得成果,提升了字體開發效率。 1.2.3.2.1.2.3.2. 字庫分字庫分發發 在一個信息高速發展的時代,人們的生活逐漸向云端轉移,中文字庫的分發形式也發生了變化。 在網絡傳輸環境大幅提升的當下, 用戶越來越多地使用云服務來獲取字體。當前通過云服務來獲取字體的方式主要可以分為以下兩類:一類是本地使用字體的云服 7 務,主要服務于需要使用字體作為素材、在各類圖形、文本編輯軟件中進行本地編輯創作的用戶,他們會通過各個公司推出的電腦客戶端(如漢儀字庫的字由,方正字庫的字加等) , 通過聯網獲取自己訂閱賬戶中的字體, 將其同步至個人設備中進行使用; 另
16、一類字體的云服務,需要使用云字庫(WebFont)技術,其本質特征是將字體存儲于服務器云端,用戶在實際需要顯示這些字體時向云端即時提出請求。 1.2.3.3.1.2.3.3. 字體應用字體應用 隨著移動互聯網的發展,為了適應字體在各種場景中的應用,字體廠商研發出了可變字庫技術、壓縮字庫技術、云字庫(WebFont)技術以及特效字體技術??勺冏謳旒夹g是 OpenType1.8 規范的最新字庫技術, 它允許單個字體文件同時支持多個字體形態,以滿足用戶場景下不同形態字體的使用需求;通過壓縮字庫技術,可以隨意在受限的移動嵌入式設備中使用大容量中文字體;特效字體技術實現了字形的彩色和動態效果,為字體能夠
17、在互動娛樂產品場景中的使用提供基礎。云字庫(WebFont)技術主要是針對字體的網絡使用場景,特別是中文的顯示,該技術可以根據網頁的顯示需求快速動態生成所需的字庫數據,并及時在瀏覽器頁面展示。多種新應用技術的不斷實現,豐富了字體的應用場景,為字體行業的發展提供技術保障。 1.3.1.3. 領域關鍵技術進展及趨勢領域關鍵技術進展及趨勢 中文字庫兼具美術作品屬性和軟件屬性,除了設計創新,技術實力也是字庫企業的重要保障。隨著計算機運算能力的提升和人工智能技術的成熟,不少行業企業、院校關注字庫相關技術的研發和應用。 1.3.1. 中文字庫設計軟件中文字庫設計軟件 中文字體的設計軟件主要包含開放的商業字
18、體設計軟件,以及行業企業自主研發、內部使用的中文字體設計軟件。業內廣泛使用的商業字體軟件有 Fontlab、Glyphs,也有設計師使用 Adobe Illustrator 設計字體等,這類軟件大多來自國外,開發之初并沒有考慮中文字體設計的特點,缺失中文字體開發所需的很多核心功能。西文字體字符量比較少,輪廓相對簡單,一般由一個人就可以完成一套字體的開發,但是中文字體字符量較大,最少的也要設計 6000 多漢字,GKB 字符集字庫更需要制作 2 萬多字。行業企業自 8 主開發的字體設計軟件主要解決了提高龐大中文字符集字形開發的工作效率。 為了滿足中文字體開發字體設計軟件具有如下功能: 1)貝塞爾
19、曲線和直線的繪制、精調、平滑處理等功能 2)字形輪廓質量檢查及自動糾正 3)曲線降階處理 4)組件快速檢索并復用 5)家族化字體生成 6)支持多人協同工作 除上述功能外,行業企業自主開發的軟件,還可以根據各自項目需求,快速添加或調整軟件功能,以滿足自己的個性化需求。大多數行業企業也在生產流程中引入開放的商業字體設計軟件,以滿足外文字符設計的需要。 1.3.2. AI 輔助字體設計技術輔助字體設計技術 以深度神經網絡為代表的的深度學習在計算機視覺、自然語言處理等領域取得了巨大的成功,人工智能技術應用在中文字庫領域的主要目標是降低字體設計師的重復勞動,提升中文字體的生產效率。 2011 年由上海印
20、刷技術研究所聯合同濟大學共同開展了 “漢字字庫計算機智能制作系統”項目的研發。利用漢字構件及字形數據建立漢字構件字形庫,并在此基礎上提供漢字自動組合與編輯功能,在規范化和自動化方面為漢字字庫的研制開發,提供一個更有效、更合理、更容易控制品質的應用平臺。其中“基于神經網絡的漢字構字方法”和“字形智能化評價模型與修正方法”是項目的關鍵技術。該項目經過 2 年多的研發,于2014 年通過了上海市科委的驗收。 2016 年方正手跡公司采用北京大學王選計算機研究所的人工智能輔助字體生成技術,推出手跡造字 APP,只要手寫 100 個漢字,約半小時,即可產生包含 6763 漢字的完整個人字庫,目前也在華為
21、主題商店、WPS 提供個人造字服務,產生的個人字庫,分別可以在華為手機、WPS 文檔中使用。2020 年 vivo 手機、2021 年百度輸入法也分別推出面向普通個人的個人造字服務。 2018 年阿里巴巴和漢儀合作,推出阿里漢儀智能黑體,由阿里計算平臺事業部 PAI產品線 Deep Learning 團隊、阿里人機自然交互實驗室以及漢儀字庫設計師協作完成。這款字體的生成是人機協同工作的成果,機器學習,人工干預,循環往復,直到最終生成達標字庫。 9 方正、漢儀等行業企業也開始人工智能在精品字庫設計方面的研究探索,提升設計效率, 已經可以將一套 300500 字左右的手稿, 自動拓展至 GB231
22、2 編碼中的全部 6,763個漢字的字形,由于質量要求高,還需要設計師精修、調整,以便形成面向企業服務的精品字庫。 人工智能技術在字體行業的應用是未來不容忽視的發展趨勢,一方面極大的提升字體開發效率,另一方面解放了字體設計師的生產力,使未來的字體設計師,能將重心歸于創意,更加專注于靈感構思和創意挖掘等更為重要環節。 1.3.3. 可變字體技術可變字體技術 可變字體(Variable Fonts)技術源于 Adobe、Apple、Google、Microsoft 四巨頭于2016 年發布的 OpenType v1.8 字體格式規范,該技術是在已有的 OpenType 字庫基礎上增加可變特性數據表
23、,數據格式有 OTF 和 TTF 兩種。OpenType v1.8 字體格式規范的發布,將允許單個字體文件同時支持多個字體形態,它可以將幾個字體緊湊地封裝在單個字體文件中,通過定義字體內的變化來實現單軸或者多軸設計空間。目前主流的操作系統、瀏覽器、設計軟件大多在不同程度上支持可變字體。 在網頁設計上,只需使用一款可變字體,就可以為網頁中各層級的標題以及正文設置不同的字體樣式。這不僅能夠加快頁面的加載速度,也讓頁面整體排版可以適應不同屏幕尺寸的變化,滿足多屏時代的設計需求,提供更好的閱讀體驗。而在平面設計上,可變字體響應了當下和未來的動態設計需求。它可以應對足夠復雜的平面空間和應用場景。 之前大
24、多可變字體以西文為主。中文字庫的字符集龐大、字形復雜,實現字體無級可變的難度更高。近年來各個字體廠商研發出越來越多的中文可變字體。 文鼎字庫在 2017 年推出了全球首款中文可變字體“文鼎晶熙黑” ,擁有字重、字寬兩種可變軸。同年 11 月方正推出全球首款中文三軸可變字體“方正悠黑” ,具有字重、字寬、字高的可變三軸字體設計空間;在 2019 年,方正還為小米品牌打造了“小米蘭亭 Pro”可變字體,支持字體粗細的無級調節。漢儀字庫在 2021 年 6 月發布了為華為品牌定制的可變字體 HarmonyOS Sans,它是一款多語言的無級可變字體,支持簡繁中文、拉丁、西里爾、希臘、阿拉伯等書寫系統
25、。 隨著人們逐漸了解可變字體,以及更多適配硬件和軟件的出現,中文變字體將會有更多的應用形式,在實用功能與視覺設計上,帶給我們更多的驚喜。 10 1.3.4. 壓縮字庫技術壓縮字庫技術 嵌入式設備, 如手機, 導航儀, 電子書閱讀器, 要求字體具有體積小, 反應速度快,美觀多樣等特點。但是由于漢字的數量非常多,導致漢字字庫的數據量很大,一般包含GB13000 基本平面 2 萬 7 千多漢字的字庫,如 Windows XP 系統中的宋體字庫數據量是10M,無法滿足嵌入式設備屏幕顯示用字的需求。 手機 QQ、QQ 空間等 移動交互平臺希望用戶自己可以看到具有特殊效果的字體,與他人聊天時,其他用戶無需
26、單獨下載安裝字庫,即時看到其使用的具有特殊效果的字體。 為了解決以上問題,需要研發體量小的壓縮字庫,同時也可以滿足手機 QQ 希望通過網絡快速傳輸字庫的需求。 目前常見的壓縮字庫有兩種, 一種是自有格式的壓縮字庫, 一種是標準 TrueType 格式的壓縮字庫。自有格式壓縮字庫壓縮率更高,但是依賴自有字體解釋引擎,接入應用系統相對復雜; 標準 TrueType 壓縮字庫格式使用系統自帶的字體解釋引擎即可, 不需要加載額外的引擎,使用標準的接口就可以實現調用,通用性更好。 2015 年漢儀研發的 FullType 超小字庫,其存儲容量只有傳統 TrueType 格式的 1/5到 1/10 左右,
27、在手機 QQ、QQ 空間上線,顯著減少了對手機存儲空間的占用,提升了字體的加載速度,優化了用戶體驗;2016 年方正研發的基于標準 TrueType 格式的壓縮字庫, 存儲容量約為標準字庫的 20%-30%, 也在手機 QQ、 QQ 空間上線提供字庫服務。 1.3.5. 字體特效引擎技術字體特效引擎技術 字體特效引擎是通過字體引擎渲染繪制可以把常規靜態文字轉化為彩色動態文字,實現字體的多元化應用,在手機 QQ 平臺,2015 年漢儀研發了基于 Fulltype 字庫的字體特效渲染引擎,2016 年方正推出基于標準的 TrueType 壓縮字庫的字體特效引擎。 目前手機 QQ 提供的互娛式字體主
28、要包括黑白字體、彩色字體、炫動字體、嗨爆字體、藝人手寫字體和文娛 IP 字體等。其中,彩色字體、炫動字體和 嗨爆字體的生成涉及到二維圖形渲染畫刷引擎技術、矢量彩色字體技術、彩色位圖字體自動生成技術,有效解決在移動社交應用場景中,字體千人一面的問題,滿足了用戶的個性化聊天社交需求。 11 1.3.6. 云字庫(云字庫(WebFont)技術)技術 隨著網站的設計趨于個性化,字體作為網頁中最主要的元素,不同風格的字體對于網站的展示愈加重要。網絡字體是 CSS3 中的一個模塊,主要是把定義的特殊的字體嵌入到網頁中,免安裝、免下載、在線使用。常用的網絡字體格式有 woff、woff2、eot 等,不同格
29、式網絡字體適配不同的瀏覽器。 方正、漢儀等字體廠商都開發并實現了中文字體云字庫技術,通過按需截取和高效壓縮等技術有效地控制了字體文件的大小,使之和英文字體文件大小相當,提高頁面的加載效率,降低對網絡帶寬的占用,可以兼容市場上大部分瀏覽器。 云字庫技術的實現大大的推動了字體在互聯網場景下的應用,云字庫優勢主要體現在以下幾個方面: 極速推送字體: WebFont 極速推送網絡字體,使網絡字體瞬間加載,速度與效果兼得。 流量分壓:為用戶量身定制的小字庫文件,將被托管在 WebFont 平臺上,當用戶的頁面被瀏覽時,文件直接從 WebFont 平臺推送到客戶端終端瀏覽器,節約服務器流量。 優化搜索引擎
30、排名:雖然圖片也可以呈現中文字體,但是 Google、百度等搜索引擎無法辨認出圖片的文字內容, 無法搜索到網站相關內容。 使用網絡字體, 則是呈現真實的文字,無論是標題、內容都適合引用。 無級縮放不模糊:圖片在放大和縮小的過程中會產生變形或馬賽克,網絡字體采用的是矢量字體,支持無級縮放,不管放多大或縮再小都不會產生變形或模糊,給用戶一致的體驗。 改善使用體驗:圖片在高分辨率的視網膜屏幕中,常遇到分辨率不足的狀況;網頁字體則以矢量字在網頁中真實呈現,根據瀏覽分辨率做實時的字體描繪,無論放大到任何尺寸都能清晰分明。 1.3.7. AI 字體識別技術字體識別技術 文字識別一直是文檔分析中的重要環節,
31、互聯網的迅猛發展極大地推動了新字體的傳播,字體種類的迅速增長帶來了字體識別的新需求。 與常規的光學字符識別不同,字體識別的關鍵是要區分出不同字體之間的形態差異。字體風格的差異體現在字符形態的多個方面,如部件的空間分布、疏密程度、中宮的聚集程度,以及筆畫的粗細、曲直、光滑度,還有筆鋒的變化、交叉點的處理等。 12 目前方正、漢儀等字庫公司在字體檢測、字體識別等方面都取得了進展?,F有的字體識別方法針對常用字體取得不錯的識別效果,已經應用在各種消費和商用場景,包括對各種場景下的字體識別、字體風格提取等。 1.3.8. 字庫分字庫分發技術發技術 在 5G 網絡即將走向普及的高速信息時代, 中文字體的分
32、發形式也產生了一定變化。無論是之前通過光盤等實體介質發送給用戶,還是現在通過郵件、主頁、微信公眾號自助服務將字體發送給用戶,最終的目的都是讓用戶可以直接獲取字體文件在所需設備上進行本地安裝。 而在網絡傳輸環境大幅提升的當下, 用戶越來越多的通過聯網獲取字體,將其同步至個人設備中進行使用。 目前字體市場應用比較廣泛的字庫分發軟件主要是漢儀的 “字由” 和方正的 “字加” 。這兩大分發軟件旨在為獨立設計師、廣告宣傳類企業和其他有用字需求的企業建立一個字體方面相互交流、融通、應用和創新的開放性平臺,將傳統的字體下載、安裝、預覽以及在設計軟件中的使用字體等功能全部集成到應用中,為眾多用戶解決“找字體”
33、和“換字體”兩大核心問題,提高使用者的工作效率。 1.4.1.4. 領域產業發展現狀及趨勢領域產業發展現狀及趨勢 2020 年 10 月,上海印刷字體展示館揭牌儀式在現代漢字印刷字體發源地上海印刷技術研究所隆重舉行。新中國成立后,上海印刷技術研究所率先在此從事漢字印刷字體科研攻關,開發了當下廣泛使用的宋體、黑體、仿宋體、楷體。2009 年, “漢字印刷字體書寫技藝”被列入上海市非物質文化遺產名錄。上海印刷字體展示館面向公眾免費開放,讓更多人了解現代漢字印刷字體的起源和發展,了解漢字印刷字體的設計規范和創寫工藝,更好地宣揚與傳承漢字文化、字體文化、非遺文化。 上世紀九十年代,是中國字體行業發展輝
34、煌的時期,全國有十幾家從事字庫開發的企業,字庫數量增長迅猛。進入 2000 年后,由于盜版的日益猖獗,社會版權意識的淡薄,中文字體行業發展遭遇空前困境,稍具規模的字體設計研發企業數量銳減,中國大陸僅剩方正、漢儀、華文、華光與中易,且大多處于勉強維持的狀態。 近年來,隨著國家對知識產權相關政策法規的不斷完善,以及媒體對版權知識的科普與宣傳,大眾的版權意識顯著提升。在字體廠商、設計師群體、設計院校、行業協會 13 等各方的共同努力和推動下,中文字體產業逐漸呈現健康發展態勢。 1.4.1. 中文字體產業發展現狀中文字體產業發展現狀 1.4.1.1.1.4.1.1. 中中文字體行業百花齊放文字體行業百
35、花齊放 字體行業在中國消沉了十多年后,中文字體整體的質量和數量都落后于西方、日本和韓國。值得欣慰的是,近幾年,設計界掀起了一股字體的熱潮,越來越多的設計師意識到了字體對于平面設計的重要性,與此同時,字體設計軟件種類越來越多且越來越人性化,設計師坐在電腦前,無需紙筆,就能設計出可以在電腦上使用的字庫,大大降低了行業門檻。 設計界的關注和認可帶動了整個中文字體行業的發展,目前,國內大大小小的字體廠商、個人字體工作室已有 100 多家,呈現出百花齊放的景象,整個行業處于上升期。 1.4.1.2.1.4.1.2. 中文字體種類豐富多彩中文字體種類豐富多彩 行業蓬勃發展的直接成果就是中文字體種類的豐富多
36、彩。在創新方面,國內字庫公司主要是通過自主創作、外部合作的方式,來不斷提高字體產品的創新能力。 外部合作通常是指和社會各界人士的字體合作, 包括個人字體設計師、 平面設計師、書法家、漫畫家、漢字發燒友,甚至民間藝人、影視明星,通過合作的形式將更多優秀創意轉化成字體產品。近年來,外部合作的范疇進一步拓寬,多家字體廠商,如方正、上海銳線等, 開始嘗試與國外字體廠商、 設計師合作, 將優秀的日文字體開發成中文版,來豐富中文字體的選擇。 目前,國內不同廠商推出的中文字體已多達數千款,并且字體的質量也越來越高,涵蓋排版正文字、創意美術字、個性手書、傳統書法字等不同的風格種類,能夠滿足社會各領域的不同應用
37、需求。 1.4.1.3.1.4.1.3. 國家對中文字體行業日益重視國家對中文字體行業日益重視 中文字體行業的健康發展離不開國家層面的關注和重視。近年來,國家不斷加大對中文字體行業的重視力度,一方面不斷完善字庫知識產權相關政策法規,另一方面,將中文字庫相關內容納入國家文化發展規劃,先后啟動了中華字庫工程、中華精品字庫工程兩大重要文化工程。 14 “中華字庫”工程是一項引領中華文化步入信息化、數字化時代的先導性、奠基性工程, 目的是要建立全部漢字及少數民族文字的編碼和主要字體字符庫, 工程于 2011 年正式啟動。工程共分為 28 包,有近 30 家高校、研究院所和企業參與了工程研發工作,其中包
38、括多家字庫企業。 中易字庫參與承擔了第 2 包 “數據采集平臺研發” 、 第 22 包 “輸入法研發” ,方正字庫承擔了第 17 包“當代人名地名用字搜集與整理” 、第 20 包“字庫制作一:中間字庫、宋體楷體等成果字庫”的研發,華光字庫參與承擔了第 18 包“少數民族古文字的搜集與整理” 、第 19 包“少數民族現行文字的搜集整理與字庫制作” ,漢儀字庫承擔了第 21 包“字庫制作二黑體仿宋體及古漢字成果字庫”的研發。這些成果將滿足中華各民族古今各類文獻的出版印刷、數字化處理和傳輸的需要,全面打通信息化的發展瓶頸,使中華各民族文字的使用,中華文明的普及與傳播,更加方便和高效。 “中華精品字庫
39、工程”是中華優秀傳統文化傳承發展工程支持項目,工程由中國文學藝術界聯合會、國家語言文字工作委員會共同指導,將精選 100 位中國歷代書法名家的代表作品,開發成電腦字庫,中國書法家協會負責開發字體的遴選和質量審核,北京北大方正電子有限公司負責字庫的開發工作。工程于 2017 年申請立項,截止到 2021 年6 月底,已對外發布了 35 款精品字庫。 “中華精品字庫工程”是書法藝術和信息技術、漢字應用的高度融合,是推動中華優秀傳統文化傳承與發展的重要舉措,對傳承中華文化基因、弘揚中國精神、傳播中國價值,都有著重要的作用與意義。工程成果可以滿足日益發展的互聯網媒體和社會大眾多樣化漢字字形需要,功在當
40、代,利在千秋。 1.4.1.4.1.4.1.4. 字體設計相關字體設計相關研究成果研究成果不斷推出不斷推出 在字體廠商們不斷推出漢字字形創新成果的同時,設計院校的學者們也積極開展漢字字形方向的學術研究,并將研究成果轉化成了專業書籍。 2018 年,由中央美術學院設計學院副教授周博博士撰寫的中國現代文字設計圖史 ,對從晚清、民國到今天一百多年的時間里中國現代文字設計成就做了一番比較全面的梳理,清晰、明了的講述了中國現代文字的設計歷史。 2019 年,湖北美術學院副教授李海平推出的漢字字形學新論一書,立足先輩們的累累碩果,結合文字學、書法學和設計學,嘗試從一個新的角度探討漢字字形造字技法,演變過程
41、及相關的影響因素。 2021 年 8 月, 澳門理工學院藝術高等學校副教授孫明遠撰寫的 中國近現代平面設計和文字設計發展歷程研究從 1805 年至 1949 年付梓,該書以近現代印刷技術在中國的發展為主線,多角度清晰描繪這一時期中國平面設計和文字設計的歷史發展進程。 2021 年 10 月,清華大學美術學院陳楠教授的新書中國漢字設計史出版上市, 15 該書以漢字設計傳承與創新的發展脈絡開篇,結合設計學、傳播學和美學的宏觀視角,通過研究與分析,挖掘潛藏于漢字藝術審美與信息傳播功能背后的思維與方法。 中央美術學院副教授、 國際文字設計協會 (ATypI) 中國國家代表劉釗一直關注中外字體設計交流,
42、 組織中國專家在國際文字設計協會 AtypI 論壇演講, 對外傳播漢字文化。她統籌引進拉丁文字設計叢書,叢書由中央美術學院、雷丁大學、國際文字設計協會聯合推薦, 文本造型 如何創作字體 字腔字沖:16 世紀鑄字到現代字體設計分別于 2018 年 5 月、2019 年 2 月、于 2021 年 6 月出版上市。 這些學術研究成果的推出,為漢字字形領域的教育和傳播提供了有效工具,也為中文字體行業的創新發展提供了理論支撐。 1.4.1.5.1.4.1.5. 產學研實現良性循環產學研實現良性循環 近年來,眾多字體企業與設計院校之間積極開展產學研合作。一方面,設計高校積極聘請字體企業中有豐富實踐經驗和扎
43、實理論水平的資深字體設計師,擔任導師或客座教授,為字體設計教學提供有力支持;另一方面,字體企業與高校師生緊密合作,積極推動設計成果的創新轉化。 如方正與中國美術學院合作推出的首款高校定制字體方正國美進道體,與湖南師范大學美術學院教授李少波合作推出了方正方俊黑系列字體,與中國美術學院教師孫善春合作推出了首款屏幕手寫字體方正善春屏寫;漢儀與上海視覺藝術學院副教授陳嶸合作推出了漢儀新人文宋系列字體,與大連民族大學設計學院教師戰國棟合作推出了漢儀瑞虎宋、漢儀瑞意宋,與湖南師大李少波教授合作推出了首款地方文化字體漢儀霸蠻體。 這些合作字體的推出,是字體設計領域產學研良性循環的體現,既豐富了中文字體的種類
44、,也為更多產學研合作提供了示范。 1.4.1.6.1.4.1.6. 字體設計力量不斷壯大字體設計力量不斷壯大 字體價值的廣泛認可,字體企業的健康發展,字體教育的不斷普及,行業組織的積極推動,帶來了可喜的變化字體設計力量不斷壯大。目前,國內不同規模的字體廠商、字體工作室,有 100 多家,從事專職字體設計的設計師大多有平面設計或書法專業背景,來自八大美院的也不在少數。除了專職字體設計師,還有眾多平面設計師、書法 16 家,積極參與到字體設計創作中來,和字體廠商合作開發字庫。在產品化的字體設計之外, 越來越多的設計師熱衷于運用漢字元素進行設計創作, 這類設計師及其作品的傳播,也在不知不覺中壯大了字
45、體設計隊伍。 行業的發展離不開人才的支撐,除了依靠設計院校的專業人才輸出,目前,行業企業、院校也在努力從不同渠道、以不同形式為字體設計師的培育增磚添瓦。 方正獎設計大賽、 漢儀字體之星設計大賽 、Hiii Typography 中英文字體設計大賽等專業賽事,南京藝術學院和中國文字博物館舉辦的“字酷”文字藝術設計展、深圳市平面設計協會舉辦的 GDC Award(包含字體設計版塊)等,吸引了眾多設計師和字體愛好者對中文字體設計的關注和參與。與此同時,字體廠商與設計院校合作舉辦的字體工作坊、設計訓練營,則是以短期集中課程的形式,幫助學生提升字體素養、掌握字體設計方法,也頗有成效。 字體設計力量的壯大
46、,必將帶來中文字體創新的加速以及產業規模的進一步擴大。 1.4.1.7.1.4.1.7. 字庫字庫 B B 端市場端市場呈規?;?,運作形式多樣化呈規?;?,運作形式多樣化 B 端市場即針對企業或組織的字體授權市場。如今,越來越多的企業開始意識到字體是品牌宣傳的重要元素,不管是 logo、廣告、海報、包裝,都離不開字體,字體應用的好壞直接關系著品牌形象,并且影響企業產品銷售。與此同時,字體廠商也在不斷完善授權模式,建立簡單透明的交易流程,引導企業用戶正確購買字體版權。B 端市場作為字體行業的傳統市場,近 5 年來發展迅速,逐漸規?;?。 除了常規的商業用字授權模式,還出現了許多新的形式,如針對網頁的
47、云字庫解決方案、針對特殊領域的人口信息字庫解決方案,以及企業定制字體、城市定制字體、多文種匹配字體等。B 端市場逐步朝多樣化、細分化、定制化、差異化方向發展。 1.4.1.8.1.4.1.8. 字庫字庫 C C 端市場端市場發展迅猛,個性化需求激增發展迅猛,個性化需求激增 C 端市場即針對個人的字體授權市場。 當前, 我們已經進入移動互聯網時代, 工具、媒介都變得多元化、自由化,不再是設計的壁壘,與此同時,崇尚個性表達的 90 后、00后正逐漸成為社會主力軍,也是最具消費潛力的群體。伴隨國內智能手機市場的快速發展,字庫公司逐步與 OPPO、VIVO、華為、小米等手機品牌廠商合作開展非交互類平臺
48、授權業務,推出明星手寫字體、彩色字體、拼音字體等創意字體,豐富了終端手機用戶的系統體驗。在各大手機應用市場、手 Q 個性裝扮、搜狗輸入法、WPS 里,大量個性化字體被年輕消費者購買、使用。 17 作為近年來新誕生的市場業務類型,C 端市場近幾年發展迅猛,并迅速成為紅海市場。由于需求激增,大量字體企業、設計工作室及個人設計師參與到 C 端字體的創作中, 。隨著手機用戶的不斷增長,C 端市場的銷售額也在逐年增長。 1.4.2. 中文字體產業發展趨勢中文字體產業發展趨勢 1.4.2.1.1.4.2.1. 中文字體設計求新求變,不斷創新中文字體設計求新求變,不斷創新 字體設計是中文字體行業的核心生產力
49、,如何通過設計創新,來滿足不斷變化的市場需求,是中文字體產業可持續運轉的首要問題。在字體價值已得到廣泛認可的當下,隨著大眾審美的不斷提高,各行各業都對字體創新提出了需求。 近年來,在廣告、包裝等應用領域,有時尚感、有創意、風格突出的視覺風格,比較容易受到年輕人的關注,這一市場趨勢對時尚創意類字體提出了大量需求;在影視、綜藝節目,尤其是新興的短視頻等領域,有文化底蘊、個性鮮明、具有視覺沖擊力的字體,往往能帶來出其不意的流量效果,這讓書法類字體、個性手書類字體成為了市場關注的熱點。 中文字體設計只有不斷創新、求新求變,順應市場需求、甚至引領市場需求,才能在競爭中得以生存,為社會創造更多價值。 1.
50、4.2.2.1.4.2.2. 屏顯字體設計屏顯字體設計大勢所趨大勢所趨 如今,屏幕閱讀已經成為人們日常獲取信息的主要途徑。老一代屏顯字體為適應較低的像素密度,在中宮、筆畫細節、字面率、結構等方面做了很多屈從于技術條件的設計。 隨著移動互聯網的發展, 手機高清屏的高像素密度給了屏顯字體設計更大的自由度,加之手機閱讀的近視距,使得不必再一味追求大字面,從而使字體設計可以回歸審美表達,表現空間更為寬廣。時代給了字體行業好的機遇,越來越多的字體企業開始了新一代屏顯字體的研發。 方正字庫先后推出了方正悠黑、方正屏顯雅宋、方正悠宋、方正蘭亭黑 Pro 等多款閱讀舒適、富有人文氣息的屏顯字體。由倉耳字庫推出