《中國開源軟件(OSS)推進聯盟:2023中國開源發展藍皮書(294頁).pdf》由會員分享,可在線閱讀,更多相關《中國開源軟件(OSS)推進聯盟:2023中國開源發展藍皮書(294頁).pdf(294頁珍藏版)》請在三個皮匠報告上搜索。
1、2023 中國開源發展藍皮書2942023 中國開源發展藍皮書2942023 中國開源發展藍皮書編寫委員會顧 問:陸首群策 劃:劉 澎 孫文龍 趙 琛 蔣 濤 梁志輝 主 編:孟迎霞 武延軍 陳 偉 王 偉 耿 航 唐小引 鞠東穎 宋可為 工作組(按姓氏首字母排序):白國華 邊思康 程海旭 陳 陽 狄 安 丁 蔚 董世曉 郭 煒 何 苗 郇丹丹 紀明超 姜 寧 荊 琦 李德豪 李光杰 李建盛 梁 堯 劉建珍 劉京娟 隆云滔 羅文江 孫 啟 譚中意 滕召智 田 忠 屠 敏 汪 亮 王 慶 王 銀 王啟隆 王 溯 夏 清 許哲平 楊繼國 楊麗蘊 尹 剛 余 躍 岳松頌 張家駒 張 雨 鄭偉波 朱其
2、罡2023 中國開源發展藍皮書2目錄概要4總論92023 中國開源發展現狀10中國開源發展的機遇與挑戰18中國開源發展建議20第一章 開源的基本概念221.1 開源的定義和特征221.2 世界開源發展簡史231.3 中國開源發展簡史271.4 開源軟件與知識產權311.5 開源與標準39第二章 開發者發展現狀462.1 開發者規模、增速及發展趨勢462.2 開發者對開源社區、活動和項目的投入與貢獻542.3 開發者的需求和面臨的挑戰64第三章 開源項目發展現狀683.1 GitHub中國項目活躍度及趨勢683.2 基于OSS Compass的國內開源發展現狀753.3 中國重點領域開源項目發展
3、現狀80第四章 開源行業應用現狀1034.1 開源在金融行業的應用1034.2 開源在汽車行業的應用1074.3 開源在工業互聯網的應用1114.4 開源在風洞等場景的應用120第五章 開源社區發展現狀1235.1 開源社區的起源與發展歷程1235.2 開源社區的現狀特征1245.3 開源社區發展的挑戰和趨勢130第六章 開源組織及開源生態發展現狀1346.1 開源組織發展現狀1342023 中國開源發展藍皮書36.2 開源組織問題與挑戰1536.3 開源組織發展趨勢1546.4 開源組織發展建議155第七章 開源教育現狀1567.1 開源教育加速融入并貫穿教育全階段1567.2 開源教育平臺
4、和開源協作模式1577.3 校企結合的開源教育協同模式1597.4 開源教育問題與挑戰1627.5 開源教育發展建議163第八章 開源商業現狀1648.1 開源商業模式1658.2 開源商業現狀1688.3 開源支撐的四大業務模型1738.4 開源商業問題與挑戰175第九章 中國開源發展的機遇和挑戰1799.1 中國開源發展的機遇1799.2 中國開源發展的挑戰183第十章 開源貢獻19410.1 國際開源社區的中國貢獻19410.2 中國企業在開源基金會中發揮重要作用20410.3 中國頭部科技企業的開源貢獻21010.4 中國原生開源企業加速涌現22310.5 國際機構、國際企業對中國開源
5、的貢獻230附錄1:開源大事記240附錄2:開源專有名詞256附錄3:開源人物262附錄4:開源產品名錄266附錄5:開放科學和開放獲取281致謝2882023 中國開源發展藍皮書42023 開源藍皮書概要2023 中國開源發展藍皮書是由中國開源軟件推進聯盟(COPU)牽頭,聯合CSDN、中國科學院軟件研究所、開放原子開源基金會等多家企業和機構聯合編撰的年度開源報告。2023年,在全世界開源大發展的背景下,中國開源迎來了新的發展高峰,其發展速度仍舊為全球最快,其迸發的活力、潛力和速度已得到全球開源界的認可,中國開源部分領域和部分企業已接近或達到世界先進水平,在國際開源事務中的影響力正與日俱增,
6、發揮著越來越重要的力量。過去的2022年,是中國開源飛速發展的一年,也是中國開源邁向世界開源歷史新高度的一年。中國開源開發者、開源項目、開源社區、開源用戶數量持續攀升;基金會、知識產權、商業模式、投融資、公共服務平臺等開源生態快速完善,繁榮發展。但與此同時,我們也看到,中國開源發展不平衡的特點依然比較明顯,與總體發展水平處于第一梯隊的美國相比,尚有一定差距。2022-2023 中國開源新發展多年來中國政府始終高度重視開源的發展,隨著2021年開源被正式列入國家頂層規劃中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要,各地政府和相關部門相繼出臺開源支持鼓勵政策,中國開源發
7、展更是全面進入高速發展階段。中國開源開發者數量突破800萬,居全球第二;年新增數量據全球第二;中國開源開發者正以令人矚目的速度快速增長。國內開源代碼托管平臺逐漸形成規模,包括Gitee、GitCode、GitLink、木蘭開源社區、Gitlab、Gitea等平臺,持續迭代發展。此外,2023年6月開放原子開源基金會發布新的代碼托管平臺AtomGit,為中國開源基礎設施再添新力。以華為、阿里為代表的一大批國內大企業以及PingCAP為代表的部分中國創新企業已進入世界開源領跑者之列;全球開源排行榜中,中國開源活躍度TOP企業分別為:阿里巴巴、百度、螞蟻集團、PingCAP、騰訊、樂鑫ESPRESS
8、IF、飛致云Fit2Cloud、深度科技Deepin、青云。同時,包括微軟、英特爾、IBM、紅帽等知名跨國企業在推動中國開源產業發展方面均發揮了非常重要的作用。2022年華人主導的開源項目數量已達2500萬個,項目數量與質量雙雙提升,部分開源項目已進入全球開源項目排行榜前列,包括:PaddlePaddle,TiDB,ant-design,Flink,Pulsar,Doris,esp-idf,tvm,ShardingSphere,DolphinScheduler 等均脫穎而出。2023 中國開源發展藍皮書5中國開源軟件技術深入領域:從操作系統開始,發展到數據庫、中間件,并向應用領域逐漸延展,進而
9、在近年來開始主導深度信息技術領域的創新,大數據、云原生、云計算成為最活躍的開源應用領域;人工智能、物聯網、元宇宙等新領域,也逐漸擁抱開源并落地開源產品。操作系統上游社區基本成熟:以OpenHarmony、openEuler、龍蜥(Anolis OS)、OpenCloudOS、統信UOS、深度Deepin等為代表的國內力量上游操作系統社區基本成熟且進入生態大發展期。2022年12月ChatGPT的發布引發了新一輪人工智能爆發式增長,包括百度、智源在內的諸多國內企業和研究機構,正全力推進中國大模型底層基礎設施的建設。開源技術在中國關鍵領域和重點行業進一步得到廣泛應用,金融電信政務等部分行業處于開源
10、應用進入第一梯隊領先態勢。在以智能汽車為代表的數字化大發展行業,也成為開源高滲透率的重點領域。在中國成立的開源基金會現有兩家,分別為2020年成立的開放原子開源基金會、2023年成立的重慶天工開物開源基金會。開放原子開源基金會現有捐贈單位47家,30個開源項目通過技術監督委員會(TOC)的技術準入,其中OpenHarmony、openEuler兩個重點開源項目在業界形成較大影響力。重慶天工開物開源基金會,由重慶市政府批復設立,由清華大學、華中科技大學、重慶大學、中冶賽迪、中國信科、中科院等知名高校和企業聯合發起。中國的開源社區從最初單一且獨立的社區不斷演進,呈現出今天百花齊放、社區規模穩定增長
11、的繁榮景象,為中國開源生態的發展提供了強大的動力。2023年,中國開源組織的數量和質量不斷提升,中國開源產業鏈不斷完善。各類型開源組織,包括開源基金會、綜合型產業聯盟、專業型開源組織、地區型開源組織、開源推廣型社會組織等不斷涌現,對完善中國開源生態建設發揮著積極的貢獻。2022年,中國各大企業紛紛成立開源辦公室(OSPO),開源辦公室在企業治理中發揮著重要作用:以阿里巴巴、華為、百度、騰訊、字節跳動、螞蟻集團、中興、極氪汽車為例,越來越多的企業積極開設開源辦公室,成為企業開源統籌和運營的核心能力中心。開源軟件供應鏈標準(SBOM)日益受到重視,COPU牽頭組織國內企業代表與國際頂級基金會合力推
12、動企業開源軟件供應鏈安全與發展。中國開源的挑戰與不足中國開源生態部分環節仍然薄弱,尤其在開源自主創新、供應鏈安全、開源社區生態專業治理、開源人才培養以及開放合作擴大國際化影響力等方面仍需加強,如何持續打造開源高地、創新高地、科技高地、人才高地,仍然是中國開源產業的關鍵課題。2023 中國開源發展藍皮書6China Open Source Blue Book(2023)SummaryChina Open Source Blue Book(2023)is coordinated by China Open Source Software Promotion Union(COPU),together
13、 with Chinese Software Developer Network(CSDN),Institute of Software from Chinese Academy of Sciences,OpenAtom Foundation and other organizations.In 2023,China open source development remains fast growth and comes to a new height that is recognized from the global level.Some local companies are taki
14、ng leadership roles in open source technologies and segment applications.The influence from China open source communities and the ecosystems is growing significantly and clearly will be continuing.2022 was a year of rapid development for Chinas open source community.The number of Chinese open source
15、 developers,projects,communities,and users continued to rise.The open source ecosystem,including foundations,intellectual property,business models,investment and financing,and public service platforms,has rapidly improved and thrived.However,we are seeing great challenges such as the uneven developm
16、ent of Chinas open source communities in terms of skills,technology and open source governance.There is still a certain gap compared to the global leaders.New Developments of Chinas Open Source Community in 20222023 The Chinese government has always attached great importance to the development of op
17、en source.As a result,the development of open source in China has entered a high-speed phase.The number of Chinese open source developers has exceeded 8 million,ranking second globally.The annual growth rate of Chinese open source developers is also the second highest in the world,growing at an impr
18、essive pace.Domestic code hosting platforms have gradually gained scale,including platforms such as Gitee,GitCode,GitLink,Mulan Open Source Community,GitLab,and Gitea,among others,which have continued to iterate and develop.In addition,in June 2023,the OpenAtom Foundation launched a new code hosting
19、 platform called AtomGit,adding new strength to Chinas open source infrastructure.A large number of companies have become leaders in the global open source community,such as Alibaba,Huawei,Baidu,Ant Group,PingCAP,Tencent,Espressif,Fit2Cloud,Deepin,and QingCloud.Meanwhile,well-known global companies
20、such as Microsoft,Intel,IBM,and Red Hat have been playing important roles in promoting the development of Chinas open source industry.2023 中國開源發展藍皮書7In 2022,the local-led open source projects reached 25 million,with both the quantity and quality of projects improving.Some open source projects have e
21、ntered the forefront of global open source project rankings,including PaddlePaddle,TiDB,ant-design,Flink,Pulsar,Doris,esp-idf,tvm,ShardingSphere,DolphinScheduler,TDengine,etc.Open source technologies in China have deepened their reach into various fields,starting from operating systems and expanding
22、 to databases,middleware,and gradually extending into application domains.In recent years,China has begun to lead innovation in the field of deep information technology,with big data,cloud-native,and cloud computing being the most active areas of open source application.Technologies such as artifici
23、al intelligence,Internet of Things,and metaverse are also embracing open source and implementing open source with products.OpenHarmony,openEuler,Anolis OS,OpenCloudOS,UOS,and Deepin,which represent popular operating system communities,have entered a phase of rapid ecosystem development.The launch of
24、 ChatGPT in December 2022 has triggered explosive growth in artificial intelligence.The companies and research institutions,including Baidu and Beijing Academy of Artificial Intelligence,are actively promoting the construction of Chinas large-scale model infrastructure.Open source technologies have
25、been widely applied in critical sectors and emerging areas,such as finance,telecommunications,government,intelligent automoibiles,etc.China currently has two open source software foundations:the OpenAtom Foundation established in 2020 and the Chance Foundation established in 2023.The OpenAtom Founda
26、tion has 47 donating members,and 30 open source projects have passed the Technical Oversight Committees technical admission process.The Chance Foundation is jointly initiated by well-known universities and companies.The Chinese open source community has evolved from initial singular and isolated to
27、a vibrant landscape with diverse communities and stable growth,providing strong momentum for the development of Chinas open source ecosystem.In 2023,the quantity and quality of Chinese open source organizations continue to improve,and the Chinese open source industrial chain is continuously improvin
28、g.Various types of open source organizations,including industry open source software foundations,alliances and professional organizations,continue to grow and actively contribute to the development of Chinas open source ecosystem.In 2022,many large Chinese enterprises have established Open Source Pr
29、ogram Offices(OSPOs),which play an important role in enterprise governance.For example,Alibaba,Huawei,Baidu,Tencent,ByteDance,Ant Group,ZTE,and Zeekr motors have all set up OSPOs for coordinating and operating 2023 中國開源發展藍皮書8enterprise open source activities.The attention to Software Bill of Materia
30、ls(SBOM)is increasing.COPU is promoting the security and development of enterprise open source software supply chains with Linux Foundation and other organizations and enterprises.Challenges and Shortcomings in Chinas Open Source Community Chinas open source ecosystem are still weak in certain areas
31、,especially in terms of open source innovation,software supply chain security,community and ecosystem governance,talent cultivation,and international influence.How to sustainably nurture open source community,innovation,talents,and technology developments remains a key issue for Chinas open source i
32、ndustry.2023 中國開源發展藍皮書9總論2023年,在全世界開源大發展的背景下,中國開源迎來了新的發展高峰。中國開源的發展速度仍舊為全球最快,其迸發的活力、潛力和速度已得到全球開源界的認可,中國開源部分領域和部分企業已接近或達到世界先進水平,在國際開源事務中的影響力正與日俱增,發揮著越來越重要的力量?;仡欉^去的2022年,是中國開源飛速發展的一年,也是中國開源邁向世界開源歷史新高度的一年。中國開源開發者、開源項目、開源社區、開源用戶數量持續攀升;基金會、知識產權、商業模式、投融資、公共服務平臺等開源生態快速完善,開源生態繁榮發展。2023年中國開源取得新進展:開發者新增數量排名全球第
33、2,部分中國開源項目已進入全球開源項目排行榜前列;以華為、阿里為代表的一大批國內大企業以及PingCAP為代表的部分中國創新企業已進入世界開源領跑者之列;開源社區、開源人才、開源組織正在蓬勃發展;多年來中國政府始終高度重視開源的發展,隨著2021年開源被正式列入國家頂層規劃中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要,各地政府和相關部門相繼出臺開源支持鼓勵政策,開源技術在國內關鍵領域和重點行業得到了極大的推動和廣泛應用。中國開源生態正全面進入高速發展階段。當前,中國開源正處于加速發展階段,各技術領域如操作系統、數據庫、人工智能、云計算等正與開源深度融合,傳統行業如金
34、融、電信、醫療、制造業等也正在被開源快速滲透。更重要的是,中國正在成為全球開源市場的增長點,極大的市場容量、完善的產業鏈、快速的迭代能力正吸引全球的開源項目進入中國。不過,中國開源的高速發展也面臨成長的煩惱,如與日俱增的技術風險、法律風險、供應鏈風險,以及人才危機。但與此同時,我們也看到,中國開源發展不平衡的特點依然比較明顯,與總體發展水平處于第一梯隊的美國相比,尚有一定差距。中國開源生態部分環節仍然薄弱,尤其在開源自主創新、供應鏈安全、開源社區生態專業治理、開源人才培養以及開放合作擴大國際化影響力等方面仍需加強,如何持續打造開源高地、創新高地、科技高地、人才高地,是中國開源產業的關鍵課題。為
35、更準確、客觀、真實、完整的展現中國開源發展現狀,由中國開源推進聯盟(COPU)牽頭,聯合中國開發者社區CSDN、中國科學院軟件研究所、開放原子開源基金會、北京開源創新委員會、開源社、開源中國、北京大學、華東師范大學、國防科技大學等106家單位以及120多位開源專家和志愿者共同協作編撰完成這本2023中國開源發展藍皮書,力圖呈現2023中國開源產業生態全貌、中國2023 中國開源發展藍皮書10開源在技術創新、產業發展方面的積極進展以及當前所面臨的機遇與挑戰。在2021、2022年度開源藍皮書基礎上,2023中國開源發展藍皮書從10個章節分別介紹了開源基本概念、開源開發者現狀、開源項目現狀、開源行
36、業應用現狀、開源社區現狀、開源組織及開源生態現狀、開源教育現狀、開源商業現狀、開源發展與挑戰、開源貢獻,并對中國開源大事記、開源專有名詞、開源人物、開源產品庫以附錄形式作補充說明。值得一提的是,基于本年度中國開源發展的進展,在2022年版本基礎上,2023中國開源發展藍皮書進行了三項改進:1)新增“開源行業應用現狀”獨立章節;2)新增開源產品庫(全球數據庫產品庫、全球大模型產品庫、開源操作系統產品庫、主流編程語言庫、區塊鏈產品庫),并將產品庫作為中國開源藍皮書長期開源項目,在線運營和維護。3)新增開放科學相關介紹。希望2023中國開源發展藍皮書能夠為廣大開源從業者、愛好者、用戶,以及開源生態建
37、設者、參與者,全面展現當前中國開源發展的全景圖。2023 中國開源發展現狀2023年,是中國開源大發展的新高峰,中國已成為開源生態發展最具活力和潛力的國家之一,隨著國家支持開源發展的政策力度不斷加大和深化,開源軟件的使用者和貢獻者數量持續增長,開源社區的規模和活躍度不斷擴大,開源組織的數量和質量持續提升,開源技術在關鍵領域和行業得到更深入和廣泛的應用,中國開源與及國際開源界的交流合作也在不斷深入推進,同時,開放科學的發展,也讓開源從單純的代碼開源,擴展到數據開源、算力開源等范疇,所有的新進展,都為中國開源生態系統快速發展注入了強大的動力。中國開源的快速發展,得益于幾個重要的前提背景:第一,根據
38、Github中國開發者注冊用戶數量以及中國開發者的總和推算,中國已擁有全球最大規模的開發者群體,這是中國開源發展的根本動力引擎;第二,中國已成為世界最大的開源應用市場,涌現了大批超級用戶,為開源技術的成熟演進做出了卓越貢獻。第三,中國已經成為全球開源的智庫高地。中國開源軟件推進聯盟的國際智囊團多年來聘請了幾十位全球頂級開源專家,以多種形式參與和推進中國的開源建設,是開源界公認的頂級智庫。為了完整全面的呈現中國開源產業生態全貌,全書從開源生態的構成要素現狀逐一闡述:從最基石的開發者、開源項目、開源社區,到包括基金會在內的開源組織和生態、開源教育,再到開源商業模2023 中國開源發展藍皮書11式的
39、發展。中國開源自主創新的成功,離不開政府對開源的大力扶持,離不開優秀開源領袖、大型企業、開源基金會、大型投資機構對開源的投入,以及所有開源生態參與者與個體開源愛好者的貢獻。一、中國開源在國際開源界的地位和語話權持續提升2004年,在政府相關部門指導下,中國開源軟件推進聯盟(China OSS Promotion Union,縮寫 COPU)在北京成立,作為中國第一個專業權威的開源組織首次站在了國際開源舞臺上,同一年,發起召開中日韓三國IT局長OSS會議暨東北亞開源軟件推進論壇,至今已舉辦19屆。2006年,中國開源軟件推進聯盟主辦了首屆“開源中國開源世界高峰論壇”和“圓桌會議”。自此,已連續1
40、6年作為每年標志性的重要開源活動。伴隨首屆“開源中國開源世界高峰論壇”和“圓桌會議”,中國開源軟件推進聯盟聘請了世界著名的開源領袖、大師、著名開源基金會主席、跨國企業開源高管等擔任中國開源軟件推進聯盟智囊團(Think Tank)高級顧問。首屆智囊團20人,包括Linux基金會執行董事Jim Zemlin;Linux內核開發大師兼2.6版本監護人Andrew Morton;Apache創始人Brian Behlendorf;MySQL創始人David Axmark;Ubuntu創始人Mark Shuttleworth;開放源碼促進會(OSI)主席Michael Tiemann;Source F
41、orge創始人Larry Augustin;自由軟件基金會(FSF)的Eben Moglen;IBM Linux技術中心(LTC)副總裁Daniel Frye博士;英特爾開源技術中心(Intel OTC)總監Dirk Hohndel;Jboss創始人Marc Fleury;Gnome基金會(Gnome Foundation)主席Dave Neary等。到今天智囊團已發展到60多人。這是中國開源軟件推進聯盟很早就創建的開源高地、創新高地、科技高地、人才高地!中國開源高地的創立,吸引了全球開源大師、開源組織和機構對中國開源的重視與投入,眾多全球知名開源組織(如Debian、Linux、Apache
42、、FreeBSD、Ubuntu、Mozilla等)及28家跨國公司(包括IBM、HP、Intel、Google、SUN、Oracle、Motorola、Nokia等)等相繼申請加入。多年來,中國開源高地為提高中國開源的話語權,加速中國開源發展、擴大中國開源在世界上的影響,打下了深厚的基礎。Linux基金會執行董事Jim Zemlin曾在2021中國開源發展藍皮書中評價:中國開源發展很快,如今已接近或達到世界先進水平,一些企業開始進入世界領跑者行列,還涌現出杰出的開源領袖。期望中國在開源的教育、標準化、立法、知識產權保護,以及開源社區、基金會、風險投資等建設方面,基于已取得的較大進步更上一層樓。
43、2023年,中國開源迎來了新的發展高峰。中國開源開發者、開源項目、開源社區、開源用戶數量持續攀升;基金會、知識產權、商業模式、投融資、公共服務平臺等開源生態快速完善,盡管其中還有不2023 中國開源發展藍皮書12少待改進和完善處,但中國開源爆發出來的活力、潛力和驚人的加速度已經成為全球開源界的共識,在國際開源界的地位和話語權持續提升。以華為、阿里為代表的一大批國內大企業以及PingCAP為代表的部分中國創新企業已進入世界開源領跑者之列;全球開源排行榜中,中國開源活躍度TOP企業分別為:阿里巴巴、百度、螞蟻集團、PingCAP、騰訊、樂鑫ESPRESSIF、飛致云Fit2Cloud、深度科技De
44、epin、青云。同時,包括微軟、英特爾、IBM、紅帽等知名跨國企業在推動中國開源產業發展方面均發揮了非常重要的作用。中國在國際開源的地位和話語權,更多是由數字背后的中國開源人持之以恒的努力和奉獻贏得。華為、阿里、百度、騰訊、中興、字節跳動、滴滴、小米等國內頭部科技企業積極投身開源項目貢獻與社區治理、生態共建,麒麟軟件、統信軟件、平凱星辰、Kyligence、濤思數據等多家科創領域新秀脫穎而出,表現不凡,正是每一家企業和學、研機構的積極投入和踴躍參與,才使得中國在世界上的開源貢獻度不斷攀升。中國開源的發展也少不了跨國企業的貢獻。包括微軟、英特爾、IBM、紅帽等知名國際技術公司在推動中國開源產業、
45、中國開源項目與技術的發展和應用、開源人才、開源社區發展、開源國際性交流與助力等方面均發揮了非常重要的作用。二、中國開源最大的活力來源于數千萬開發者,開發者增長速度令人矚目中國開源開發者數量突破800萬,居全球第二;中國開源開發者年新增數量據全球第二;中國開源開發者正以令人矚目的速度快速增長。開源新生力量偏向年輕化,增長空間和潛力巨大。中國開發者社區CSDN 2022年度數據顯示,中國開發者注冊用戶數4300萬中,2022年新增用戶600萬,其中新增用戶中60%為大學生和高中生,高校計算機專業學生覆蓋度90%。隨著開源的普及,很多年輕開源新生軍逐漸加入和成長,開源人才增長空間和潛力巨大。全國超過
46、40%的開發者工作在一線城市(其中以北京、上海、廣州、深圳為主)。北京、廣東是開源開發者聚集較多的地域,占全國總數28.2%。上海、江蘇地區占比數量處于第二梯隊,占全國總數15.1%。開源正在吞噬世界,在日常的開發工作中,96%的開發者正在使用開源軟件,僅有2%的開發者表示從未使用開源軟件。2023 中國開源發展藍皮書13開發者中,49%的開發者參與過開源項目,接近一半的開發者加入了開源的大隊伍。參與開源項目的開發者中,67%的人員表示每周在開源上投入的時間不超過5小時,4%的開發者每周在開源上投入超過30小時以上。在開源項目的貢獻上,開發者主要還是通過代碼和文檔的貢獻,在參與過開源項目的開發
47、者中,有72.9%的開發者有代碼貢獻,49%開發者有文檔貢獻。國內的開源項目與社區中,QQ群、郵件列表、微信為最主要的三大交流工具。三、中國開源項目穩定發展,部分企業表現搶眼,但中美仍有不少差距據GitHub統計,近5年全球開源總體活躍倉庫數量保持著約24%左右的增速,中國在2022年的開源日志事件和活躍倉庫數也均有明顯增長。中國大企業開源的項目體量及活躍度總量,與美國大企業相比,還是有不少的差距。全球排名第一的企業為微軟公司,活躍項目數7629,年度活躍度82萬,項目平均活躍度108;中國排名第一的企業為阿里巴巴,活躍開源項目數2635,年度活躍度10.3萬,項目平均活躍度39。全球開源排行
48、榜中,中國開源活躍度TOP企業分別為:阿里巴巴、百度、螞蟻集團、PingCAP、騰訊、樂鑫ESPRESSIF、飛致云Fit2Cloud、深度科技Deepin、青云。華人主導的開源初創企業和項目表現搶眼,從項目平均活躍度,可以看到PingCAP(tidb,tikv)、ESPRESSIF(esp-idf)、StarRocks(StarRocks)均脫穎而出。中國開源軟件的發展從操作系統開始,發展到數據庫、中間件,并向應用領域逐漸延展,進而在近年來開始主導深度信息技術領域的創新,開源正在與各技術領域深度融合。其中,數據庫、云原生與開源項目的結合最為緊密,操作系統領域也出現大量成熟的Linux發行版,
49、很多企業開始自研開源的實時操作系統。在新技術領域,人工智能、物聯網、元宇宙等技術也逐漸擁抱開源并落地開源產品。中國高度重視各個技術領域在開源方向的前瞻性布局,無論是項目活躍度,還是項目影響力,都在快速提升。在數據庫領域,開源展現出兩大趨勢。一是國產商業數據庫逐漸走向開源,其中華為的openGauss、阿里云的PolarDB、奧星貝斯的OceanBase等,開始致力于為國內數據庫行業構建基礎根技術和根生態;二是中國在分布式、實時數倉等方向的開源產品已經成為了全球范圍內的優秀項目,如PingCAP發起的TiDB、百度發起的Doris和由國人開發的在Apache基金會孵化畢業的HAWQ項2023 中
50、國開源發展藍皮書14目等。在人工智能領域,深度學習已經是技術創新與開源落地的主要方向。2022年12月ChatGPT的發布引發了新一輪人工智能爆發式增長,中美在大模型領域將掀起新一輪人工智能競爭熱潮,包括百度、智源在內的諸多國內企業,將持續推動中國大模型底層基礎設施的建設。2022中國開源貢獻度報告顯示,國際開源Top50項目中,中國只有ant-design和vue-element-admin兩個項目上榜,排名17和26,均為前端項目,主流開源項目中國內仍然較少,中國在開源根技術和核心開發工具方面仍很薄弱。2023年2月,由開源中國、華為、南京大學等機構聯合發布開源指南針(OSS Compas
51、s)平臺,面向 GitHub、Gitee等托管平臺上托管的所有開源項目開放,為國內和國際開源社區提供了SaaS服務,為中國開源社區的健康指標和結果評估提供量化指標。四、開源在傳統行業的應用進一步深化,金融電信政務等部分行業處于第一梯隊領先態勢開源在各行業的滲透率正在逐漸加深。據紅帽發布的報告顯示,當前已經有超過90%的IT領導者都在使用企業級開源。同時數據顯示,國內超過八成的行業客戶都在軟件開發生產中使用到了開源技術。據開源在傳統行業的應用統計,金融、電信、政務、醫療行業占比最高。其中,金融行業占比17.3%,電信行業運營商占比10.9%,醫療行業占比為9.6%。以開源操作系統openEule
52、r、企業級Kubernetes平臺OpenShift等為例,其主要應用場景分布在金融、運營商、政府、物流、制造等場景。開源在以智能汽車為代表的數字化大發展行業,將成為開源高滲透率的領域。以寶馬為例,在多年前就成立了自動駕駛項目,并將開源作為重點推進,核心在于使用開源能夠推進開發更加敏捷高效,同時對系統的穩定性及安全大有裨益。開源正在滲透行業,同時行業也在反哺開源,其中尤以金融和電信行業為甚,近年來涌現了諸多非常優秀的開源項目。金融行業以微眾銀行為代表,已發起二十余個開源項目,其中兩個已于2021年進入Apache孵化器。電信行業中,以中國移動為代表的中國運營商與海外企業合作,參與推動了包括ON
53、AP、Edge、G-SRv6等基于平臺、關鍵部件、系統與集成領域的開源項目。在開源社區與組織建設方面,金融、電信、制造業、智能汽車等已形成行業特色。行業開源社區及組織主要承擔行業內的開源代碼服務、供需對接、開源治理推動、開源規范制定、開原生態建設及企業2023 中國開源發展藍皮書15交流等工作,極大地推動了各行業開源協作和開源實踐。例如,金融行業開源技術應用社區、工業技術軟件化開源社區(OSIICN)、通信行業開源社區(ICTOSC)、OpenSDV汽車軟件開源聯盟等等??梢灶A見,行業正在逐漸形成擁抱開源、使用開源的共識。未來,開源將在傳統企業展現更多的力量,而傳統行業積極擁抱開源、引入開源軟
54、件的背后,是其業務發展導致的企業對持續變化的業務需求響應能力、軟件性能及成本與效率方面的考慮,降低成本、提升效率和創新發展。開源技術將以更加深入地融入各個行業,推動數字化轉型和智能化升級。五、開源社區蓬勃發展,但運營和治理的專業化程度仍需提升中國的開源社區從最初單一且獨立的社區不斷演進,呈現出今天百花齊放、社區規模穩定增長的繁榮景象,為中國開源生態的發展提供了強大的動力。國內開源代碼托管平臺逐漸形成規模,包括GitCode、Gitee、GitLink、木蘭開源社區、Gitlab、Gitea等平臺在內,持續迭代發展。此外,2023年6月開放原子開源基金會發布新的代碼托管平臺AtomGit,為中國
55、開源基礎設施再添新力。項目型開源社區大量涌現。根據開源社匯總的中國開源地圖,2022年中國開源社區新增21個組織,增幅明顯。按地域排序,開發者社區聚集最多的前三位地區為北京、上海、杭州。北京地區共有69個社區,包括Apache IoTDB、開源GitOps產業聯盟、Apache ShardingSphere、Apache Doris、亞馬遜云科技、OceanBase等。上海開源社區包括KubeSphere、Neo4j開發者社區、OpenMLDB社區、X-lab開放實驗室等;杭州開源社區有Apache RocketMQ、阿里云PolarDB開源社區、Ruby China、龍蜥社區、KubeEdg
56、e等。大數據、云原生、云計算為專業開源社區排名最多的3個領域,中間件、機器學習、數據庫社區數量近幾年增長迅速。大數據在開源社區領域的類別中數量最高,有46個。一方面,在數字化時代,大數據發展起步較早,行業對大數據技術和工具的需求非常高;另一方面,大數據領域的技術非常復雜,涉及到分布式計算、數據存儲和處理乃至機器學習等多個方面,這也涌現了Hadoop、Spark、Kafka等成熟的技術工具和框架。云原生和云計算開源社區數量排在第二和第三位,分別有43個和39個。中間件、機器學習、數據庫的社區數量在近幾年增長迅速,如今均達到了31個。2022年,國內舉辦了多場開源社區活動和會議,為開發者提供了學習
57、和交流的機會。比較有影響力2023 中國開源發展藍皮書16的會議包括:開放原子全球開源峰會、中國開源年會(COSCon 2022)、CCF中國開源大會、長沙 中國1024程序員節、全球開源技術峰會GOTC等。中國開源社區與國際交流更為緊密:中國開源社區積極參與國際開源項目,共商開源供應鏈安全策略,中國的開源項目和開發者在國際開源社區中逐漸脫穎而出,中國舉辦的開源技術大會和交流活動,吸引了來自世界各地的開源愛好者和專業人士。六、開源組織數量和質量不斷提升,對開源生態建設發揮著重要推動作用2023年,中國開源組織的數量和質量不斷提升,中國開源產業鏈不斷完善。各類型開源組織,包括開源基金會、綜合型產
58、業聯盟、專業型開源組織、地區型開源組織、開源推廣型社會組織等不斷涌現,對完善中國開源生態建設發揮著積極的貢獻。專業型開源組織,例如在國際上頗具影響力的中國開源軟件推進聯盟(COPU),倡導發展開源芯片的中國開放指令生態(RISC-V)聯盟和中國RISC-V產業聯盟,關注開源人工智能等的新一代人工智能產業技術創新戰略聯盟,聚焦工業4.0的開源工業互聯網聯盟,著力于云計算產業的中國開源云聯盟、云計算開源產業聯盟等,都彰顯了中國開源生態蓬勃發展的生命力。中國開源基金會新進展:2020年6月成立的開放原子開源基金會,是我國首家開源基金會?,F有捐贈單位47家,30個開源項目通過技術監督委員會(TOC)的
59、技術準入,其中OpenHarmony、openEuler兩個重點開源項目在業界形成較大影響力,累計數億人次、數百萬用戶企業通過網絡免費獲取。2023年4月成立的重慶天工開物開源基金會,由重慶市政府批復設立,由清華大學、華中科技大學、重慶大學、中冶賽迪、中國信科、中科院等知名高校和企業聯合發起。以華為、阿里巴巴、字節跳動、螞蟻集團、中興、極氪汽車為例,越來越多的企業積極開設開源辦公室,成為企業開源統籌和運營的核心能力中心,專業合規地運營開源,并在開源社區貢獻代碼、資源和經驗,大大推動企業開放組織和繁榮開源生態的發展進程。中國開源生態的蓬勃發展,不僅對于中國的技術創新和產業發展具有重要意義,對于全
60、球的開源生態同樣產生了積極的影響。七、開源教育橫縱連合協同發展,人才培養規?;€步推進國內眾多高等院校加大開源基礎設施投入力度,進行開源課程建設,組織開源相關講座、競賽以及2023 中國開源發展藍皮書17多種線上、線下活動,積極探索開源創新人才培養路徑,提升軟件人才與關鍵軟件技術創新和供給能力。北京大學計算機學院周明輝開設OSS Development開源軟件技術課程,華東師范大學與同濟大學共同創建X-lab開放實驗室,開設開源軟件通識基礎課程,等。知名開源項目及開源企業紛紛組建專門的技術培訓學院,發布開源培訓認證課程,圍繞開源項目推動專業化教育,如百度AI Studio、PingCAP Ti
61、DB培訓及認證課程等?;陂_發工具和知識社區的開源教育平臺快速發展,形成了活躍的互動在線學習與實訓模式。國內平臺類典型代表包括 CSDN GitCode、GitL、木蘭開源社區、頭歌()、G 等社區,為全球開源學習者提供學習實踐的通道。開源教育正加速融入并貫穿教育全階段:開源逐漸滲入各地高、中、小學教育,像Arduino、Scratch等開源軟硬件在兒童創客教育產品中被廣泛使用,眾多開源組織和開源在線教育平臺組織師資培訓及學生創客活動,支持學校進行開源啟蒙教育。同時,越來越多的職業教育機構和培訓機構,大量引入和增設開源軟件和工具、開源相關培訓及網絡課程。政產學研用,多方協同,從開源文化、開源素
62、質、開源技能“三位一體”協同培養,構建開源教育的生態發展。2023年中國計算機教育大會上,由教育部、CCF開源發展委員會、軟件行業協會、開源基金會等多方一起,探討大規模計算機實踐教育資源共建共享方法及流程,支持高校加速推進計算機開源人才培養體系建設,從規?;瞬排囵B方面賦能發展。但開源教育快速發展的同時,當前市場仍存在開源人才短缺,開源教育資源不完善;高校對開源教育的接受程度有限、開源教育缺乏可持續發展的商業模式等等問題與挑戰。八、開源商業:開源商業模式逐漸演進成型,投融資偏好人工智能熱點開源作為多年來長盛不衰的話題,在全球范圍內,已經有越來越多的開源項目公司獲得大量投資或最終上市。而在此過程
63、中,開源的商業模式也逐漸成型,演進出多種商業模式。2022年對于開源商業化來說稱得上是極具挑戰的一年。無論在全球資本市場上,還是在國內市場上,由于Covid-19疫情的影響以及全球政治形勢的影響,經濟的緩慢復蘇和資本的驟冷,讓開源生態里的商業公司都經歷著各種考驗。全球市場上,2022年有MariaDB(MySQL之父Monty創建)通過SPAC方式上市,但不到半年的時間市值腰斬。在國內市場上,相比資本市場的謹慎觀望,國家和政府則對于開源逐漸重視,并不斷推出利好政策。2023 中國開源發展藍皮書18與過去兩年相比,開源投融資的賽道發生顯著的變化,從數據庫為先轉為人工智能為先。就國內市場而言,大模
64、型的火熱帶動了Mengzi(瀾舟科技)、ChatGLM和CodeGeeX(智譜 AI),而面向AI的向量數據庫 Milvus(Zilliz)也迎來了前所未有的機遇。當前,開源商業化依然面臨著極大的挑戰,開源項目的貢獻方、擁有方、開源社區力量、基金會或者OSI等行業非政府組織以及政府最終相互結合起來,形成了對于整個開源世界的運作和治理控制體系及至關重要的獎懲執行。中國開源發展的機遇與挑戰中國開源發展的機遇開源正成為全球數字市場的增長點,我國政府更加重視與推動開源的發展:開源軟件以前所未有的力量推動全球創新和經濟增長,世界各國紛紛將數字經濟作為重要的發展戰略,我國政府對開源技術的支持力度也在不斷加
65、大,從國家層面、省市及地區相繼出臺政策,引導和投資促進開源技術在關鍵領域的應用和發展,支持開源社區的建設和國際合作,推動中國開源走向全球。政府對開源的支持促進了開源生態系統的繁榮,并為開源軟件在國內的廣泛應用創造了條件。中國具有極大的開源應用市場空間:中國擁有全球最完善的電子工業產業鏈,許多開源技術在中國市場找到載體落地并銷往全球。開源技術本地化,并在本地提供服務和二次開發的過程,是一個明顯的趨勢,RISC-V、TWS(True Wireless Stereo)等技術在中國的快速產業化就是最佳案例。特別是軟件、硬件結合的產品及軟硬一體化的應用解決方案,依托中國完備、高效的產業鏈優勢,這是中國開
66、源發展在全球市場占據領先地位的歷史機遇。而隨著IoT和AIoT的發展,數據將從萬物互聯中產生。中國制造業的市場規模與快速迭代的優勢,將帶來更多的技術創新。開源的訂閱服務費的商業模式和可定制化的開放技術架構為中國企業降低了市場門檻與學習成本,提升了性價比。據2022年中國開源軟件產業研究報告的數據顯示,開源可為企業項目節省38%的直接開發成本,避免重復造輪子的成本投入。開源正與各技術領域深度融合:開源軟件的發展從操作系統開始,發展到數據庫、中間件,并向應用領域逐漸延展,進而在近年來開始主導深度信息技術領域的創新,開源正在與各技術領域深度融合。開源逐步滲透傳統行業:開源在各行業的滲透率正在逐漸加深
67、。據紅帽發布的2021全球企業開2023 中國開源發展藍皮書19源現狀報告顯示,當前已經有超過90%的IT領導者都在使用企業級開源。同時,據數據統計,2020年在全球財富50強中,共有72%的企業在使用GitHub平臺托管代碼,國內超過八成的行業客戶都在軟件開發生產中使用到了開源技術。中國具有極大的開發者人才基礎:據CSDN數據顯示,當前中國開發者用戶已超過4300萬,2022年新增600萬開發者相關用戶,其對開源相關技術的關注度和學習熱情持續高漲,這數千萬的開發者群體為中國開源事業提供了源源不斷的動力和創新能力,成為推動中國開源發展的重要基礎力量。中國開源發展的挑戰高質量開源項目仍然缺乏:盡
68、管中國的開源項目數量不斷增長,但仍面臨高質量開源項目的相對匱乏,尤其是根技術和核心技術棧工具的缺乏。在全球開源競爭中,仍然需要持續加強創新能力,培育更多具有核心競爭力的開源項目,提升開源軟件的質量和可靠性。頂尖開源人才匱乏,規?;_源人才培養生態還待發展:優秀開源人才所帶來的生態效應,是非常稀缺的資源。但當前開源人才供需對接的效率低;高技能人才匱乏,頂尖開源人才更難尋;同時企業對開源人才的培養成本投入少,開源人才留存困難等問題。開源供應鏈安全、知識產權合規及法律風險問題,日益突出:開源軟件漏洞數量保持高位的情況下,隨著開源應用的增加,加強開源安全解決方案的研發和應用,提升開源軟件和系統的安全性
69、,建立健全的開源治理機制和規范是一大挑戰。同時,開源軟件的使用和貢獻涉及知識產權和法律合規等問題,如何更好地保護知識產權,合規地貢獻、使用和貢獻開源代碼,也是是一大挑戰。開源社區的治理和協作,需要提升系統化建設能力:隨著開源社區規模的不斷擴大,社區治理和協作機制的建設變得更加重要。加強開源社區的組織和管理,建立有效的決策機制和協作平臺,促進社區成員之間的合作和交流,提高社區的活躍度和效率。國際競爭和合作壓力:中國開源界面臨來自全球其他國家和地區的競爭和合作壓力,在全球開源領域,各國都在積極推動開源技術的發展,中國需要與其他國家開展更加廣泛和深入的合作,加強國際交流與競爭,提升中國開源在全球的影
70、響力和競爭力。中國開源發展建議一、持續加強重點開源人才培養,推動開源教育和人才基礎2023 中國開源發展藍皮書20加強開源教育和人才培養,加大對開源教育、開源培訓的投入,建設開源教育資源和平臺,全方位完善開源人才教育體系。鼓勵開源產教融合、科教融合的高效協同教育機制,持續打造創新型產教融合平臺,鼓勵開放融合、參與開源實踐。加大開源知識庫和資源庫的建設,通過提供培訓、指導和資源的方式,鼓勵和支持中國開源開發者積極參與和貢獻到全球主流開源項目中,幫助中國開發者融入全球開源社區。加強開源文化的宣傳與推廣力度,提高開發者對開源的認知,鼓勵舉辦開源活動、開源研討會和開源培訓、實訓營等平臺,提高開發者的開
71、源意識和技術能力,推動開源文化的普及和傳播。進一步加大開源創新大賽等的獎勵和扶持、優秀開源人才的培養計劃。二、加大對開源項目和源企業的投入與扶持,鼓勵新創開源項目,提高中國開源影響力鼓勵企業和政府機構參與開源項目的投入,加大對開源組織和企業的投入與扶持,提高開源項目的質量和數量,為國內外用戶提供更好的開源產品和服務,讓更多的用戶使用中國主導的開源項目。支持開源創新和項目孵化,持續打造高質量的開源項目:鼓勵和支持創新型開源項目的孵化和發展,提供資金、資源和政策支持,培育更多有國際影響力的開源項目,推動中國開源在全球的競爭力。加大對開源托管及運營基礎平臺的投入,加大對支撐型代碼托管平臺以及開發者平
72、臺的支持與扶持,對持續打造有國際競爭力的支撐平臺具有非常重要的意義與價值。三、繼續深化開源生態發展,推動開源產業化的可持續發展。加強對開源社區的扶持和治理,保障開源社區的穩定和可持續發展。鼓勵開源項目的商業模式和產業化路徑發展,加強產業上下游戲的的對接和合作,深化更好的技術支持和應用場景,推動開源技術在產業領域的應用和發展。扶持開源企業發展,培育優秀開源項目。從開源產品的誕生到商業化,往往要經過很長的周期。建議政府部門對開源項目、開源產品和開源企業給與較長期支持。例如,鼓勵各行業企業積極擁抱開源,出臺相關支持政策,引導企業采用開源產品,擴大開源用戶群體等。四、推動開源供應鏈安全及知識產權保護2
73、023 中國開源發展藍皮書21積極參與國際開源標準制定,推動開源技術的標準化進程,提高中國在國際開源社區的話語權和影響力,為中國企業在全球開源領域的競爭提供有力支持。強化知識產權保護:加強對開源軟件知識產權的保護和管理,建立健全的法律法規和制度,確保開源軟件的合法權益,增強開源社區和企業的創新動力和信心。五、加強國際交流與合作,加大力度促進開源國際化合作,提升國際化影響力進一步擴大中國開源與國際的交流與合作,鼓勵參與國際開源項目、開源社區、開源組織和標準的制定。鼓勵多形式與國際開源建立合作關系,促進技術共享與合作,推動形成統一融合的開源生態。鼓勵中國開源國際化,積極參與全球競爭。數字經濟快速發
74、展,中國的規?;瘓鼍坝袡C會誕生更多世界級的基礎軟件公司。開源能吸引全球人才、匯聚全球場景、快速打磨產品,在技術變革日新月異的今天,為中國企業超越傳統巨頭提供了可能。借助開源“全球化”的天然屬性,中國開源企業有能力參與全球競爭,建議政府鼓勵更多的中國開源企業走向世界,并提供相應的政策支持。鼓勵國外優秀開源項目和優秀人才引進來:吸收和借鑒國際先進經驗,加強與國際開源組織和社區的交流合作,吸引全球優秀項目與杰出開發者加入,提升中國開源在國際舞臺上的影響力和競爭力。正如中國開源推進聯盟名譽主席陸首群所言,在國際形勢愈發復雜的背景下,中國開源發展的核心是自主創新。中國開源社區要加強原創性的技術研發,推動
75、自主知識產權發展,以實現關鍵技術領域的自主可控。中國開源人和開源組織更應該不忘初心、堅守本心,堅守并踐行中立原則的開源發展之路,推動中國科技及全球開源的大發展。中國開源的發展,未來可期!2023 中國開源發展藍皮書22第一章 開源的基本概念1.1 開源的定義和特征1.1.1 開源的定義開源(Open Source)一詞于1998年2月3日由Chris Peterson提出,“Open Source”的概念出自當時著名的黑客(Hacker)社區Debian的社長Bruce Perens起草的“Debian Free Software Guidelines”(DFSG)。1998年2月下旬,Eri
76、c Raymond和Bruce Perens共同創立Open Source Initiative(OSI)。OSI承擔的首要任務之一是起草開源定義(OSD),并使用它來開始創建OSI批準的許可證列表。對確立“Open Source”定義有決定意義的是在1998年4月7日在美國加州Palo Alto由18位“自由軟件運動領袖”召開的Freeware高層會議,通過了傳播開源的必要性。會議由Tim OReilly主持,Brain Behlendorf(Apache創始人)、Linus Torvalds(Linux創始人)、Guido Van Rossum(Python創始人)、Eric Raymon
77、d(著名記者、OSI首屆主席)等參加。隨著時代的變遷,開源的定義內涵也在不斷演進。目前的共識是:開源是促進信息技術創新的重要途徑,是將源代碼、設計文檔或其他創作內容開放共享的一種技術開發和發行模式。技術領域的開源已包含源代碼+軟硬件設計文檔源代碼、源數據等技術和資源的開放共享,源代碼仍然是開源的主要內容。在開源模式下,通過許可證的方式,使用者在遵守許可限制的條件下,可自由獲取源代碼等,并可使用、復制、修改和再發布。本質上,開源模式是一種依托互聯網平臺,大規模群體智慧通過共同參與和協作,不斷累積智慧,實現持續創新的方法。該方法中,項目的核心開發人員與大規模的外圍群體緊密合作,他們通過互聯網來共享
78、資源、開展協同開發、管理代碼等,由此使得項目開發的效率、應對需求變化的能力大幅提升。1.1.2 開源的特征中國開源軟件推進聯盟于2016年歸納提出的(已被國際認可)開源特征包括:開放、創新、自由、共享、協同、綠色、民主(化)。開源的本質在于開放、共享、協同。2023 中國開源發展藍皮書23開放指開放標準、開放環境、開放源碼;創新是主軸;自由指自由發布、自由傳播、自由復制、自由修改、自由使用,其中,自由傳播是開源運動的要義;共享指共享資源;協同指協同開發、協同作業、協作生產;綠色指支持綠色可再生能源、綠色環境和零邊際成本效應;民主化指在新興協同共享中,創新和創造力的民主化正在孵化一種新的激勵機制
79、,這種機制很少基于經濟回報,而更多地基于推動人類的經濟生活方式,縮小收入差距,實現全球民主化。為避免原創技術的流失,不能單純限制孵化階段開源代碼的自由傳播,可通過開源的商業模式、安全模塊、運維舉措、生態系統所構筑的屏蔽層來解決。作為一種創新協作模式,開源已經不僅僅是開放源代碼的軟件技術開發,還包括更為廣泛的開放技術領域及協同創新的理念與機制,總體包括開放科學、開源軟件、開源硬件、開源技術、開源文化、開源經濟等?!盎ヂ摼W基于知識社會的創新 2.0”是開源創新的基礎理論(2005年由中國開源軟件推進聯盟提出,后來獲得全球開源界領袖們的確認),與工業 4.0、工業互聯網機制相通,與元宇宙(Metav
80、erse)概念相似。利用開源渠道,將高階社會(知識社會,虛擬化的實驗空間)中的技術、管理、資源等要素,作用于低階社會(現實的工業社會,物理空間)中的業態(生產的、技術的、經濟的、社會的),促使其產生01的爆發性重構。1.1.3 開源的范疇時至今天,開源已成為開源軟件、開源硬件、開源生態、開源技術、開源社區、開源經濟、開源商業模式、開源理念、開源文化、開源教育、開源許可證、開源基金會、開源孵化器、開源數字化治理體系、開源標準等的總稱。1.2 世界開源發展簡史世界開源發展史,有三個里程碑時間節點:1970年、1985年、1991年,分別對應UNIX、GNU、Linux的發展。2023 中國開源發展
81、藍皮書241.2.1 UNIX簡史1969年之前,Bell實驗室和MIT、GE合作啟動開發一個多任務多用戶的操作系統Multics,為UNICS操作系統誕生創造條件。1969年,UNIX原型UNICS(UNiplexed Information and Computing System)誕生。1973年,Dennis Ritchie發明C語言,用C語言將UNICS重寫并更名為UNIX,UNIX正式誕生。1969-1977年,UNIX相繼推出V1-V6版本,向社會開放源代碼。1977年開始進入“后UNIX”時代,UNIX演化為UNIX(閉源,即AT&T-UNIX)和BSD(開源,即BSD-UNI
82、X)。主流的開源BSD操作系統有386BSD、FreeBSD、NetBSD、OpenBSD。因此,世界開源的歷史始自1970年開啟的“前UNIX”,至今53年,開源在事實上已經歷了半個世紀的發展歷程。1.2.2 GNU簡史GNU系統是一套向上兼容UNIX的完全自由的操作系統。GNU代表“GNUs Not UNIX”。1983年9月27日,Richard Stallman提出了GNU工程的初始聲明,意圖找回在早期計算機社區中廣泛存在的合作精神,通過除去專屬軟件所有者設置的障礙而使得合作再次成為可能。1984年1月,Richard Stallman從MIT離職并開始編寫GNU軟件,同年9月開始GN
83、U Emacs的工作。1985年,Richard Stallman發表GNU宣言,吸收“前UNIX”和BSD的開源成果,開發推出Emacs等編譯器等自由軟件(Free Software)。同年10月,自由軟件基金會(FSF)正式成立?!癋ree Software”中的“Free”關乎自由,而不是價格,是指可以付費或不付費得到GNU軟件。一旦得到了軟件,便擁有了使用它的四項特定自由??梢宰杂砂凑兆约旱囊庠高\行該軟件;可以自由復制軟件并將其送給朋友和同事;可以自由通過對源代碼的完全控制而改進程序;可以自由發布改進的版本從而幫助社區建設。1.2.3 Linux簡史Linux的誕生、發展和成長過程始終
84、依賴著五個重要支柱:UNIX操作系統、MINIX操作系統、GNU計劃、POSIX標準和Internet網絡。2023 中國開源發展藍皮書251977年,UNIX的重要分支BSD在UC Berkeley誕生。開發者是SUN公司創辦者Bill Joy。1984年,Andrew S.Tanenbaum為能續進行學術教育研究,重新開發了一個基于“前UNIX”和BSD4.3的開放源代碼操作系統Minix,這是Linux最開始的前身。1985年,GNU開源計劃和FSF基金會成立。在這個時間前后,涌現了很多重要的軟件和協議,如GPL協議、GCC C編譯器、Emacs編輯器、Glibc、bash shell等
85、,為Linux后來的發展創造了肥沃的土壤。1991年,芬蘭本科生Linus Torvalds在Minix和GNU成果的基礎上,開發并以GNU GPL許可方式發布了開放源代碼操作系統Linux v0.01。1992年5月21日,Peter MacDonald發布第一個獨立的Linux安裝包SLS。1993年6月17日,Slackware Linux由Patrick Volkerding發布,這是第一個取得廣泛成功的Linux發行版。8月16日,Ian Murdock(Debian中的“ian”)發布了第一個Debian Linux發行版。Debian是最有影響力的Linux發行版之一,是MEPI
86、S、Mint、Ubuntu等的鼻祖。8月19日,Matt Welsh寫的Linux Installation and Getting Started第1版出版,這是第一本關于Linux的書籍。1994年3月14日,Linux內核V1.0發布,它支持基于i386單處理器的計算機系統。8月15日,William R.Della Croce,Jr.申請了“Linux”商標,9月進行了注冊。11月3日,Red Hat共同創始人Marc Ewing宣布可以以49.95美元的零售價格獲得Red Hat Software Linux的CD-ROM和30天的安裝支持。1996年5月9日,吉祥物Tux誕生。6月
87、9日,Linux內核V2.0發布,這是第一個在單系統中支持多處理器的穩定內核版本。Linux從此成為很多公司的重要選擇。10月14日,Mattias Ettrich發起KDE項目,此前UNIX和Linux都沒有統一的桌面系統,編寫桌面軟件非常復雜。1997年1月9日,第一個“Linux病毒”Bliss被發現。1998年5月1日,基于Linux的Google搜索引擎面世。12月4日,IDC報告稱1998年Linux出貨量至少上升200%,以其他任何操作系統無法企及的速度增長著。1999年3月3日,GNOME桌面系統進入Linux世界。2000年2月4日,IDC報告表明Linux排在“最受歡迎的服
88、務器操作系統的第2位”。10月30日,第一個Linux live發行版Knoppix發布。2001年1月,Linux 2.4發布,進一步提升了SMP系統的擴展性,同時集成了很多用于支持桌面系統的2023 中國開源發展藍皮書26特性:USB、PC卡(PCMCIA)的支持,內置的即插即用等功能。2003年3月6日,SCO Group公司宣布正在發起對IBM高達10億美元的訴訟,聲稱IBM把SCO的商業機密整合到了Linux中。12月,Linux 2.6版內核發布。2007年8月8日,Linux基金會由開源發展實驗室(OSDL)和自由標準組織(FSG)聯合成立,得到了主要的Linux和開源公司,包括
89、富士通、HP、IBM、Intel、NEC、Oracle、Qualcomm、三星以及開發者的支持。11月5日,Google發布Android,被稱為“第一個真正開放的綜合移動設備平臺”。2011年5月11日,Google I/O大會發布基于Linux內核的云操作系統Chrome OS的Chromebook。6月21日,Linus Torvalds發布Linux3.0版本。Linux內核大版本的更新周期一般是2-3個月,當前最新版本為Linux 6.4-rc4,發布時間為2023年5月28日;穩定版本Linux 6.3.4,發布時間為2023年5月24日。其Maintainer為Greg Kroa
90、h-Hartman&Sasha Levin。1.2.4 開源基金會崛起開源基金會是開源生態中的重要部分。對于非營利性且處于中立位置的開源基金會來說,他們擁有開源項目的知識產權,而且沒有任何商業利益,這為貢獻者、開發者、用戶提供了良好的協作平臺;基金會也會通過技術服務和項目孵化來幫助開發者和開源企業,如軟件倉庫、問題跟蹤、技術指導、法律支持、項目投資、公共關系維護等;基金會還會提供項目日常的運營和治理,以滿足在項目生命周期不同階段對于管理項目的需求。自20世紀80年代自由軟件基金會(FSF)開始,全球各類開源基金會快速發展,在構建全球開源生態中發揮著巨大的促進作用,據不完全統計,各類開源基金會已
91、經超過100家,其中具有代表性的包括(以下數據截至2023年4月):自由軟件基金會(1985年成立)Open Source Intiative(1998年成立)Apache軟件基金會(1999年成立)GNOME基金會(2000年成立)Blender基金會(2002年成立)Mozilla基金會(2003年成立)2023 中國開源發展藍皮書27Eclipse基金會(2004年成立)Open Invention Network(2005年成立)Linux基金會(2007年成立)云原生計算基金會(2015年成立)RISC-V基金會(2015年成立)OpenJS基金會(2019年成立)TARS基金會(2
92、020年成立)SODA基金會(2020年成立)開放原子開源基金會(2020年成立)開源基礎設施基金會(2020年成立)OpenSSF基金會(2020年成立)Rust基金會(2021年成立)天工開物開源基金會(2023年成立)1.3 中國開源發展簡史1991年,中國與AT&T Bell Laboratories USL/USG合作,引進UNIX SVR 4.2版本源代碼(全球唯一,但屬于“后UNIX”閉源時期),并發布了中文版本,合作組建了中國UNIX公司;中方同時也引進“前UNIX”開放的源代碼。1999年,中科紅旗、中軟網絡、沖浪平臺在引進Red Hat公司Linux發行版的基礎上,分別推出
93、最早的Linux中文版本。因此,中國開源的發展歷史具有兩個里程碑節點:1991年、1999年,至今32年、24年,可以分為啟蒙、萌芽、發展、加速四個時代。1.3.1 啟蒙時代1991年,陸首群、張克治和楊天行牽頭代表中方代表團與美國AT&T USG合作,美方將最新開發的UNIX版本UNIX SVR4.2源代碼向中方開放。中方為此組織了UNIX新版本編輯委員會,由楊芙清、胡道元、仲萃豪、劉錦德、尤晉元、賈耀良、孫玉芳等國內資深軟件專家組成,并邀集全國軟件專家、程序員200多人,翻譯、編輯、出版了UNIX SVR4.2中文版本共19冊,首發式在人民大會堂舉2023 中國開源發展藍皮書28行,向全國
94、各大圖書館、高等院校贈書,業界影響甚大。這一歷史事件被Linux基金會收錄,后被作為中國開源誕生的標志性事件。1991年成為中國開源元年。1992年12月,中方與USG合資在華成立了中國UNIX公司。1994年,已經在芬蘭工作5年的宮敏博士第一次將Linux和大量自由/開源軟件源碼通過磁帶帶回中國。1997年,宮敏第二次帶回80GB的自由軟件,并在國家信息中心的幫助下在中國經濟信息網(https:/ Linux收獲了第一個市場用戶北京市政府政策研究室。1999年3月正式對外發布Xteam Linux中文版1.0。2001年沖浪平臺在香港創業板上市。1.3.2 萌芽時代在歷時8年的啟蒙階段中,自
95、由/開源軟件的理念和文化開始在中國大地生根發芽,隨著UNIX、Linux在中國用戶的激增,以及互聯網時代的到來,中國自發地涌現出一批開源社區和開源企業。在中國開源發展的萌芽階段,Linux技術的快速普及起到了核心的推動作用。1999年9月,藍點軟件技術(深圳)有限公司成立,次年3月在美國納斯達克上市。一個中國初創公司從成立到在美上市僅用不足200天,且上市當天股價暴漲400余倍,這個神話曠古絕今。1999年底,時任中國科學院軟件所副所長的孫玉芳老師牽頭籌建北京中科紅旗軟件有限公司和北京紅旗中文貳仟有限公司,分別基于Linux和OpenOffice進行中文版紅旗Linux和RedOffice的研
96、制。孫玉芳老師英年早逝,一生發表操作系統相關論文180余篇,編著和譯著操作系統原理相關著作140余冊,他指導過的諸多碩士/博士生現已成為開源產業的中堅力量。2023 中國開源發展藍皮書291999年,中國軟件開發者社區CSDN在蔣濤的努力下成立了,并于2000年創辦程序員雜志。2000年2月,在科技部國家高技術研究發展計劃(863計劃)的支持下,由一批國內高校、研究院所、IT企業聯合發起成立了共創軟件聯盟。共創軟件聯盟在開源許可證規則下對863計劃的軟件成果進行開源培育和孵化,并提出以開放源代碼的協同創新模式作為中國基礎軟件發展的主要路徑,對我國開源產業發展起到了重要的推動作用。2002年,黃
97、建忠以CJacker的ID在中國Linux公社發布了基于RedHat 8再發布的Magic Linux版本這是國內第一個Linux社區發行版。在這個階段,部分中國開發者開始嘗試向國際上游社區貢獻代碼。但同時,國內Linux企業對開源技術采用拿來主義,忽視開源社區、商業模式和開源知識產權等方面的投入和積累,導致在國際社區中出現了許多針對中國Linux發行商只是開源使用者的評價,直到2008年,這種印象才得以扭轉。2003年,原信息產業部通過電子發展基金支持“Linux公共開發平臺”的建設,并成立國家軟件與集成電路公共服務平臺,組織國內操作系統廠商進行Linux參考平臺的研發和Linux操作系統的
98、應用推廣。2004年,中國開源軟件推進聯盟成立,陸首群教授被推舉為聯盟主席。在陸首群主席的大力推進下,COPU 為推動中國開源軟件的發展而不懈努力,也為促進中、日、韓乃至全球關于開源運動的溝通、交流、共享、協同與合作而努力,為促進中國、東北亞和全球開源運動作出貢獻而努力。聯盟的國際智囊團聘請了幾十位全球頂級開源專家以多種形式參與和推進中國開源建設,如此規模的智囊團在全球首屈一指,是開源界公認的頂級智庫,是COPU創建的開源高地、科技高地、創新高地、人才高地??梢哉f,聯盟的成立和陸主席的領導加速了中國開源軟件發展的速度,為碎片化的國內開源產業建立了統一的根據地,為國際開源生態和中國開源生態建立了
99、紐帶。2008年,以Kernel、Apache、GNOME、OpenOffice為代表的國際知名開源社區紛紛選擇在北京召開全球技術峰會,作為他們進入亞洲的第一步(之前從未在亞洲國家召開頂級技術峰會)。這是對中國開發者在社區提交貢獻的肯定。因此,我們認為2008年成了中國開源發展重要的分水嶺。1.3.3 發展時代在2009年前,中國常被視為國際開源資源單純的使用者,2009年之后,中國開發者提交的代碼被Linux基金會接受,排名穩居世界前四(Kernel 2.6.27之后),中國開始成為國際開源資源的貢獻者。在2009年之后,伴隨著云計算、物聯網、大數據、移動互聯網的快速發展,中國一批有實力有抱
100、負的2023 中國開源發展藍皮書30知名科技IT企業、互聯網公司開始選擇擁抱開源。Linux基金會執行董事Jim Zemlin曾表示:“這些中國科技公司無論從開源技術上,還是產業、經濟發展上,已經走進世界領導者行列?!痹?009-2018年這十年中,中國開源呈現了百花齊放的繁榮局面,從開源開發者數量的激增,到開源社區的多樣化(不再局限Linux等操作系統領域),再到知名科技企業自內而外的擁抱開源(內部實行開源治理,逐漸對外捐獻開源項目,并向上游技術社區提交貢獻)。2012年成立的中國開源云聯盟(COSCL)和2016年成立的云計算開源產業聯盟(OSCAR)就是典型的開源與云計算技術融合的產業聯
101、盟。這一階段明顯的特點在于不論是初創企業還是千百億體量的科技巨頭紛紛用開源技術來構建公司自身的技術堆棧,在技術上全面擁抱開源,并越來越重視對上游開源社區和開源基金會的投入與貢獻。1.3.4 加速時代2019年至今,中國開源進入了一個新的時代加速階段。根據Linux基金會有關Kernel.org社區貢獻的統計,來自中國開發者的貢獻已居全世界之首(Kernel 4.14至今)。中國開源發展進入深水區,開源生態的完整性、開源社區的成熟性、開源商業模式的多樣性和復合性都在發生巨大變化。由木蘭開源社區牽頭、多家單位聯合參與起草的“中國第一個開源協議木蘭許可證”已經正式發布,前不久還被OSGJ翻譯為日文版
102、使用。由華為、百度、騰訊、360、浪潮等發起成立的開放原子開源基金會填補了中國沒有開源基金會的空白,盡管它還不能與Linux基金會、Apache軟件基金會相提并論,但在開源領域備受矚目。在現階段,部分領先的中國企業不滿足于擁抱開源,他們正在很多創新領域躍躍欲試,希望通過開模式來對創新技術進行引領,如商湯的OpenMMLab計算機視覺開放算法、矩陣元的Rosetta隱私AI開源框架、阿里的RocketMQ海量信息中間件、京東的JD Chain開源區塊鏈、百度的PaddlePaddle深度學習平臺和Apollo自動駕駛平臺、海爾卡奧斯COSMOPlat工業互聯網平臺的工業APP開發框架開源項目等。
103、同時,在現階段出現了一些原生的開源明星項目,如Apache SkyWalking、Apache Echarts、Apache IoTDB、TiDB,其中一些優秀的開源項目如TiDB備受資本市場的推崇,創造了全球數據庫融資歷史新的里程碑。2023 中國開源發展藍皮書311.4 開源軟件與知識產權至此,我們對開源的定義和發展史有了基本的認識,在繼續深入了解之前,有必要關注開源軟件與知識產權的知識。1.4.1 軟件知識產權的主要內涵軟件知識產權是計算機軟件人員對自己的研發成果依法享有的權利。目前國際上對軟件知識產權的保護法律還不是很健全,大多數國家都是通過著作權法來保護軟件知識產權的,與硬件相關密切
104、的軟件設計原理還可以申請專利保護。軟件知識產權主要包括著作權、專利權與商標權。著作權指軟件的表達(如程序代碼、文檔等)方面的權利。專利權包括軟件的技術設計,如程序設計方案、處理問題的方法、各項有關技術信息等方面的權利。商標權則是指軟件的名稱標識方面的權利。軟件需要有硬件平臺的支撐才可以運行,而在硬件平臺上運行的軟件基本上是目標碼(二進制格式),從而造成軟件源碼和二進制目標碼的分離和割裂,而軟件作為通用商品進行銷售或分發時主要提供的只是二進制文件,這也成為主流的軟件銷售和分發方式,并主要通過隨軟件一起發布的最終用戶許可協議(End User License Agreement,EULA)對軟件的
105、使用、修改和分享及其他相關事宜作出規定。針對上述對軟件源代碼的處置方式,出現了一種開放、協同、共享的軟件發展模式通過開源軟件許可證對軟件源代碼的復制、修改、再分發等權益,對商標、專利、著作權等內容進行進一步規范,這也是對軟件知識產權發展的一個重要補充。1.4.2 開源軟件許可證開源許可證就是開源軟件使用的許可證。對開源軟件許可證的法律界定先前存在一定的爭議。在美國,一些法院認為軟件許可證是合同(Contract),一些法院則認為是許可(License)。兩者的區別在于,許可在傳統上是由地產或物主作出的,目的在于允許他人使用自己的地塊或物品。因此,它是單方向的,不構成完整的合同,而是作為合同的一
106、個要素,用來和他人交換的條件。2023 中國開源發展藍皮書32合同和許可之分在美國法上具有重要意義。如果是合同,那么需要適用各州不同的合同法;如果是許可,那么需要適用統一的聯邦版權法。此外,合同的違約救濟和版權的侵權救濟也有諸多不同,比如禁令(行為保全)的適用、判賠額的確定、律師費的分擔等。不過,包括中國在內的大陸法系國家,則普遍認為開源軟件許可證構成合同;只不過這種許可合同并非協商得到,而是事先規定好的標準化格式合同。具體來講,開源許可證是涉及版權、專利、商標等一系列權利義務的格式合同,且自動生效。法律并沒有限定許可證不能包含什么條款,這導致許可證的類型極其繁多、內容也非常自由。據不完全統計
107、,廣義上的開源許可證目前有超過200種,即便是OSI批準的許可證目前也多達96種,其中包括由中國主導編制的Mulan Permissive Software License v2(MulanPSL-2.0),全部許可證可參見https:/opensource.org/licenses/alphabetical和https:/opensource.org/licenses/category。1.4.3 國外主流開源許可證解讀(一)GNU通用公共許可證(GPL)GPL通用公共許可證是一個許可證家族的泛稱,是一個被廣泛使用的自由軟件許可協議條款,為使用者提供了足夠的復制、分發、修改的權利:可自由復制
108、;可自由分發,提供他人下載;可用來盈利,分發軟件過程中收費(必須在收費前向客戶提供該軟件的GNU GPL許可協議);可自由地修改(使用了這段代碼的項目也必須使用GPL協議)。GPL當前主要有GPL v2和GPL v3兩個版本。這組許可證的共同特征在于其“傳染性”:任何基于GPL代碼編寫的軟件都必須成為開源軟件。換言之,使用了任何GPL代碼的軟件,無論GPL代碼占比多少,都必須將完整的源代碼公開,并允許他人修改、發布。GPLv2許可證存在一些漏洞,例如它不能阻止一個軟硬件結合的系統中,通過對硬件部分施加限制,間接阻止用戶在該硬件上運行軟件的修改版本;沒有包括關于專利的約定,導致實踐中出現Micr
109、osoft-Novell專利協議這類試圖將專利申請用作于對付自由軟件社群的武器的現象。2023 中國開源發展藍皮書33為解決這些問題,GPL v3于2007年發布。除填補上述漏洞,GPL v3兼容性更好。自由軟件基金會明確表示GPL v3與Apache 2.0許可證兼容。目前,使用GPL許可證的重要項目包括Linux內核和MySQL等,但新興項目一般會選用更寬松的許可證。(二)LGPL(Lesser General Public License)LGPL叫做GNU寬通用公共協議,對產品所保留的權利比GPL少,適用于非開源產品的開源類庫或框架,并可以不繼承LGPL協議,使用其他的開源協議。LGP
110、L的特點在于,鏈接到該軟件庫的軟件可以不適用LGPL或GPL,換言之,可以不公開源代碼。LGPL的這一特性消除了在GPL下軟件商用的最大障礙。盡管如此,基于該庫修改而得到的軟件仍然需要遵循GPL許可證。(三)Mozilla Public License(MPL)MPL允許在其授權下的源代碼與其他授權的文件進行混合,包括私有許可證。在MPL授權下的代碼文件必須保持MPL授權,并且保持開源,即允許在派生項目中存在私有模塊,同時保證核心文件的開源。使用MPL授權的軟件并不受專利的限制,其可以自由使用、修改,并可自由的重新發布。帶有專利代碼的版本仍然可以使用、轉讓,甚至出售。(四)BSD許可證系列BS
111、D許可證是由UC Berkeley首倡和維護的,版本繁多,目前常用版本包括原始的BSD-4、BSD-3以及簡化的BSD-2。BSD屬于寬松許可證,與MIT許可證接近但更加寬松,甚至跟公有領域更為接近。在最簡化的BSD-2許可證下,保留著作權聲明、許可證內容以及免責聲明即可;只要滿足許可證設定的條件,就可以自由地修改并發布代碼。BSD-3許可證在BSD-2許可證的基礎上增加了禁止背書條款(未經事先書面許可不得使用原作者之名來推廣衍生作品);BSD許可證進一步增加了廣告條款(衍生作品的廣告材料必須說明該軟件包含由UC Berkeley及其貢獻者開發的軟件)。(五)MIT許可證MIT許可證之名源自首
112、倡者MIT麻省理工學院,又稱“X許可協議”(X License)或“X11許可協議”2023 中國開源發展藍皮書34(X11 License)。據統計,2015年GitHub上高達45%的項目使用MIT許可證。近幾年MIT許可證的份額有所下滑,在2020年市場份額第一的位置被Apache 2.0取代,但仍是最受開發者歡迎的許可證之一。MIT的特點在于條款非常簡單,是開源協議中最寬松的一個:“被許可人有權利使用、復制、修改、合并、出版發行、散布、再許可和/或販售軟件及軟件的副本,及授予被供應人同等權利”,加上要求被許可人保持同樣的聲明。(六)Apache許可證Apache許可證是一種“寬松”(P
113、ermissive)的許可證,目前常用版本是2.0,2020年成為使用最多的許可證?!皩捤伞笔侵覆槐WC被使用軟件的派生版會繼續保持自由軟件的形式,即:“怎么用都行,用在哪都行”。具體而言,Apache 2.0許可要求保留版權和許可聲明,但允許許可作品、修改和更大的作品在不同的條款和沒有源代碼的情況下分發,只是未修改的部分仍然需要保留Apache許可證。除了為用戶提供版權許可之外,還有專利許可,對于那些涉及專利內容的開發者而言,該協議最適合。由于上述利好條件,Apache 2.0成為了相當多流行的開源項目的許可證,最著名的例子之一就是Kubernetes。不同開源許可證就許可、條件和限制的比較參
114、見https:/ 商標使用保證Apache許可證 v2.0是是是是是是是否否否BSD-3 Clause Clear License是是是否是是是否BSD-2 Clause Simplified License是是是是是否否DPL v2.0是是是是是是是是否否GPL v3.0是是是是是是是是是否否LGPL v2.1是是是是是是是?是否否LGPL v3.0是是是是是是是是?是否否2023 中國開源發展藍皮書35可以看出,除了允許商業性使用、分發和修改外等常見特征外,開源許可證還有兩個共同點。一是開發者不承擔保證責任(瑕疵擔保責任)。開源代碼通常都是免費提供的,因此開發者不應為他人使用該軟件造成的損
115、失而承擔責任。二是要求保留著作權標記。開源軟件并不意味著放棄著作權。相反,開源許可證的強制效力來源,恰恰來自于作者對開源軟件的著作權。因此,許可證一般都要求以適當的形式保留著作權標記(包括許可證正文以及作者署名)。1.4.4 木蘭開源許可證族解讀木蘭許可證族由中國電子標準化研究院牽頭研制,已發布版本包含木蘭寬松許可證(MulanPSL v1;MulanPSL v2)、木蘭公共許可證(MulanPubL v1;MulanPubL v2)、木蘭白玉蘭開放數據許可協議(MBODL v1)、木蘭開放作品許可協議(MulanOWLs v1)。1.4.4.1 木蘭寬松許可證(MulanPSL)MulanP
116、SL v2于2020年通過OSI認證,是全球首個由我國主導的國際通用中英文雙語許可證,與Apache 2.0許可證有良好的兼容性,最大限度鼓勵專利和版權開放,并于2021年發布日文版。截止2020年底,已有超過1萬余項國內自主開源項目支持MulanPSL 2.0,得到Linux基金會、Apache基金會、華為、阿里、開源中國、CSDN等開源組織、公司和代碼托管平臺的支持應用,1萬7千余代碼AGPL v3.0是是是是是是是是是是否否MIT許可證是是是是否否Mozilla Public License v2.0是是是是是是是是?否否否Eclipse Public License v2.0是是是是是
117、是是是否否木蘭寬松軟件許可證 v2.0是是是是是是否否否開放數據共享開放數據庫許可證是是是否是是是是否否否Microsoft Public License是是是是是是否否SIL 開放字體許可證 v11是是是是是是否否知識共享署名 4.0 國際(CC-4)是是是否是是是否否否常見開源許可證的對比匯總2023 中國開源發展藍皮書36倉應用(Gitee 11000+,GitHub 7000+)。其中典型應用有OpenEuler、OpenGauss、方舟編譯器、XiOUS等。1.4.4.2 木蘭公共許可證(MulanPubL)木蘭公共許可證在寬松版基礎上增加了其傳染性,對開源軟件的分發增加了限制性要求
118、。木蘭公共許可證和木蘭寬松許可證間存在較大差異,均以第 2 版為例,其差別集中在“分發限制”上。木蘭公共許可證類似GPL具有傳染性,要求接受者必須開放源代碼。而木蘭寬松許可證的“分發限制”中僅僅要求保留代碼中的許可證聲明,并未要求再次分發時的許可證設置,不具有“傳染”特質。木蘭寬松許可證與木蘭公共許可證的共同特點是:采用中英文表述,且具有同等法律效力;遵從表述簡潔原則,容易理解;明確授予版權和專利權,不授予商標權。而區別在于前者能與現有的其他許可證友好MulanPSL V2BSD 3-clause LicenseApache License V2.0聲明義務 分發時附帶許可證,保留免責等聲明
119、分發時附帶許可證,保留免責等聲明 其他使用時附帶許可證,保留免責等聲明許可證,保留免責等聲明 分發時附帶許可證 分發修改版時應明顯聲明已修改的文件 分發修改版源代碼時保留各種聲明 如許可軟件含有Notice文件,則分發修改版時應帶其中的歸屬聲明專利許可 原始許可人及其關聯實體提供專利許可 后續貢獻者及其關聯實體提供專利許可無明確專利許可 原始許可人提供專利許可 后續貢獻者及其關聯實體提供專利許可對 用 戶專利維 權的限制 用戶及其關聯實體如直接對許可軟件發起專利訴訟,專利許可終止 發起非訴訟維權(如行政維權),專利許可終止 通過間接方式實施上述行為,專利許可終止無 原始許可人提供版權許可 后續
120、貢獻者及其關聯實體提供版權許可版權許可 原始版權人及其關聯公司提供版權許可 后續貢獻者及其關聯實體提供版權許可所有貢獻者授予版權許可 原始許可人提供版權許可 后續貢獻者及其關聯實體提供版權許可商標許可無無無語言 采用中英雙語表述,中英文版權具有相同法律效力 如果中英文版本存在任何沖突不一致,以中文版為準采用英文表述采用英文表述木蘭寬松許可證與國外主流許可證的異同2023 中國開源發展藍皮書37兼容,后者對開源軟件的分發條件有限制性要求,對云計算和SaaS等新興技術的分發也有條件限制。1.4.4.3 木蘭白玉蘭開放數據許可協議木蘭白玉蘭開放數據許可協議于2021年7月在世界人工智能大會發布第一版
121、,旨在基于中國國情和法律,針對人工智能場景下的數據使用與非商業約束做了分層詳實約定,從而最大限度鼓勵和助力關鍵數據資源的開放流通。數據要素的流通是一個復雜問題,其牽涉到技術、商業模式、法律環境等多個維度的問題,而“木蘭白玉蘭協議”的目的是希望從法律層面提供一套可以約定數據發布方和使用方的標準權責的文本,從而形成一種“社區行為規范”去加速數據的開放共享??紤]到數據要素流通的合規復雜性,MBODL v1基于以下原則和適用性擬定:針對人工智能訓練數據集的發布擬定適用的協議。所發布數據應滿足基本的公開發布、免費發布的前提。所發布數據符合國家數據安全的要求,不涉及國家秘密、國家安全、社會公共利益、商業秘
122、密等。所發布數據當前不涉及個人信息?;诋斍叭斯ぶ悄苡柧殧祿瘡臋鄬俳嵌瓤煞譃閮深惽闆r:第一類,數據由數據發布者合法合規所有或具備用益權;第二類,數據由數據發布者通過合法合規的方式自第三方處獲取匯編組合而得。因此,MBODL對上述兩類情況產出了兩組不同起草策略的協議:(1)MBODL自主擁有數據或擁有處置權。在協議架構上,設置了類似CC協議的一個套組協議:GPLMulanPubl-2.0分發限制 分發時附帶許可證,保留免責等聲明 分發修改版時應明顯聲明已修改的文件,并附有日期;如果修改后的程序在運行時和用戶以命令的形式交互,須在程序運行開始時顯示版權等聲明 分發時提供完整且便于編譯的源代碼 如
123、果不能遵守本許可證的條件,就要放棄分發 分發時附帶許可證,保留免責等聲明 對于接收到的“貢獻”,必須沿用許可證做二次分發。對于“衍生作品”,需要沿用該許可證,并在明顯位置提供“衍生作品”對應的源代碼下載地址,約束有效期均為3年 在作品明顯位置上,隨“衍生作品”向接收者提供一個書面要約,表明您愿意提供根據“本許可證”“分發”的您“衍生作品”的“對應源代碼”。確保接收者根據書面要約可獲取“對應源代碼”的時間從您接到該請求之日起不得超過三個月,且有效期自該“衍生作品”“分發”之日起不少于三年木蘭公共許可證與國外主流許可證對分發的限制2023 中國開源發展藍皮書38MBODL-SA:相同方式授權,使M
124、BODL具備傳染性。MBODL-NC:非商業,可匹配不同非商業限定。MBODL-CU:僅計算使用,限定模型和分析類使用。以上協議均以MBODL基礎,在“許可限制”小節中予以增加不同的限制而形成,同時也類似CC協議,可以再進行許可限制的疊加交叉,形成新的協議。(2)匯編第三方內容形成數據集。類似Open Database License(ODbL),采用“數據集結構和數據集內容分離”策略。對數據庫或者數據集的結構(即數據選取、組織的方式,database scheme)和數據內容予以了拆分授權的方式。目前,MBODL(結構內容分離版)協議作為一個單獨的實驗性協議供各界討論適用性和條款的實踐落地可
125、能。MBODL協議突破了以往數據協議中對“使用”一詞的模糊定義,將傳統的“使用”一詞,依照數據分析和機器學習的術語,做技術性分解和定義,便于行業內技術人員理解協議的制約。同時破局“非商業”的模糊性,對數據本身商業化、模型商業化、基于分析和模型的結論商業化做明確的獨立切割。并且明確限制的類型和范疇。1.4.4.4 木蘭開放作品許可協議木蘭開放作品許可協議于2022年木蘭峰會正式發布。本協議適用于著作權法下的作品。旨在適應開放作品的新特點,滿足開放作品創作者的新需要,推動開放作品的發展。(1)當前開放作品新特點:群體化創作作品變得越來越流行,這類作品通常由多個作者共同參與完成,作品更新較快,版本較
126、多;開放作品創作者對作品的授權也呈現更加開放的新需求,如授予作品相關的專利許可。(2)木蘭開放作品許可協議解決問題:授予專利許可的許可協議類別。滿足了作品權利人授予作品涉及的技術方案、外觀設計等專利權的需要;對多版本作品如群智作品提供了署名規范。方便了相關作品在實踐過程中的使用和檢索;2023 中國開源發展藍皮書39以中英文雙語表述,中英文版本具有同等法律效力,在中英文版本存在不一致的情況下以中文版為準,對中文用戶理解和使用協議具有一定優勢;在明確合同雙方行為約束的前提下盡可能地精簡條款、優化表述,降低產生法律糾紛的風險。1.5 開源與標準中國電子技術標準化研究院自2019年起開展開源標準化研
127、究,依托全國信標委和中電標協開展國內開源標準研制工作,并作為我國信息技術國際標準化工作的國內對口單位,在ISO/IEC JTC1下與其他各國共同探討推進開源國際標準化工作?;谇捌诠ぷ骰A,2022年,電子標準院聯合華為、華東師范、第四范式、螞蟻、騰訊各單位的開源標準化專家,共同發布開源與標準協同發展研究報告,該報告介紹了開源生態的發展要素,給出了新趨勢下開源內涵與外延,分析了開源與標準協同2023 中國開源發展藍皮書40發展的案例和價值,提出開源與標準協同發展的工作建議。本節內容來源于開源與標準協同發展研究報告。1.5.1 開源與標準的關系開源與標準之間既是研究對象關系、規范與實現的關系又是
128、協同發展關系。開源與標準化協同發展是信息技術領域發展的最佳模式,共同構建開放的產業生態。1.5.1.1 開源與標準的關系開源與標準關系分三種:一是研究對象關系,開源作為標準化對象開展標準化工作;二是規范與實現關系,標準是技術的抽象規范,開源是標準的具體實現;三是協同發展關系,開源與標準以協同發展、相互促進的方式,共同支撐產業創新、助力產業發展。研究對象的關系開源作為標準化對象。標準化對象是指需要標準化的主題。通常,標準化對象包括兩方面的內容:一是標準化學的研究對象,二是標準化工作的對象。規范與實現的關系標準是技術的抽象規范,開源則是以“開源方式”對于標準所定義規范的具體實現。協同發展的關系標準
129、是基于開放流程的、以實現兼容性和互操作為目標的技術規范的開發過程。開源是基于開放合作和代碼共享為特征的技術實現過程。開源與標準是構建開放的信息技術生態的兩種重要工具,兩者相互補充,相互促進,協同發展,缺一不可。開源與標準關系圖2023 中國開源發展藍皮書41開源與標準協同,共筑開放的技術和產業生態1.5.1.2 開源與標準協同發展標準化是開源治理的重要手段,以開源為對象的治理,是專注于開源活動體系及其效能和風險管理的一系列治理規則,由治理主客體、組織結構和過程組成,以確保參與開源活動能夠支撐組織的目標。Linux、OpenInfra、Apache等全球代表性開源基金會均將標準化作為開源社區建設
130、和發展的重點任務之一,主要圍繞開源社區治理、技術開發以及推動實現互操作等方面。國內已著手布局構建自主開源規則體系,但當前開源生態仍面臨基礎共性理論統一、技術互聯互通困難、社區治理能力尚待完善等問題,需要標準化手段推進開源運營治理規則體系建設。開源和標準協同發展,是推動開源和標準規則研究、技術及應用發展的重要基礎性工作,可以共同構筑開放有序的產業生態,預防獨家壟斷與技術鎖定;為客戶提供更多選擇;促進產業包容式發展;持續推動開放式創新。1.5.1.3 開源標準化價值開源規則和社區治理標準化的價值在規則層面,標準化對開源的價值體現于統一產業界認識,如開源術語、元數據、許可證等。針對開源技術和應用的相
131、關概念,是認識、理解開源技術的基礎,為開源領域其他標準研制提供支撐,旨在形成行業基礎共識。由我國官方推出的首個開源協議木蘭寬松許可證”(MulanPSL)在此方面邁出了堅實的一步,但還需要后續更多的系列行動;在社區層面,標準化對開源的價值體現于保障社區的健康與穩定。社區文化、領導及治理能力是維護2023 中國開源發展藍皮書42社區可持續發展的基礎。社區治理遵循開放、透明、平等、共識、協作的原則,以法律法規、社區機制、治理流程、運營流程、基礎設施、社區評估六大域建立開源社區治理、運營和技術框架,支撐社區可持續發展。通過建立開源社區治理機構,協調內外資源,對開源軟件的許可模式和開源的知識產權保護提
132、供法律和法理的保障;通過制定開源項目的治理流程和合規規范來保障項目健康發展。開源項目和技術標準化的價值在項目和技術層面,標準化對開源的價值體現在以下幾個方面:(1)開源通過實施標準并在標準的支持下實現與現有技術生態的互操作,促進開源的快速、廣泛應用。(2)標準化可以支持開源技術形成穩定演進的技術框架和外部接口,與外部系統的互聯互通,防止社區分裂,推動生態發展。(3)標準可以支撐開源所定義的技術成為穩定的規范,同時支持閉源實現,共同構建產業生態,保證開源項目的可持續發展。(4)標準化可以開源項目構建穩定的技術品牌的建設。例如Open Infrastructure Foundation通過DefC
133、ore標準的制定,并結合基于標準的合格評定,定義OpenStack技術品牌。通過為開源建立標準,可以解決四個方面的問題:(1)統一概念和認識當前OSD的本質是定義了開源軟件的授權協議的主要特征,并非定義開源本身。同時關于開源軟件、開源硬件、開源社區、開源產品、開源基金會等概念,也一直沒有明確、無歧義、相互之間協調一致的定義。開源標準化價值2023 中國開源發展藍皮書43而概念與概念之間的關系,也需要清晰的定義,如:開源基金會、開源社區與開源產品、開源項目與軟件版本、開源代碼倉庫與開源制品等,都應建立某種符合邏輯、能夠涵蓋各種情況的關聯關系。我國亟需一套完整的定義,將各種相關的概念統一在一個框架
134、之下。開源作為標準化對象,對于其基礎共性理論及方法論,可以從國家標準層面進行統一。(2)構建互聯互通的技術生態體系開源必須通過實現標準才能完成與外部系統兼容和互聯互通,實現多平臺的可移植性和進入技術生態系統的目標。開源與標準化協同發展過程中,將做到以團體標準為抓手,構建協調一致的技術生態體系并連接尚未聯通的斷點,減少行業內上下游的重復工作,同時用標準化的方式持續推進制定互聯互通的標準。(3)構建技術品牌,防止社區分裂針對開源項目核心技術接口,通過標準化機制制定和發布團體標準,并基于標準建設合格評定機制,構建技術品牌。穩定的技術品牌發展路徑和版本更新機制,可以增強技術社區的向心力,有助于維護開源
135、項目統一演進,防止技術社區分裂(4)建立評估體系在開源標準制定過程中,將關注如何計算、評估以及測量各種指標,如一個GitHub倉庫中可以看到的stars數量、其數量背后的價值、開源項目的熱門程度、技術難度、質量高低、社區健康度等指標。同時基于開源標準構建評估體系,更好服務開源生態建設。當前開源發展過程中,以標準體系化方式匯集最佳實踐,并不斷修訂以幫助開源社區健康成長,是開源標準化工作重點關注的方向之一。1.5.1.4 標準開源化價值標準是“通過標準化活動,按照規定的程序經協商一致制定,為各種活動或其結果提供規則、指南或特性,供共同使用和重復使用的文件”。標準對于開源的價值在于提供可移植性和互操
136、作性,從而提高開源軟件的開發和部署效率,節省成本;同時標準制定、優化和推廣也與開源項目的研發、升級和應用密切相關。(1)開源是標準制定需求的來源標準制定的需求來源于多個途徑,開源作為廣泛應用的軟件是重要的需求來源之一。開源可以把在研發和推廣過程中的客戶需求和技術需求反饋到標準化流程中,通過開放的討論形成共識,形成標2023 中國開源發展藍皮書44準化文本,并通過標準化體系廣泛推廣,支持更多形式的標準實現,包括其他的開源項目、閉源軟件,共同構造產業生態。(2)開源是標準優化的基礎標準通過版本演進實現不斷優化。開源在廣泛應用過程中積累發現的問題不僅通過代碼實現即時改進,對于影響兼容性和互操作的技術
137、模塊也應當及時反饋到標準化,實現標準的持續優化,提高標準的質量,并通過標準化體系為開源生態的擴展提供更大的支撐。(3)開源幫助驗證標準的可行性標準作為抽象的技術要求需要得到驗證,開源可以提供代碼實現驗證標準的可實現性,并將實現過程中遇到的問題回饋標準化流程,有利于提高標準的質量。(4)開源幫助推廣標準標準通過開源代碼的實現加速了標準的快速應用。一般的標準都立足于技術的高層定義,以滿足多種實現方式的需求,而無法直接通過代碼方式使用。開源作為代碼的直接實現,可以快速實現標準,大幅度提高了標準的易用性,可以推動標準的廣泛使用。當然標準不僅支持開源實現,也支持閉源實現。例如,TCP/IP協議棧的實現,
138、有開源的版本,也有閉源的版本,特點不同,面對不同用戶的需求,滿足在使用標準過程中對于多樣性的需求。1.5.2 開源與標準協同發展現狀開源與標準之間既是研究對象關系、規范與實現的關系又是協同發展關系。開源與標準化協同發展是信息技術領域發展的最佳模式,共同構建開放的產業生態。以國家標準結合團體標準的方式來共標準開源化價值2023 中國開源發展藍皮書45同促進開源生態可持續健康發展。1.5.2.1 開源的標準化需求(1)開源規則和社區治理的標準化。開源要素包括術語、概念和規則等需要通過標準化達成共識,否則會埋下混淆的隱患。目前開源的一些重要要素由“開放源代碼促進會”(Open Source Init
139、iative,OSI)定義,符合其發布的“開源定義”(Open Source Definition,OSD)已經成為業界廣泛應用的、用于確定“開源許可證”的標準;在OSD的基礎上OSI發布的“開源許可證”在業界應用廣泛;同時,OSI還建立了許可證審查流程,“確保標記為開源的許可證和軟件符合現有的社區規范和期望”。OSI標準在開源領域內達成了共識,防止開源的濫用。(2)開源項目和技術的標準化。大量開源社區建設標準化流程,圍繞開源項目和技術制定團體標準,并基于團體標準推動國際標準的制定。例如,Linux Foundation建立了標準化組織Joint Development Foundation(
140、JDF),2020年經ISO/IEC JTC1批準,成為公開可用規范(PAS)提交者;Eclipse Foundation設立Eclipse Foundation Specification Process,“為制定開源社區驅動的、開源友好的規范提供開放和透明的框架”;OpenInfra Foundation為OpenStack技術品牌的定義成立了DefCore標準項目,用于“確定如何授予OpenStack的商業實施使用商標的指導原則”。1.5.2.2 標準的開源化需求標準化組織建設開源項目,圍繞標準的驗證、實施和推廣開發開源代碼。例如,萬維網聯盟(World Wide Web Consort
141、ium,W3C)建立開源項目W3C Open Source Software,認為“W3C標準的自然補充是可運行的代碼,實現和測試是標準開發的重要組成部分,發布代碼促進了開發人員社區的思想交流”;結構化信息標準促進組織(Organization for the Advancement of Structured Information Standards,OASIS)建立開源項目Open Projects,支持社區“在開源許可證下開發所需技術代碼、API、標準、參考實現”;致力于Java語言標準開發的Java Community Process標準組織建設OpenJDK開源社區,“為JavaS
142、E JSRs標準提供開源參考實現”。2023 中國開源發展藍皮書46全球開源開發者快速增長的地區Top10第二章 開發者發展現狀開源軟件在全球技術發展中已成為不可或缺的一部分,并對技術創新、合作和貢獻產生了深遠影響。開源為開發者提供了一個具有開放性、透明性的自由交流、分享、協作的平臺。與此同時,開發者立足于項目、企業、社區、基金會,通過編寫、測試和優化代碼,以及運營、治理等方式,深度參與開源的創造、貢獻、建設,在開源項目的成功、社區的生態繁榮、百業同鳴歷程中起著至關重要的作用。2.1 中國開源開發者規模、增速及發展趨勢2.1.1 開發者基本畫像全球開源生態研究報告指出,得益于開源寫入“十四五”
143、規劃,國家層面對開源的重視程度不斷加深,相較往年開源支持政策體現在新技術發展得推動方式,近年開源政策更加體系化和多樣化。在此趨勢下,企業重視程序持續提高,開發者隊伍日漸龐大。中國開源開發者的數量呈現出快速增長的趨勢。據GitHub 2022年數據統計,GitHub平臺開發者數量達到9400萬開發者,開發者同比增長 27%,新增用戶超過2050萬,全球有90%的公司在使用開源,2022年有4.13億次開源貢獻。按照國家/地區來劃分,2022年中中國新增開發者數量占GitHub新增開發者數百分比為15.6%。據2023 年4月工信部透露,我國開源軟件開發者數量已經突破800萬,居全球第二,中國開源
144、開發者的增速令人矚目。據 C SDN Gi t C o d e、P i n g C A P OSSInsight、北京大學軟件與微電子學2023 中國開源發展藍皮書47中國開發者占比院荊琦副教授聯合出品的2022 中國開源貢獻度報告統計,中國擁有占全球30%的最大規模開發者群體,開源增長空間和潛力巨大。該報告以兩年作為統計期,全球貢獻者(以郵箱統計)共計213,982人,貢獻者地區為中國的用戶數為10,691人(僅包括填寫地區的中國貢獻者),預計中國開發者占總貢獻者的數量約為9.5%(假設未填寫地區的和填寫地區的中國貢獻者比例分布一致)?;趪鴥戎髁鞯募夹g社區及論壇的注冊用戶數,觀察中國開發者
145、的整體增長趨勢時發現,中國開發者社區CSDN,擁有注冊賬號是8700萬,而注冊用戶在排重以后是4200萬,相較2021年新增了600萬用戶。這新增的600萬用戶里,新增用戶中有60%都是大學生和高中生,高校計算機專業學生覆蓋度90%,非常的年輕化。與此同時,CSDN已推出開源代碼托管平臺GitCode,為中國開源生態提供源代碼托管、項目管理、DevOps、安全掃描、安全監控等免費服務;推出開源工具平臺InsCode,打造面向開發者的集編程,創作,分享于一體的全新共創開源社區,為開源人才的學習和成長賦能。根據開源社區Gitee統計,2022年Gitee新增了200萬的用戶,平臺倉庫數量達到250
146、0萬,新倉庫數量為480萬,總用戶數達到1000萬。2.1.2 開發者行業、地域、技術特點等根據CSDN發布的2022-2023 中國開發者調查報告顯示,我們將開發者根據年齡范圍劃分成三類發現,30歲以下的開發者人數占71%,本科及以上學歷占8成,89%的開發者都是男性。軟件行業涵蓋了國內近半數開發者,40歲以下的開發者從事后端開發的比例最高。40歲以上開發者主要擔任技2023 中國開源發展藍皮書48開發者基本特征術經理以及架構師的職位,所屬行業重點分布在互聯網、軟件、教育領域。2023 中國開源發展藍皮書49開發者地域分布(省、自治區、直轄市、特別行政區)Top 15全國超過40%的開發者工
147、作在一線城市(其中以北京、上海、廣州、深圳為主)。北京、廣東是開發者聚集較多的地域,占全國總數28.2%。上海、江蘇地區的開發者占比數量處于第二梯隊,占全國總數的15.1%。2023 中國開源發展藍皮書50開發者是否使用過開源軟件比例開發者參與開源項目的比例開源正在吞噬世界,在日常的開發工作中,無可避免地要使用到開源軟件,數據顯示,96%的開發者正在使用開源軟件,僅有2%的開發者表示從未使用開源軟件。當然,開發者在使用開源開源的過程中,也參與開源、回饋開源。相較去年42%的開發者參與過開源,今年有較大幅的增長,49%的開發者參與過開源項目,接近一半的開發者加入了開源的大隊伍。2023 中國開源
148、發展藍皮書51開發者在開源上花費的時間開發者參與開源的方式67%的開發者每周在開源上投入的時間不超過5小時,隨著開源的發展,有更多的人從事開源相關的工作,數據顯示,有4%的開發者每周在開源上投入30小時以上。在開源項目的貢獻上,主要還是通過代碼和文檔的貢獻,在參與過開源項目的開發者中,有72.9%的開發者有代碼貢獻,49%開發者有文檔貢獻。2023 中國開源發展藍皮書52開源中常用的開發語言在開源項目中,Java依然是最常用的開發語言,有41%的開發者表示,在開源項目中經常會使用到。其次是Python,占比27%。2023 中國開源發展藍皮書53開發者關注的開源技術領域中國開源開發者在各個技術
149、領域都有涉獵和貢獻。從人工智能、大數據到區塊鏈、云計算等領域,中國開發者在各個前沿技術的開源項目中都有積極參與和貢獻。他們不僅關注國內的開源項目,也積極參與到國際開源社區中,與全球開發者共同推動技術的進步。人工智能的發展,吸引了眾多開發者的目光,45%的開發者比較關注開源AI,其次是編程語言。2023 中國開源發展藍皮書542.2 開源開發者對開源社區、開源活動和開源項目的投入和貢獻數據顯示,開放透明的代碼和知識共享是吸引眾多開發者使用開源軟件的最大因素之一,占比55.8%。為了促進開源生態的可持續發展,越來越多的開源社區和組織在中國成立,為開發者提供了學習、交流和合作的平臺。同時,一些國內知
150、名的技術企業也在積極推動開源文化,通過開源項目和活動,促進開發者之間的合作和創新。2.2.1 開源社區和開源活動根據開源社匯總的中國開源地圖,2022年中國開源社區新增21個組織,增幅明顯。在2021年,開源社區增速最快,一年新增42個。吸引開發者使用開源軟件的因素社區創始年表2023 中國開源發展藍皮書55就地域而言,多數社區聚集在北京地區,共有69個社區,包括Apache IoTDB、開源GitOps產業聯盟、Apache ShardingSphere、Apache Doris、亞馬遜云科技、OceanBase等。杭州的開源社區數量排名第二,有Apache RocketMQ、阿里云Pola
151、rDB開源社區、Ruby China、龍蜥社區、KubeEdge等19個。上海地區也有19個開源社區,覆蓋KubeSphere、Neo4j開發者社區、OpenMLDB社區、X-lab開放實驗室等。社區城市排行2023 中國開源發展藍皮書56大數據在開源社區領域的類別中數量最高,有46個。一方面,在數字化時代,大數據發展起步較早,行業對大數據技術和工具的需求非常高;另一方面,大數據領域的技術非常復雜,涉及到分布式計算、數據存儲和處理乃至機器學習等多個方面,這也涌現了Hadoop、Spark、Kafka等成熟的技術工具和框架。云原生和云計算開源社區數量排在第二和第三位,分別有43個和39個。中間件
152、、機器學習、數據庫的社區數量在近幾年增長迅速,如今均達到了31個。在過去一年,國內舉辦了多場開源社區活動和會議,為開發者提供了學習和交流的機會。例如:2022開放原子全球開源峰會于2022年7月27-29日在北京成功舉辦。本屆峰會以“軟件定義世界,開源共筑未來”為主題,以立足中國、面向世界的姿態,宣揚開源成果,傳遞“開放共享、共建共治”理念,打造成為國際開源盛會,贏得社會各界廣泛好評和高度關注。由開源社舉辦的2022第七屆中國開源年會(COSCon 2022)在2022年10月29日-30日于線上成功舉辦,這次會議以“Open the World!”為主題,以Open對抗Close、以Conn
153、ection對抗Broken、以Public Good對抗Bad News,希望能以開源的技術、開源的方式、開源的力量,治愈這個世界。2022長沙 中國1024程序員節于2022年10月23-25日在長沙、北京等多地同步舉行。本次程序員節以“算力新時代,開源創未來”為活動主題,由5大院士領銜,四城聯動,開設十余場專業主題論壇,覆蓋AI、芯片、數據庫、大數據、數字化轉型、工業互聯網等技術領域,囊括中國根技術掌門人、8大海外開源技術掌門人等多場尖峰對話環節,以及代碼比拼、企業創新展等特色嘉年華活動。全球開源技術峰會(Global Open-source Technology Conference,
154、簡稱 GOTC),是面向全球開發者的一場盛大開源技術盛宴。GOTC 2023在2023年5月27日-28日上海成功舉辦,這次開源行業盛會以行業展覽、主題發言、特別論壇、分論壇的形式展現,與會者將一起探討元宇宙、3D 與游戲、eBPF、Web3.0、區塊鏈等熱門技術主題,以及開源社區、開源商業化、開源教育培訓、云原生等熱社區領域排行2023 中國開源發展藍皮書57門話題,探討開源未來,助力開源發展。2.2.2 開源項目2022中國開源貢獻度報告根據每個項目中提交是否為中國開發者的提交,按照大于標注為中國地區開發者的提交占比超過40%為主要標準,外加CSDN、Gitee等國內社區標簽信息為參考,確
155、認674個項目為中國開發者主導的項目,占比約12.5%。中國項目占比2023 中國開源發展藍皮書58一個值得關注的數據是:在674個中國項目兩年內收到的343,735個提交中,標注地區信息的開發者提交數為205,528。其中,中國開發者的提交136,350,占比66.3%。國際開發者提交69,178,占比33.7%。國際開發者高于三成的參與率,說明中國的開源項目正在走向全球,引起了全球開發者的關注。這意味著中國開源勢力已經開始登上國際化的舞臺。報告根據GitHub Event的數據,匯總出“中國開源項目 Top20”(注:由于本輪發布項目排行數據主要參考GitHub中Event數據,目前在Gi
156、tHub中沒有數據的項目尚未計算在內,例如OpenHarmony、openEuler、MindSpore等)。榜單上,位列前五的是ant-design、vue-element-admin、echarts、frp,以及 dubbo。有五個項目的Star數超過五萬,Fork數最高為ant-design的36,086,貢獻者近兩千人。值得注意的是,Top20的項目中,阿里系占到6席(包括阿里巴巴、螞蟻集團和餓了么),這與阿里在GitHub上的長期沉淀不無關系。早在五年前,阿里就成為唯一一家入圍GitHub頂尖貢獻名單的中國公司。中國項目貢獻分布2023 中國開源發展藍皮書59中國開源項目TOP 20
157、根據2022 中國開源年度報告,中國項目中,排名前兩名的項目遙遙領先,后續項目OpenRank值相近,說明中國開源項目正在平穩發展。Top30榜單中,我們發現中國頂尖開源項目在前端、數據庫、云原生、人工智能領域表現突出。其中ant-design/ant-design表現優異,項目參與者方面,ant-design達到了最高的3882 人,巴士系數也達到了2530人,在issue解決時間以及活躍度方面也有不錯的表現。2023 中國開源發展藍皮書60中國項目OpenRank排名Top302023 中國開源發展藍皮書61全球貢獻排名前50的公司中有10家國內企業上榜。整體來看,前五分別是谷歌、臉書、英
158、特爾、紅帽,以及美國超威半導體。中國上榜公司包括華為、阿里巴巴、聯發科(中國臺灣)、騰訊、樂鑫科技、百度、字節跳動、中興、瑞昱(中國臺灣),以及濤思數據。其中,華為的貢獻度遙遙領先,排在第六,前三十中還有阿里巴巴和聯發科,其余七家在30到50位之間。全球公司開源貢獻榜TOP 502023 中國開源發展藍皮書62在國內,通信、互聯網、大數據、云、電子等領域的頭部公司對開源作出重要貢獻。中國公司開源貢獻榜TOP 202023 中國開源發展藍皮書63在捐獻到Apache Software Foundation和Linux Foundation的中國項目中,Apache項目的整體數據表現亮眼,Shar
159、dingSphere、Pulsar、Flink、tvm等項目名列前茅,值得指出的是,Flink在沒有使用GitHubIssue功能的情況下影響力第三,活躍程度可見一斑?;饡兄袊椖颗判蠺op202023 中國開源發展藍皮書642.3 開源開發者的需求和面臨的挑戰2.3.1 調研需求分析雖然近年來,中國的開源發展速度非常迅猛,且自2021年以來Apache基金會的孵化項目基本都來自中國,未來中國必將會是參與國際開源的一股重要的力量。不過,2022中國開源貢獻度報告指出,當下從項目來看,主流開源項目國內席位稀少,國際開源Top50項目中,中國只有ant-design和vue-element-a
160、dmin兩個項目上榜,排名17和26,均為前端項目。國際開源項目Top502023 中國開源發展藍皮書65從開發者角度來看,開發者對于開源協議、內源、開源辦公室等含義的理解與適用的程度還遠遠不足。據CSDN2022-2023中國開發者調查報告顯示,在各家公司開始發力內源(InnerSource)加速公司類部代碼共享初期,僅14%的開發者對其有較深入的了解。要想更好的發展內源,各公司還需要加大投入。此外,開源協議是開源的重中之重,在開發者中,了解最多的是Apache許可證,占比43.8%,其次是MIT許可證。值得注意的是,依然有21.4%的開發者在使用開源項目時,沒有關注過開源協議就直接進行使用
161、,這可能使自己以及所在的企業陷入開源合規風險。開發者對內源的了解程度開發者了解的開源許可證2023 中國開源發展藍皮書66國內外有很多公司在開源浪潮下都建立了開源辦公室,主要職能是設置代碼使用、分發、選擇、審計相關政策、培訓開發人員等。到目前為止,還有超過半數的開發者完全沒有聽過開源辦公室。與此同時,63%的開發者表示未曾在開源中獲得收入,依然在用愛發電,依然靠著自己的熱愛在勉力支撐。實際上,這樣的狀況,已經到了迫切需要改變的時候了,否則,下一個類似colors.js作者直接“刪庫”最終導致數千個應用程序無限輸出亂碼的悲劇,依然會發生。2.3.2 建議基于以上挑戰,需要開源社區和相關企業共同協
162、力解決,從而更好地推動整個行業向更加開放、透明、合作的方向發展。在此,分享一些建議和措施:1.提升國際化影響力:提供培訓、指導和資源,鼓勵和支持中國開源開發者積極參與和貢獻到全球主流開源項目中,幫助開發者對開源辦公室(OSPO)的了解程度開發者在開源上獲得的收入2023 中國開源發展藍皮書67他們融入全球開源社區。打造高質量的開源項目,能夠滿足國際標準和需求,推動中國開源項目在全球開源社區中的知名度和影響力,提高其在全球主流開源項目中的席位。提供良好的中英文文檔、教程和示例代碼,幫助新用戶更好地了解和使用項目。同時,及時響應用戶的反饋和問題,不斷改進和優化項目。多參與國際開源標準和組織,與全球
163、開源社區保持密切聯系。2.加強內源理解和實踐:提供培訓和教育資源,幫助企業內部員工、開發者深入理解內源的概念和實踐,并在項目開發中積極采用內源模式。建立內源文化和價值觀:強調開放合作、共享知識和透明溝通的價值通過獎勵機制、認可制度或內源貢獻者的稱號,激勵開發者積極參與內源實踐。提供支持和反饋渠道:建立一個反饋渠道,讓開發者能夠提出問題、分享經驗和尋求支持。3.加強開源文化的推廣:加大宣傳力度,提高開發者對開源辦公室的認知。舉辦開源活動、研討會和培訓,讓更多開發者了解開源文化和實踐的重要性。建立開源社區的合作機制,促進開源辦公室與開發者之間的聯系和交流,共同推動開源的發展。4.開發者收入機制的改
164、進:探索多元化的開源項目收入模式,例如基于贊助、捐贈、咨詢服務和定制開發等方式,為開源開發者提供更多的收入來源。建立合理的激勵機制,鼓勵開發者在開源項目中的貢獻,并將其貢獻價值化,以吸引更多開發者積極參與和貢獻??偟膩碚f,提升中國開源開發者的國際化影響力、加強內源理解和實踐、推廣開源文化以及改進開發者收入機制,這些努力將有助于解決中國開源開發者面臨的挑戰,并推動中國開源生態系統的發展。2023 中國開源發展藍皮書68第三章 開源項目發展現狀3.1 GitHub中國項目活躍度及趨勢3.1.1 中國開源項目的總體現狀通過統計全域GitHub事件日志,可以看到近5年全球開源的總體活躍情況,各項指標都
165、在明顯上升,特別是疫情后有一個加速上升的趨勢。同時活躍倉庫數量目前保持著大約24%左右的增速,顯示了全球開源發展中的增速。此節包含近五年中國項目在GitHub日志的事件總量、活躍倉庫數量、活躍在中國項目上的開發者總量的變化趨勢。在經歷了疫情前后的快速增長后,開始處于一個穩定的增長期。中國在2022年的日志事件和活躍倉庫數均有明顯的增長,相信在國家各項政策性意見的出臺下,中國開源的發展會越來越好。3.1.2 中美企業開源貢獻對比為了更好地展現中國企業在全球范圍下的開源貢獻整體水平,本報告通過對比美國頭部企業參與開源貢獻的數據來進行分析,四張表分別為:2022年美國活躍度排名TOP 10的開源貢獻
166、企業、中國活躍度排名TOP 10的開源貢獻企業、美國開源影響力排名TOP 10的企業、以及中國開源影響力排名全球GitHub事件日志、活躍倉庫、活躍開發者五年趨勢圖中國項目GitHub事件日志、活躍倉庫、活躍開發者五年趨勢圖2023 中國開源發展藍皮書69TOP 10的企業,可以看到:美國的傳統互聯網大企業活躍度與影響力排名仍然靠前。由于微軟已使用GitHub作為大部分團隊的日常開發平臺,故項目數量較大,總活躍度第一,與第二名Google的差距逐漸拉大;著名的開源獨角獸公司HashiCorp也榜上有名。中國阿里巴巴的項目數量和總活躍度均為國內企業第一,但整體項目體量以及活躍度總量距離美國Goo
167、gle等大企業還有一定差距;而中國的開源初創企業和項目則表現搶眼,按照項目平均活躍度,可以看到如PingCAP(tidb,tikv)、Baidu(PaddlePaddle)、ESPRESSIF(esp-idf)都脫穎而出。影響力指標更關注開發者生態。體量上中美存在一定差距,在項目平均影響力上則相當,中國企業映云科技(EMQ)進入榜單,該公司成立于2017年,主要的開源項目emqx有著相當不錯的開發者生態。進一步,本報告也詳細分析了中國企業近5年的開源發展趨勢,包括活躍度趨勢與影響力趨勢??梢钥吹桨⒗锇桶?、百度、螞蟻三家企業長期名列前茅;阿里長期排名榜首,而百度近幾年也明顯加大了對開源貢獻的投入
168、,初創企業PingCAP也是一直穩居第四的,需要注意的是鼎石科技在2021年上榜并在2022年達到第8位,其目前已捐獻給Linux基金會的StarRocks數據庫影響力不容忽視。美國企業活躍度TOP 102023 中國開源發展藍皮書70中國企業活躍度TOP 10中國企業影響力TOP 10中國企業活躍度TOP 10 2018 2022中國企業影響力TOP 10 2018-20222023 中國開源發展藍皮書713.1.3 中國項目活躍度與影響力情況在開源項目洞察這部分,同樣根據活躍度和影響力,分別比較了全球和中國排名前20的開源項目,可以看到:在單個項目上,中國主導的開源項目的活躍度和影響力距離
169、全球頂級開源項目的活躍度與影響力還有一定的差距,特別是在影響力方面,需要長期建設,需要最大限度融入全球開源生態里。中國主導的開源項目中,百度PaddlePaddle相關的兩個項目保持上升,活躍度與影響力均位列第一。PingCAP旗下的兩個開源項目(TiDB、TiKV)與StarRocks已捐獻給Linux基金會的數據庫則表現不俗。在近5年的變化趨勢上,活躍度方面,PaddlePaddle相關的兩個項目保持上升;影響力方面,ShardingSphere和MeterSphere則穩步上升。GitHub全球項目活躍度TOP 202023 中國開源發展藍皮書72中國項目活躍度TOP 202023 中國
170、開源發展藍皮書73中國項目影響力TOP 20全球項目影響力TOP 202023 中國開源發展藍皮書74近五年中國活躍度TOP 10項目變化趨勢圖Paddle項目上升至第一,TiDB上升至第二。StarRocks在2021年上榜,2022年直接上升至第三位。近五年中國影響力TOP 10項目變化趨勢圖PaddleOCR在2020年開源以來,活躍度和影響力都飛速進步,很快就進入了頂級項目行列。同樣,MeterSphere自2020年上榜以來影響力逐漸上升。從下圖中同樣可以看出2020年以來項目影響力競爭激烈,反映出中國開源項目積極的發展。中國項目活躍度TOP 10 2018-2022中國項目影響力T
171、OP 10 2018 20223.1.4 數據庫領域項目分析本小節從數據庫領域角度出發,分別給出了數據庫領域影響力和活躍度TOP 10項目、數據庫各子領域TOP 5影響力和活躍度變化趨勢以及近5年TOP 10項目的影響力變化趨勢。數據庫領域影響力TOP 10可以看出Clickhouse活躍度和影響力穩居第一,數據庫領域影響力TOP 102023 中國開源發展藍皮書75Elasticsearch其次。ClickHouse是俄羅斯的Yandex于2016年開源的用于在線分析處理MPP架構的列式存儲數據庫,作為高性能的OLAP數據庫,其性能十分優越,查詢速度極快。數據庫領域項目TOP 10影響力變化
172、趨勢從下圖可以看出Clickhouse雙指標均在2022年上升至第一位,Elasticsearch和Spark有一定的回落,排名較后的項目雙指標均有不同程度的增長。數據庫各子領域TOP 5影響力變化趨勢本節給出了數據庫下各個主要子領域的影響力變化趨勢,從趨勢圖可以看到,關系型數據庫連年位居第一且影響力不斷增長,其他類型數據庫影響力均處于穩定期。數據庫領域項目影響力TOP 10 2018 2022數據庫子領域影響力TOP 5 2018 20223.2 基于OSS Compass的國內開源發展現狀洞察開源指南針(OSS Compass,https:/oss-compass.org)面向GitHub
173、、Gite等托管平臺上托管的所有開源項目開放,為國內外開源社區提供公開的SaaS服務,用于開源社區健康分析。本報告以收錄于開源指南針平臺的國內代表性開源項目為樣本,對國內開源軟件的發展狀態進行評估和洞察,涉及國內開源軟件項目74個,涵蓋了人工智能、OS發行版、數據庫、云原生、前端、中間件、嵌入式OS、安全等多個領域。3.2.1 開源指南針(OSS Compass)平臺開源指南針平臺由開源中國、華為等國內著名企業以及南京大學、北京大學等國內知名高校聯合發2023 中國開源發展藍皮書76開源指南針評估體系起,于2023年2月21日正式對外發布并提供服務。其創立的愿景是為包括但不限于OSPOs、社區
174、管理人員、學術研究人員、項目所有者、維護者、開發者等廣大開源社區的參與者提供公開、客觀、量化的評估指標體系和評估結果。通過分析大量開源項目的實際數據,并參照行業最佳實踐和學術界的研究結果,以評估促發展,為開源軟件社區和生態的健康發展提供助力。如上圖所示,開源指南針平臺目前以“產業生態健康(Business Ecosystem Health)”理論模型為指導,通過連接國際開源社區健康評估組織CHAOSS社區的指標體系,形成了針對開源軟件項目和生態的三維度健康評估體系。該三維度體系包括生產力、穩健性和創新力。該指標體系可以從內部效度、外部效度和結構效度等多個方面,采用包括內容效度、因素獨立性、區分
175、于預測能力等多項指標,對其有效性進行充分的評估和驗證?;谠摻】翟u估模型,開源指南針平臺針對托管在GitHub和Gitee上的大量項目進行了評估和分析。目前,針對GitHub和Gitee托管平臺,已經實現了針對包括人工智能深度學習框架、ChatGPT、大數據、數據庫、云原生、代碼分析等在內的超過200個領域、18000個開源軟件倉庫的評估,并在持續增長過程中。3.2.2 國內開源領域發展現狀下面將基于開源指南針已經公布的協作開發指數、社區服務與支撐、活躍度和組織活躍度四個度量模型,對2022-2023年度的數據開展分析。其中每個度量模型由多個原子度量指標綜合形成,具體參見開源指南針的評估模型定
176、義(https:/oss-compass.org/docs/zh/dimensions-define/)。本節選取OSS Compass收錄的國內各典型領域中的代表性開源項目,對其年度發展狀態進行分析。2022-2023年度具體時間為2022年5月1日-2023年4月30日,用于對比的上一年度具體時間為2021年52023 中國開源發展藍皮書77月1日-2022年4月30日。代表性領域和開源項目整體情況如下表所示,參考OSS Compass專家意見和上一年度的開源藍皮書相關章節,選擇了人工智能、OS發行版、數據庫和云原生等九個典型的應用領域中包括MindSpore、PaddlePaddle、T
177、HUDM、OpenLMLab、OpenHarmony、ShardingSphere等在內的共74個國內具有代表性的開源項目作為樣本開展分析。整體情況如后圖所示,在2022-2023年度,國內開源的整體平均活躍度、組織活躍度、協作開發指數、社區服務與支撐指數為0.326、0.153、0.333和0.314。相較于2021-2022年度,本年度的活躍度、組織活躍度、協作開發指數、社區服務與支撐指數分別上升了3.5%、6.3%、4.4%和3.3%。對比上一年度,2022-2023年度國內開源的整體發展呈現穩中求進,在波動中上升的態勢。人工智能領域分析隨著深度學習技術在近年來的持續發展,特別是Chat
178、GPT等大語言模型取得的突破性進展。人工智能領域得到了各界的廣泛關注,包括華為的MindSpore、百度的PaddlePaddle、清華大學THUDM團隊的項目、OpenLMLab、TVM等項目都是國內在人工智能領域的典型代表。為此,我們選擇人工智能領域作為典型,開展深入分析。領域代表性項目人工智能MindSpore、PaddlePaddle、THUDM、OpenLMLab、apache/tvmLinux操作系統發行版openEuler、龍蜥、CloudOS智能終端操作系統OpenHarmony數據庫OceanBase、OpenGauss、TiDB、ShardingSphere云原生apach
179、e/apisix、goharbor/harbor前端apache/echarts、ant-design/ant-design、NervJS/taro、ant-design/pro-components、ant-design/ant-design-pro、umijs/umi、web-infra-dev/modern.js、alibaba/ice、dcloud/uni-app、Tencent/Hippy、Tencent/wepy、alibaba/rax、didi/chameleon、areslabs/alita、iqiyi/LiteApp、umijs/qiankun、micro-zoe/micro
180、-app、alibaba/beidou、alibaba/lowcode-engine、baidu/amis、web-infra-dev/rspack、vitejs/vite、ctripcorp/moles-packer、element-plus/element-plus、arco-design/arco-design、ecomfe/san-mui、Tencent/weui、didi/cube-ui、zhihu/griffith、alibaba-fusion/next、jdf2e/nutui、fex-team/webuploader、wux-weapp/wux-weapp、alibaba/Biz
181、Charts、fex-team/kityminder、spritejs/spritejs、alibaba/f2etest、didi/AgileTC、alipay/SoloPi、dvajs/dva、alibaba/pont、thx/RAP、thx/rapper、didi/di18n、baidu/san、NervJS/nerv、Tencent/omi中間件apache/flink、alibaba/nacos、apache/shardingsphere、apache/dolphinscheduler、k3s-io/k3s、apache/dubbo嵌入式OSrtthread/rt-thread、djy
182、os/djysrc、alibaba/AliOS-Things安全Tongsuo-Project/Tongsuo、Mbed-TLS/mbedtls、google/boringssl本節所包含的代表性領域和開源項目細則2023 中國開源發展藍皮書78自上而下分別是活躍度、組織活躍度、協作開發指數和社區服務與支撐指數。藍色均值和綠色中位數分別表示人工智能領域在相關指數上的均值和中位數。黃色的總均值和總中位數,則對應了所有領域在相關指數上的均值和中位數。從后圖可以看出,除社區服務與支撐指數,人工智能領域對比其它領域在活躍度、組織活躍度、協作開發指數上,其均值和中位數均穩定保持在總均值和總中位數之上,展
183、示出了人工智能領域的長期活躍。同時,可以明顯看到在2023年3月左右,人工智能領域的活躍度、協作開發指數和社區服務與支撐指數呈現出了一個爆發式的增長。特別是社區服務與支撐指數,從低于總均值和總中位數的位置,短期形成了大幅超越。ChatGPT的發布是引發這一輪人工智能領域在2023年初的爆發式增長的主要因素。自2022年12月以來,OpenAI對ChatGPT進行了一系列的發布(https:/ 中國開源發展藍皮書793.2.3 國內開源項目發展的挑戰與建議加大基礎軟件的投入:相較前端項目,國內在基礎軟件,如OS發行版、中間件、數據庫等領域能夠發掘出的代表性開源軟件項目的數量仍相對較少?;A軟件作
184、為關鍵軟件,如何培養國內相應的優秀人工智能領域的發展趨勢2023 中國開源發展藍皮書80開源社區,提升整體研發能力,是值得關注的一個話題。人工智能領域要維持發展后勁:在重點關注的人工智能領域,隨著ChatGPT的提出,國內的相關框架、模型和應用發展迅速。目前國內有百度的文心一言、華為盤古、清華大學的ChatGLM、復旦大學的MOSS等模型。人工智能作為未來發展的重點方向之一,是一個充滿機遇的領域。但是總體而言,國內開源的大模型框架仍然較少,中文支持仍不夠強大。從指標分析結果來看,整個國內人工智能社區要維持其發展的后勁,還需要更多的投入。要提高個人貢獻者的數量和比例:綜合活躍度和組織活躍度的指標
185、分析可以看出,在當下備受關注的人工智能領域,每周平均活躍貢獻者數量不超過500,其中近30%的活躍貢獻者來自于組織,且有向頭部組織聚集的趨勢。如何在國內的廣大程序員、相關專業學生群體中,培養開源文化,豐富貢獻者的來源,壯大國內開源貢獻者隊伍規模,是我們要長期關注并采取切實行動的一個重要問題。3.3 中國重點領域開源項目發展現狀3.3.1 開源操作系統國產開源操作系統在近年來得到飛速發展,從趨勢上看,已經進入行業整體即將起飛的階段。從傳統上看,操作系統的開發屬于底層基礎軟件,復雜性很高,開發和維護資源投入需求巨大,卻很難直接轉化成商業利益回報,因此一直以來大型企業對于自研操作系統的決策都是非常謹
186、慎的,而國內專業從事操作系統開發的軟件企業、操作系統廠商(OSV),卻都一直處境艱難。近年來隨著政府一系列鼓勵本土操作系統發展的政策推動,國家應對信息安全威脅的需求,再加上國內市場的旺盛需求,以及國內科技實力的提升,國產操作系統的發展進入了一個迅猛發展的前夜,騰飛指日可待。大部分的國產操作系統都是基于開源的Linux,同時也出現了像Open Harmony這樣完全自主開發的操作系統。在數據中心和服務器領域,基于開源Linux操作系統進行定制化和創新是仍然是主流,但相對于早年,近年來中國操作系統行業最大的變化在于,國內系統軟件社區的飛速發展和普及,社區化是相對于以前靠單個公司和組織的開發模式的顯
187、著變化,也是國內操作系統行業近年來飛速發展的引擎。國內目前有四個主流的開源操作系統社區,分別是歐拉社區(openEuler),龍蜥社區(OpenAnolis),OpenCloudOS以及OpenHarmony;目前這四個社區都已經捐贈或者正在捐贈到同一個開源基金會,開放原子基金會(OpenAtom Foundation)。2023 中國開源發展藍皮書81促使國內開源操作系統社區出現和迅速發展的直接因素之一,是國際開源操作系統CentOS的停止服務。CentOS是一個基于Red Hat商業版企業的開源的Linux發行版,由于與Red Hat商業版(RHEL)100%兼容,以及免費,開源的特性,長
188、期以來國內有大量企業和用戶在使用和定制基于CentOS的Linux操作系統。2020年12月,Red Hat和CentOS項目組宣布CentOS Linux項目停止維護,到2021年底CentOS8系列已經完成生命周期支持,另外CentOS7也將于2024年6月底停止支持,由此尋求CentOS的替代成為眾多企業的當務之急。龍蜥操作系統(Anolis OS)為CentOS用戶提供了平滑遷移過渡的方案,龍蜥社區就是在這樣的背景下應運而生,社區在操作系統的性能,安全性,云原生支持,運維等各個領域進行了自主創新。與龍蜥操作系統定位略有不同,歐拉操作系統(Euler OS)并未將兼容CentOS作為主要
189、目標,希望通過社區創新,打造自主的面向數字基礎設施的開源操作系統,歐拉社區作為另外一個國產操作系統社區的代表,成為了一個獨立發展生態的社區。OpenCloudOS則致力于打造一個完全中立、全面開放、安全穩定、高性能的操作系統及生態,在云原生、穩定性、性能、硬件支持等方面有一定的技術支撐,可以平等全面地支持所有硬件平臺。OpenHarmony,開放原子開源基金會旗下另外一個重要的開源操作系統,與其他基于Linux的操作系統不同,一開始就致力于構建一個全新,自主的系統架構和生態,目標是面向全場景、全連接、全智能時代、基于開源的方式,搭建一個智能終端設備操作系統的框架和平臺,促進萬物互聯產業的繁榮發
190、展。目前OpenHarmony在物聯網(IoT)和嵌入式領域得到了長足發展,生態繁榮,社區參與者覆蓋面很廣。在桌面操作系統領域,盡管隨著時間的推移,越來越多的用戶開始使用Linux桌面操作系統,但與Windows和macOS相比,Linux桌面用戶的數量仍然相對較少。根據各種市場調查,全球Linux桌面市場份額大約在24。中國桌面Linux的市場情況與全球大體一致,同時在國產化和信創的政策推動下,國產桌面Linux操作系統在政企辦公OA,金融,能源,電力等領域得到長足的發展。主要的國產桌面操作系統廠商包括統信,麒麟,紅旗,中科方德,普華,中興新支點等,同時也出現了OpenKylin這樣專注于桌
191、面操作系統的開源技術社區。從生態上看,應用軟件特別是專業應用軟件的缺失,硬件(包括顯卡驅動,指紋識別器和一些特殊硬件等)驅動支持不足仍然是制約國內桌面Linux操作系統普及的重要原因。3.3.2 開源芯片在開源軟件大生態中,開源芯片尚處于起步階段,但發展勢頭迅猛,基于開源指令集RISC-的開源2023 中國開源發展藍皮書82芯片生態正在快速崛起,為包括中國在內的廣大發展中國家突破芯片領域的技術壁壘和市場壁壘帶來了新機遇。它不僅能夠協同全球各國特別是眾多發展中國家共同構建開源處理器芯片生態,開拓新興應用市場。也是一種突破處理器芯片壟斷格局的新路線,有望形成普惠世界的芯片領域的“人類命運共同體”。
192、2015年才逐漸興起的RISC-V架構,經過僅僅8年時間的發展,就大有與X86、ARM三分天下之勢。截至2022年底,全球有數萬名工程師致力于RISC-V計劃,基于RISC-V架構的處理器出貨量已超過100億顆,預計2025年,RISC-V芯片出貨量將超過800億顆。中國成為了RISC-V最為活躍的地區,也為推動全球范圍內RISC-V的發展做出了貢獻。今年3月,阿里平頭哥在生態大會上公布了其對RISC-V生態體系的支持計劃。當前開源芯片發展突出的趨勢:RISC-V不僅在工業控制、物聯網、智能家居等對算力要求不高的領域已經占據主流市場,也正在向對算力有更高需求的移動設備、桌面應用、邊緣計算等領域
193、發展;RISC-V在數據中心服務器市場開始起步,比如微核芯推出對標ARM服務器端處理器核的RISC-V處理器核;與X86、ARM在服務器領域提供通用芯片服務不同,RISC-V能夠根據用戶的應用場景進行定向的改進、優化,以給客戶提供最優的解決方案;未來在云計算平臺上,X86、ARM、RISC-V三方可以優勢互補。國產開源芯片面臨的主要挑戰在于如何基于可控供應鏈實現具備全球競爭力的高性能芯片。過去高性能芯片往往依賴于工藝進步來實現產品性能的升級。當前背景下,高性能芯片產品和先進工藝被限制封鎖,中國高性能芯片產業必須進行供應鏈重組。對于中國的高性能芯片產品來說,難度在于如何在可控供應鏈條件下滿足日益
194、增長的算力需求,同時還有足夠的商業競爭力應對全球競爭。一方面國產芯片只能使用落后國際先進工藝兩三代以上的成熟工藝。另一方面目前高性能領域的商用處理器IP都是基于最先進的目標工藝(例如7nm、5nm、甚至3nm)開發的,這些商用IP在國內可控供應鏈條件下(12nm、14nm工藝)很難實現最優化的性能指標。國產高性能芯片必須走出自己的獨立自主開發之路。但開源芯片的市場空間廣闊。從高端的數據中心芯片,到桌面,到高端嵌入式,都需要開源芯片。2023 中國開源發展藍皮書83從宏觀角度分析,開源的真正價值在于能夠帶動整個信息產業的發展。通過開源模式,用戶企業都能夠學習和了解高性能芯片技術,能夠有能力和可能
195、參與到芯片的定義和設計中,形成產業合力,完成產業升級和信息化。從微觀角度看,開源芯片模式能夠大幅度降低企業對高性能芯片技術的試用使用成本,因此有利于技術推廣,擴大市場規模。過去開源軟件的發展已經證明了這一點?;谕耆瓶卦谏虡I公司手中的閉源處理器IP,對用戶企業的發展是一種限制,更是一種隱患,任何一家企業都不愿意把自己的未來與另一家不可控的商業公司緊密綁定。過去兩三年IC產業的混亂也證明閉源模式已經不適于整個信息產業的發展。而開源解決了商業企業的信息安全可控問題?;谶@點,很多用戶企業會主動擁抱開源的RISC-V和開源高性能處理器,主動共建生態,這也是開源的最大優勢!對于國產高性能芯片來說,如
196、果希望在可控供應鏈條件下實現足夠商業競爭力的芯片產品,唯一的機會就在于與應用需求的深入結合。在特定行業的專用領域專項性能方面,即便使用相對不夠先進的工藝,也完全有可能以相對低的代價和成本實現領域內絕對性能的超越。對于RISC-V產業來說,只有以與應用需求結合作為抓手,才能從點到面,逐漸將RISC-V的生態豐富成熟。因此對于國產開源芯片的發展建議如下:構建開放的生態體系,聚集各行各業的力量,通過與行業應用的深度結合,從需求端引導芯片生態的發展,以中國龐大的市場需求為基礎,獲取新興產業的主導權和話語權,最終成就中國獨立自主的半導體產業。要想讓用戶敢用會用最終好用,首先必須有行業應用的機會,在某些行
197、業領域率先落地,進行應用示范。建議在政策強有力的支持下,通過政府搭臺,應用引導,企業合作以完成產業升級,在解決國家戰略需求的同時,完成行業企業的技術升級和創新發展。3.3.3 開源與數據庫早在20世紀50年代,互聯網技術(ARPANET)的先驅們就十分推崇同行評審和開放反饋,用戶組通過共享源代碼,相互扶持并激發創新,到20世紀90年代互聯網誕生時,協作、開放、創新的價值觀就已植根于互聯網的內核之中。在數據庫技術領域,始于20世紀70年代的Ingres項目,代碼使用BSD許可證分發,在其基礎之上,以2023 中國開源發展藍皮書84各種形式演繹出包括Sybase、Microsoft SQL Ser
198、ver、NonSTOP SQL、Informix、PostgreSQL等著名產品,成為數據庫歷史上最成功的項目之一。本質上,開源軟件和閉源軟件都只是一種軟件研發和消費模式,在不同時期和場景有著各自獨特的競爭力與優勢體現。時至今日,開源軟件依托其社區開發模式,能更快地實現產品迭代和用戶觸達,進而形成免費軟件結合付費服務的業務模式,并進一步通過云獲得價值回報,MongoDB等數據庫都在探索這一模式。此外,從市場競爭戰略來看,軟件開源已經成為后來者擴大其市場影響力、追趕頭部企業的重要手段。國內開源數據庫的發展,經歷了借鑒、發展、創新的全歷程,早期國產數據庫的探索者人大金倉就是以PostgreSQL為
199、基礎,在國產數據庫的發展中,基于PostgreSQL開源路線的產品,成為了一支主要流派,其中以瀚高數據庫發展時間最為悠久,在充分掌握PostgreSQL核心代碼并逐步發展后,通過二次開源的方式發展自主ivorySQL開源社區,借助社區提供源源不斷的技術迭代能力。而NewSQL的代表產品TiDB則是源自2013年Google Spanner/F1論文的技術實現,更多的NoSQL數據庫也相繼開源,如悅數科技在2019年開源了它的原生圖數據庫Nebula Graph的alpha版。自2019年以來,國內開源數據庫領域快速發展,大事件頻現,推動國內開源產業的蓬勃興盛。據DB-Engines的數據顯示,
200、2021年1月,開源數據庫的流行度首次超過商業數據庫,并持續領先,截止到2023年5月,開源數據庫的流行度繼續擴大了相對商業數據庫的優勢。全球383款數據庫中,開DB-Engines商業數據庫和開源數據庫流行度趨勢對比2023 中國開源發展藍皮書85源數據庫占據51.7%,排名前十的數據庫中,開源數據庫占據六席。據墨天輪的中國數據庫流行度排行榜,198個數據庫產品中包含13個開源的數據庫產品,而榜單的前十名就有5個開源產品。從數據庫開源項目的現狀來看,全球最受歡迎的兩種開源數據庫MySQL與PostgreSQL是一系列數據庫產品衍生的基礎,中國數據庫流行度排行榜中,源自MySQL和Postgr
201、eSQL的數據庫數量分別為12和18。在今天的數據庫領域,開源已經成為主要的趨勢和潮流。特別是基于PostgreSQL的開源數據庫項目,由于在供應鏈安全性和開源協議的商業友好性方面更具優勢,未來發展趨勢進一步被看好。2015年以后,中國的開源數據庫項目進一步發展并逐漸成熟。一些項目已經在技術上取得了重大突破,并在國內外獲得了廣泛的認可和應用。主要的代表有TiDB(HTAP分布式數據庫)、OceanBase(分布式數據庫)、IvorySQL(關系型數據庫)等在國際上逐漸嶄露頭角。同時,中國開源數據庫項目的社區規模不斷擴大,國際影響力逐漸增強。各個數據庫項目的社區活躍度提升,開發者數量增加,貢獻者
202、不斷涌現。同時,中國開源數據庫項目也開始積極參與國際標準制定和國際合作,加強與國際數據庫社區的交流與合作。逐步開啟了中國開源社區的國際化階段。未來,中國開源數據庫項目有望繼續發展,為國內外用戶提供更多高質量、高性能的開源數據庫解決方案。項目名稱項目地址項目簡介TiDBhttps:/ 平擴容或縮容、金融級高可用、實時HTAP、云原生分布式、兼容 MySQL5.7協議和MySQL生態等重要特性。ApacheDorishttps:/ p e n g a u s s-m i r r o r/openGauss-serveropenGauss是一款由華為在2020年開源的關系型數據庫管理系統,采用木蘭寬
203、松許可證v2發行,深度融合了華為在數據庫領域的企業級經驗,打造國內根社區。P o l a r D B-f O r-PostgreSQLhttps:/ 中國開源發展藍皮書863.3.4 開源與人工智能大型自然語言處理預訓練模型發展情況近年來,隨著深度學習的發展和大規模數據的積累,自然語言模型的規模和性能都有了顯著的提升。2022年11月,OpenAI發布正式發布ChatGPT,僅僅2個月后,其成為迄今為止用戶數最快破億的應用,使自然語言處理(NLP)及大型自然語言模型(LLM)成為2023年最受關注的科技話題。自然語言模型的應用已進入快速發展和變革的時期,對高校學習、科研、產業應用、投融資等各社
204、會組織活動將產生重大影響。為了把握新一輪科技革命和產業變革機遇,推動我國人工智能事業高質量發展,中國早在“十四五”期間制定了“十四五”智能制造發展規劃等一系列頂層設計文件,并從多個方面給予了政策扶持和資源投入。(一)政策扶持加強基礎研究和應用研究:國務院辦公廳關于全面加強新時代語言文字工作的意見提出進一步推進計算機視覺、智能語音處理、生物特征識別、自然語言理解、智能決策控制以及新型人機交互等關鍵技術的研發和產業化,支持語言文字基礎研究和應用研究,鼓勵學科交叉,完善相關學科體系建設。支持產業創新和轉化:促進新一代人工智能產業發展三年行動計劃(2018-2020年)提出大力推動語言文字與人工智能、
205、大數據、云計算等信息技術的深度融合,加強人工智能環境下自然語言處理等關鍵問題研究和原創技術研發,加強語言技術成果轉化及推廣應用,支持創業創新。促進多領域多場景應用:以2021年我國智能語音產業相關政策規劃匯總為例,梳理了我國部分地區出臺的多項政策規劃,鼓勵開發自然語言處理和自然語言大模型在教育、文化、媒體、司法、醫療等行業領域的應用,并基于在具體場景中的使用,形成“使用開發研究”的反饋鏈路,加速中國主導的開源數據庫TBasehttps:/ 時序數據管理系統,2014年項目啟動,2018年成為中國高校首個進入Apache孵化器的項目。2023 中國開源發展藍皮書87基礎研究與應用開發。(二)科研
206、投入以鵬城實驗室、智源研究院為代表的一系列科研機構的建立,進行重點攻關大規模自然語言處理領域的核心技術,逐步形成了以悟道、鵬程盤古為代表的自然語言模型,并向產學研各界開放使用,有效促進了我國科研領域組織與人才在自然語言處理和語言模型方面不斷努力和創新。國內的頂級高校,如清華大學、北京大學、復旦大學等知名高校已經成立了專門的自然語言實驗室或研究組織,致力于自然語言處理和語言模型方面的研究和應用。如近期上線并開源的MOSS和ChatGLM-6B分別來自于復旦大學的邱錫鵬教授團隊和清華大學孵化的智譜AI團隊。在全球知名頂會期刊中,我國開發者體量、國內論文投遞量及收錄量也在逐年提高,根據斯坦福大學的A
207、I Index統計,自2017年開始統計以來,中國AI相關的研發活力始終處于世界第二的位置;以ACL 2021為例,共有1239篇論文投稿來自中國大陸,其中251篇被接收,接收率為20.3%。(三)大模型現狀中國作為世界上最大的中文使用國家,也在積極探索大型語言模型的研究和應用。截至2023年5月,國內已有超過30個大模型項目發布,其中,包含通用大型預訓練語言模型,如騰訊的混元、阿里巴巴的通義千問、百度的文心、鵬程盤古、華為的盤古、智源的悟道和IDEA的封神榜-姜子牙,也包括源自垂直領域如教育行業的網易有道的子曰,學而思的MathGPT等項目。以上模型基于不同的架構和數據集進行了預訓練,并且在
208、不同領域展示了其強大的生成和理解能力。下面對部分模型進行簡要介紹:文心:文心大模型是百度為主體發布的產業級知識增強大模型,能夠理解和生成自然語言,同時結合知識圖譜,提升了學習效率和可解釋性。文心大模型包括多個子模型,如ERNIE、PLATO、鵬城-百度文心等,分別在語言理解、文本生成、跨模態語義理解、對話互動等領域取得多項技術突破。其中鵬城-百度文心是全球首個知識增強千億大模型,參數規模達到2600億,在60多項典型任務中取得了世界領先效果,在各類AI應用場景中均具備極強的泛化能力。悟道:悟道是北京智源人工智能研究院開發的一系列超大規模預訓練語言模型,包括悟道1.0和悟道2.0。悟道2.0于2
209、021年6月發布,參數量達到1.75萬億,并在世界公認的9項 Benchmark 上達到了世界第一,在多項基準測試中超越OpenAI GPT-3、DALLE以及Google ALIGN等先進模型;除此之外,2023 中國開源發展藍皮書88智源通過FlagAI開源平臺,將悟道GLM正式開源。盤古:華為盤古大模型是循環智能與華為云聯合推出千億參數中文語言預訓練模型,鵬城實驗室提供算力支持。華為盤古是2020年4月25日發布的Transformer encoder-decoder的中文理解模型,在權威的中文語言理解測評基準CLUE榜單中,總成績及閱讀理解、分類任務單項均排名第一。而鵬程盤古大模型是鵬
210、城實驗室與華為聯合研發的全球首個完全開源開放、以中文為核心的兩千億參國產大模型概覽2023 中國開源發展藍皮書89數的預訓練生成語言模型,包括鵬程盤古、鵬程盤古增強版、鵬程盤古多語言大模型和鵬程盤古對話生成大模型?;煸涸撃P驮趪鴥茸顧嗤淖匀徽Z言理解任務榜單CLUE上取得了優異的成績,并且已經成功應用于騰訊廣告、搜索、對話等多個核心業務場景。2022年底,混元1T大模型利用騰訊太極機器學習平臺的高效算力和低成本網絡,用千億模型熱啟動的情況下,可以在256張顯卡上一天內完成訓練。通義千問:2023年4月,阿里正式發布“通義千問”,該模型基于10萬億級參數的大模型底座M6模型。該模型在電商、制造
211、業、文學藝術、科學研究等領域有廣泛應用前景,并且已經實現了商業化落地。封神榜-姜子牙:2023年5月17日,IDEA研究院發布“姜子牙通用大模型V1”,姜子牙通用大模型v1(Ziya-LLaMA-13B-v1)擁有130億參數,從LLaMA-13B開始重新構建中文詞表,進行千億token量級的已知的最大規模繼續預訓練,使模型具備原生中文能力。再經過500萬條多任務樣本的有監督微調(SFT)和綜合人類反饋訓練,進一步激發和加強各種AI任務能力。知海圖AI:2023年4月,面壁科技與知乎合作的知海圖AI正式發布,該項目在開源的雙語預訓練語言模型CPM-Bee基礎上進行研發。值得一提的是,作為參數量
212、10B的CPM-Bee模型,不僅有十余種原生能力,更是具有強大的通用語言能力。CPM-Bee模型于2023年1月15日在 ZeroCLUE 榜單上登頂榜首。GLM-130B及ChatGLM:GLM-130B是清華大學發布的預訓練語言模型,具有1300億個參數。根據其官網介紹,該模型不僅支持中文和英文雙語,兩種語言的精度均于發布時對比其他模型具有明顯優勢,除此之外,GLM-130B具備快速且基本無損推理的能力,并兼容包括昇騰NPU、英偉達GPU、海光DCU等多種架構的智能計算芯片。2023年3月,對話模型ChatGLM-6B及千億對話模型ChatGLM由智譜AI(由清華大學計算機系技術成果轉化而
213、來)正式發布。MOSS:2023年2月由復旦大學邱錫鵬教授團隊正式發布,并于4月正式上線并開源。開源代碼涵蓋模型訓練和推理代碼,開源數據包括超100萬條對話訓練數據,開源模型包括160億參數中英雙語基座語言模型、對話模型及插件增強的對話模型。要想大模型蓬勃發展,仍需在以下幾大方面繼續努力。提升算力水平:算力是支撐大規模預訓練語言模型訓練和部署的關鍵因素。因此,集中力量建設“中國算力網”,像使用電力一樣使用算力,將成為未來我國人工智能基礎建設中的重要一環。一方面賦能用戶根據需求靈活獲取和使用各種類型和規模的AI算力服務,降低人工智能應用開發和部署的門2023 中國開源發展藍皮書90檻和成本;另一
214、方面也使得大規模算力跨區域協同計算成為可能,為我國人工智能產業發展提供強有力的支撐。加強數據資源建設:數據是訓練大規模預訓練語言模型不可或缺的基礎,如何建立我國的數據標準以及數據工程化實現方案對于提升我國在自然語言處理及語言大模型成果產生方面,將產生重大意義。探索新穎有效的模型架構:ChatGPT和GPT-4的成功證明,模型架構是決定大規模預訓練語言模型性能和泛化能力的核心要素。諸如多頭注意力機制的改進、深度殘差網絡的優化、人類反饋強化學習(RLHF)的應用以及在多模態數據處理及應用方面的探索和嘗試,均對新一代大模型的產生,提供了巨大的支持。(四)增強開放協作截至2023年5月,OpenAI仍
215、未對GPT-3.5及GPT-4進行開源計劃的發布,限制了其他研究者基于此的改進和創新,阻礙了模型的可解釋性,也增加了模型被濫用和誤用的風險?;诖?,我國可以充分發揮制度優勢,在中立機構的組織和協調下,團結各研究和開發力量,整合算力、數據資源,以開源開放方式進行大模型的研究與開發工作。通過建立統一的標準和規范,也可以有效地保護用戶隱私、維護網絡安全、防止信息偏見和歧視等問題。3.3.5 開源與云計算云計算如今已是IT業界的主流技術,越來越多的用戶選擇云計算平臺作為自己軟件業務的基礎設施,而云計算業務帶來的IT產業營收比重也越發凸顯。云計算的概念從上世紀八十年代發端,到真正成型落地廣為人知,開源理
216、念和開源軟件在其中起到了決定性的推動作用。系統軟件里,以Linux為代表的開源的操作系統是云計算軟件技術棧里堅實的基礎,開源的虛擬化技術對于計算資源的池化也是必不可少的一環,包括Xen,KVM,QEMU等開源項目。在網絡技術軟件棧和存儲技術軟件棧里,各種逐漸成熟的開源技術和開放標準,也加速了云計算時代的到來。作為云計算產業的先鋒Amazon AWS,就架構在這一系列的開源軟件之上。在AWS穩定的技術表現和成功的商業模式的帶動下,一系列開源的云計算基礎架構管理軟件風起云涌,而時至今日,OpenStack最終成為最成功和唯一事實上的標準云基礎設施開放平臺。同時,在過去幾年里,容器化和容器資源的管理
217、,也逐漸走向成熟,并快速被廣大開發人員和廠商所采用,也標志了云(計算)原生時代的到來。在此中起關鍵作用的還是幾個核心的開源軟件項目,首先是Linux kernel里的幾個核心技術帶來了容器化的可能,隨后Docker工具橫空出世讓業界快速擁抱了容器技2023 中國開源發展藍皮書91術,容器資源從單節點走向大規模集群的過程中,Kubernetes漸漸成為了容器資源調度和編排的事實標準,可稱為云原生時代的云操作系統。存儲服務支撐了應用的狀態、數據的持久化,是應用得以運行的基礎。云原生存儲是一種用于云原生環境的存儲技術,是云原生的重要組成部分,特征主要包括可用性、可擴展性、高性能、一致性以及持久性等。
218、近年來我國出現了一批優秀成熟的開源云原生存儲項目,具有代表性的有PingCAP的分布式事務鍵值數據庫TiKV,阿里巴巴的云原生鏡像分發系統Dragonfly和分布式內存數據管理引擎Vineyard,以及OPPO為大規模容器平臺設計的分布式文件系統CubeFS等。2022年,隨著云基礎設施、網絡和存儲等技術發展的深入,以及以容器和微服務為代表的云原生技術興起,云計算的發展呈現出如下的趨勢,也帶來了新的挑戰與機遇。綠色云計算成為重要議題中國信息通信研究院泰爾系統實驗室聯合IBM,在2023年1月5日發布的可持續計算藍皮報告(2022年)指出:在IT計算領域,可持續計算是以優化清潔產能、提升計算水平
219、、保障不間斷服務、快速響應安全事件為目標,包含可持續計算基礎設施、云計算技術與平臺、可持續業務應用成為可持續計算三個要素,覆蓋IT軟硬件、配套設施、業務應用,囊括了規劃、設計、開發、運行、維護、升級、廢棄回收的全周期活動。隨著云計算的普及,數據中心作為云計算的基礎設施,消耗大量電力并產生大量溫室氣體排放,能耗和碳排放問題日益嚴重,政府、企業和公眾對此越來越關注,綠色云計算成為一個重要的議題。它的定義是利用技術突破來推動計算和其他IT資源的可持續發展,以實現可能的環境優勢。與可持續計算目標一致。支撐人工智能和機器學習蓬勃發展2022年,ChatGPT的流行把人工智能發展推向了新高潮。在這個爆發式
220、增長的行業里,云計算為工智能和機器學習提供了基礎算力服務。云計算提供商如谷歌、亞馬遜和微軟,不僅提供了一系列預構建的人工智能和機器學習服務AI-as-a-Service(AIaaS),如語音識別、圖像識別和自然語言處理等,使企業能夠輕松集成和部署AI功能,而且還提供了強大的分布式計算能力,支持在多臺計算機上并行執行機器學習訓練任務,從而縮短訓練時間。除此之外,云計算提供商還提供了基于GPU和專用AI芯片(如谷歌TPU)的計算資源,為AI提供了強大的計算能力。2023 中國開源發展藍皮書92云原生是云計算發展主線在云下半場中,如火如荼的云原生技術是云計算發展的主線。在CNCF基金會對云原生技術的
221、解釋中提到,云原生要用一個開源軟件棧解決三個問題:一是把軟件應用程序切分為多個微服務;二是把每個部分打包成容器;三是動態地編排這些容器以優化系統資源。因此,把一個單體軟件應用解耦成許多微服務,并讓這些微服務在各自的容器中高效協作,是云原生的重要內容和發展方向。相對于物理機和虛擬機而言,容器是很輕量化的技術,在等量資源的基礎上能創建出更多的容器實例是當下緊迫需求。簡單且高效地管理快速增長的容器實例,是容器編排系統的主要任務,而Kubernetes就是容器編排和管理系統中的最佳選擇。未來,隨著云原生技術的成熟和發展,企業會更多地采用云原生技術,而Kubernetes可能會繼續發展,成為云原生應用部
222、署和管理的事實標準。云安全將成為關鍵領域云計算的基礎是資源共享,隨著越來越多的企業將其基礎設施遷移到云端,云安全將成為關鍵領域。云提供商可能會繼續加大投資以確??蛻舻臄祿踩?,并采取更嚴格的合規和隱私政策。數據在使用態時的保護正亟需新的技術填補空白。機密計算(Confidential Computing)正是基于硬件的受信任執行環境中執行計算來保護正在使用的數據,它基于建立硬件的可信執行環境(Trusted Execution Environment,TEE),如英特爾SGX和TDX,ARM TrustZone,AMD SEV/SEV-ES/SEV-SNP、RISC-V Keystone等技術
223、,為數據在云原生環境中的安全使用提供保障。隨著容器化和微服務架構的普及,確保這些技術的安全性可能會成為一個關鍵議題。目前在CNCF中就有Inclavare Containers和 Confidential Containers等開源機密計算項目,它們已經成為云安全的新趨勢。5G與云計算融合蘊含巨大潛力5G(第五代移動通信技術)和云計算的結合為各種行業和應用帶來了巨大的潛力。同時創造出全新的應用場景。譬如,邊緣計算是一種將計算資源和服務部署在網絡邊緣(靠近數據源或用戶)的技術,在某種意義上可以認為是云計算的擴展和延伸。5G的低延遲特性使得邊緣計算成為現實,但是構建分布式邊緣計算基礎設施工具和架構
224、仍處于初級階段,仍有諸多問題有待解決。國內廠商發起的KubeEdge、OpenYurt、SuperEdge等開源項目繼續推進,通過邊緣自治,云邊流量治理,邊緣設備管理等功能來實現云邊協同。邊緣計算可以減少數據傳輸延遲,提高實時性能,特別適用于自動駕駛、工業自動化、增強現實(AR)和虛擬現實(VR)等應用場景,這些邊緣應用場景都是5G與云計算融合的典型案例。2023 中國開源發展藍皮書93再譬如,在物聯網(IoT)領域,與云計算相結合,物聯網應用可以實現更高的數據處理能力、智能分析和遠程管理,這對于智能城市、智能交通和智能家居等領域具有重要意義??梢哉f,5G和云計算的融合將成為推動數字化轉型和智
225、能化發展的關鍵力量。3.3.6 開源與區塊鏈區塊鏈技術是融合共識機制、密碼學算法、智能合約的分布式賬本技術,具備可追溯、不可篡改、公開透明等特性。區塊鏈技術概念起源于比特幣白皮書,但由于比特幣系統技術棧中腳本語言的可編程性限制,早期的區塊鏈生態局限在以比特幣為代表的多個獨立數字貨幣系統。2015年,以太坊系統引入圖靈完備的通用編程語言作為合約開發語言,以太坊上快速涌現出一批數字資產驅動的金融類創新項目。區塊鏈技術的迅猛發展得到各國政府和產學研界的廣泛關注,在政策支持及市場驅動下,國內外誕生了一批擁有不同技術特點的區塊鏈底層平臺,應用場景也從金融領域拓展到各行各業。區塊鏈底層平臺(以下簡稱區塊鏈
226、平臺)是搭建區塊鏈系統的關鍵基礎設施,提供網絡通信、分布式共識、合約執行、數據存儲等基礎功能,為各行業區塊鏈應用落地提供支持。本文對比了國內區塊鏈開源平臺與具備一定影響力的國外區塊鏈開源平臺。由于本文重點關注我國區塊鏈開源進展,國內區塊鏈開源平臺通過匯總行業白皮書、區塊鏈信息服務備案文件、可信區塊鏈測評、公開征集等多種渠道搜集得到,而國外區塊鏈開源平臺由于數量較多,僅遴選了star數在1000以上的知名區塊鏈平臺。國內區塊鏈開源平臺基本信息2023 中國開源發展藍皮書94可以看出,由于監管政策不同,國內外在區塊鏈平臺發展上具有明顯差異。國外區塊鏈平臺發布時間較早,以公有鏈為主,大部分內置原生數
227、字貨幣,并通過經濟激勵建設平臺生態、完善社區治理。國內區塊鏈平臺以聯盟鏈為主,大部分是無幣區塊鏈,側重通過行業聯盟與政府力量推動平臺與社區建設。國內14個區塊鏈開源平臺中,聯盟鏈共有10個,占比71.4%,國外具有較高影響力的14個區塊鏈開源平臺中,公有鏈共有10個,占比71.4%。在開源協議上,Apache 2.0占據國內開源平臺的主流,占比達到42.9%,國外具有影響力的區塊鏈開源平臺中,GPL 3.0協議最多,其次是Apache 2.0協議。開源協議的使用與區塊鏈平臺類別有關,多數聯盟鏈應用場景有閉源需求,因此聯盟鏈平臺普遍采用Apache 2.0協議,例如Hyperledger Fab
228、ric,而公有鏈平臺則希望后續使用者持續開源,更多采用GPL 3.0協議。在開發語言上,無論國內外,Go語言市場占有率遙遙領先,達到46.4%,其次是C+,占比為17.9%。由于Go語言是以太坊和Hyperledger Fabric的主要開發語言,這一定程度上反映了這兩個平臺的生態影響力。如后圖,我們從影響力、star數、項目活躍度、最近維護時間、貢獻者數量、主要貢獻者數量等多個維度對國內外區塊鏈開源項目進行比較。國外知名區塊鏈開源平臺基本信息2023 中國開源發展藍皮書95對比可知,整體上,國內區塊鏈開源平臺影響力與國外有較大差距,在活躍度和貢獻者數量上也有顯著差距。國內區塊鏈開源平臺影響力
229、與活躍度(RepChain由于托管在Gitee社區,影響力和活躍度缺失;WuTongChain,INT Chain由于影響力和活躍度較低,數據缺失)國外知名區塊鏈開源平臺影響力與活躍度2023 中國開源發展藍皮書96擁有1000個star數以上的國外區塊鏈開源平臺有14個,而國內開源平臺僅有4個。國內區塊鏈開源平臺的貢獻者和核心貢獻者數量比國外低一個數量級,例如,ChainSQL是項目規模最大的國內開源項目,貢獻者、核心貢獻者分別為137和53人,而以太坊分別是837和67人。少數國內外區塊鏈開源平臺已超過兩年沒有維護項目代碼,例如CITA、BCOS、Wutongchain、EOS、sia,其
230、中BCOS較為特殊,其開發團隊后續遷移到FISCO BCOS項目。2022年,區塊鏈平臺聚焦于性能優化,完善技術棧配套組件。公有鏈頭部平臺以太坊Layer2快速發展,rollup成為主流鏈下擴容解決方案,吸引了超過200個項目部署,顯著降低交易成本。此外,以太坊共識機制在9月從POW轉向POS一事引發關注,該方案預期將解決以太坊狀態數據龐大帶來的網絡中心化問題,并為后續的分片擴容提供基礎。在聯盟鏈上,國內開源平臺技術積累趨向成熟,強調全面的信創適配,包括支持國密、國產數據庫、適配國產操作系統、國產CPU等。此外,國內開源平臺根據業務場景逐漸完善跨鏈互操作、管理運維平臺、隱私保護等配套組件。在加
231、密資產應用場景上,2022年加密資產市場行情整體低迷,市值縮水嚴重,以DeFi為代表的熱門賽道鎖倉量腰斬。Terra崩盤、FTX集團申請破產等事件使投資者遭受重大損失,嚴重打擊市場信心。盡管NFT數字藏品在年初開啟了市場新一輪熱度,但在年中達到峰值后持續降低。相比國外,國內的數字藏品在上半年也同樣火熱,但由于禁止二級市場交易與價格炒作、強調收藏屬性,行業逐漸回歸理性。在產業應用場景上,我國在政務協同、司法存證、供應鏈溯源等重點領域探索出可行的區塊鏈應用方案,并通過開展國家區塊鏈創新應用試點工作形成可復制推廣的典型案例和做法經驗。盡管我國有部分開源的區塊鏈平臺及配套組件,誕生了一批與實體行業結合
232、的落地應用,但在開源領域還面臨諸多挑戰:區塊鏈行業領域尚未形成開源共識,區塊鏈平臺開源比例低、總體數量少,部分機構僅開源配套組件或開發文檔,針對最核心的底層平臺仍選擇閉源。區塊鏈開源項目整體缺乏影響力,活躍度偏低,缺乏具備國際知名度的區塊鏈行業團體與開源項目。區塊鏈開源項目的生態建設機制、社區治理機制尚不明朗,大多數項目由單家機構維護管理,行業聯盟分布式協作治理程度較低。缺乏具有認可度的開源測試框架、測試工具與測試數據集,關鍵性能指標可對比性不足。開源已成為軟件發展的主流趨勢,區塊鏈作為構建分布式可信環境的關鍵技術,天然地在開源土壤中2023 中國開源發展藍皮書97孕育成長。隨著區塊鏈技術的普
233、及、軟件社區對開源重視度的提升,是否開源將成為使用方選擇區塊鏈平臺的重要指標。但我國在區塊鏈開源項目的數量和質量上均有較大的提升空間。除底層平臺外,開源項目方正在逐漸開源多語言SDK、跨鏈、控制臺、開發模板等組件,以豐富開源生態,擴大開源社區影響力。盡管國內外的政策環境不同,但開放是區塊鏈的可信基礎逐漸成為區塊鏈從業者的共識。盡管目前我國應用場景以封閉的行業聯盟鏈為主,但未來可能會誕生更多的開放聯盟鏈、無幣公鏈等提升開放能力。為擴大我國區塊鏈開源社區的影響力,建議由具備一定影響力的行業協會牽頭,聯合開源底層平臺的項目發布方、企事業單位、行業協會等,組建區塊鏈開源聯盟,設立聯盟章程,通過制定區塊
234、鏈開源規范、舉辦區塊鏈開源大會、定期發布開源發展報告等形式凝聚我國區塊鏈開源社區力量。同時需加大政策支持,考慮由政府部門、企事業單位、行業協會等共同出資,依托開源聯盟設立區塊鏈開源基金會,為高質量開源項目提供資金支持,同時通過舉辦開源比賽、高校宣講等形式普及區塊鏈開源知識,吸引更多人加入開源社區。3.3.7 開源與元宇宙元宇宙(Metaverse)是指一個虛擬的、以實時映射仿真的、具有高度互動性和沉浸感的虛擬世界,是互聯網科技發展的新階段。元宇宙不僅是一個虛擬的空間,而且是一個由數字資產、智能合約、虛擬現實和人工智能等多種技術組成的復雜系統。隨著互聯網技術的快速發展和物聯網技術的廣泛應用,元宇
235、宙已經成為了互聯網行業的熱點話題,得到了政府和企業的高度關注和投入。開源世界是建立元宇宙的首選之地。元宇宙是一個從現實映射出來的虛擬世界,它需要多種技術的支持才能夠成功。目前最核心的技術是人工智能、區塊鏈和云計算,隨著技術的不斷發展和應用場景的不斷拓展,元宇宙將實現更加豐富和多樣化的應用場景。在中國,元宇宙已經成為互聯網行業的熱點話題,得到了政府和企業的高度關注和投入。全球范圍內,元宇宙市場的規模正在逐年增長,預計在2025年內將達到500億美元。它作為數字經濟的重要組成部分,將在教育、醫療、文化娛樂、游戲、金融等領域得到廣泛應用。元宇宙項目的推出標志著中國互聯網行業在數字經濟領域的崛起。20
236、22年,全球元宇宙市場持續穩步增長,各大公司紛紛加大投入,推動元宇宙技術不斷創新和應用場景不斷拓展。據IDC預計,全球元宇2023 中國開源發展藍皮書98宙將會有十倍的增長,到2030年的一萬五千億。全球元宇宙2021-2022年度數據:全球元宇宙總用戶數量:截至2021年底,全球元宇宙總用戶數量已經超過了10億,而根據最新的數據,截至2022年底,全球元宇宙總用戶數量已經超過了15億。全球元宇宙總收入:2021年全球元宇宙總收入達到了250億美元,而到了2022年底,這一數字已經增長到了300億美元。全球元宇宙總支出:2021年全球元宇宙總支出達到了270億美元,而到了2022年底,這一數字
237、已經增長到了280億美元。元宇宙相關企業數量:截至2021年底,全球范圍內與元宇宙相關的企業數量已經超過了2.5萬家,而到了2022年底,這一數字已經增長到了3.5萬家。中國元宇宙2021-2022年度數據:中國元宇宙總用戶數量:截至2021年底,中國元宇宙總用戶數量已經超過了5億,而根據最新的數據,截至2022年底,中國元宇宙總用戶數量已經超過了6億。中國元宇宙總收入:2021年中國元宇宙總收入達到了150億美元,而到了2022年底,這一數字已經增長到了180億美元。中國元宇宙總支出:2021年中國元宇宙總支出達到了130億美元,而到了2022年底,這一數字已經增長到了160億美元。中國元宇
238、宙相關企業數量:截至2021年底,中國范圍內與元宇宙相關的企業數量已經超過了1.5萬家,而到了2022年底,這一數字已經增長到了2.5萬家。(以上數據僅供參考,具體數字可能會因為時間的推移而有所變化。提供的數據來源包括但不限于:艾媒網、中國產業信息網、前瞻網、億歐、中商產業研究院、中國信通院、中國互聯網協會、IDC圈等)在發展特點方面,2022年全球元宇宙市場呈現出了多樣化、高科技、開放性等特點。在中國市場,政府和企業加大了對于元宇宙的投入和支持力度,各類應用場景不斷涌現,用戶數量和市場規模也不斷增長。同時,各大公司也紛紛加大投入,推動元宇宙技術不斷創新和應用場景不斷拓展。目前,元宇宙技術仍存
239、在一些瓶頸和挑戰,如虛擬現實技術的表現、延遲、體驗等方面的問題。同2023 中國開源發展藍皮書99時,也需要解決數字身份認證、數據隱私保護等方面的問題。政策風險:在政策風險方面,政府對于元宇宙的監管和管理還需要進一步加強和完善。同時,也需要加強對于數字身份認證、數據隱私保護等方面的監管和管理。市場失衡:在市場失衡方面,目前元宇宙市場還存在著內容創作者生存狀況差、應用場景單一等問題。同時,也需要加強對于不同利益相關者之間的利益平衡和協調。未來,元宇宙將在數字經濟和數字文化領域發揮更加重要的作用,并推動數字化社會建設。而且,元宇宙不僅可以用于娛樂和游戲,還可以用于教育、醫療、旅游等多個領域和多樣化
240、的應用場景,為用戶提供更全面、更豐富的服務。同時,也將帶來更多的商業機遇和社會機遇。如何讓中國在全球元宇宙發展且劇烈競爭的同時,找出領先的空間?構建中國特色元宇宙或許是答案。在這之前,先分析一下中國在元宇宙發展方面的優勢:1 5G高速公路:利用5G技術將所有的VR實景同步到元宇宙中,實現高速傳輸和精準定位。2 三維的空間標準:北斗網格碼標準則提供了時間和空間的標準,保證了元宇宙的準確性和穩定性。而北斗網格碼跟國際的GPS有差異的技術,可留有空間發展。3 強大的硬件供應網絡:中國的電商帶動了整個硬件物流的簡化。在中國特色元宇宙的發展下,虛實間(在線線下)的浸沉式的互動、新硬件的研發、二代智能物聯
241、網的發展將成為我國的強大優勢。當然,以上的三點優勢也是可以被抄襲、追趕的,但以下兩個優勢,則是中國特色元宇宙的關鍵點:4 獨特的中國歷史文化:如果說元宇宙是未來的計算機,內容就是計算機吸引人的關鍵,中國擁有數千年的歷史文化,可以將這些歷史文化元素融入到元宇宙中,打造出獨具無限內容的中國特色的元宇宙。5 戶外空間的實時數據:與外國不同,我國要做一個戶外數字孿生所映射出來的元宇宙空間,需要向國家申請的使用戶外空間實時數據。一個具有深厚歷史文化的景點若開放實時數據,會吸引全國的元宇宙開發者來參與,這就是中國特色元宇宙的核心。3.3.8 DevOpsDevOps是Dev和Ops的組合詞,是開發和運營維
242、護的總稱,是目前已經收到國內外公認的確保高效研發運維流程的方法。隨著技術的發展,高效敏捷安全的研發訴求使得DevOps領域持續受到國內2023 中國開源發展藍皮書100外開發者的關注。在GitLab 發布的2023 Global DevSecOps Report SeriesWhat s next in DevSecOps(GitLab 2023 DevSecOps 報告)提到這樣一些數據:調研報告采訪了5010名開發者,其中有56%的開發者正在使用DevOps 或 DevSecOp的方法論,比2022年的47%有所增加。而相較于同樣的進行敏捷開發的方法論,只有DevOps/DevSecOps
243、 是唯一有所增長的。這也正說明了DevOps(包含DevSecOps)的受重視程度穩步上升。另一方面,中國信通院領銜聯合超50家企業,其中超五成的問卷受訪企業資產規模在5千萬元以上,覆蓋全國32個省級行政區近90個城市,發布了中國DevOps現狀調查報告(2022)梳理國內DevOps實踐現狀,洞察中國DevOps轉型新趨勢,助力企業DevOps落地實踐,促進全行業DevOps演進與變革,也印證了國內對于DevOps行業的關注。國外的DevOps生態工具鏈百家爭鳴,而且功能豐富:(一)版本控制&協作開發包括:版本控制系統Git、代碼托管平臺GitLab、代碼評審工具Gerrit、版本控制系統B
244、azaar。(二)自動化構建和測試包括:Apache Ant、JMeter、Gradle。(三)持續集成&交付包括:Jenkins、Fabric、Travis CI。(四)部署工具1.Docker:Docker是一個開源的應用容器引擎,讓開發者可以打包他們的應用以及依賴包到一個可移植的容器中,然后發布到任何流行的Linux機器上,也可以實現虛擬化。2.Chef:Chef是一個系統集成框架,為整個架構提供配置管理功能。3.Ansible:Ansible提供一種最簡單的方式用于發布、管理和編排計算機系統的工具,你可在數分鐘內搞定。Ansible是一個模型驅動的配置管理器,支持多節點發布、遠程任務執
245、行。默認使用 SSH進行遠程連接。無需在被管理節點上安裝附加軟件,可使用各種編程語言進行擴展。而在國內同樣也有同樣的DevOps 工具鏈生態:(一)DevOps 一體化平臺1.極狐GitLab:極狐GitLab不是GitLab的中文版本,而是GitLab版本基礎上融合了本土功能的中國發行版,集成了代碼管理、CI/CD、項目敏捷管理、安全監控、效能管理等覆蓋軟件研發全生命周期的2023 中國開源發展藍皮書101DevOps能力,公司在中國獨立運營。2.CODO:企業多混合云、自動化運維、完全開源的云管理平臺(二)CI/CD(持續交付、持續集成)1.JIANMU(建木):建木自動化平臺以觸發器、流
246、程編排、任務分發等功能為平臺核心,可以應用在各類使用場景下,包括但不限于,CI/CD、DevOps、自動化運維、多業務系統集成等場景的自動化。2.flow.ci:采用三端架構,服務端、Web、Agent,支持服務端的負載均衡以提高穩定性。所有任務運行在Agent上,并可以配置任務主機來自動調度Agent提升構建速度。(三)項目管理1.禪道:禪道是一款專業的國產開源研發項目管理軟件,集產品管理、項目管理、質量管理、文檔管理、組織管理和事務管理于一體,完整覆蓋了研發項目管理的核心流程。(四)測試可觀測性1.Metersphere:一站式的開源持續測試平臺,遵循GPL v3開源許可協議,涵蓋測試跟蹤
247、、接口測試、UI測試和性能測試等功能,全面兼容JMeter、Selenium等主流開源標準,有效助力開發和測試團隊充分利用云彈性進行高度可擴展的自動化測試,加速高質量的軟件交付。2.Datakit:一款開源、一體式的數據采集可觀測Agent。國內的DevOps項目雖然不及國外開源項目種類豐富數量眾多,但數量還是在穩步上升。DevSecOps是DevOps的下一個階段,其目的就是為了把安全性注入到持續集成和持續交付(CI/CD)管道中,使開發團隊能夠以DevOps的速度應對當今所面臨的一些非常緊迫的安全挑戰。DevSecOps幫助軟件供應鏈更上一個臺階,幫助開發者和研發將安全方案集成到整個軟件開
248、發交付流程。面對日益復雜的開發環境,GitLab對DevOps行業的發展有這樣的趨勢預測:保護供應鏈安全將是最高優先級安全依舊是整個組織的責任,未來將進一步“左移”,并從集成開發環境(IDE)擴展到生產環境。安全左移的目的是加強軟件供應鏈安全。2023 中國開源發展藍皮書102同時軟件供應鏈安全將朝著以下三個方向發展。一線工程師將在日常運維中承擔更多的威脅管理職責。為了完成這一工作,開發人員需要在軟件開發生命周期的每個階段,實時了解漏洞情況和修復策略,降低生產環境中發生嚴重事件的可能性。安全和合規團隊將把軟件安全保障策略融入代碼,避免因耗時的手動安全審查,拖累開發速度。一些引人矚目的安全事件進
249、一步凸顯了軟件開發風險。組織將建立審計流程,更好地評估和報告SDLC 風險。這就要求組織設計好如何交付工件,以證明其開發工具鏈各方面部署的控件具有不變性。安全將深入DevOps教育加速DevOps向DevSecOps的演進,將安全視為DevOps培訓和教育課程的重要部分,組織提供培訓。AI/ML將貫穿SDLCAI將成為提高生產力的關鍵,DevOps團隊將數字化轉型和業務分析與AI相結合,才能讓數字化轉型真正發生。AI/ML將進一步助力研發加速、安全修復和提高自動化測試以及可觀測性。價值流分析將在組織中發揮更大作用價值流分析將拓寬過去的開發工作流程,從而更全面地了解組織向其用戶(內部和外部)提供
250、的價值??捎^測性將左移,以實現高效的DevSecOps可觀測性將在SDLC中進一步左移,在提高DevSecOps工作流效率方面發揮重大作用,包括CI/CD、基礎設施成本分析和趨勢預測,以實現更好的容量規劃。預估中國圍繞DevOps生態的開源軟件提供軟件也會往預測的幾個方向發展。2023 中國開源發展藍皮書103第四章 開源行業應用現狀作為行業發展的重要基石,開源已經成為促進全球各行業轉型升級、推動數字經濟快速發展的中堅力量,行業業已形成擁抱開源、使用開源的共識。未來,開源將在傳統企業展現更多的力量,而行業積極擁抱開源、引入開源軟件的背后,是其業務發展導致的企業對持續變化的業務需求響應能力、軟件
251、性能及成本與效率方面的考慮。出于傳統行業的增長需求、市場環境的變化、客戶需求的多樣性等原因,傳統企業自身的研發能力不足以支撐企業敏捷響應、快速迭代、開發,制約了企業的快速發展。但企業根據需求自研系統或引入外部商業軟件都會帶來高昂的采購成本、維護成本和人力投入。在此背景下,開源由于其開放式協作的特點,使得開發流程更為敏捷,業務需求和變化能快速得到響應,而且開源社區為企業與外部精英提供合作平臺,可以解決短期內傳統行業研發實力不足的問題。引入開源軟件意味著企業可以基于原有開源代碼自行開發或只需采購增量服務,節約時間、人力、經濟成本。傳統行業引入開源軟件提升了企業業務競爭力,驅動了企業數字化轉型,幫助
252、企業系統實現了安全性和可靠性提升。從全局角度而言,傳統行業擁抱開源為其帶來了新的增長機遇。據信通院在全球開源生態研究報告(2022)中指出,開源開放是數字化催生的新“創新范式”,開源通過數字技術擴散互聯促進數字技術創新,進而加速數字化轉型。一方面,企業通過開源開放充分集結全社會智力資源,與外部創新主體協同創新,搭建企業技術創新入口和交互平臺,獲得“數字化生存”的動態技術創新能力。另一方面,開源戰略通過核心開源產品快速建立一個以開源技術為平臺、參與者相互賦能的行業生態圈。數字企業通過開源產品,與上下游企業形成共享代碼、協同開發、成本分攤的戰略聯盟,能夠充分發揮各個企業的競爭優勢與核心能力,增強企
253、業之間的資源互補,有效地擴大行業業務范圍,加速行業數字化轉型。4.1 開源在金融行業的應用4.1.1 2022-2023年金融行業開源發展現狀開源技術已成為金融服務的重要技術支撐金融行業在強化技術掌控和提質增效的雙重壓力下,越來越多地選擇開源技術產品作為其基礎技術2023 中國開源發展藍皮書104架構組成部分。金融行業通過開源技術支持企業核心技術框架,既能保證接軌國際主流技術,又能確保以深度參與的方式完成金融信息建設,實現從“可用”到“好用”的轉變。根據北京金融科技產業聯盟調研報告顯示,90%的金融機構已官方應用和試用開源軟件?!?022金融行業開源技術應用調查”顯示,47.06%的金融機構開
254、源架構資產庫系統使用開源組件和軟件的清單列表數量在1000至10000之間,35.29%小于1000,另有11.76%在1萬至10萬之間,5.88%在10萬以上。金融行業積極布局開源發展,陸續出臺多項政策規范,提供金融業開源治理和生態建設基本遵循因開源技術的廣泛使用,金融行業日益重視開源治理和開源生態建設,2021年10月,人民銀行辦公廳、中央網信辦秘書局、工業和信息化部辦公廳、銀保監會辦公廳、證監會辦公廳聯合發布關于規范金融業開源技術應用與發展的意見(以下簡稱意見)。整體從金融機構使用開源、自發開源、開源生態構建、構建標準和法律體系等4個方面提出了指導意見,并鼓勵“金融機構將開源技術應用作為
255、提高核心技術自主可控能力的重要手段”、鼓勵“金融機構積極參與開源生態建設”和“開展開源項目合作,實現優勢互補、互利共贏、共同發展”。同年人行發布的金融科技發展規劃(2022-2025)提出了要在開源生態方面“依法合規參與數字技術開源社區等創新聯合體”。行業相關政策陸續出臺,規范和鼓勵了金融機構安全合規應用開源技術,促進了金融行業開源生態培育和發展,推動了金融機構的數字化轉型。2022年金融行業開源相關標準規范陸續出臺,護航金融業參與開源生態行穩致遠。在行業標準方面,金融業開源軟件應用管理指南 金融信息系統開源軟件應用評估規范 金融業開源技術術語為進一步規范金融機構開源軟件的資產管理提供了寶貴的
256、經驗。金融行業開源軟件評測規范、金融行業開源軟件服務商評測規范為銀行機構評估和選擇合適的開源軟件及服務商提供參考依據,保障銀行業開源軟件的應用安全,促使開源軟件服務商提升企業競爭。金融技術產品開源項目管理指南保障金融技術產品開源管理流程的規范性和可行性,促進金融機構合法合規、擁抱開源。金融機構逐漸強化開源治理,嘗試探索對外開源在內部開源治理方面,超70%的金融機構具有開源相關治理流程,其中41.18%的企業有多個開源相關治理流程,29.41%的企業有1個開源治理流程,另有29.41%的企業尚無開源治理相關流程。70.59%的公司無單獨開源管理團隊,17.65%的公司擁有單獨開源管理團隊,其中1
257、人專職,5-10人兼職;11.76%的公司具備2-3人專職,10-20人兼職的單獨開源管理團隊。多家大型商業銀行已制定企業級開源治理流程,具備明確開源管理人員責任劃分,保障開源技術的安全可控應用。例如,中國農業銀行結合商業銀行特點和自身實踐涉及了一套融合傳統和開源理念的軟件管理體系和框架TOSIM2023 中國開源發展藍皮書105(Tranditional&Open-source Software Integrated Management),規范企業內部開源管理;交通銀行也根據自身企業技術架構發展,制定了開源軟件管理辦法、開源依賴庫管理細則等,形成開源軟件管理模型;浦發銀行成立了開源治理配套
258、組織架構,建設了開源治理平臺實現開源軟件全流程、一體化、自動化管理;中國銀行打造了包括開源技術架構師、開源安全專家、開源軟件開發專家在內的三支專家隊伍,確保高效協同;中信銀行成立了專業開源治理團隊,啟動開源治理平臺建設,實現開源資產管理線上化。在行業開源生態建設方面,金融機構逐步凝聚開源發展共識,共建行業開源平臺社區生態,增強行業合作,解決共性問題,開始培育、支持開源項目孵化與推廣。北京科技產業聯盟組織、中國銀聯承建了金融開源平臺(OFTP),賦能金融領域開源項目孵化,為用戶提供高質量的軟件源碼托管平臺,當前已接入70多家金融機構,承接了如金融業生僻字處里項目、金融業開源項目生態檢測平臺等多個
259、行業開源項目。此外聯盟還發起金融業開源技術信息服務平臺FOST風險信息共享計劃,依托平臺風險同胞服務模塊,為金融機構共享已知開源漏洞及風險信息,建立了風險漏洞和安全實踐的發現和共享機制,提高金融業開源技術風險防范和處置能力。在對外開源方面,部分金融機構逐漸從原來的開源技術的使用方,開始嘗試輸出貢獻。以微眾銀行、網商銀行、螞蟻集團為代表的互聯網銀行主動擁抱開源技術,積極參與開源社區,同時,反哺社區,通過將內部孵化的產品進行開源,捐贈給開源社區。2022年螞蟻開源可信隱私計算開源框架“隱語”、高性能圖數據庫TuGraph單機版、SOFAStack云原生項目。微眾銀行在人工智能、區塊鏈、云計算、大數
260、據等多個領域開源33個項目。工商銀行、中國銀行、招商銀行、浦發銀行、浙商銀行等參與區塊鏈跨鏈陸羽開源項目;工商銀行等與科技企業合作開展MySQL數據庫金融分支版本項目;招商銀行參與共建KubeVela項目,對外開源EasyBaaS項目和ChainHub項目;光大銀行與趣鏈科技合作開展區塊鏈BaaS平臺跨鏈子平臺項目。在內部開源方面,64.71%的金融機構實施了企業或集團內部開源,35.29%的企業還未實施。缺乏專門的開源管理團隊和企業級的開源文化認同以及安全、商務、法律因素是內部開源的最大阻力。4.1.2 金融行業開源發展的問題與挑戰金融行業開源要得到長足發展,必然面臨開源領域普遍會遇到的開源
261、許可證合規風險、供應鏈風險、代碼安全風險、自主創新風險和運維服務支持風險,各家金融機構也面臨自身IT轉型過程中的開源發展問題與挑戰。2023 中國開源發展藍皮書106開源許可證合規風險高許可證合規性是金融機構引入、使用、治理開源軟件面臨的首要問題。同時,也需要保護金融機構自身的知識產權免遭傳染性許可證侵害。目前,國際公認的開源許可證91種,主流使用的許可證也有9種(截至2020年12月19日,OSI),其中大多采用英文編寫,只有木蘭許可證采用中文編寫。金融機構需要有具備熟悉許可證特性與要求的法律法規團隊支持,并建設在開源軟件全生命周期內動態管理、定期掃描,發揮監控、評估等能力。缺少運維支持服務
262、風險開源軟件相較閉源商業軟件缺少完善的運維保障支持。對開源軟件應用中出現的安全漏洞、隱私風險,金融機構需要自行分析解決。此外,金融機構對開源軟件二次開發的代碼,因其針對金融特定場景不具有通用性,在開源軟件進行大版本升級后,金融機構仍需要重復開發、測試、上線。開源商業模式運營公司的不可持續服務風險開源軟件獨特的商業運營模式,使成功的開源軟件幾乎都由成熟商業組織推動,在無法為其商業模式帶來流量、關注度等回報,或開源軟件的存在對其盈利造成影響時,開源軟件將面臨人員投入、資金支持、代碼貢獻調整的風險。缺少統一安全管理風險金融行業普遍應用了成千上萬的開源軟件,開源軟件之間的依賴關系趨于復雜,管理成本較高
263、。開源軟件間安全漏洞、后門風險的連鎖傳播,須進行有效漏洞管理。對外參與和對外開源程度不足金融機構整體上在開源產業生態鏈中貢獻度較低。傳統銀行科技團隊面臨的挑戰更多,對外開源的內部流程更復雜、孵化時間更長。開源供應鏈風險層出不窮隨著軟件供應鏈開源化趨勢日益明顯,供應鏈風險也隨之愈發復雜和多樣化,主要包括了斷供風險和攻擊風險。4.1.3 金融行業開源發展前景與趨勢和開源供給側合作更加緊密2023 中國開源發展藍皮書107金融行業開源已廣泛應用,開源軟件方面的專業服務需求日益旺盛,和開源商業公司、開源技術服務公司、開源軟件安全服務公司、開源治理咨詢公司的合作將更加緊密。生態共建步伐進一步加快金融行業
264、在意見的指導下,在北京金融科技產業聯盟開源專委會的組織下,通過FOST平臺和OFTP平臺,將進一步分享開源技術應用經驗,共享開源技術研究成果。通過各類團體,行業合作共建步伐將進一步加快。對外開源意義進一步普及各類機構在開展生態共建的基礎上,將進一步了解對外開源的意義并逐步熟悉對外開源能力建設方法。4.1.4 金融行業開源發展建議金融機構應合理制定開源規劃金融機構應在IT頂層規劃設計,加強開源軟件使用、開源治理、開源人才隊伍建設方面的規劃,實現開源核心技術的自主可控。金融機構應加強開源安全管理金融機構應加強開源風險意識,提升開源工作認知度和參與度,建立統一安全管理機制,破除開源引入障礙,規范開源
265、全生命周期管理,推動適合開源的組織架構調整,指導金融機構建立開源辦公室,配備相應的開源法律合規團隊,切實掌握開源使用規模、復雜度,對已存在的安全漏洞、許可證合規風險主動防控處理。金融機構應積極參與開源生態建設,加強開源社區互動金融機構應走出以使用為主的單方模式,在貢獻開源、主動開源、開源慈善捐贈等方面主動投入和布局,加強與協會、聯盟、基金會等社會組織合作,和開源社區互動,推動開源供給側參與金融開源工作,積極參加編制開源標準,促進金融行業開源生態可持續健康發展。4.2 開源在汽車行業的應用4.2.1 2022-2023年全球汽車軟件開源生態2023 中國開源發展藍皮書1082022年,汽車行業的
266、戰略技術儲備通過成本及供應鏈的棱鏡,在市場表現上展露明顯,技術架構也隨著軟件比重及EE架構進入了新的雙螺旋進化模式。目前各車企根據自身供應鏈條件的不同,也正處于不同的發展階段。軟件定義汽車正在通過軟件的技術、基礎技術的普及、科技團隊的引入影響汽車行業,促使整個行業進入到一個新的發展階段?;谝陨系男袠I發展趨勢,軟件的比重在汽車研發時間以及成本上均上升迅速,據麥肯錫的預測,到2030年軟件的比例將達到30%。2025年汽車軟件的市場規模將達到620億美元,尤其是網絡,車用芯片,V2X架構以及云端基礎設施的完善,“硬件預置、軟件解鎖”的產品策略將會出現在汽車的多個功能域中。要做好靈活的上層架構,需
267、要在性能強大的硬件架構基礎上,有一個“可編程”“安全成熟”“生態豐富”的車用操作系統。因此,車用操作系統成為車企核心競爭力的基石。但由于底層操作系統的投入巨大,產出不明確,現在大多數車企還是采用了商業化的成熟產品,比如QNX、VXWorks等,成熟產品的好處是可以非常高效地完成汽車的研發。但這些都基于相對固定的供應鏈體系,如果想要在產品設計上有豐富的擴展性和靈活性,使用商業軟件,需要付出昂貴的成本以及可能存在的供應鏈被控風險,因此,還有很多廠商,投入了巨大的研發進行“全棧自研”,鮮有成功的案例。從產業角度來看,需要有一種方式聯合操作系統的硬件環境,需要熟悉操作系統的科技公司和科研機構進行合力共
268、建,對產業共性的問題進行解決,當然,還有很多的中間件以及工具,也是重要的基汽車技術架構進入雙螺旋進化模式2023 中國開源發展藍皮書109礎軟件。2022年涌現了非常多的組織,例如OpenSDV、Eclipse的SDV工作組,中國智能網聯汽車產業創新聯盟的基礎軟件工作組等等。大家都在尋求一種新的共建模式,需要有一定的組織形式,有共同的代碼共享存儲,有活躍的參與者組成的社區,這就是產業需求衍生的開源模式。汽車因為供應鏈很長,涉及面非常廣,汽車軟件的復雜度也很高。同時,隨著開源軟件的引用、供應商大量使用開源中間件或組件進行交付,在車企進行SBOM管理時迎來了巨大的挑戰,需要有一個跨部門、跨組織、跨
269、權限的協調組織出現,進行資源、流程的配置與管理,因此,開始引入了OSPO(Open Source Program Office)。這在大型互聯網企業相對成熟,對于企業在使用外部開源組件/項目的合規,以及代碼開源到外部的流程負責,協調研發、產品、市場、法務、人力進行綜合的管理,在用好開源的同時,也遵循開源世界的游戲規則,更好地融入其中。比如在2022年7月,極氪汽車成立了自己的OSPO,取名為極氪開源合規審查小組。在同期,長安也正在考察開源軟件辦公室的作用和意義,最終還是以知識產權相關部門為驅動,在合規上進行把關。4.2.2 問題、機遇與挑戰從當前的生產模式和電子電氣架構在大多數車廠的發展階段,
270、車企在整體開源生態上,還是一個使用者的角度,Tire1和Tire2廠商在基礎技術的投入、技術要更深入。從車企以及軟件供應商和集成解決方案的提供商來說,需要從引入開源軟件或組件入手,逐漸規范起來,迎接開源帶來的無限可能,也正視可能的風險。開源合規與供應鏈安全根據新思科技發布的2023年開源安全和風險分析報告,2022年,在汽車所在領域(航空航天/汽車/運輸和物流),100%的代碼庫包含開源代碼,開源代碼占所有代碼的73%;65%左右的代碼庫包含許可證沖突(遠高于全體樣本的53%);63%的代碼庫包含高風險漏洞(遠高于全體樣本的48%)。2022年9月,美國發布了備忘錄(M-22-18)通過安全的
271、軟件開發實踐增強軟件供應鏈的安全性,歐盟發布了提案關于具有數字元素的產品的橫向網絡安全要求(網絡彈性法案),對軟件安全提出了相關要求,涉及符合性聲明、軟件材料清單(SBOM)、漏洞處理流程、第三方評估等多個方面。在這種情況下,即使沒有海外法規的倒逼,我們也應該關注到使用或應用開源可能存在以下風險:可能會有安全漏洞;可能在整合過程中出現Bug;可能存在潛在的合規性問題,例如許可證和出口管制風險。2023 中國開源發展藍皮書110針對上述幾個現狀問題,開源軟件的規范化使用以及合理的開源協議的使用,要盡可能地減少風險以及為應對海內外法案做好前置準備:合理地建立開源組件的白名單機制,從可信的托管服務商
272、或基金會取得高質量、有限的開源組件;增加對于公司開源加密算法數據庫管理的要求,以及加密算法審查備案機制;安全團隊記錄使用的組件來源,做好SBOM動態采編,并跟蹤組件的漏洞報告,明確和優化組件選型和進入流程;法務團隊了解該組件的法律合規需求,并提出風險建議,目前企業在開源軟件的合規性問題上,主要關注許可證風險和出口管制風險。前者主要是開源風險、知識產權風險、對外展示風險。后者在于開源加密算法的使用;通過組建專門的或虛擬的OSPO團隊,從各部門協助監控整個流程的執行;在對外輸出服務或發布軟件時,工程師可以根據組件來源快速梳理使用的開源組件清單,并明確當前版本的漏洞閉合以及協議使用情況,了解最優及最
273、糟的安全狀態,可以高效地應對安全/合規的不同場景輸出。新技術探索GPT(Generative Pre-trainedTransformer)技術在多個車企內部的SOA中均有所提及,除了從應用端解決類似智能客服的問題外,如果可以訓練GPT參與到代碼編寫過程,不僅可以規范化和模塊化可靠的代碼塊,也可以盡可能減少人為錯誤。通過GPT將具有功能安全不同等級要求的代碼風格,結構和關系樹結合到開發流程中,開發滿足功能安全要求或者適用于汽車座艙環境的代碼。要達到這樣的效果,需要對模型進行大量的訓練,給予正確的邊界理解,讓GPT可以在汽車這種垂直領域的軟件開發中貢獻力量。這里也不可避免的需要參與單位通過開源、
274、開放的形式,在數據樣本、編碼要求上進行共享,促進整體行業的技術進步。4.2.3 主要問題的解決思路及建議產業的技術更迭太快,人才的儲備不足通過調研,最近五年的汽車行業技術更迭,超過了過去十五年的綜合。對于汽車行業的人來說,需要學習和了解軟件技術,而熟悉軟件技術的人,極少有熟悉汽車這種垂直行業的,因此現在人才的引2023 中國開源發展藍皮書111入、培養、梯隊都非常有挑戰。但通過開源,或許是過渡時期解決人才短缺的一個可行路徑:芯片企業通過低成本的模擬仿真工具,讓開發者,尤其是學生開發者可以盡早的進入到這樣的開發環境;車企需要通過聯合實驗室的形式,將汽車所需要的技術以課題拋出,讓開發者可以早日接觸
275、到真實需求;科技企業需要引入和參與到Tire1和車企,完成對產業的理解;開源開放,多鼓勵汽車相關領域的開源社區,以不同的主題,給跨界的人才尋找也就方向,逐漸形成大的生態。合規使用開源,需要車企重視無論是外部的逼迫,或者是我們從開源生態的建設來看,都需要建設規范的使用和參與開源。在出海的需求驅動下,車企和軟件供應商等需要開始儲備SBOM或者相關的管理措施。需要發出源自中國供應鏈體系的聲音,破解很多年的規則和要求底層系統的兼容性,以及外部工具軟件的硬件清單,其實就是汽車供應鏈角度的朋友圈,國內鮮有企業能夠參與決策,需要通過底層系統的開源,構建和發出可控供應鏈體系的聲音。另外,在功能安全角度,車用系
276、統已經發生了架構上很大的變革,但是現在的判斷標準還停留在幾年前。我們可組織產業內的企業共建,在國際汽車供應鏈體系內發出聲音,也通過生態企業的廣泛應用,形成事實標準,推進團標、國際標準的更新迭代。4.3 開源在工業互聯網的應用4.3.1 2022-2023年工業互聯網開源發展現狀工業互聯網自2017年上升為國家戰略以來,在政策與市場雙輪驅動下,呈現快速發展態勢,國家級雙跨平臺從最初的10家已經發展到29家,面向行業和專業領域的工業互聯網平臺更是達到幾百家,體系架構也從1.0進化到2.0。2023 中國開源發展藍皮書112工業互聯網高速發展,部分功勞應歸功于開源軟硬件的助力。目前,工業互聯網通用技
277、術領域開源項目較多、成熟度相對高,但不可忽視的是,深入到OT層、傳統制造領域,開源項目相對少、成熟度也較低,且核心開源項目以國外為主。推動開源開放技術體系,對加快我國工業互聯網發展具有重大意義。近年來,我國也涌現了一批優秀的工業互聯網開源項目,整體呈增長態勢。工業互聯網邊緣側碎片化程度高,開源技術發展空間廣闊工業互聯網邊緣側主要是通過物聯網技術實現工業設備數據接入能力、協議解析與數據預處理,整個服務市場呈現碎片化的形態,為開源技術提供了更廣闊的發展空間。從通信網絡、連接協議到物聯軟件、時序數據庫,都存在大量優秀開源項目,我國開源項目表現也相當亮眼。工業互聯網功能視圖平臺體系框架2023 中國開
278、源發展藍皮書113在網絡方面,5G開源項目較多,包括Open5Gs、Free5GC和Magma等,NB-IoT、LoRa、ZigBee等相對少。在連接協議方面,MQTT、CoAP、OPC UA、AMQP、XMPP、DDS等都是開源協議,基于標準協議的開源項目也較多,其中,中國的開源物聯網MQTT服務器EMQX的全球下載量已超千萬。工業協議方面,由于傳統工業廠家的市場格局和商業利益,大多數工業協議都是封閉化設計,較少開源。在物聯軟件方面,從組件到整個平臺軟件都有典型開源項目,包括消息隊列Kafka、Pulsar,規則引擎Node-RED、EMQ X IoT Rule Engine,開源物聯網平臺
279、ThingsBoard、IOT DC3、Kaa等。此外,為了物聯網邊緣計算構建通用開放框架,2017年6月,Linux基金會主持成立開源邊緣計算框架EdgeX Foundry,提供開源微服務的集合,用于統一工業互聯網邊緣計算解決方案的生態系統。在時序數據庫方面,近幾年一直處于高速發展階段,開源項目更是層出不窮,權威排名DB-Engines TimeSeries熱度前五中,包括第一名InfluxDB在內的4個都是開源項目,國內的開源時序數據庫TDengine、Apache IoT DB排名也比較靠前。工業應用開發環境逐漸轉向低代碼模式,開源項目正在興起工業互聯網的價值在于重構工業知識創造、擴散、
280、復用新體系。工業知識往往掌握在專業技術人員手中,低代碼、零代碼的工業應用開發環境為這些技術人員提供一個標準化、易用的編程環境,通過統一的編程語言,實現流程、邏輯、經驗、算法、規律等工業知識的快速封裝,已經成為填補技術人員的開發技能的有效工具。目前,國內低代碼、零代碼創業型公司和產品眾多,開源項目較少,正處于興起階段。百度開源了amis前端框架,阿里巴巴開源低代碼引擎LowCodeEngine。浪潮開源低代碼內核UBML,并發布了具有完整企業級應用能力的海岳低代碼平臺inBuilder社區版。雖然國內低代碼平臺目前取得了很多不錯的成果,在低代碼平臺開發類型上對OT類應用仍支撐不足,期待開源社區帶
281、動在這方面的持續深化發展。工業數據管理領域以開源為主導,多種技術和架構并存工業數據管理與服務通過大數據技術提供面向海量工業數據提供數據治理、數據共享、數據可視化等服務,是工業互聯網發揮工業大數據價值的重要一環。大數據技術與開源之間有著密不可分的關系,目前市場上應用最廣泛的大數據技術棧還是以開源大數據框架Hadoop與開源通用內存并行計算框架Spark為核心的生態系統。近年來,以Hadoop為核心的開源大數據體系,逐漸向多元化技術并行發展。一方面,原有Hadoop2023 中國開源發展藍皮書114體系的產品迭代趨于穩定,一些常見的開源組合,比如Flink+Kafka、Spark+HDFS等,經過
282、開源生態市場的檢驗,已經成為相對固定的標準化選擇。另一方面,大數據技術生態也在向流處理、數據可視化、交互式分析等方面探索。隨著云原生的發展,與云原生結合更緊密的Airbyte、Flink CDC、SeaTunnel、InLong等項目也得到了飛速發展。工業數字化工具成熟開源項目少,主要集中在歐美發達國家工業數字化工具融合數字建模、數字仿真、數字孿生等技術,提供產品、設備、工藝和系統的三維設計、仿真、展現、優化等,是工業自主可控的關鍵,是工業互聯網的重要工具,其中,幾何內核、約束求解器、3D引擎是工業數字化工具核心技術,屬于高技術含量、高研發投入、高應用門檻產業,成熟技術高度集中在歐美發達國家。
283、目前全球市場上只有少數內核廠商,其中,CGM、ACIS、Parasolid、Granite屬于第一梯隊,分別屬于法國達索(前兩個)、德國西門子、美國PTC,這些技術雖然閉源,但應用廣泛;Open CASCADE(OCC)是目前世界上為數不多的開源幾何內核,由法國Matra Datavision公司開發,基于OCC的CAD軟件有FreeCAD、HeeksCAD、AnyCAD等。在約束求解器方面,西門子的DCM是全球最成功的商用幾何約束求解器,處于壟斷地位,其他還包括達索的CGM、俄羅斯LEDAS的LGS,知名度也較高。因此市面上的開源約束求解器也眾多,但是大多數是限定于某些細分領域或來自于研究性
284、項目,例如OpenFOAM、FEniCS、Elmer、Salome-Meca等。在3D引擎方面,國內開源項目處于空缺狀態,目前主流的引擎包括商業引擎Unity Technologies公司的Unity,和開源引擎Epic Games公司的UE、Analytical Graphics公司的Cesium、Mr.doob個人開發的Three.js等,其中,UE以逼真的渲染效果著稱,在游戲開發中應用較多,工業領域也有一些項目在應用UE;Unity、Cesium、Three.js在工業領域應用較廣泛。國內積極探索工業模型開源開放,促進工業知識的沉淀、復用和迭代創新工業互聯網的核心資源是工業模型,即工業知
285、識的模型化、標準化表達。工業模型的跨系統流轉、交付、應用,極大促進了工業知識的共享與發展。統一建模語言具有領域無關的通用模型描述能力,基于統一建模語言的方法能夠實現復雜系統的不同領域子系統模型間的無縫集成。歐洲仿真協會EUROSIM于1996年推出多領域統一建模語言Modelica,經過多年發展,目前Modelica標準庫已經包括了不同物理領域的1600多個模型組件,基于Modelica發展出來的商業軟件、開源軟件也非常多,2023 中國開源發展藍皮書115Modelica模型可以在這些軟件中自由流轉。除了Modelica外,工業界大部分成熟的建模工具都建有自己的模型庫,例如Simulink建
286、模工具在產業界、學術界被廣泛應用,自帶對象模型庫、算法庫、控制系統、環境模型、基礎元器件模型庫等,但這些模型并不是免費開放的。國內工業互聯網發展始終提倡加速工業知識的沉淀、復用和迭代創新,其中,同元軟控通過打造工業知識模型互聯平臺MoHub,構建了一個覆蓋函數庫、模型庫、App庫服務的模型社區,開發者以開源方式分享到社區的模型庫,支持海量用戶參與到工業知識模型的開發、分享、創新應用過程。工業App基于應用商店模式加快開源開放步伐工業App是基于工業互聯網,承載工業知識和經驗,滿足特定需求的工業應用軟件,本質是企業知識和技術訣竅的模型化、模塊化、標準化和軟件化。開發者社區是開發工業App的主要推
287、動力,平臺和微服務框架降低了工業App開發的難度和門檻,大量的開發者都可以參與開發工業App。面向特定工業應用場景,激發全社會資源形成生態,推動工業技術、經驗、知識和最佳實踐的模型化、軟件化和封裝,形成海量工業App。應用商店是向企業用戶提供的工業App分發渠道,是促進工業App應用生態繁榮發展的有力支撐。在應用商店模式下,來自不同制造商的工業App可以跨平臺運行,相互交互,具有一致的語義,按照共同的標準工作,并且對所有社區開發者開放。目前開發工業App的核心技術主要由國外公司把控,國內整體開源產品較弱。開源可成為顛覆傳統工業App的重要武器,國內企業開始布局探索,開源意識逐漸增強,傳統優勢企
288、業和創新性企業加快開源布局。在應用商店模式下形成開放的應用程序生態系統后,工業App領域會向傳統PC軟件市場一樣取得蓬勃發展。開源工業軟件成果豐富,國內積極探索破局之路工業軟件是工業互聯網的核心力量,近年來均涌現了大量開源工業軟件。在研發設計類軟件方面,有開源免費的用于3D建模的FreeCAD、2D建模QCAD社區版以及基于QCAD的一個開源分支發布的LibreCAD等開源軟件。目前開源CAD軟件供個人使用表現的比較出色,但仍然無法在大型企業直接代替AutoCAD的直接模擬。在工業設備中常見的生產控制類軟件可編程邏輯控制器(PLC)方面,OpenPLC、Beremiz、Apache PLC4X
289、等都是非常優秀的開源PLC軟件。開源的ERP、CRM類業務管理軟件數量也已形成規?;鷳B,如Odoo。我國工業軟件在國家的大力扶持以及各類企業的不懈努力之下,發展步伐明顯加快,但仍存在高端工業軟件缺位、本土工業軟件應用困難等問題。工業軟件的破局之路艱難,開源不失為一種新的思路。2022年7月,開放原子全球開源峰會成立OpenAtom openCAX工作委員會,在開源領域布局了一批共性關鍵技術,聯合構建OpenDACS開源EDA平臺,2023 中國開源發展藍皮書116聚集國內優勢力量,共同探索工業軟件發展新路徑。工業互聯網開源社區整體發展良好,與實際產業聯系仍需加強目前工業互聯網領域應用比較廣泛
290、的開源項目,其社區發展也比較活躍,如Eclipse IoT、Linux Foundation、OPC Foundation、FreeRTOS、Zephyr等。其中,Eclipse IoT提供了基于Eclipse的開源工具,包括開發工具、測試工具、運維工具等,這些工具都能夠支持工業領域的物聯網應用開發和測試。Eclipse IoT的社區正在快速成長,145+的創新組織都致力于加速采用由Eclipse IoT社區開發的商業級、生產就緒的開源技術。OPC Foundation推動了OPC UA協議的發展和普及,積極參與了各種工業物聯網協議的制定,提高了標準的普適性和實用性。僅2019-2022年,O
291、PC Foundation基金會成員就增加了150多名。截至目前,全球已有超過920家OPC基金會成員和數千個符合OPC標準的產品。但是,許多其他工業互聯網領域的開源項目,由于沒有形成實際的產業應用,發展相對滯后,仍需要進一步改進與完善。如EdgeX Foundry項目,由于其與實際工業應用場景不夠貼合,該項目會員數發展至今仍低于100,且在GitHub上僅三十多人貢獻了代碼倉庫。4.3.2 工業互聯網開源發展的問題與挑戰工業互聯網開源要得到長足發展,必然面臨開源領域普遍會遇到的供應鏈風險、代碼安全風險、知識產權風險、自主創新風險,同時,還要解決自身領域存在的開源發展問題與挑戰。平臺層工具軟件
292、開源運營成本高、傳統商業模式獲利難工業互聯網平臺發展迅速,國內頭部廠商紛紛搭建了雙跨平臺,我們仔細研究這些平臺,就會發現重要部件幾乎都用到了開源軟件。但平臺型軟件商業巨頭,往往體量大,在市場競爭中處于優勢地位,通過采用開源軟件、工具搭建商業工業互聯網解決方案,實現快速推廣并獲利,而這些開源軟件、工具的創新型廠商由于體量小、整合能力有限,沒有提前布局商業,再加之開源運營成本高、難以獲利,往往給別人做了嫁衣,自身發展后勁不足,長此以往不利于工業互聯網基礎軟件開源生態發展。工業互聯網技術門檻高,跨大量開源組件構建平臺往往導致深度整合和優化不夠工業互聯網融合OT、IT、CT等多個領域技術,實現深度整合
293、和優化是一件非常復雜且困難的事情,開源項目在這方面存在非常多的市場機會,開源軟件、工具可以免費獲取源代碼,對于有一定IT能力的企業來說,具有較好的經濟效益。例如大部分軟件廠商、工業企業往往會選擇Kubernetes、Istio、Docker等快速搭建工業互聯網平臺。開源軟件雖然使用簡單、經濟,但往往也面臨著“免費即最貴”2023 中國開源發展藍皮書117的尷尬局面,開源技術的大規模商用需要充分的評估與實踐,需要技術團隊同時掌握很多不同領域的開源組件,并且能融會貫通、知道如何將這些組件更好地組合到一起。但大部分中小軟件廠商或傳統企業沒有足夠的專業人才,缺少融合多個開源軟件系統的一整套解決方案,往
294、往面臨因軟件版本不統一的兼容問題、因參數配置不合適的性能問題、因缺少技術支持的運維優化困境,導致深度整合和優化不夠。工業互聯網各子技術領域開源發展不均,缺乏核心工具的開源工業互聯網邊緣層、PaaS層、應用層,由于各層功能與技術差異,其開源發展不均,國內更是少見核心工具的開源。邊緣層主要提供協議解析、工業數據接入及預處理等能力,國內外開源項目較多,如設備網關接入方面有NEURON、MQTT、ThingsBoard、EMQX等開源項目,但受制于工業協議的多樣性,多數開源項目都無法做到協議適配的通用性。PaaS層主要提供工業數字化工具、工業數據管理服務、工業模型管理服務等工具及通用能力,因商業用途及
295、專業工具的技術門檻高,廠商往往選擇封閉發展,構建技術壁壘,核心開源項目較少,尤其三維設計、仿真優化。不過,近幾年隨著Open CASCADE等開源數字化工具的出現,逐漸打破了AutoCAD等主流封閉軟件的壟斷局面。應用層方面,傳統研發設計類軟件、生產控制類軟件、業務管理類軟件和工業數據軟件中,均涌現出了大量開源軟件,如開源ERP Odoo、Apache基金會旗下的Apache OFBiz項目,已經有了較大的應用生態。但從整體發展來看,工業設計類軟件、工具仍需加強布局。邊緣側工控系統、協議相對封閉,影響設備的互聯互通邊緣側工控設備(PLC、DCS等)以及工控協議經過20年間的發展,一方面激烈的市
296、場競爭刺激了西門子、施耐德、歐姆龍等國際廠商產品快速迭代升級,另一方面也構筑了設備互聯互通的壁壘,各家廠商所采用的PLC編程和通訊交互方式不盡相同,衍生出不同類型的通信協議,雖然極大的增強了自身向上層的數據傳輸能力,但這些協議大部分是采用封閉設計,彼此不兼容,用戶無法擴展或自定義系統、協議以滿足其特定需求。目前邊緣側工控系統、協議的開源程度雖然不是很高,但還是有一些有影響力的開源項目,例如,OpenPLC是一個開源的可編程邏輯控制器,Open Industrial Linux是一個基于Linux的開源工業操作系統,還提供PLC、HMI工業自動化應用程序。4.3.3 工業互聯網開源發展前景與趨勢
297、當前,開源已成為工業互聯網領域的重要開發模式,工業互聯網各技術領域越來越多的采用開源代2023 中國開源發展藍皮書118碼,自身的開源化趨勢也越來越明顯。工業互聯網開源正在向垂直行業解決方案、海量工業App、工業技術為主的OT層滲透。工業互聯網依托開源社區與生態發展垂直行業解決方案我國石化、鋼鐵、電子信息、家電、機械、汽車、裝備、航空航天等垂直行業廣泛應用了工業互聯網技術能力。各垂直行業的工業互聯網實施業務場景相對獨立、應用領域不盡相同,應用深度參差不齊,實施路徑也存在差異,如何打造更多的垂直行業解決方案,將單獨部署的工業互聯網項目拓展和融合達到行業規?;?,是工業互聯網高速發展必須解決的問題。
298、開源社區可以使跨地區、跨領域的專業人才之間通過開放式的創新生態實現深度交互與智慧共享,讓更多的人參與到垂直行業解決方案構建中,從而提高項目的數量和質量。面向垂直行業的工業模型、插件類開源項目將逐漸增多。工業App需求繁雜,低代碼工具開源能夠加速創新效率工業App涉及研發設計、生產制造、運維服務和經營管理等不同領域與環節,個性化強,對象眾多,關系非常復雜,體系龐大且需求繁雜。低代碼開發工具沉淀過去十幾年策劃、開發、應用工業App的經驗,參考工業產品制造模式形成一些典型模型和架構模式,提供低門檻應對復雜需求的開發方案。低代碼開發工具通過生態聯盟,由多家企業專注其擅長的部分,彼此協同發展,可以不斷積
299、累工業App模式,構建領先的產業集群。開源是建立這個生態聯盟的有效方式,通過開放源代碼,聚集各個行業工業App的領先廠商,彼此打通、串聯,共同推動沉淀工業軟件、智慧城市、智能制造等領域的低代碼模型,應對繁雜的工業App需求,提供低門檻開發方案,加速工業互聯網領域創新效率。工業互聯網技術開源由IT層邁向OT層IT層主要涉及計算機、互聯網、應用軟件等,其軟件系統相互連接,通常運行在iOS和Windows等流行的操作系統上,缺乏自主性,軟件開發規范、使用標準解決方案以及流行的通信協議,應用場景廣泛,因此開源項目較多。相比之下,OT層主要涉及機械、工控網絡、工控系統以及跨工業協議的通信,系統一般是自治
300、的、隔離的、自包含的,運行在專有軟件上,與傳統計算機編程不同,應用場景也涉及更多專業知識和技能,因此OT層開源項目一直發展緩慢。隨著IT與OT融合越來越深,OT層也開始尋求標準化的發展道路,IT與OT之間的界限正在被引入連接設備的OT系統和物聯網的興起所模糊,OT層的開源項目也會逐漸增多。2023 中國開源發展藍皮書119工業互聯網通過開源社區培養專業人才工業互聯網領域開源項目蓬勃發展,開源軟件的易獲取性讓眾多高校學生、企業人才可以低成本的接受并使用開源軟件,同時開源社區中匯聚了眾多有著開源精神和探索精神的開源貢獻者,開發者可以在社區中獲取到軟件源代碼、與更多的業內優秀從業者進行協作、擴充個人
301、技術圖譜和技術棧等,因此開源社區也成為了工業互聯網領域人才培養的重要基地。高校是人才培養的重要來源,高校學生也可以通過開源社區開拓技術視野,鍛煉協作能力。通過一系列的開源校園行活動可以有效推進開源文化、開源實踐在高校的普及,促進高校開源人才培養、加強高校人才參與到企業開源實踐,為工業互聯網行業提供源源不斷的人才供給。4.3.4 工業互聯網開源發展建議鼓勵龍頭廠商積極參與工業互聯網開源發展,布局重點領域的開源項目工業互聯網龍頭廠商是產業技術創新的主要推動者,是產業高質量發展的重要依托。工業互聯網龍頭廠商應積極發揮產業創新過程中的融通引領作用,參與開放原子開源基金會組織的重點開源活動、開源項目,共
302、同營造良好的工業開源文化氛圍,開展產業開源頂層設計與總體規劃布局,打造中國工業互聯網頂級開源社區,組織引導產業鏈上下游企業圍繞核心技術領域孵化CAX、PLC等優質工業互聯網開源項目,加快形成我國工業互聯網發展新優勢。開源社區倡導開源文化,激發工業領域的開源氛圍T層和OT層的開源空間都很廣闊,但是由于兩者的應用場景和技術需求不同,開源社區的重心和方向也有所不同。在IT層,由于其應用范圍廣泛,開源也更加活躍。比如,開放原子開源基金會、Linux、Docker、Kubernetes等受眾廣的基金會,以及Apache基金會下的Apache Hadoop、Apache Spark項目等大型開源項目。而在
303、OT層,出于優先保護商業利益,以及應用場景和技術需求相對專業等原因,導致整個領域的對開源的認識和開源氛圍不足。未來,工業互聯網各方力量應積極利用開源社區的資源和平臺,重點推動工業互聯網領域OT層開源活動的普及和推廣,為工業企業提供更好的開源解決方案和技術支持。其次,注重高?;顒訉嵺`,開展校園行、組織開源軟件開發比賽、提供技術講座等活動,提高對開源文化的認知和參與度,進而推動整個領域的開源氛圍。2023 中國開源發展藍皮書1204.4 開源在風洞等場景的應用計算流體力學(CFD,Computational Fluid Dynamics)發展對開源生態建設有重要影響。CFD興起于20世紀60年代,
304、是流體力學與計算機科學相互融合的新興交叉學科,主要通過計算機和數值方法來求解流體力學的控制方程,對流體力學問題進行模擬和分析。90年代初期,隨著計算機性能的優化提升,加速促進了CFD仿真軟件在航天設計、化工處理、半導體等重要工業領域應用。當前,以Fluent(美國ANSYS企業主導研發)為代表的商用CFD仿真軟件已得到廣泛應用,在國際市場的占有率高達70%。為打破商用CFD仿真軟件的壟斷,由英國帝國理工大學Gosman團隊編寫,面向公眾發行的開源流體學仿真軟件OpenFoam應運而生,為用戶提供了可擴展的數值模擬方法和求解器,進一步豐富了軟件業態。而目前,在CFD仿真軟件的商業化和開源應用方面
305、,我國頭部研發力量薄弱,對外依附性較強。為提升本土工業應用軟件的精確度、穩定性和計算效率,國產CFD軟件選擇擁抱開源,通過高效的在線協同機制,匯聚廣大使用者和開發者群體,利用信息化創作環境和大規模在線協同開發工具實現技術協同攻關,共同打造國產自主CFD軟件生態。4.4.1 風雷軟件風雷開源項目即風雷軟件是中國空氣動力研究與發展中心(CARDC)研發的面向流體工程的開源混合CFD平臺。平臺的建立遵循面向對象的設計理念,采用C+語言編程。風雷軟件為了適應結構網格、非結構網格、混合網格、重疊網格等不同網格的計算,設計了具有良好通用性、可擴展性的體系結構和數據結構,實現了在同一個軟件平臺上,同時兼容結
306、構求解器和非結構求解器。兩種求解器可獨立運行,也能耦合計算,即在流場中同時含有結構網格和非結構網格的情況下,在結構網格上調用結構求解器,在非結構網格上調用非結構求解器。風雷軟件作為目前全球唯一同時兼容結構/非結構的開源軟件,其計算范圍覆蓋低速、亞跨聲速和高超聲速。開發過程中,以現代軟件工程方法為指導,結合CFD行業特點,設計了面向下一代的軟件體系結構。4.4.2 IDRLNet物理場的快速仿真與精確反演是飛行器設計和運行監測中面臨的兩個重要課題。在設計過程中,可以通過計算流體力學(CFD)實現物理場數值仿真。但是,CFD數值仿真往往需要消耗大量時間,在計算成本和準確性方面仍然面臨許多挑戰。在飛
307、行器運行過程中,性能監測涉及物理場反演,為2023 中國開源發展藍皮書121滿足實時性需求,數據驅動方法被引入其中。然而受限于傳感器數量和精度,單純數據驅動的方式并不能滿足物理場的重建需求。面對這些困難,內嵌物理知識神經網絡(Physics-Informed Neural Network,PINN)作為一種新興深度學習技術,逐漸被應用到CFD領域中。PINN保持了神經網絡對數據高效利用特性的同時,在神經網絡中內嵌物理知識,從而實現數據與物理知識混合驅動。為解決飛行器設計優化過程中物理場快速仿真問題和運行監測階段物理場精確反演問題,國防科技創新研究院無人系統技術研究中心、智能博弈與決策重點實驗室
308、推出了基于PINN的微分方程智能求解框架IDRLnet。IDRLnet是一款以飛行器設計優化任務為應用背景、基于PyTorch開發的開源框架。IDRLnet主要包括幾何生成、數據處理、神經網絡構建和偏微分方程求解四大模塊。該框架提供了二維與三維的基本幾何對象,并支持幾何對象之間的集合運算。PINN方法的基本思路是對采樣配點上的數據和方程殘差進行擬合,因此,面向該領域學術研究需求,幾何生成模塊提供了內部采樣方法及其對應符號距離場(SDF)、邊界采樣方法及其對應法向量。數據源包括采樣得到的數據節點和外部數據節點,可用于代理模型構建與逆問題求解。該框架內置了多種神經網絡架構與常見微分方程,便于多種方
309、法比較研究。處理復雜物理場時可能涉及較多對象,物理方程與采樣點數據之間的耦合較為復雜。為了應對潛在的復雜關聯問題,該框架在架構設計上解耦了數據源、物理方程、神經網絡之間的依賴,各個計算對象如微分方程和神經網絡相關的計算節點可以進行單獨定義。最后,基于給定數據源,自動獲取需要的依賴結點;構建計算圖,利用拓撲排序構造計算流水線;整合多個流水線,得到最終損失函數,進而利用反向傳播結合梯度優化方法完成訓練??紤]到PINN本身仍沒有發展成熟,更多高效算法亟待開發。因此,該框架提供了回調機制支持用戶自定義算法,使得PINN新方法也容易集成到框架中。IDRLnet包含了大量典型測試案例。首先,面向飛行器設計
310、參數優化問題,IDRLnet在不依賴外部數值仿真提供訓練數據的條件下,能夠實現物理場對設計變量的實時響應,大幅壓縮“設計參數-數值仿真”迭代循環的周期。其次,對于含有異常傳感數據的物理場重建問題,IDRLnet提供多種魯棒優化方法可以對物理場參數進行反演識別。為進一步提升效率與精度,IDRLnet提供了自適應采樣方法,動態改變各區域采樣權重。同時,該框架還支持簡單偏微分方程的變分形式求解。4.4.3 OpenMatrixMATLAB是美國MathWorks公司出品的商業矩陣計算軟件,軟件具有編程語言簡潔易懂、計算功能強大、豐富的領域工具箱等優勢,已成為快速實現算法驗證和生成原型軟件的有效編程工
311、具,廣泛用于科學計算、可視化以及交互式程序設計等設計建模和數值分析領域。自2020年起,我國多家單2023 中國開源發展藍皮書122位被列入美國政府的進出口管制名單,禁止使用MATLAB服務。為實現大型矩陣計算軟件自主可控,解決大量基于MATLAB編程語言的軟件原型遺產代碼問題,同時緩解國產軟件性能不足問題,迫切需要研發一款面向數值計算的高性能矩陣計算軟件。國防科大龔春葉團隊研發的OpenMatrix矩陣計算軟件將對標商用MATLAB軟件,旨在開發構建一款開源的適用于數值計算和科學工程計算的高級語言交互式環境,為計算流體力學、電磁學、氣候氣象等數值計算領域的設計建模與專業分析提供數值計算服務。
312、軟件的定位一方面是解決禁運問題,滿足遺產MATLAB代碼快速適配需求,另一方面是利用高性能計算機實現并行優化,充分發揮計算性能。此外,OpenMatrix矩陣計算軟件著重解決MATLAB并行計算能力弱、性能效率低等問題,針對重要領域開發并行求解工具箱,在不修改源程序的前提下實現性能躍升,利用并行算力優勢彌補軟件水平差距,彌補中美軟件水平差距。當前OpenMatrix矩陣計算軟件版本已具備提供高級語言解釋器,實現了語言的前端解釋功能,支持將MATLAB語言轉換為中間代碼,支持高級編程語言和交互式計算;支持面向高級語言的數據和通用函數兼容技術,提供統一編程接口,能夠用簡易編碼方式支持各類問題的高效
313、試算,減輕使用者的編程負擔和應用性能優化難度;已實現不包括第三方工具箱函數的大部分通用函數覆蓋,包括:初等數學函數庫、基本矩陣函數庫、二維三維圖形函數庫、邏輯字符運算函數庫、調試與控制流程函數庫、時間與日期函數庫和特殊數學函數庫等,支持面向多種程序設計語言的統一外部編程接口,支持不依賴第三方庫的MATLAB程序移植,支持遺產MATLAB代碼的快速適配。OpenMatrix矩陣計算軟件項目的下階段規劃是進一步開發和完善并行求解工具箱,突破關鍵領域算子并行優化,支持用戶利用高性能計算機實現并行計算,使現有代碼充分發揮底層高性能計算系統的算力資源,同時擬開發支持求解偏微分方程組的各種數值方法,包括有
314、限差分、有限體積和有限元方法,提供面向CFD計算的網格生成和自適應細化工具箱;最后充分開放共享,提供海納百川的軟件框架,著重解決標準化接口問題,使潛在的用戶群體都能參與軟件開發,豐富軟件的工具箱和功能模塊。OpenMatrix矩陣計算軟件將迭代發展形成生態,支撐航空航天飛行器裝備設計、環境仿真、密碼分析、生物安全等傳統數值計算領域應用,持續提供高效的數值計算服務。目前OpenMatrix矩陣計算軟件已發布基于天河超算在線版,擬在三年內進一步拓展應用到1000家科研單位,拓展用戶10000名。2023 中國開源發展藍皮書123第五章 開源社區發展現狀當前我們所身處的數字化時代幾乎都是由開源代碼所
315、構建的,伴隨著開源運動在中國的落地與發展,中國的開源社區從最初單一且獨立的社區不斷演進,呈現出今天百花齊放的繁榮景象。本篇集中呈現當前國內各類社區發展的現狀和特點。5.1 開源社區的起源與發展歷程十幾年前,很多人認為“開源=Linux”,因為當時的Linux操作系統、桌面辦公軟件(GNOME、OpenOffice)和瀏覽器(Mozilla)作為開源項目的主戰場,掀起了第一波開源的浪潮。隨著開源項目規模的不斷壯大,開源社區也逐漸形成。國內的開源社區起初以Linux愛好者為主導,最早出現于1998年。不過,早期國內社區多為個人愛好者興辦,社區的發展規模和影響力有很大的局限性,因此中國第一代社區的持
316、續發展能力不足,大多銷聲匿跡。如,于1998年在清華大學成立的阿卡社區(AKA),2000年前后發展到頂峰,但此后受骨干成員出國、成家、創業等影響,逐漸進入低潮期,其中部分人員轉型嵌入式培訓,AKA轉變為亞嵌公司。AKA早期的多數成員后來成為了中國最早的一批Linux精英。2001年創立的灰狐動力社區,最初只是一個關于中間件技術研究和應用純個人網站,到2002年已經成為國內中間件行業極具權威性的站點。但在2010年5月19日,灰狐動力和開源力量宣布合并。創始于2006年12月的哲思社區,在當時是中國知名的自由軟件社區,也已于多年前停更。而其中只有少數幸運的優秀社區因得到企業和產業的廣泛認可而找
317、到生存模式獲得新生,如CSDN逐漸成長為中國最大開發者社區,ChinaUnix社區被IT168公司收購,PHPChina社區被康盛創想公司收購(后期被騰訊整體收購),開源中國社區被恒拓開源公司收購等。后來,隨著互聯網的興起,開源的項目和技術呈現百花齊放之盛況,從數據庫到中間件、從前端到后端、從編程語言到編譯器、從物聯網到微服務、從大數據到人工智能,開源的技術和項目越來越豐富和多樣化。在此趨勢下,自2008年起,中國第二代開源社區紛紛登場。在吸取了一代的教訓后,第二代社區的典型特征是更加聚焦、更加務實,通常是圍繞一個公司的特定產品,且該公司作為社區的唯一或最大贊助商。這類社區包括深度操作系統社區
318、、Ubuntu麒麟社區、龍芯俱樂部、OpenEuler社區等。這些社區的發起團隊普遍具有全球開源視野,同時也認識到知名科技企業在開源生態發展中2023 中國開源發展藍皮書124的核心作用,與企業合作共贏是開源社區發展的關鍵路徑,第二代社區開始有意識地吸納開源布道者、市場專業人士和法律專業人士成為社區的骨干人員。近幾年,隨著移動互聯網和云計算、AI在中國的蓬勃發展,中國開始涌現出大量開源項目的開發者,國內開源社區進入第三代。典型代表包括開放原子開源基金會、開源中國社區、木蘭開源社區、GitCode、確實(Trustie)開源社區、OpenI啟智開源社區等。第三代社區的典型特征是在社區運營和管理上
319、更加中立和平衡,且社區內包含不同來源的眾多開源項目。目前中國第三代開源社區仍處于起步階段,在開源治理、社區運營等方面尚顯稚嫩。能夠堅持中立立場、平衡諸多贊助商之間以及與開發者之間的關系,吸引開源治理專家、培養社區運營骨干是第三代社區當前面對的主要挑戰。中國第一代技術社區至今仍堅持運營的屈指可數,最成功的典范就是CSDN開發者社區,作為目前世界第二大的開發者社區,20多年來CSDN為中國培養了幾代開源開發者,同時也見證了中國開源快速發展的20年。2022年4月,CSDN成為開放原子開源基金會黃金捐贈人。也通過擴大對開發者服務內容(開源知識庫、培訓、獵頭、代碼托管平臺、開源項目孵化和開源創投),身
320、體力行地推進開源產業的發展,正在積極地向第三代開源社區轉型。由企業主導的第二代社區正在積極的與第三代社區(含國際開源社區和開源基金會)合作,通過開源捐贈或發起新項目等多種形式融入第三代社區,如華為將歐拉開源操作系統(openEuler,簡稱“歐拉”)捐贈給開放原子開源基金會,攜程捐贈Apollo項目到Apollo開源社區,百度捐贈HugeGraph圖數據庫給Apache軟件基金會,華為將開源的云原生多云容器編排項目Karmada捐贈給CNCF等。5.2 開源社區的現狀特征據中國開源軟件聯盟不完全統計,截止2023年6月,國內各類開源社區已經超過500個,按照項目型社區、本地化社區、開發者社區和
321、代碼托管社區四類進行匯總,項目型社區增速最為顯著。從開發者規模和開發者合作參與層次上,部分開源社區已經發展到非常大的規模,在社區生態上取得了顯著的成績。5.2.1 項目型社區項目型社區是聚焦特定開源項目,包括代碼貢獻和協作、集成測試、應用實踐、用戶反饋等核心功能,大部分項目型社區由背后的機構或企業來資助或直接運營。具有代表性的項目型社區見后表。2023 中國開源發展藍皮書125社區名領域項目地址項目社區介紹openEuler社區操作系統www.openeuler.orgopenEuler是由OpenAtom Foundation開發和運營的開源平臺。其愿景是通過開放的社區形式與全球開發者共同構
322、建一個開放、多元和架構包容的軟件生態體系,孵化支持多種處理器架構、覆蓋數字設施全場景,推動企業數字基礎設施軟硬件、應用生態繁榮發展。OpenAnolis龍蜥社區操作系統OpenAnolis(龍蜥)社區成立于2020年9月,是一個操作系統開源社區及創新平臺,由國內、外領先操作系統、芯片、云計算公司共同發起,致力于通過開放的社區合作,構建國內自主Linux開源發行版及開源創新技術,推動軟、硬件及應用生態繁榮發展。OpenHarmony社區操作系統OpenHarmony是由開放原子開源基金會(OpenAtom Foundation)孵化及運營的開源項目,目標是面向全場景、全連接、全智能時代,基于開源
323、的方式,搭建一個智能終端設備操作系統的框架和平臺,促進萬物互聯產業的繁榮發展。OpenCloudOS操作系統www.opencloudos.orgOpenCloudOS是一個完全開放中立的操作系統社區項目,由操作系統、云平臺、軟硬件廠商及個人發起。該項目旨在打造全面中立、開放、安全、穩定易用、高性能的Linux服務器操作系統,共同構建健康繁榮的國產操作系統生態。同時OpenCloudOS及衍生版本已在互聯網、金融、政務等12大行業廣泛應用,節點規模超1000萬,經歷了海量業務的長時間驗證。我們秉承科技向善的使命價值觀,是全球首個提出綠色操作系統的開源社區,用實際行動推動綠色數據中心節能減排,助
324、力全球碳中和舉措。深度社區操作系統www.deepin.org深度社區是由統信軟件全資子公司武漢深之度科技于2008年發起,已經持續運營15年,以桌面操作系統為主的開源社區,也是國內規模最大、歷史最悠久、活躍度最高的開源操作系統社區之一,深受全球開源愛好者喜愛,具備相當的國際影響力。RT-thread社區操作系統www.rt-thread.orgRT-Thread是由上海睿賽德電子科技主導開發的開源實時操作系統,它也是集實時操作系統(RTOS)內核、中間件組件和開發者社區于一體的技術平臺。Ubuntu Kylin社區操作系統優麒麟是由麒麟軟件有限公司主導開發的全球開源項目。自創立以來已經有10
325、年的歷史以及技術沉淀,并得到了國際社區的認可?,F累計發行20個操作系統版本,全球下載量3800+萬次,活躍愛好者和開發者20+萬人,累計向開源社區貢獻代碼超400萬行,其中被 Linux、GNOME、Unity、OpenStack、Ceph接收Patch超7400個。OceanBase社區數據庫OceanBase社區版是一款開源分布式HTAP(Hybrid Transactional/Analytical Processing)數據庫管理系統,具有原生分布式架構,支持金融級高可用、透明水平擴展、分布式事務、多租戶和語法兼容等企業級特性。OceanBase內核通過大規模商用場景的考驗,已服務眾多
326、行業客戶,現面向未來持續構建內核技術競爭力。TiDB社區數據庫TiDB是PingCAP公司自主設計、研發的開源分布式關系型數據庫,是一款同時支持在線事務處理與在線分析處理(Hybrid Transactional and Analytical Processing,HTAP)的融合型分布式數據庫產品,具備水平擴容或者縮容、金融級高可用、實時HTAP、云原生的分布式數據庫、兼容MySQL 5.7協議和MySQL生態等重要特性。MongoDB中文社區數據庫MongoDB中文社區是圍繞MongoDB生態建立的中文技術社區,獲得MongoDB官方的認可和支持。社區關注MongoDB以及相關數據產品和工
327、具。來自MongoDB官方的工程師、阿里、騰訊等大型互聯網公司及業界MongoDB專家、MongoDB書籍作者等組成社區核心成員。2023 中國開源發展藍皮書126TDengine社區數據庫TDengine是濤思數據開發的一款高性能、分布式、支持SQL的時序數據庫,其核心代碼包括集群功能全部開源,同時TDengine還帶有內建的緩存、流式計算、數據訂閱等系統功能,能大幅減少研發和運維的復雜度,可廣泛應用于物聯網、車聯網、工業互聯網、IT運維、金融等領域。Apache Kylin大數據kylin.apache.orgApache Kylin是一個開源的、分布式的分析型數據倉庫,提供Hadoop/
328、Spark之上的SQL查詢接口及多維分析(OLAP)能力以支持超大規模數據,它能在亞秒內查詢巨大的表。ClickHouse中文社區大數據ClickH社區為國內最專業最具影響力的ClickHouse開源技術社區,致力于ClickHouse的技術研究、推廣和普及。Apache SkyWalking云原生skywalking.apache.orgSkyWalking是一款分布式系統的應用程序性能監控工具,專為微服務、云原生和基于容器(Kubernetes)的架構而設計。飛槳PaddlePaddle社區人工智能飛槳(PaddlePaddle)是百度開發的一款集深度學習核心框架、工具組件和服務平臺為一體
329、的技術先進、功能完備的開源深度學習平臺,已被中國企業廣泛使用,深度契合企業應用需求,擁有活躍的開發者社區生態。華為MindSpore社區人工智能 用戶型社區用戶型社區主要是開源愛好者自發形成的小型社區,以知識分享、經驗交流和傳播開源文化為主要目標。具有代表性的用戶型社區見下表。社區名社區地址社區介紹LinuxFanswww.linuxfans.orgLinuxFans社區成立于2002年,是一個專注于Linux及開源相關的技術社區及互助論壇,擁有社區發行版Magic Linux。GoCN社區gocn.vipGoCN是中國最專業和最具影響力的Go技術社區。Python中國社區 pychina.o
330、rgPyChina是一個由全球使用中文的Python程序員自發組成的技術社區,面向實習、應用、推廣Python以及相關技術的愛好者,關注Python語言在中國的應用、推廣和學習。由Zoom.Quiet(大媽)和Sting Chen在2014年發起。它的前身是CPyUG(China Python User Group,華蟒用戶組),發源于啄木鳥社區。物聯網自動化社區物聯網與自動化一脈相承,物聯網自動化社區從工業控制和自動化的角度解讀物聯網產業的發展,分享最新動態、技術和應用。Linux人社區Linux人社區建立于2006年,是紅旗Linux最輝煌時期的產物。Linux人社區不僅具有網論壇特性,它
331、還擁有一個具有開發能力的社區團隊。具有代表性的用戶型社區2023 中國開源發展藍皮書1275.2.3 開發者社區CSDN()CSDN(中國開發者網絡)創立于1999年,是全球第二大開發者社區,現有注冊用戶4300萬。秉承成就一億技術人的使命,為IT技術人成長及科技企業發展,提供開發者生態的全方位服務。CSDN在社區基礎上,通過知識云、人才云、開發云三大服務,賦能開發者、研發團隊及科技企業在IT知識學習、人才招聘、研發效能與協同管理等方面的高速成長與發展。開源社()開源社成立于2014年,是由志愿貢獻于開源事業的個人成員,依“貢獻、共識、共治”原則所組成,始終維持廠商中立、公益、非營利的特點,是
332、最早以“開源治理、國際接軌、社區發展、項目孵化”為使命的開源社區聯合體。開源社積極與支持開源的社區、企業以及政府相關單位緊密合作,以“立足中國、貢獻全球”為愿景,旨在共創健康可持續發展的開源生態,推動中國開源社區成為全球開源體系的積極參與及貢獻者。2017年,開源社轉型為完全由個人成員組成,參照ASF等國際頂級開源基金會的治理模式運作。近九年來,鏈接了數萬名開源人,集聚了上千名社區成員及志愿者、海內外數百位講師,合作了數百家贊助、媒體、社區伙伴。木蘭開源社區()“木蘭開源社區”建立于2019年8月,是國家重點研發計劃重點專項“云計算和大數據開源社區生態系統”的核心成果。旨在促進產學研用各方開源
333、領域的交流,推動國家科技創新成果開源,加強企業、科教研單位和行業用戶之間的溝通,推動開源成果轉化落地,同時為各類開源項目提供中立托管,保證開源項目的持續發展不受第三方影響,通過更加開放的方式來打造和完善開源社區生態??尚砰_源社區()可信開源社區共同體(TWOS)由眾多開源項目和開源社區組成,目的是引導建立健康可信且可持續發展的開源項目和開源社區??尚砰_源社區共同體(TWOS)旨在搭建交流平臺,提供全套的開源風險監測與生態監測服務。SegmentFault 思否()SegmentFault 思否()是中國領先的新一代技術問答社區,也是中國最大的黑客馬拉松(Hackathon)組織者。我們為中文開發者提供一個純粹、高質量的技術交流平臺以及前沿的2023 中國開源發展藍皮書128技術行業動態。目前已經覆蓋和服務了超過 1000 萬開發者和 IT 信息從業者,幫助開發者解決了數百萬個技術問題。開