《OSCHINA & Gitee:2023中國開源開發者報告(86頁).pdf》由會員分享,可在線閱讀,更多相關《OSCHINA & Gitee:2023中國開源開發者報告(86頁).pdf(86頁珍藏版)》請在三個皮匠報告上搜索。
1、11/*使用電腦閱讀,獲得最佳體驗11序毫無疑問,開源開發者圈子來看,2023?年是大模型?LLM年、生成式?AI?GenAI?年。一、這自然要從?OpenAI?說起,前一年年底,ChatGPT?的橫空出世,標志著對話式?LLM?開始進入公眾視野,為人們提供了全新的人機交互方式。而?2023?年?3?月,同系GPT-4.0?的發布則將?LLM?的規模和能力提升到一個新的臺階,為?LLM?的廣泛應用奠定了基礎。再之后的?11月份,OpenAI?再發力,GPTs?的到來,“用戶自定義ChatGPT”的能力,更是讓世人領略了?OpenAI?作為LLM?一哥的宏大敘事能力與強勁技術實力。sgpjbg二
2、、New?Bing(Bing?AI)代表了微軟在?LLM?領域的野心和決心,它首次把當時世人能想到最有價值又可行的?LLM應用場景“智能對話+聯網搜索”無縫整合了起來,大有干掉搜索行業和問答社區的趨勢,而后事實證明,全球最強?IT?問答社區?Stack?OverFlow?深受其害。?Google?緊隨其后推出?Bard,作為其首次亮相的對話LLM?產品,無疑具有其里程碑意義,盡管它的首秀并不盡如人意,車翻了又翻。三、Claude?2、PaLM?2、Llama?等模型與產品也展現了?LLM在語言理解和多模態處理能力方面的探索,甚至?Claude?2還一度被譽為實力可以硬剛?ChatGPT。而?M
3、eta?開源的Llama?2?更成為了?LLM?領域開源勢力的典型代表,它的出現,猶如一顆投入平靜湖面的石子,激蕩起層層水波,?“Llama?2?一開源,全球范圍內進入了百?;鞈痣A段”,這個說法一點也不為過。年底的“虛假宣傳”?Gemini?與“磁力鏈開源”?Mistral?8x7B?兩大神作,也憑借不輸?GPT-4?的實力,將?LLM?狂潮卷到天際。四、Stable Diffusion 和 Midjourney 這兩大圖像生成系統的出現,極大地拓展和加速了 LLM 在計算機視覺領域的應用,它們突破了傳統圖像生成方式的局限,僅需要用戶提供文字描述,就可以生成高質量的數字藝術作品。它們的圖像生成
4、質量、樣式多樣性和用戶便捷性都是極大的突破。這為廣大的個人用戶和創意行業提供了強有力的工具,徹底改變了數字藝術內容的創作方式。同時,它們也引發了人工智能在創作領域的倫理和法律討論。LLM 殺進多媒體領域。往后 DALL-E 3 模型升級、Adobe 產品整合 LLM 能力、語音模型 whisper-3 更新、AI 虛擬主播創造等,都是在這條路上的進一步發展。五、AI 編程方面,Copilot 可以根據開發者的代碼提示自動補全代碼,大大提高了開發效率。這也引發了代碼原創性的討論,但它已經實實在在將 LLM 拉進了編程應用領域。六、LangChain 的出現,實現了 LLM 之間的鏈式交互,使多個
5、 LLM 模型串聯工作,發揮各自的優勢,并且可以將LLM 模型與外部數據源進行連接,產生更強大的語言理解和生成效果。這開啟了 LLM 集成應用的新方向,并誕生了一個新的細分領域“LLMOps”。七、“提示詞工程”,這是 LLM 直接催生出來的新“學科”,它的核心在于研究人類如何與 LLM 更好地進行“溝通”,找到讓 LLM 能夠準確理解人類意圖的方法。提示詞工程探索如何以 LLM 可以解析的方式來表達需要它完成的任務,尋找 LLM 的“最佳輸入形式”。通過注入提示詞,提示詞工程建立了一套“人機交互語法”,來更精準地向 LLM 傳達想要它生成何種輸出的指令。這為人們與 LLM 之間建立高效、準確
6、的“溝通橋梁”提供了可能性。什么“鏈式思考11(CoT)”、“自動推理并使用工具(ART)”、“思維樹(ToT)”甚至運用心理學對 LLM 進行“情緒提示(EmotionPrompt)”,提示詞工程儼然在將 LLM 一點一點解剖,試圖讓人類成為可以將其掌控的“咒術師”。八、AutoGPT 的出現,帶著 LLM Agent 的概念進入 LLM發展的新階段。LLM Agent 是一種基于 LLM 的智能代理,它能夠自主學習和執行任務,具有一定的“認知能力和決策能力”。LLM Agent 的出現,標志著 LLM 從傳統的模型訓練和應用模式,轉向以 Agent 為中心的智能化模式。LLM Agent
7、打破了傳統 LLM 的被動性,使LLM 能夠主動學習和執行任務,從而提高了 LLM 的應用范圍和價值;它為 LLM 的智能化發展提供了新的方向,使 LLM 能夠更加接近于人類智能。九、AI 原生,目前還沒有明確的定義,大致是說,不同于當前各種應用在原本的基礎上增加 AI 能力,使其智能化,但它的智能只充當了“輔助”角色;在 AI 原生的語境下,LLM 從一開始就是應用的中樞,應用本身的架構、功能、交互層是圍繞 LLM 中樞來構建的。也許 ChatGPT 是最經典的“AI 原生”應用。此概念目前還處在萌芽期,明確的概念、應用場景、架構、技術棧細節等尚未完成自洽。換一種視角來看,這個概念的提出其實
8、都沒技術什么事,有人稱之為“造商業概念”,這里按下不表。十、鏡頭給到國內。相比國際上當前逢 AI 必 GenAI,國內更多地還是在 LLM 這一層面,Robin Li 的“卷大模型沒意義,卷應用機會更大”,其實很深刻地指出了內中區別。本報告以開發者視角為主,從 LLM 切入,但實際上或多或少與 GenAI 脫不開關系。2023 年國內 LLM 發展活躍,從最初的百度文心一言“硬剛”ChatGPT,到后來各式各樣的大模型與產品出現,覆蓋了不同的領域和場景,構建了多元化的大模型生態。大模型方面,百花齊放:百度的文心一言、抖音的云雀大模型、智譜 AI 的 GLM 大模型、中科院的紫東太初大模型、百川
9、智能的百川大模型、商湯的日日新大模型、MiniMax 的ABAB 大模型、上海人工智能實驗室的書生通用大模型、騰訊的混元大模型、螞蟻的百靈大模型等。另一方面,除了大模型本身,中國在 LLM 相關技術領域也快速迭代發展,諸如 Dify.AI 的 LLMOps、Milvus 的向量數據庫、CodeGeeX 與 Comate 的 AI 編程、對 LLMPrompt 的研究、OneFlow 的深度學習框架。值得一提的還有華為的盤古大模型,其中盤古氣象大模型是首個精度超過傳統數值預報方法的 AI 模型,速度相比傳統數值預報提速 10000 倍以上,能夠提供全球氣象秒級預報。盤古大模型的研究成果在國際頂級
10、學術期刊自然正刊發表,獲得國際學術界的認可。年底,零一萬物推出的 Yi 模型,200K 上下文窗口,可處理約 40 萬字的文本,成為當時全球大模型中最長的上下文窗口。其中 Yi-34B 在 Hugging Face 英文測試榜單中位列第一,在 C-Eval 中文能力排行榜中超越所有開源模型。十一、這一小節,通過一些數據來簡要概述 2023 年的 LLM、GenAI。根據金融數據和軟件公司 PitchBook 的數據,從截至 3 月 29 日追蹤的 9 筆交易來看,生成式 AI 公司的投前估值中位數已經飆升至 9000 萬美元,高于 2022年的 4250 萬美元。PitchBook 的分析師預
11、測,以 32%的復合年增長率計算,到 2026 年,生成式 AI 市場規模將達到 981 億美元。11由英國知名風投公司Air Street Capital 的合伙人Nathan Benaich 等 作 者 聯合 撰 寫 的“State of AIReport 2023”報告,從研究進展(Research)、行業局勢(Industry)、政策影響(Politics)、安全問題(Safety)、未來預測(Predictions)五個維度出發,對人工智能發展現狀和未來預期進行了深度分析。從中我們看到:英偉達憑借各國、初創公司、大型科技公司和研究人員對其 GPU 的巨大需求,躋身市值萬億美元俱樂部;
12、主要芯片供應商開發了不受出口管制影響的替代產品;在 ChatGPT 的帶領下,生成式 AI 的應用在圖像、視頻、編碼、語音等領域取得了突破性的進展,帶動了180 億美元的風險投資和企業投資。OReilly發 布 的“2023GenerativeAIintheEnterprise”報告顯示:54%的 AI 用戶預計 AI 的最大好處是提高生產力。77%的受訪者使用 AI 來輔助編程。其中提到的具體應用包括欺詐檢測、教學和客戶關系管理。AI 用戶表示,AI 編程(66%)和數據分析(59%)是最需要的技能。許多 AI 采用者仍處于早期階段:26%的人使用 AI不到一年,而 18%的人已經在生產中進
13、行了應用。16%從事 AI 工作的受訪者表示正在使用開源模型。意外結果、安全性、公平性、偏見和隱私是采用者測試的最大風險。工業和信息化部賽迪研究院數據顯示,目前,我國已有超過 19 個大語言模型研發廠商。其中,15 家廠商的模型產品已經通過備案,預計今年我國大語言模型市場規模將達到 132.3 億元,增長率將達到 110%。到 2027 年,我國大語言模型市場規模有望達到 600 億元。十二、如果要指出當前 LLM 種種“不成熟”中我最關切的,我會說“LLM 解決方案”。當前 LLM 行業面臨的一個大方向上的問題是:還沒有很好地從“解決方案”的角度去做技術或者應用。所謂“解決方案”,是指在設計
14、和開發 LLM 技術和應用時,首先明確用戶的目標,然后圍繞目標進行技術研發和應用設計,并且它帶有“整體解決”、“解決的不只是某個單點問題”的含義。只有這樣,才能確保 LLM 能夠真正解決實際問題,而不是成為“應付式”的工具?!皯妒健眴栴}主要表現在以下幾個方面:LLM 往往是“一刀切”的,無法根據用戶的具體需求進行個性化定制。LLM 往往是“碎片化”的,無法提供完整的解決方案。LLM 往往是“被動式”的,需要用戶不斷完善輸入。什么意思呢?就是我找 AI 是要解決實際問題的,但它往往都是給我“應付”一下,直接交貨了事了,而不善于去追問本質,去了解細節,去思考你最終想要的是一個什么樣的東西。它需要
15、你不斷完善自己的輸入,甚至有時候可能要求在你自身都不知道“可以想要一個什么東西”的情況下去輸入。這樣的話其實就是你在輸入與輸出:整個事情我都想通了,方案我其實也就都出來了,機器給到我的都只是一個個獨立性的、小而窄的、解決掉一點一點問題的東西。舉個例子,我說我肚子疼,它會直接告訴我肚子疼可能是因為什么,怎樣做可以緩解或者解決,但它不會一點一點進行“望聞問切”全套去引導,了解具體情況,最終再給出切實可行的解決方案。但回過頭來想想,這個話題可深可淺,往淺了說,當前 LLM產品可以幫助人類翻譯、潤色一段文字、提煉論文核心內容,這本身也是較為完整的解決方案;當前 LLM Agent、LLMOps,甚至只
16、是說開發者的各種“工程化組合騷操作”,實際上已經可以把不同模型、不同模態、不同工具和知識源整合,正是在往“提供更完整的解決方案”這一方向上的發展。11往深了說,或許這本質上就是在要求 AGI,而它是一個更長遠的路途了。而如何將更完備的解決方案給到用戶,如何將更平臺化、體系化的生成解決方案的技術給到解決方案生產者,是后續 LLM 應用與技術演進的重要路標。你看 GPTs,直接革掉了多少拿 OpenAI API 去套殼的“創新應用”的命?十三、報告介紹作為2023 中國開源開發者報告的引導,這里還是把話題拉回來,簡介一下整個報告。前邊講到的 LLM 領域大放異彩,自然是會作為報告中的一個重要部分,
17、我們策劃了一個2023 LLM 技術報告篇章,整體圍繞 LLM Tech Map 梳理邏輯來展開。從基礎設施、大模型、Agent、AI 編程、工具和平臺,以及算力幾個方面,為開發者整理了當前 LLM 中最為熱門和硬核的技術領域以及相關的軟件產品和開源項目。是的,先整理了一個 LLM 技術圖譜,欲知詳情,請查看后續正文?!鹃_源治理】開源健康發展必不可少的一環?!居埠税l版】最硬核、最極客的年度發版匯總!【熱門話題】回顧 2023 年度熱門開發者事件!【重磅官宣】2023 年度開源官宣?!綬.I.P.】謹以此篇紀念今年離我們而去的行業巨擘。https:/ Insight:中國開發者開源新動向是關于開
18、源開發者數據的,采用 Gitee與 OSS Compass 作為數據來源,試圖通過數據來反映2023 年開源開發者圈子的相關情況。這里提取幾個亮點數據:TypeScript 是增長最快的編程語言,增長率達到49.04%MulanPSL-2.0 在“2023 年使用增長率最快的開源許可證”中排行第二,增長率為 18.34%較為活躍的社區代表:OpenHarmony、openEuler 與MindSpore歡迎查閱、分享。除了 LLM,開源開發者圈當然還有更多高亮事件,我們在此次年度報告中整理成了另一個篇章開源開發者事件回顧,這一篇章梳理成了 9 個大塊:【AIGC】回顧 2023 大語言模型 L
19、LM 元年的重磅事件?!?024 黃金眼】關注 IT 相關民生事件,以老百姓的眼睛看 IT 圈,和開發者零距離接觸?!卷椖客8康搅嗽撜f“再見”的時候了,江湖有緣再見?!旧a事故】冥場面!速來圍觀 2023 十大生產事故“名場面”。11目錄一、開源開發者事件回顧三、中國開發者開源新動向二、2023 LLM 技術報告 46|向量數據庫向量數據庫 47|數據庫向量支持數據庫向量支持 48|大模型框架、微調大模型框架、微調 51|大模型訓練平臺與工具大模型訓練平臺與工具 53|編程語言編程語言57|知名大模型知名大模型 58|備案上線的中國大模型備案上線的中國大模型 21|硬核發版硬核發版 26|熱
20、熱門話題門話題 33|重磅官宣重磅官宣 39|R.I.P.R.I.P.07|AIGCAIGC 11|10241024 黃金眼黃金眼 13|項目停更項目停更 16|生產事故生產事故 18|開源治理開源治理 62|插件、插件、IDEIDE、終端、終端 63|代碼生成工具代碼生成工具 64|LLMLLM AgentAgent 67|LLMOpsLLMOps 68|大模型聚合平臺大模型聚合平臺 69|開發工具開發工具 70|算力算力出品:OSCHINA&Gitee編委會:雨多田光,OSCHINA 總編局長,OSCHINA 主編王茜,OSCHINA 主編葉子,OSCHINA 新媒體運營魚仔,OSCHIN
21、A 新媒體運營諾墨,Gitee 開源社區產品負責人張力文,Gitee 公有云研發負責人李澤辰,Gitee 主編李濤,APUS 董事長兼 CEO特邀評論員:陳天舟,Bytebase 聯合創始人/CTO王春生,禪道軟件公司創始人馮若航,Pigsty 作者、磐吉云數創始人葉金榮,GreatSQL 開源生態負責人杜天微,獅偶編程語言作者江湖評談,多年.NET 虛擬機技術 CLR/JIT 研究設計:張琪11O Op pe en nA AI I正正式式發發布布G GP PT T-4 4AIGC回顧 2023 大語言模型 LLM 元年的重磅事件。開源開發者事件回顧A An nt th hr ro op pi
22、 ic c推推出出C Cl la au ud de e2023 年 3 月,百度全新一代知識增強大語言模型、文心大模型家族的新成員文心一言(ERNIE Bot)正式發布。百百度度文文心心一一言言正正式式亮亮相相2023 年 7 月,Meta 和微軟深度合作,正式推出下一代開源大語言模型 Llama 2,并宣布免費提供給研究和商業使用。相比于 Llama1,Llama 2 的訓練數據多了 40%,上下文谷谷歌歌發發布布最最強強A AI I大大模模型型G Ge emmi in ni i2023 年 12 月,谷歌發布了其認為規模最大、功能最強大的多模態 AI 大模型Gemini,稱比 OpenAI
23、 的 GPT-4 更先進。MMe et ta a開開源源L Ll la amma a 2 22023 年 3 月 15 日,由 OpenAI 前成員創立的 Anthropic 發布對話 AI 產品Claude,包含 520 億個參數。與 ChatGPT 類似,Claude 能夠執行各種基于文字對話的任務,如文檔搜索、摘要、寫作、編碼,以及響應用戶的提問。四個月后,Anthropic 推出 Claude 2。Claude 2 改進了性能,響應時間更長,可通過 API 訪問。此外還上線了面向公眾的 beta 網站 claude.ai。2023 年 3 月 14 日,OpenAI 正式推出 GPT-
24、4。GPT-4 是多模態大型語言模型(Large MultiModal Model),這是和 GPT-3 的一個顯著區別,它的輸入輸出不再局限于文本,可以是圖像或者是視頻。Anthropic團隊由參與OpenAI GPT-2和GPT-3模型開發的前研究人員組建,專注于開發通用 AI 系統和語言模型,并秉持負責任的 AI 使用理念。李彥宏稱:“無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理,需要多年的堅持和積累,沒法速成?!遍L度是 Llama 1 的 2 倍,并采用了分組查詢注意力機制。具體來說,Llama 2預訓練模型是在 2 萬億的 token 上訓練的
25、,微調 Chat 模型是在 100 萬人類標記數據上訓練的。7/8711開源開發者事件回顧A Au ut to o-G GP PT T 橫橫空空出出世世,席席卷卷 A AI I 圈圈“零零一一萬萬物物”發發布布 Y Yi i 系系列列開開源源大大模模型型V Ve er rc ce el l 發發布布 v v0 0:根根據據文文本本生生成成 U UI I 代代碼碼v0 是一款根據文本生成 UI 界面代碼的 AI 產品,只要輸入文字提示,即可生成需要的 UI 組件界面。智智譜譜 A AI I 開開源源 C Ch ha at tG GL LMM-6 6B B 大大模模型型GPT-4 發布不久后,一款
26、讓這個最強大語言模型能夠自主完成任務的開源項目Auto-GPT 橫空出世,在 AI 領域掀起巨大的波瀾。它就像是賦予了GPT-4 記憶和實體一樣,讓它能夠獨立應對任務,甚至從經驗中學習,不斷提高自己的性能。Auto-GPT 是首批將 GPT-4 應用于自動執行任務的程序之一。2023 年 11 月 17 日,OpenAI 突然發布公告,宣布 Sam Altman 將辭去首席執行官一職,并離開 OpenAI 董事會?,F任首席技術官 Mira Murati 將臨時擔任首席執行官,該任命立即生效。LangChain 是封裝了大量 LLM 應用開發邏輯和工具集成的開源 Python 庫,提供了一套工具
27、、組件和接口,簡化創建由 LLM 和聊天模型提供支持的應用程序的過程。創新工場董事長兼CEO李開復今年3月創辦AI大模型創業公司“零一萬物”。11 月,零一萬物推出 Yi-34B 和 Yi-6B 兩個開源大模型,對學術研究完全開放。2023 年 3 月,由清華技術成果轉化的公司智譜 AI 宣布開源中英雙語對話模型 ChatGLM-6B,支持在單張消費級顯卡上進行推理使用。S Sa amm A Al lt tmma an n 被被“逐逐出出”O Op pe en nA AI I如此突發的重磅消息震驚了全世界,有人稱之為美國硅谷史上最大的“奪權”事件。經歷 105 小時之后,該事件迎來大結局Sam
28、 Altman 重返 OpenAI 擔任首席執行官,OpenAI 成立全新董事會,微軟將在董事會中獲得一個無投票權的觀察員席位。最最火火熱熱 L LL LMM 應應用用框框架架 L La an ng gC Ch ha ai in n與此同時,零一萬物完成由阿里云領投的新一輪融資,估值已超 10 億美元,躋身獨角獸行列。8/8711開源開發者事件回顧京京東東發發布布言言犀犀大大模模型型百百度度推推出出 A AI I 編編程程助助手手 C Co omma at te e 2023 年 3 月,微軟亞洲研究院和浙江大學的研究團隊聯合發布論文HuggingGPT:Solving AI Tasks wi
29、th ChatGPT and its Friends inHuggingFace,介紹了一個大模型協作系統。該系統提出了一種讓 LLM 充當控制器的新方法,讓 LLM 來管理現有的 AI 模型,來完成多模態的復雜 AI任務,并且使用語言作為通用接口。2023 年 2 月,谷歌首席執行官 Sundar Pichai 宣布,他們將在未來幾周內面向公眾推出由 LaMDA 提供支持的實驗性對話式 AI 服務,稱為 Bard與流行的 ChatGPT 展開直接競爭。與此同時,微軟開源了基于論文實現的項目 JARVIS。其自我描述是用于連接 LLM 和 AI 模型的協作系統。該系統由 LLM(大語言模型)作
30、為控制器和許多 AI 模型作為協作執行者(來自 HuggingFace Hub)組成。7 月 13 日,京東全面推出京東言犀大模型,服務千行百業,擁抱產業智能。言犀大模型融合了 70%的通用數據與 30%京東數智供應鏈原生數據,致力于面向知識密集型、任務型產業場景,解決真實產業問題。2023 年 6 月,百度智能云推出了基于大模型的“Comate”代碼助手。借助文心大模型的理解、推理能力,“Comate”可實現代碼的快速補齊、自然語言推薦代碼、自動查找代碼錯誤,全面提升開發者研發效率。谷谷歌歌官官宣宣 C Ch ha at tG GP PT T 競競品品:B Ba ar rd d2023 年
31、4 月,陳天奇團隊(MLC)發布了一個可將大型語言模型和基于 LLM的聊天機器人引入 Web 瀏覽器的項目:Web LLM。一切都在瀏覽器內運行,無需服務器支持,并使用 WebGPU 加速。用用 C Ch ha at tG GP PT T 控控制制 A AI I 模模型型陳陳天天奇奇團團隊隊發發布布 WWe eb b L LL LMM用用瀏瀏覽覽器器跑跑大大模模型型微微軟軟開開源源 J JA AR RV VI IS S(賈賈維維斯斯)依托大模型能力,京東云言犀為客戶提供涵蓋客戶服務、營銷導購、多模態數字人等多種營服銷一體化解決方案。L LL LMMO Op ps s 平平臺臺 D Di if
32、fy y.A AI I 代代碼碼完完全全開開源源2023 年 5 月,LLMOps 平臺 Dify.AI 宣布 46,558 行代碼完全開源,并臨時決定將開源協議從 AGPL 放寬到 Apache 2.0。華華為為云云重重磅磅發發布布盤盤古古大大模模型型 3 3.0 02023 年 7 月,華為云正式發布盤古大模型 3.0。盤古大模型 3.0 是一個面向行業的大模型系列,包括“5+N+X”三層架構。盤古為行業而生,盤古大模型已在金融、金融、制造、醫藥研發、煤礦、鐵路等諸多行業發揮著巨大價值。9/8711開源開發者事件回顧螞螞蟻蟻集集團團開開源源 C Co od de eF Fu us se e
33、 代代碼碼大大模模型型阿阿拉拉伯伯語語 A AI I 大大模模型型 J Ja ai is s 開開源源2023 年 11 月 7 日,OpenAI 首屆開發者大會(OpenAI DevDay)正式開啟。大會上,Sam Altman 宣布了多項重磅變化:GPT-4 Turbo 模型,128k 上下文窗口、GPTs 商店、Agent 工具、API 提速降價、更多的 API 開放。2023 年 8 月,谷歌宣布推出 AI 代碼編輯器 Project IDX,一個基于瀏覽器的開發環境:集成 AI、支持全棧編程語言、跨平臺真機預覽、一鍵部署,用于構建全棧網絡和多平臺應用程序。2023 年 10 月,百川
34、智能發布 Baichuan2-192K 大模型,上下文窗口長度高達 192K,號稱是當時全球最長的上下文窗口,能夠處理約 35 萬個漢字。在上下文窗口長度、長窗口文本生成質量、長上下文理解以及長文本問答、摘要等方面的表現均全面領先 Claude2。2023 年 9 月,螞蟻集團正式開源代碼大模型 CodeFuse基于螞蟻基礎大模型研發。這是螞蟻自研的代碼生成專屬大模型,幫助開發者自動生成代碼、自動增加注釋、自動生成測試用例、修復和優化代碼等。2023 年 8 月,阿聯酋研究團隊宣布開源阿拉伯語大模型 Jais。Jais 是一個經過 130 億個參數預訓練的阿拉伯語和英語雙語大型語言模型,在包含
35、 720億個阿拉伯語詞塊和 2790 億個英語/代碼詞塊的數據集上進行訓練。谷谷歌歌發發布布 A AI I 代代碼碼編編輯輯器器:P Pr ro oj je ec ct t I ID DX X2023 年 8 月,Meta 開源了號稱是編程領域“最先進的大語言模型”CodeLlama,完全免費且可用于研究和商業用途。百百川川智智能能發發布布 B Ba ai ic ch hu ua an n2 2-1 19 92 2K K 大大模模型型MMe et ta a 代代碼碼生生成成大大模模型型:C Co od de e L Ll la amma aO Op pe en nA AI I 開開發發者者大大
36、會會宣宣布布 G GP PT Ts s 商商店店用用“磁磁鏈鏈鏈鏈接接”發發布布的的 MMi ix xt tr ra al l 8 8x x7 7B B全全球球首首個個開開源源 MMo oE E 大大模模型型2023 年 12 月,有“歐洲版 OpenAI”之稱的大模型創業公司Mistral AI用磁鏈鏈接開源了 87 GB 的 8x7B MoE 模型:Mixtral 8x7B。這是一個開放權重的高質量稀疏混合專家模型(SMoE),采用 Apache 2.0License 開源。在大多數基準測試中,Mixtral 的成績都優于 Llama 2-70B,且推理速度提升了 6 倍。而且在大多數標準
37、基準測試中超過 GPT-3.5。10/8711愛愛奇奇藝藝客客戶戶端端“白白嫖嫖”電電視視機機帶帶寬寬1024“黃金眼”關注 IT 相關民生事件,以老百姓的眼睛看 IT 圈,和開發者零距離接觸。開源開發者事件回顧人人大大畢畢業業生生盜盜取取全全校校學學生生信信息息網友發帖稱,自己的電視機在息屏休眠狀態時,居然持續保持著 1-5M/s 的上傳速度,直至斷掉電源才停止上傳。而這臺新買的電視機上安裝的 APP 只有愛奇藝。在他強制關閉愛奇藝 APP 后,電視機的上傳速度馬上變為零。對此,愛奇藝客服給出的回應是,這是加速手段,對使用沒有影響,并提供了關閉 HCDN 開關的操作。HCDN(Hybrid
38、CDN)是愛奇藝技術團隊研發的大規?;旌霞軜嬙诰€視頻數據分發技術。有網友指出,這是愛奇藝客戶端將電視機當成了自己的 PCDN 服務器,因此會在后臺持續執行上傳任務。這種白嫖電費、流量、存儲空間的操作,愛奇藝要給用戶打錢才對。2023 年 9 月,上海警方接到某科技公司員工張女士報案稱,其公司發現計算機系統被他人篡改數據,導致公司賬戶錢款損失。民警對公司后臺電子數據出現的異常賬戶進行提取,搜證中發現,操作者很有可能是管理網站后臺系統的員工,監守自盜的可能性較大。程程序序員員篡篡改改 E ET TC C 余余額額河河南南聯聯通通強強迫迫用用戶戶更更換換光光貓貓河南周口聯通為了強迫用戶更換光貓,公司
39、在后臺停掉用戶的寬帶賬號,導致用戶無法上網,然后讓工程師上門“維修”,謊稱光貓損壞,需要花 299 元換新。更換完后,聯通再在后臺恢復用戶的網絡。員員工工盜盜用用公公司司游游戲戲源源代代碼碼中國人民大學一名碩士畢業生涉嫌在校期間非法獲取全校學生的個人信息,并利用這些信息制作了一個給學生顏值打分的網站。針對“中國人民大學部分學生信息被非法獲取”的情況,海淀警方接到報警后立即開展調查。經查,嫌疑人馬某某(男,25 歲,該校畢業生)涉嫌非法獲取該校部分學生個人信息等違法犯罪行為,后被海淀公安分局依法刑事拘留。上海一游戲公司三名員工利用職務之便,在從原公司離職前盜取了公司開發的手游源代碼;并將該手游的
40、源代碼提供給了另一家網絡公司,對方進行簡單“換皮”之后就開始上線經營。創創建建顏顏值值打打分分網網站站結結局局很很“刑刑”一一年年私私吞吞 2 26 60 0 余余萬萬元元民警隨即展開工作,最終嫌疑人曹某迫于壓力主動投案自首。曹某是該公司的軟件工程師,他坦白稱,去年 8 月發現公司網站后臺的漏洞,用母親和朋友身份證注冊了兩個 ETC 賬戶。一年內兩個賬戶分別從公司提取來了 230 余萬元和 36 萬元,總計 260 余萬元。最終曹某因涉嫌盜竊罪被依法刑事拘留?!皳Q換皮皮”上上線線 半半年年盈盈利利 1 1.5 5 億億為了成功上線,離職員工還套用了原公司的 計算機軟件著作權登記證 和 網絡游戲
41、出版核發單。警方鑒定發現,兩款游戲在服務器數據表和服務器戰斗服上的相似度達到 100%,服務器游戲服和客戶端相似度也在 90%左右。據統計,自盜版游戲上線半年以來,盈利超過 1.5 億,盜取源代碼的三名員工分得利潤超過 1500 萬。聯通公司不僅對老用戶進行這種強制更換光貓的行為,還會在給新用戶裝機的時候,故意使用破舊光貓,也就是之前強迫用戶換新留下的,而再過一段時間之后,又會告訴用戶使用的是舊光貓無法匹配,必須換新。聯通公司還會故意關掉用戶的短信服務,在后臺增加增值業務,之后再把短信功能打開,以此牟利。這種強制更換光貓的行為并非新鮮事。早在 2022 年上半年,就有不少用戶投訴聯通公司,以寬
42、帶升級為由強制用戶更換光貓,否則就無法上網。其中有的投訴明確是河南聯通公司,有的則未明確具體地區。11/8711知知名名大大主主播播翻翻車車現現場場開源開發者事件回顧1 14 40 00 0 多多萬萬部部老老年年手手機機被被植植入入木木馬馬B 站 50 萬粉絲 up 主通過另一名知名主播購買基于開源軟件的導播臺方案:將手機攝像頭畫面推流到 PC,再通過 OBS 推流,使用了 Zerotier+芯象。共計支付 2 萬,網友稱這名 up 主喜提“超級憨憨大冤種獎”。2023 年 9 月,網傳消息稱,網易伏羲團隊員工因工作原因在出租屋自殺離世;并表示,該員工曾“因 BUG 被 HR 威脅”。9 月
43、14 日,網易伏羲針對此事發布內部信公布事發經過,稱員工存在抑郁傾向,HRBP 在了解到情況后為其安排了休假。并表示經過調查還原和分析,暫未發現NanUI 作者在國慶節發布了停更公告,稱該項目將暫停開發,原因是去年被裁員失業后,他已轉行銷售鋼材,現在很難騰出時間來開發和維護 NanUI 項目。四川省攀枝花市公安機關網安部門在 2023 年成功偵破一起非法控制計算機信息系統案。經警方調查,犯罪嫌疑人與老年手機方案商、生產商勾結,在老年機生產環節中植入木馬程序,在手機使用者不知情的情況下,后臺訂購 SP 增值業務,并與 SP 商分成獲利(SP 即 Service Provider,服務提供商)。2
44、023 年 2 月,公安機關對該案開展集中收網,專案民警分別趕赴廣東、北京、海南、湖南等地共抓獲嫌疑人 29 名,凍結涉案資金 6000 余萬元。蘋果 App Store 被發現存在一個偽裝成學習軟件的黃色軟件,并且沖上了免費 App排行榜第一名。該軟件的年齡分級為 4 歲以上,但是會引導用戶進入賭博和其他黃色網站。有網友下載了這款軟件,想要學習英語字母,結果卻發現是一個色情視頻軟件。事件被曝光后,蘋果客服雖然進行了“自自動動訂訂購購”增增值值業業務務網網易易伏伏羲羲回回應應“HR 威脅”相關動機和證據。與此同時,該公司還公布了一系列后續關懷方案。蘋蘋果果 A Ap pp p S St to
45、or re e 免免費費榜榜第第一一是是黃黃色色軟軟件件NanUI 界面組件是一個開放源代碼的.NET/.NET Core 窗體應用程序(WinForms)界面框架。適用于希望使用 HTML5/CSS3 等前端技術來構建Windows 窗體應用程序用戶界面的.NET 開發人員。售售賣賣基基于于開開源源軟軟件件的的解解決決方方案案,收收費費 2 2 萬萬員員工工“因因 B BU UG G 被被 H HR R 威威脅脅”離離世世回應,但直到當天下午仍未下架軟件。甚至排行榜更新后,App Store 免費榜第一、二名再次出現黃色軟件。開開源源框框架架 N Na an nU UI I 作作者者轉轉行行
46、賣賣鋼鋼材材項項目目暫暫停停開開發發12/8711網網絡絡框框架架 A AF FN Ne et twwo or rk ki in ng g 停停止止維維護護開開源源 R RO OMM 魔魔趣趣(MMo ok ke ee e)創創始始人人宣宣布布項項目目結結束束開源開發者事件回顧開開發發者者遭遭死死亡亡威威脅脅,項項目目停停止止開開發發GIF 屏幕錄制工具 Peek 的開發者在 2023 年 1 月正式宣布項目停止開發,主要原因在于 Wayland 上運行時所面臨的一些技術挑戰。而解決問題的唯一途徑就是以不同的方式、不同的 UI 完全重寫應用程序,但“現在的 Peek 幾乎沒有什么資源可以重用”
47、。開發者表示自己并沒有興趣再開發一個全新的項目,所以做出了放棄該項目的決定。問問題題堆堆積積如如山山,G GI IF F 錄錄屏屏工工具具 P Pe ee ek k 停停止止開開發發aardio 編程語言作者發文表示,因妻子患癌,再無精力維護項目。aardio的所有庫基本都是由作者一個人編寫,并且 17 年來一直保持非?;钴S的更新。aardio 是一門專注于桌面軟件開發的編程語言,特點是小、輕、快,體積僅 6.5MB,學習和使用成本極低。aardio 雖然小,但提供了驚人數量的開源標準庫、擴展庫 這些庫基本都是由純 aardio 代碼實現。開開源源項項目目 T To ou uc ca a 開開
48、發發商商倒倒閉閉開 源 測 試 工 具Touca 的 創 始 人Pejman Ghorbanzade 于 2023 年 3月宣布其公司正式倒閉,不景氣的市場大環境是倒閉的一個主要原因。Pejman 于 2021 年創立了 Touca,并于 2022 年 5 月在 Apache-2.0許可下開源。Touca 公司倒閉后,Touca 這個開源項目還將繼續存在,并保持開源,Pejman 表示自己會持續維護這個項目,并開始尋找新的機會。a aa ar rd di io o 編編程程語語言言作作者者:因因妻妻子子患患癌癌,再再無無精精力力維維護護項項目目因遭受過多的騷擾甚至于死亡威脅,AetherSX2
49、 軟 件 的 開 發 者Tahlreth 于2023 年 1 月宣布無限期停止該項目的開發?!癆etherSX2 對我來說一直是一個有趣的愛好,而不是為了盈利。繼續開發一個不再有趣的項目是沒有任何意義的?!盇etherSX2 是 Android 平臺上最好用的PlayStation 2 模擬器(沒有之一)。用戶還可以繼續下載和使用 AetherSX2,但該應用程序已經不再有進一步的開發計劃。國內最大的非營利性開源 ROM 項目魔趣(Mokee)在 2023 年 1 月 7日正式宣布關閉。魔趣下載頁面所有固件已備份到 sourceforge。項目作者馬丁龍豬發文稱,“刷機的時代其實早已落幕,遲遲
50、下不定決心只是希望能讓魔趣多存續一些時間,但該來的終究會來?!盡okee 全稱 MoKee OpenSource,項目發起于 2012 年 12 月 12 日。早期基于 CyanogenMod(CM),2016 年CyanogenMod 停止開發,后開始基于AOSP。魔趣開源項目 20121212 20230107在停更近 3 年后,適用于蘋果旗下多個操作系統(iOS、macOS、watchOS 和 tvOS)的網絡框架AFNetworking 在 2023 年 1 月17 日正式發布公告宣布棄用,停止維護。原始倉庫將作為一個歸檔庫永久保留。項目停更到了該說“再見”的時候了,江湖有緣再見。13
51、/8711戰戰爭爭、疫疫情情、通通貨貨膨膨脹脹,資資源源網網站站 R RA AR RB BG G 宣宣布布關關閉閉Q Qt t 5 5.1 15 5 L LT TS S 已已結結束束標標準準支支持持開源開發者事件回顧資資金金嚴嚴重重短短缺缺,又又一一流流行行開開源源項項目目宣宣布布停停止止功功能能開開發發“李跳跳”作者于 2023 年 8 月在公眾號宣布無限期停止更新,原因是收到了某集團律師函,對方稱“李跳跳”APP涉嫌不正當競爭,對旗下的瀏覽器產生影響,并要求四十八小時內全網下架“李跳跳”?!袄钐笔且豢罾脽o障礙權限進行跳過 APP 開屏廣告的 Android 輔助應用,無需聯網,免費使
52、用。除了“李跳跳”,其他同類開屏廣告應用也都在同一時期收到了律師函,比如“大圣凈化”、“一指禪”和“叮小跳”。自自動動跳跳過過開開屏屏廣廣告告應應用用李李跳跳跳跳無無限限期期停停更更微軟于 2023 年 8 月發布了 Visual Studio for Mac 的退役公告。未來,開發團隊將專注于增強 Visual Studio 和 VS Code,優化它們以進行跨平臺開發。Visual Studio for Mac 退役后,微軟方面仍會為 Mac 開發者提供替代方案,例如 C#Dev Kit for VS Code 和其他擴展。開開源源富富文文本本編編輯輯器器 wwa an ng gE Ed
53、di it to or r 暫暫停停維維護護開源 Web 富文本編輯器 wangEditor 作者王福朋于 2023 年 8 月宣布暫停項目維護。主要原因在于作者暫無精力維護 wangEditor,且“最近行業形勢也不太好,先努力搞錢吧”。他也歡迎有人接手 wangEditor 的維護,不過需要通過初步考核:在issues 列表中,回答 10 個 issue。微微軟軟官官宣宣:V Vi is su ua al l S St tu ud di io o f fo or r MMa ac c 退退役役libjpeg-turbo 的首席開發人員 DRC 在完成該項目的 3.0.0 版本發布后表示,由
54、于資金短缺,其未來的功能開發或將受到限制,可能永遠不會有libjpeg-turbo 3.1 版本。他將繼續修復 libjpeg-turbo 中的錯誤,并在 3.0.x 發行版系列中發布錯誤修復版本;但不會再有 libjpeg-turbo 3.1 發行版系列,除非該項目可以獲得更多的通用資金。自 2024 年 8 月 31 日起,Visual Studio for Mac 將不會再獲得任何支持。屆時,VisualStudio for Mac 將只能通過,為已訂閱 Visual Studio 的用戶提供舊版安裝,但不再提供服務或維護。Qt 5 系列的最后一個次要版本 Qt5.15 LTS 于 20
55、23 年 5 月 26 日正式結束標準支持。Qt 5.15 LTS 是一個長期支持版本,有三年的標準支持期。最后一個補丁版本是 Qt 2023 年 5 月 25 日發布的5.15.14,適用于具有舊許可證的商業客戶的標準支持條款。受戰爭、疫情、通貨膨脹等因素影響,資源網站 RARBG 于 2023 年年中宣布關站。RARBG 是一個著名的 BitTorrent 網站,提供了許多高質量的電影、電視劇、音樂、游戲和軟件等種子資源。它成立于 2008 年,總部位于保加利亞,已經成為了 BitTorrent 社區中備受喜愛的網站之一。libjpeg-turbo 是一個 JPEG 圖像編解碼器。它使用S
56、IMD 指令(MMX、SSE2、AVX2、Neon、AltiVec)來加速 x86、x86-64、Arm 和PowerPC 系統上的基線 JPEG壓縮和解壓縮,以及 x86、x86-64和 Arm 系統的漸進式 JPEG 壓縮。14/8711L Li in nu ux x 4 4.9 9 正正式式 E EO OL L結結束束持持續續 6 6 年年的的 L LT TS S 周周期期微微軟軟計計劃劃在在 WWi in nd do owws s 中中淘淘汰汰寫寫字字板板開源開發者事件回顧J JS S 工工具具庫庫 l lo od da as sh h關關閉閉所所有有 i is ss su ue e
57、和和公公開開 P PR RMySQL 目前已經成為中國用戶使用最廣泛的開源數據庫,其中 5.7 版本用戶的比重又是最高的。根據報告中的統計數字,MySQL 5.7 用戶占比在國內高達 47%。屆時這些用戶將會面臨選擇,如何應對 EOL 事件。MMy yS SQ QL L 5 5.7 7 于于 2 20 02 23 3.1 10 0.2 21 1 正正式式 E EO OL L承承載載微微軟軟跨跨平平臺臺生生態態之之夢夢的的 U UWWP P,正正在在消消亡亡開發者發現,微軟最新的 Windows 11 Canary Build 25987 預覽版已經開始提供兩個版本的 XAML Shell 服務
58、,新的版本直接基于 Win32+XAML,曾經被寄予厚望的 UWP 在新版本里已經不見蹤影。老 牌JS 工 具 庫lodash 關 閉 了 所 有issue 并 統 一 打 上issuebankruptcy 的 tag,此外還關閉了所有公開 PR,表示無力處理,一關了之。微軟在 2023 年 9 月宣布計劃在未來的 Windows 更新中棄用寫字板。對于.doc 和.rtf 等富文本文檔,該公司建議使用 Microsoft Word 作為替代品;對于.txt 等純文本文檔,則建議使用 Windows 記事本。在長達 6 年多的長期支持后,Linux 4.9 內核系列在 Linux 4.9.33
59、7 更新中結束了生命周期。Linux 內核 4.9 于 2016 年 12 月 11 日發布,它帶來了對 XFS 文件系統的共享范圍和寫時復制支持、用于檢測固件引起的延遲的硬件延遲跟蹤器、對來自 Project Ara 的 Greybus 總線的支持、更高效的 BPF 分析器、新的可選BBR TCP 擁塞控制算法、虛擬映射內核堆棧等特性。由于是 LTS 版本,Linux 4.被廣泛用于生產環境,比如基于 Linux 4.9 操作系統驅動的大規模生產設備/硬件。寫字板是一種基本的文本編輯應用程序,允許用戶創建和編輯帶有格式化文本的文檔,并包含圖像和其他文件的鏈接。自1995 年 Windows
60、95 發布以來就附帶在 Windows 系統上,為用戶提供集成到操作系統中的基本文字處理器和文檔編輯器。特特邀邀評評論論員員 陳陳天天舟舟,B By yt te eb ba as se e 聯聯合合創創始始人人/C CT TO O2023 年 10 月,MySQL 5.7 宣布了 EOL,算是給 MySQL 5 系,這個支撐了過去 15 年中國互聯網的功勛做了一個告別。隨著 MySQL 的辭舊,PG 的崛起,在這 AI 的黎明,VR 的前夜,下一個 15 年,MySQL 和 PG 之間相愛相殺的故事又該會如何演繹呢。特特邀邀評評論論員員 葉葉金金榮榮,G Gr re ea at tS SQQL
61、 L 開開源源生生態態負負責責人人對于 MySQL 5.7 的 EOL,我想需要分幾種情況區別對待。1.已經在線穩定運行的系統,認為升級版本存在一定風險。在做好必要的安全防范措施后,一般是無需擔心 EOL 帶來的安全風險,最大的問題無非是用不上新功能。相當多互聯網企業都是這么做的。從 MySQL 5.6 占比仍高達 30%也可見一斑。2.想要用上新特性,借機升級版本。MySQL 8.0 及更高版本中的一些企業級特性的確吸引人,值得升級體驗。在這里也特別推薦我在負責的 GreatSQL 分支,無論從功能還是性能上說都比 MySQL 更實用、更放心??赡軙腥送扑]選擇MariaDB,從生態完善及成
62、熟度等多方面評估來看,我是持反對意見的。3.對于需要所謂原廠服務保障的場景,這種只能跟著 MySQL 官方走了,沒啥說的。15/8711B B 站站(嗶嗶哩哩嗶嗶哩哩)崩崩了了兩兩次次生產事故“名場面”冥場面!速來圍觀 2023 十大生產事故“名場面”開源開發者事件回顧騰騰訊訊“3 32 29 9”一一級級事事故故2023 年 3 月 5 日晚 20:20 左右,許多網友表示在使用 B 站時,手機和電腦端都無法訪問視頻詳情頁,且手機端無法查看收藏夾與歷史記錄。還有網友表示,首頁能夠正常加載,但全部是繁體字。8 月 4 日晚間,距離上次事故 5 個月后,又有許多網友反饋 B 站圖片(視頻封面)無
63、法加載、視頻無法打開、視頻一直在緩沖。2023 年 6 月 8 日下午,中國電信的網絡和通信服務出現無信號等失靈現象,絕大部分反饋的用戶都在廣東區域,疑似廣東省內故障。該問題在廣大社交平臺上引起熱議,受影響的電信用戶反饋,首先是信號關停,然后恢復到 2G 網絡,但遲遲未能恢復到 4G 或 5G 網絡。此后中國電信客服回應表示,電信基站全?。◤V東電信)故障,暫時不能撥打電話,請耐心等待,現在緊急加急處理中,不便之處,敬請諒解。歷時 4 個小時左右,廣東省內電信網絡全面恢復。中中國國電電信信大大規規模模無無服服務務3 月 29 日,“唯品會崩了”登上熱搜,由于崩潰時間太長,影響了很多消費者無法正常
64、下單。唯品會官方對此回應稱,因系統短時故障,主站“加購”等功能或出現異常。后續唯品會對此次事件嚴肅處理,對應部門的直接管理者承擔此次事故責任,基礎平臺部負責人予以免職作相應處理。微微軟軟A Az zu ur re e 故故障障 生生產產級級數數據據庫庫被被刪刪5 月 24 日,微軟 Azure DevOps 在巴西南部地區的一處 scale-unit 發生故障,導致宕機約 10.5 個小時。Azure DevOps 工程師在數據庫刪除開始后 20 分鐘內檢測到中斷,并開始著手修復。最終數據全部恢復,但卻花費了長達十個小時。后續微軟首席軟件工程經理 EricMattingly 出面針對此次故障事
65、件道歉,并透露了導致中斷的原因:即,一個簡單的拼寫錯誤致使 17 個生產級數據庫被刪除。唯唯品品會會崩崩了了 登登上上熱熱搜搜2023 年 3 月 29 日凌晨,騰訊旗下的微信和 QQ 等業務曾出現崩潰狀況,包括微信語音對話、朋友圈、微信支付,以及 QQ 文件傳輸、QQ 空間和 QQ 郵箱在內的多個功能無法使用。直到 29 日早間,騰訊微信團隊才回應表示,經工程師搶修,系統正在逐步恢復。本次事故由廣州電信機房冷卻系統故障導致,騰訊將它定義為公司一級事故,并對大量相關領導做出了處罰。4 月 12 日,工業和信息化部信息通信管理局聽取騰訊公司關于“329”微信業務異常情況匯報,要求騰訊公司進一步健
66、全安全生產管理制度、落實網絡運行保障措施,堅決避免發生重大安全生產事故,切實提升公眾業務安全穩定運行水平。16/8711語語雀雀1 10 0.2 23 3 重重大大服服務務故故障障開源開發者事件回顧阿阿里里云云1 11 1.1 12 2 重重大大服服務務故故障障2023 年 10 月 23 日語雀出現重大服務故障,持續 7 個多小時才完全恢復。語雀團隊后續公布了故障原因及處理過程:10 月 23 日下午,服務語雀的數據存儲運維團隊在進行升級操作時,由于新的運維升級工具 bug,導致華東地區生產環境存儲服務器被誤下線。受其影響,語雀數據服務發生嚴重故障,造成大面積的服務中斷。2023 年 11
67、月 27 日晚間,滴滴因系統故障導致 App 服務異常,不顯示定位且無法打車。隨后滴滴出行官方回復稱是因系統故障導致。11 月 28 日早間,滴滴出行消息稱,網約車等服務已恢復,騎車等在陸續修復中。在滴滴發出公告的同時,記者在上海、深圳等地使用滴滴呼叫網約車,發現網約車功能并未恢復使用,網絡加載異常,仍無法打車。11 月 28 日,滴滴向記者回應稱,網約車服務已恢復,司機乘客權益陸續恢復補發。11 月 29 日,滴滴再次發文致歉,稱初步確定事故起因是底層系統軟件發生故障。滴滴滴滴1 11 1.2 27 7 史史上上最最嚴嚴重重服服務務故故障障馬斯克收購 Twitter 并大幅裁員后,導致網站的
68、服務可靠性出現顯著下降。某天再度出現了嚴重的宕機故障無法打開任何圖片和鏈接。具體表現為,當用戶在推特上加載圖片和點擊鏈接時會返回錯誤信息,稱“您當前的 API 不包括對此端點的訪問權限”。消息人士表示,此次事故由一名工程師修改配置導致,據稱馬斯克知道此事后直接暴怒。C Ch ha at tG GP PT T服服務務中中斷斷 2 2 小小時時北京時間 11 月 8 日晚 22 點左右,OpenAI 旗下 ChatGPT 以及相關 API 出現中斷故障,導致面向用戶和開發者的服務近 2 小時無法正常使用。隨后 OpenAl更新事故報告稱,已確定了一個導致 API 和 ChatGPT 錯誤率高的問題
69、,正在努力修復。與此同時,OpenAI CEO 山姆奧特曼公開致歉稱:本周發布的新功能遇到遠超預期的使用量。由于負載的原因,短期內可能會出現服務不穩定的情況,對此情況向用戶道歉。推推特特嚴嚴重重宕宕機機 馬馬斯斯克克暴暴怒怒2023 年 11 月 12 日下午,阿里云出現嚴重故障,全線產品受影響。后續官方確認故障原因與某個底層服務組件有關。在歷時約 5 個小時后,阿里云宣布受影響云產品均已恢復。特特邀邀評評論論員員馮馮若若航航,P Pi ig gs st ty y 作作者者/磐磐吉吉云云數數創創始始人人根據海恩法則,一次嚴重故障的背后有幾十次輕微事故,幾百起未遂先兆,以及上千條事故隱患。去年十
70、二月阿里云香港機房的大故障已經暴露出來許多問題,然而一年后又給了用戶一個更大的驚喜(嚇?。?。這樣的事故對于阿里云的品牌形象絕對是致命打擊,甚至對整個行業的聲譽都有嚴重的損害。17/8711S St ta ab bl le e D Di if ff fu us si io on n 因因版版權權問問題題被被起起訴訴開源開發者事件回顧為為打打破破中中美美領領先先,G Gi it tH Hu ub b C CE EO O:開開源源開開發發者者應應免免受受歐歐盟盟 A AI I 法法案案約約束束2023 年 3 月,由于雙方規則沖突,curl 作者 Daniel Stenberg 宣布,將不再向各 L
71、inux 發行版的郵件列表發送有關 curl 安全漏洞的提前預告。curl 新的政策導致,在通知各發行版的時候,這些安全問題已經在公共的git 存儲庫中提交了修復程序,而按照發行版郵件列表的政策規定,公開的安全問題則屬于”禁運“的話題。c cu ur rl l 作作者者宣宣布布不不再再向向各各發發行行版版發發送送安安全全漏漏洞洞預預警警在經歷了多次治理風波后,為了解決導致領導層危機的潛在結構性問題,結束組織內部混亂局面。2023 年 2 月,Rust 項目發布了一項有關新的治理計劃的 RFC;旨在建立了一個領導委員會(Leadership Council)以替代原本的核心團隊(Core Tea
72、m),委員會將其大部分權力下放給各團隊。6 月,Rust 項目還宣布成立新的頂級治理機構:領導委員會(RustLeadership Council)。該領導委員會的成立,標志著 Rust 核心團隊和臨時領導者職位都將被取消,此后將由 Rust 理事承擔頂級治理問題的責任。開開源源許許可可證證亟亟需需更更新新擺擺脫脫 1 19 98 80 0 年年代代束束縛縛、應應對對人人工工智智能能科技媒體The Register發布了一篇探討更新開源許可證的文章,指出:開源許可證需要擺脫 20 世紀 80 年代的束縛,并不斷發展以應對人工智能。自由軟件和開源許可證在 20 世紀 70 年代和 80 年代的主
73、要作用對象逐步演變成“代碼”。但今天,它必須再次轉型以處理人工智能模型。R Ru us st t 管管理理結結構構大大改改:解解散散核核心心團團隊隊、成成立立“領領導導委委員員會會”2023 年初,GitHub CEO Thomas Dohmke 在歐盟開源政策峰會上對歐盟即將出臺的 AI 法案(Artificial Intelligence Act)發表了看法稱,開源為政府和企業提供動力,是 歐洲價值觀的核心,開源正在構建歐洲 AI 的基礎。立法者應該對開源開發者放寬約束,因為開源正在推動 全世界和歐洲的創新之春。歐盟 AI 法案在 2021 年 4 月被首次提出,旨在促進創新,并為 AI
74、技術設定一個全球標準。劃分了“不可接受風險的應用程序和系統、高風險應用程序、未明確禁止或列為高風險的應用程序”三個風險類別,并根據相應的風險等級制度來監管 AI 應用程序、產品和服務。三位藝術家對 Stability AI(Stable Diffusion 背后的開發商)提起了訴訟,指控 Stability AI 直接、間接侵犯版權、違反 DMCA 和不正當競爭等。他們認為 Stability AI 在未經原藝術家同意的情況下,從網絡上收集了數十億張圖片用于進行 AI 工具訓練,侵犯了包括他們在內的數百萬藝術家的權利。律師 Butterick 將此案描述為朝著使人工智能對每個人都公平和道德的方
75、向邁出的又一步。開源治理開源健康發展必不可少的一環。但滴水穿石,非一日之功。在 Rust 內部混亂問題尚未解決之際,一些開發者選擇了fork Rust語 言 并 創 建 一 個 新 的CrabLang 社區分支,以擺脫“官僚主義”。18/8711東東半半球球最最強強法法務務部部出出手手,開開源源模模擬擬器器D Do ol lp ph hi in n 被被 S St te ea amm 下下架架開源開發者事件回顧A Ap pa ac ch he e 孵孵化化項項目目被被公公然然抄抄襲襲,開開源源世世界界真真的的會會變變得得更更好好嗎嗎?TII(阿聯酋阿布扎比技術創新研究所)在 2023 年 5
76、月推出了號稱是“史上最強的開源大語言模型”Falcon(獵鷹)。雖然 Falcon 的參數比LLaMA 小,但性能卻更加強大。但 Falcon 采用了自擬的 TII Falcon LLM License在 Apache License的基礎上進行了一系列修改。TII Falcon LLM License 要求它的用例需支付商業用途特許權使用費,收入超過 100 萬美元的任何商業應用都要收 10%的授權費。此外,對如何發布或分發作品也有額外限制,比如要求歸屬于Falcon LLMtechnology from the Technology Innovation Institute。在招致諸多罵聲
77、之后,Falcon-40B 將 License 修改為 Apache 2.0。號號稱稱擊擊敗敗 L LL La aMMA A 的的大大模模型型開開源源了了,卻卻因因為為許許可可證證被被罵罵深深圳圳發發力力,打打造造開開源源操操作作系系統統產產業業高高地地2023 年 7 月 28 日,深圳市工業和信息化局印發 深圳市推動開源鴻蒙歐拉產業創新發展行動計劃(20232025 年)。目的是推動開源鴻蒙歐拉產業創新發展,助力關鍵核心技術高水平自立自強,主動擁抱新的技術與產業升級機遇,加快構建現代化產業體系??傮w的發展目標是瞄準最高最優最強,通過培育和吸引更多企業、更多人才、更多產業組織集聚深圳發展開源
78、鴻蒙歐拉產業,力爭率先將深圳建成為核心技術領先、產業高度集聚、應用場景豐富、生態支撐完備、全球輻射引領的開源鴻蒙歐拉產業高地。2023 年 4 月,流處理應用程序開發管理框架 Apache StreamPark(incubating)發文稱,項目代碼被赤兔實時計算平臺公然大量抄襲。所有引用代碼的地方都刪除了 Apache License 抬頭,并將 Apache License2.0 協議修改成了 GPL 3.0 高調進行開源。多方聲討下,赤兔團隊在數日后就其違規行為在官網公開發布了一則道歉聲明,并表示已經重新按照 Apache 的合規要求,更新了相關代碼并且公開。作為回應,StreamPar
79、k 團隊也發布正式聲明表示,鑒于赤兔團隊良好的認錯態度和積極的響應,決定接受道歉。開源合規和知識產權至關重要,身處行業中的你我都應該遵守。海豚模擬器(Dolphin)是一款跨平臺的開源模擬器,支持在 Windows、Linux、macOS、Android 上模擬運行任天堂 GameCube 和 Wii 游戲。2023 年 3 月,Dolphin 開發團隊宣布將于今年第 2 季度登陸 Steam 平臺。但在 5 月,團隊表示收到了來自任天堂的警告,宣布無限期推遲上架到 Steam 版本的計劃。7 月,Dolphin 確認徹底放棄上架 Steam 平臺。事情背后的具體經過為:當得知 Dolphin
80、 要上架 Steam 后,Valve 法務部門聯系了任天堂詢問相關信息;得到的回應是,按 DMCA 規定 Valve 需要阻止該模擬器登陸 Steam。因此 Valve 要求 Dolphin 必須自行解決與任天堂的協議,否則將無法上架??紤]到這一操作的難度性,Dolphin 最終決定放棄上架 Steam。、Apache StreamPark(incubating)是一個流處理應用程序開發管理框架。初衷是讓流處理更簡單,旨在輕松構建和管理流處理應用程序,提供使用Apache Flink 和 Apache Spark 等編寫流處理應用程序的開發框架。2021 年 4 月 以 StreamX 為名進
81、行開源,于 2022 年 8 月更名為StreamPark,隨后通過投票于 9 月正式成為 Apache 開源軟件基金會的孵化項目。19/8711“零零一一萬萬物物”回回應應 Y Yi i 開開源源大大模模型型“套套殼殼”L Ll la amma a開源開發者事件回顧微軟在 2023 年 9 月 7 日發布了新版 Copilot 版權承諾,并表示當用戶因版權問題受到質疑時,微軟將承擔潛在的法律責任涉及的風險。新版承諾建立在微軟此前的 AI 客戶承諾基礎之上,將把知識產權賠償支持擴展到商業 Copilot 服務之中。如果客戶在使用 Copilot 等產品時開啟了內置的內容過濾器后仍然遭到侵犯版權
82、起訴,微軟將為客戶辯護并支付因訴訟而產生的任何不利判決或和解金額。微微軟軟官官宣宣新新的的 C Co op pi il lo ot t 版版權權承承諾諾李開復旗下 AI 公司“零一萬物”(01.AI)在 2023 年 11 月推出了Yi-34B 和 Yi-6B 兩個開源大模型。其公布的基準測試結果顯示雖然模型參數少于其它大模型,但性能更出色。然而在 Yi 正式開源數日后,有人指出 Yi-34B 完全使用了 Meta 開源大模型 Llama 的架構,最明顯的變化只是修改了張量(Tensor)名稱。根據公開的信息,Yi 系列開源大模型沒有在開源 License 中提及 Llama。因此,零一萬物的
83、 Yi 系列大模型被質疑是 Llama 的套殼?!傲阋蝗f物”后續正式公開回應了此事。該公司開源團隊總監 Richard Lin回復承認了修改 Llama 張量名稱的做法不妥,并會按照建議進行修改。Richard Lin 稱此問題是團隊的疏忽。因為在大量的訓練實驗中,他們對代碼進行了多次重命名,以滿足實驗要求。但最后沒有在發布之前將它們改回來。他為這個失誤造成的混亂表示抱歉。被被泄泄露露的的大大語語言言模模型型 L LL La aMMA A助助長長了了一一系系列列 C Ch ha at tG GP PT T 開開源源替替代代品品開源和基于 API 的分發之間的摩擦是生成式 AI 生態中極為迫切的
84、矛盾。比如在從文本到圖像領域,Stable Diffusion 的發布清楚地表明開源是基礎模型的可行分發機制。不過在大型語言模型(LLM)領域卻并非如此,這些模型只能通過 API 獲取。并且這些模型的開源替代品沒有表現出相同水平的性能,特別是在它們遵循人類指令的能力方面。然而,一項意想不到的研究突破和泄露的模型版本徹底改變了這一現狀。2023 年 3 月,Meta 宣布了它的大語言模型 LLaMA,該模型的一大優勢是能運行在單張顯卡上。當時 Meta 沒有開源 LLaMA,而是通過邀請制的方式出于研究的目的將源代碼提供給社區。但在宣布該消息一周后,LLaMA模型在 4chan 上被泄露,有匿名
85、用戶通過 BT 種子公開了 LLaMA-65B有 650 億個參數的 LLaMA,容量為 220GB。在此之后的幾周里,這場本應是不幸的事件卻成了 LLM 領域最有趣的創新來源之一。自 LLaMA 被泄露后,基于它而構建的 LLM 代理的創新呈現出爆炸式增長。開開源源游游戲戲引引擎擎 G Go od do ot t 成成立立開開發發基基金金在 Unity 引擎宣布 runtime fee 收費模式后,開源游戲引擎 Godot 成立了開發基金(Godot Development Fund)維持項目的獨立性,以及可持續性。20/8711MMe ei il li is se ea ar rc ch
86、h 1 1.0 0 穩穩定定版版發發布布WWi in ne e-C CE E 首首個個正正式式版版發發布布開源開發者事件回顧開開源源 3 3D D 建建模模軟軟件件 B Bl le en nd de er r 發發布布 4 4.0 0Pigsty v2.0.0 于 2023 年 2 月正式發布,帶來了一系列重大的功能更新。PIGSTY 是 PostgreSQL In Great STYle 的首字母縮寫,即 全盛狀態的PostgreSQL。Pigsty 的定位也不再是“開箱即用的 PostgreSQL 數據庫發行版”,變成了“Me Better 開源 RDS PG 替代”。P Pi ig gs
87、 st ty y v v2 2 正正式式發發布布經過 3 年多從頭開始的打破和重建、徹底的核心改造和全面的引擎重寫,歷經 17 個 alpha 版本、17 個 beta 版和 6 個 RC 版,Godot 4.0 于2023 年 3 月正式發布。比起常規更新,這更像是一次偉大的重建。C Ce er re es sD DB B 1 1.0 0 正正式式發發布布CeresDB 是一個時序數據庫,與經典時序數據庫相比,CeresDB 的目標是能夠同時處理時序型和分析型兩種模式的數據,并提供高效的讀寫。開開源源 3 3D D 游游戲戲引引擎擎 G Go od do ot t 正正式式發發布布 4 4.
88、0 0主要新特性包括:Cycles 支持光和影的耦合,支持光滑表面的路徑引導,支持蘋果 Metal API 的 MetalRT 硬件光線追蹤,HIP 后端支持 AMD RDNA2和 RDNA3 APU,默認 UI 字體 Inter,Linux 和 macOS 版最低要求 OpenGL4.3,升級渲染能力,等等。Wine-CE 是在不同指令集架構 Linux 系統上運行 Windows 程序的兼容層,它基于Wine 項目和 Qemu 項目。與 Wine 相比,Wine-CE 可以 模擬 執行 不同 指令 集的Windows 軟件,它使用修改過的 Qemu作為指令翻譯層。歷經三年多的開發,Meil
89、isearch 1.0 首個完全穩定版于 2023 年 2 月發布,可用于生產環境且向前兼容。1.0 的 CLI 工具不僅進入了穩定狀態,還新增了許多破壞兼容性的重要變化,使錯誤處理程序更加直觀。Meilisearch 是 Rust 實現的高性能開源搜索引擎,支持方便地集成到任何網站 或應用 程序,支持自 托管(self-hosting),可 作為Algolia 和Elasticsearch 的輕量替代方案。硬核發版最硬核、最極客的年度發版匯總!P Py yT To or rc ch h 2 2.0 0 正正式式發發布布PyTorch 2.0 版本包括穩定版的 Accelerated Tran
90、sformers(以前稱為Better Transformers)。PyTorch 是一個 Torch7 團隊開源的 Python 優先的深度學習框架。21/8711S Sl li in nt t 1 1.0 0 正正式式發發布布D Dr ra ag go on nf fl ly yD DB B 1 1.0 0 正正式式發發布布開源開發者事件回顧F Fe er rr re et tD DB B 1 1.0 0 正正式式 G GA ALayui 于 2023 年 4 月發布了 2.8.0 的正式版本,以及全新的文檔站?!霸?Layui 過往七年的開源歷程中,從未用多達二十個預覽版去為一個正式版而
91、引路。顯然,2.8.0 是 Layui 一次樸實的回歸,更是情懷的延續?!盠 La ay yu ui i 2 2.8 8.0 0 正正式式發發布布,樸樸實實歸歸來來經過漫長的測試,foobar2000 于 2023 年 4 月底正式發布了 2.0 版本,標志著 foobar2000 發布 21 年后終于進入 2.0。foobar2000 是一款免費的高級音頻播放器軟件。D De el lp ph hi i 1 11 1 和和 C C+B Bu ui il ld de er r 1 11 1 社社區區版版發發布布Embarcadero 在 2023 年 4 月為 Delphi 11 和 C+Bu
92、ilder 11 發布了提供了可免費使用的社區版,具體版本號為 11.3。發布公告寫道,社區版用戶現在可以使用 Delphi 11 Alexandria Pro 版本中的里程碑式創新,包括支持高分屏(4K 顯示器)、改進對 VCL 和 IDE的遠程桌面支持、針對多窗口和多顯示器顯示的改進。f fo oo ob ba ar r2 20 00 00 0 正正式式發發布布 2 2.0 0FerretDB 1.0 于 2023 年 4 月正式 GA,達到生產可用。這是一個開源的MongoDB 替代品,建立在 PostgreSQL 之上,并在 Apache 2.0 許可下發布。Dragonfly 1.0
93、 完全支持 Redis 最常見的數據類型和命令,以及快照、主從復制和高可用等特性。DragonflyDB 是一個現代化的開源內存數據庫,兼容 Redis 和 Memcached API,遷移時無需修改任何代碼,可作為兩者的替代方案。Slint 1.0 于 2023 年 4 月發布,標志著項目已順利從開發階段“畢業”,可正式用于生產環境。Slint(最初稱為 SixtyFPS)是一個 Rust 編寫的綜合性 UI 工具包,用于為桌面和嵌入式設備構建原生用戶界面。P Py yt th ho on n 深深度度學學習習框框架架 K Ke er ra as s 3 3.0 0 一一統統江江湖湖Kera
94、s 3.0 被譽為改變了機器學習游戲規則:不僅支持 TensorFlow、PyTorch、Jax 三大框架作為后端,還能在它們之間無縫切換,甚至混合使用。據稱有 250 多萬開發者都在使用Keras 框架。Keras 之父 Franois Chollet 表示:歡迎來到多框架機器學習。22/8711Q Qwwi ik k 1 1.0 0 發發布布,全全棧棧式式 WWe eb b 框框架架前前端端 U UI I 框框架架 S Sv ve el lt te e 4 4 發發布布開源開發者事件回顧B Bl li in nk k 1 1.0 0 正正式式發發布布ECMAScript 是標準化的 Jav
95、aScript 語言,于 1997 年發布了第一版,現已發展成為世界上使用最廣泛的通用編程語言之一。E EC CMMA AS Sc cr ri ip pt t 2 20 02 23 3 正正式式發發布布openKylin 1.0 版本默認搭載 6.1+5.15 雙內核,完成 20+操作系統核心組件自主選型升級,并新增許多新特性,修復超千個 bug,進一步提升系統整體穩定性和兼容性,為用戶帶來更好體驗。A Ar rc c 瀏瀏覽覽器器正正式式發發布布 1 1.0 0Arc 官網廣告語直接引用了媒體評價:Arc is the Chrome replacement Ive been waiting
96、for.Arc 旨在成為一個“萬維網的操作系統”,并試圖將網頁瀏覽與內置應用程序和功能整合在一起。Arc 基于 Chromium 并用 Swift 語言編寫。o op pe en nK Ky yl li in n 1 1.0 0 重重磅磅發發布布Blink 1.0 于 2023 年 6 月正式發布。Blink 是無特權用戶空間虛擬機,支持在任何 POSIX 平臺上模擬 x86-64-linux 二進制文件,聲稱是最小的x86 Linux 模擬器??偟膩碚f,它是一個 220kb 的無依賴靜態二進制文件,實現了大約 600條 x86 指令和 180 條 Linux 系統調用。距離 Svelte 3
97、 發布過去了四年多的時間,Svelte 4 穩定版本于 2023 年 6 月正式發布。新版本改進了性能、優化了開發者體驗,并大改了網站。Svelte 4 主要是一個維護版本,它為下一代的 Svelte 發布奠定了基礎。Qwik 是一個全棧式 Web 框架,Qwik 基于 React、Angular 和 Vue 等其他 Web 框架的概念,但以 JavaScript 流等更新的方法脫穎而出,允許以高性能向用戶交付復雜的 Web 應用程序。D Da ar rt t 3 3 正正式式發發布布,1 10 00 0%健健全全的的空空安安全全Dart 3 包含了三個主要改進:完成了 100%健全的空安全;
98、添加了記錄、模式和類修飾符的新語言特性;以及對未來進行了預覽,即,通過 Wasm 編譯擴大了對網絡原生代碼的平臺支持。C Cy yt th ho on n 3 3.0 0 正正式式發發布布經過近五年的漫長歲月,Cython 3.0 于 2023 年 7 月宣布正式發布。Cython 3.0 在各個方面都優于之前的任何其他 Cython 版本。它更加Python 化,與 C 和 C+集成得更好,支持更多 Python 實現和配置,提供了許多很棒的新語言特性。更快、更安全、更易用。Its simply better。23/8711N Ni imm v v2 2.0 0 正正式式發發布布,命命令令式
99、式編編程程語語言言開開源源十十年年后后 C Ca ap p n n P Pr ro ot to o 1 1.0 0 終終發發布布開源開發者事件回顧華華為為正正式式發發布布 H Ha ar rmmo on ny yO OS S 4 4Apache Doris 2.0.0 版本于 2023 年 8 月 11 日正式發布,有超過 275 位貢獻者提交了超過 4100個優化與修復。在 2.0.0 版本中,Apache Doris 在標準 Benchmark數據集上盲測查詢性能得到超過 10 倍的提升。A Ap pa ac ch he e D Do or ri is s 2 2.0 0.0 0 版版本本
100、正正式式發發布布sudo-rs 是互聯網安全研究小組(ISRG)發起的 Prossimo 項目用 Rust重寫 sudo 和 su,目標是提升它們在內存方面的安全性,確保它們不再遭受內存安全漏洞的困擾,并進一步增強 Linux 和開源生態系統的安全性。B Bu un n 發發布布 1 1.0 0 正正式式版版本本2023 年 9 月 8 日,JavaScript 運行時 Bun 正式發布 1.0 版本,標志著這個由前 Facebook 工程師創建的項目正式進入穩定生產可用階段。Bun 的愿景是通過深度整合,讓 JavaScript 開發“快如閃電”。s su ud do o-r rs s 發發
101、布布首首個個穩穩定定版版 0 0.2 2.0 0華為 HarmonyOS 4(鴻蒙 4)操作系統于 2023 年 8 月正式發布。全新的 HarmonyOS 4 在隱私安全、AI 大模型能力和個性交互等方面有全新突破。HarmonyOS 4 的小藝是首個具備 AI 大模型能力的智慧助手,可以通過對自然對話的理解,識別出用戶意圖,很多操作不需要用戶用專業的功能術語表達,小藝都可以明白并執行。Capn Proto 是一種速度極快的數據交換格式和 capability-based RPC 系統,于 2013 年4 月開源發布。Capn Proto 1.0 于 2023 年7 月正式發布,這是一個長期
102、支持版本。Capn Proto 項目作者是 Kenton Varda Protocol Buffers version 2 的主要開發者。Nim v2.0 于 2023 年 8 月正式發布,這是一門指令式、通用、多范式、靜態類型、編譯型的編程語言。2.0 是 Nim 的一次進化,新版本的一項重要特性是將 ORC 內存管理作為默認設置,以及許多其他新功能和改進。J Je et tB Br ra ai in ns s 編編程程工工具具“全全家家桶桶”J Ja av va a 2 21 1/J JD DK K 2 21 1(L LT TS S)G GA AJava 21/JDK21于2023 年 9
103、 月正式 GA。此版本是繼 JDK 17 后的長期支持版本(LTS),Oracle 將為其提供至少八年的技術支持和更新。T Ti iD DB B 7 7.5 5 L LT TS S:提提升升穩穩定定性性和和靈靈活活性性年年度度大大版版本本更更新新:2 20 02 23 3.3 324/8711c cu ur rl l 8 8.4 4.0 0 正正式式發發布布開源開發者事件回顧Y Ya ar rn n 4 4.0 0 正正式式發發布布微軟稱.NET 8 提供了數以千計的性能、穩定性和安全性改進,以及平臺和工具增強功能,有助于提高開發者的工作效率和創新速度。.N NE ET T 8 8 正正式式
104、G GA AP PH HP P 8 8.3 3 G GA AYarn 不僅是現代化的JavaScript 軟件包管理器,還可以作為項目管理工具。與 3.x 相比,Yarn4.0 引入了不少破壞性變化。此外,4.0 性能方面有了顯著提升,其安裝速度明顯快于 3.6。curl 8.4.0 于 2023 年 10 月正式發布。該版本修復了一個高危安全漏洞:SOCKS5 堆溢出漏洞(heap buffer overflow),該漏洞(CVE-2023-38545)導致 curl 在 SOCKS5 代理握手過程中溢出基于堆的緩沖區。MMo oj jo o 編編程程語語言言開開放放下下載載Mojo 是 M
105、odular AI 公司開發的新編程語言,它結合了 Python 的易用性以及 C 語言的可移植性和性能,目標是使其成為 AI 研究和生產的理想選擇。V VS S C Co od de e 實實現現“浮浮動動窗窗口口”特特性性在2023 年11 月 發 布 的vscodeOctober 2023(version 1.84)更新中,開發者呼聲極高的 vscode“浮動窗口”特性(預覽特性)終于實現。相關提案最初于 2016 年提出,數千人贊同,期間帖子也增長到 300 多條。特特邀邀評評論論員員 江江湖湖評評談談(多多年年.N NE ET T 虛虛擬擬機機技技術術 C CL LR R/J JI
106、IT T 研研究究、安安全全領領域域架架構構帶帶頭頭人人)有人問.NET 8 好用嗎?個人的使用的感官是跟之前的版本比如.NET 6、.NET 7 這些版本在底層上有本質的區別,比如.NET 7 里面修改了上百個性能的問題,JIT 大幅度改動的地方上千次。.NET 8 里面把這些性能問題(OSR、Tiere、PGO、GDEV、Quick 等等)統統進行了默認啟動,這是一個跨度很大的改動。但是問題不在于此,而在于.NET 6 升級到.NET 8,甚至于.NET Core 2.0 到.NET8.0 都可以較為絲滑的升級,而極少出錯?;蛘卟恍枰艽蟮男薷牟拍軓牡桶姹旧壍礁甙姹?。這是因為在托管代碼層
107、面,也就 C#源碼層面,這些 API 和框架基本上與以前的版本保持了一致或者是兼容性上的極大寬松導致的。從.NET 6 到.NET 8 這兩個 LTS 版本來看,微軟對于.NET 的升級主要著重于性能的提升,比如每一個版本都比前一個版本都有較大的性能提升。另外一個就是語法糖的包裝越來越深厚了,也就是從之前的簡單的語法糖包裝已經深入到了.NET 骨髓的 CLR 層面的語法糖包裝,比如 JIT 優化上面的一些判斷和語法樹對于 IL 語法糖的值傳遞進行騷操,以配合.NET 性能提升或者語法的優雅,或者一些其它功能性上的傳導。這點可以看下分層或者 PGO 或者是循環提升這些方面的案例??傊?,.NET
108、8 算是比較完美的一個版本,值得推薦。但是缺陷依然存在,比如AOT 的適用性并不廣泛,MAUI 跨平臺的界面框架 BUG 依舊繁多,分層編譯Debug 的奇怪 Error 等等。這些問題,只能有待持續性的版本更新解決了。25/8711紅紅帽帽限限制制 R RH HE EL L 代代碼碼訪訪問問熱門話題回顧 2023 年度熱門開發者事件!開源開發者事件回顧俄俄羅羅斯斯開開發發者者被被阻阻止止為為開開源源軟軟件件貢貢獻獻代代碼碼2023 年初,某國產電商 APP 被安全研究機構披露利用 Android 系統漏洞提權使其難以卸載。此后,卡巴斯基證實該 APP 的部分版本包含惡意代碼,利用已知的 An
109、droid 漏洞提權,下載并執行額外的惡意模塊,其中一些還獲得了訪問用戶通知和文件的權限。某某國國產產電電商商A AP PP P利利用用A An nd dr ro oi id d 漏漏洞洞提提權權2023 年 3 月 31 日,馬斯克終 于 履 行 諾 言 正 式 開 源Twitter 算法,并表示“今天標志著 Twitter 進入了一個透明的新時代。我們正在與全世界共享為推特平臺提供底層支持的大部分源代碼”。路路透透社社:開開源源軟軟件件成成為為貿貿易易戰戰的的重重要要環環節節2023 年 2 月 27 日,路透社發布了 一 篇 評 論 Open-sourcesoftwarebracesfo
110、rtradewar。文章指出,開源軟件運動已成為全球創新和生產力增長中前所未有的推動力。然而,不斷加劇的地緣政治緊張局勢正在危及開源未來的經濟貢獻。T Twwi it tt te er r 開開源源推推薦薦算算法法2023年3月發生了兩起俄羅斯公司開發者被阻止向開源軟件(FOSS)貢獻代碼的事件。一是任職于俄羅斯芯片制造商 Baikal Electronics 的開發者 SergeySemin。Linux 內核郵件列表顯示,他以公司員工身份貢獻的補丁遭到拒絕。內核維護者回復了簡短的通知:我們不愿意接受來自貴組織生產的硬件或與之相關的補丁。2023 年 6 月,紅帽宣布了限制源代碼訪問性的政策,
111、稱其企業發行版 RHEL(Red Hat Enterprise Linux)相關源碼僅通過 CentOS Stream 公開,付費客戶 和 合 作 伙 伴 可 通 過 Red HatCustomer Portal 訪問到源代碼。8 月,素有“全球白帽黑客奧斯卡獎”之稱的網絡安全獎項 Pwnie Awards 也在 2023 年度“最差廠商獎”中提名了該廠商。提名理由是:在 App 植入后門、竊聽用戶信息,被 Google 踢出應用市場,被卡巴斯基實錘曝光后,該廠商不僅拒不承認,還反而指責 Google 的處罰,并悄悄刪除惡意代碼、解散木馬團隊。在引發了巨大爭議,甚至被指責“背叛”開源后。紅帽副
112、總裁 Mike McGrath做出回應稱,公司恪守對開源的承諾。他表示,RHEL 是基于 CentOS Stream,而 CentOS Stream 的 GitLab 庫是公開的,稱 RHEL 閉源完全不正確。紅紅帽帽副副總總裁裁 MMi ik ke e MMc cG Gr ra at th h 回回應應節節選選:如果是僅僅重新構建代碼,而不對現有代碼增加價值或進行任何修改,對于所有開源公司來說,這才是真正的威脅。這對開源來說是一個真正的威脅,有可能將開源重新變回到只適用于業余愛好者和黑客的活動。O OS SC CH HI IN NA A 社社區區用用戶戶L Li ib br re eS So
113、 of ft tc c評評論論:大聲和我一起讀:不論目的為何,有運行該軟件的自由(自由之零)。有研究該軟件如何工作以及按需改寫該軟件的自由(自由之一)。取得該軟件源代碼為達成此目的之前提。有重新發布拷貝的自由,這樣你可以借此來敦親睦鄰(自由之二)。有向公眾發布改進版軟件的自由(自由之三),這樣整個社群都可因此受惠。取得該軟件源碼為達成此目的之前提。還有一個是俄羅斯芯片制造商 Yadro 的員工 Alexander Amelkin,他的 GitHub帳號在沒有任何警告的前提下遭到封鎖,所維護的開源項目 ipmitool 也被標記為“已存檔”狀態。Twitter公司在GitHub上發布了兩 個 倉
114、 庫(main repo、mlrepo),其中涵蓋了推薦算法在內的許多推特源代碼,包括用來控制用戶在 For You 時間線上看到的推文的機制。文章結尾寫道:將世界劃分為相互競爭的開源陣營將標志著自由貿易的又一次倒退。這也是對“天下沒有免費的午餐”這句古老格言的可悲注腳。銳銳評評:開源無國界,但是開源軟件相關公司是有國界的。開源因為貿易戰而淪為打擊經濟發展的重要手段開源事實上有了國界。而很明顯,由此帶來對整個開源生態乃至供應鏈的打擊是沒有國界的。26/8711開源開發者事件回顧U Un ni it ty y 引引擎擎根根據據游游戲戲安安裝裝量量收收費費自自由由軟軟件件基基金金會會正正在在消消亡
115、亡MMy yS SQ QL L v vs s P Po os st tg gr re eS SQ QL L:年年度度“圣圣戰戰”該收費政策給社區帶來了巨大混亂和爭議,Unity 首席執行官 John Riccitiello因此宣布離職。之后 Unity 向公眾和業內人士道歉,并調整了收費規則。在 Godot 4.0 正式發布前,Godot 團隊發文探討了一個問題:Godot 與主流商業產品相比有多大差距?文章闡述了一些尚未實現的功能對于使 Godot 成為更接近商業領域產品的重要性。文章還強調了 Godot 作為免費開源軟件的特質這是一個雙贏的局面,因為它允許使用者保持創新的自由,同時避免支付
116、昂貴的技術許可費用??査刽敹蚶砉W院(簡稱 KIT)學生 Jan Strehmel 分析了 GitHub 上大量開源項目的倉庫代碼,最終發現在多項統計測試中,含有臟話的開源代碼比不含臟話的代碼質量明顯要好。當然,這不意味著臟話越多則代碼質量越高。Hare Lang 作者 Drew DeVault 發文稱,歷時近 40 年,自由軟件基金會(FreeSoftware Foundation,FSF)正在走向消亡。G Go od do ot t 離離開開發發 3 3A A 游游戲戲還還有有多多遠遠?2023 年 8 月,Meta 開源了號稱是編程領域“最先進的大語言模型”CodeLlama,完全免費
117、且可用于研究和商業用途。開開源源代代碼碼質質量量與與臟臟話話的的相相關關性性2023 年中旬,兩篇文章引起技術圈熱烈討論:PostgreSQL:世界上最成功的數據庫和MySQL:這個星球最成功的數據庫。開源中國借此話題順勢舉辦了線上技術直播現場畫面堪稱是年度大戲。MMe et ta a 代代碼碼生生成成大大模模型型:C Co od de e L Ll la amma a2023 年 9 月,Unity 發布公告介紹了新的收費模式,以及配套服務更新:Unity引擎自 2024 年 1 月 1 日起將根據游戲的安裝量引入新的 Unity Runtime 費用(runtime fee)。O OS S
118、C CH HI IN NA A 社社區區用用戶戶哈哈庫庫納納評評論論:正常的商業合作關系是你賺你的錢我賺我的錢。如果你想賺我的錢那么之前的一切商業關系都要重新考慮。Unity 相當于要從“你賺你的錢我賺我的錢”模式轉變為“我賺你賺的錢”。Drew 表示 FSF 的成就毋庸置疑,但 FSF 沒有重視起傳播自由軟件理念,開發、發布和推廣 CopyLeft 許可證,監督自由軟件運動的健康演進這幾個核心理念的發展,同時還分心將資源投入到了其他的閑散工作中。O OS SC CH HI IN NA A 社社區區用用戶戶王王政政評評論論:FSF 的確有問題,但我認為問題并不在文章所說的那些點里面:根本問題是
119、能否創造獨屬于自由軟件的生產方式如果我開發了自由軟件,我如何用自由軟件維持我的生活?網網友友銳銳評評 你以為的技術論戰:性能分析,社區建設,技術架構實際上的技術論戰:翻看對手 P5 的定級,嘲笑只能做打工人沒有投資,互相出 DBA 的面試題 一家公司成功與失敗,跟他們選 MySQL 還是 PG 一毛錢關系都不會有。這次直播效果拉滿,我最開始也是抱著看熱鬧不嫌事大的心態,但是看到后面,覺得嘉賓們很長時間陷入了爭論情緒中,有點可惜。沒有完美的技術,只有最合適的技術,我最想聽嘉賓們討論什么場景使用什么技術,以及該方案的優缺點,或者從更高的維度來討論數據庫的發展趨勢。所以,我對這次直播既覺得有趣,但又
120、有點失望。27/8711開源開發者事件回顧P PH HP P 市市場場份份額額超超 7 7 成成、C CMMS S 中中的的王王者者N Ne ex xt t.j js s 支支持持在在前前端端代代碼碼中中寫寫 S SQ QL LC Ch hr ro omme e 支支持持運運行行 J Ja av va a 等等 G GC C 編編程程語語言言2023 年 8 月,微軟宣布推出集成到 Excel 中的 Python 公開預覽版(Python inExcel),這項特性允許用戶在無需進行任何配置的情況下,將流行 Python 語言中的腳本與其常用的 Excel 公式在同一工作簿中組合使用。退休后又
121、被微軟招聘的 Python 之父龜叔(Guido van Rossum)也深度參與了Python in Excel項目,他負責架構制定方面的工作。Next.js Conf 2023 展示的一張截圖,里面的代碼使用了名為ServerActions的特性:在前端代碼中使用 SQL 語句直接操作數據庫。其團隊表示,Server Actions 改進了開發者在編寫數據變更方面的體驗。但許多人表示這是過去 24 小時內 Twitter 上最讓人討厭的圖片。微微軟軟將將 P Py yt th ho on n 集集成成到到 E Ex xc ce el l谷歌 Chrome 開發者博客在 2023 年 10
122、月底官宣:Chrome 已默認啟用WebAssembly 垃圾回收(WasmGC)功能能夠將具有 GC 的編程語言編譯為 WebAssembly(Wasm)。這意味著 Chrome 將支持運行 Kotlin、Java 等 GC編程語言。WasmGC 是 WebAssembly 社區群組發布的一項提案。通過 WasmGC,將編程語言移植到 Wasm 意味著編程語言的垃圾回收器不再需要成為移植的一部分,而是可以直接使用現有的垃圾回收器。Wikimedia 基 金 會 首 席 工 程 師 TimoTijhof 發表文章An Internet of PHP,并整理了一些 PHP 應用相關的數據。根據W
123、3 Techs對全球前1000萬個網站使用的編程語言分析(截至 2023.8),PHP仍然是首選編程語言,占比 77.2%。且絕大多數公開網站都是使用基于PHP的CMS 進行構建。根據市場份額,12 大CMS 軟件中有 8 個采用 PHP 編寫。O OS SC CH HI IN NA A 社社區區用用戶戶評評論論T Te el ll lMMe eT Th hi is sO OK K:感覺就像是把保險柜放在大門口,沒毛病但是挺危險。w wa ay yl la au u:“Server Actions”名字理解,就是服務器端的代碼呀。服務器端寫SQL 不很正常嘛。f fa a1 1s se e:前
124、端直連 redis、memcached、mongodb、kafka.的時代即將到來,直接干掉后端運維測試,統一所有 bugO OS SC CH HI IN NA A 社社區區用用戶戶評評論論J Ja as so on n9 90 09 9:JavaScript 作為動態類型語言,V8 引擎已經對其做了極致的優化,但性能跟 C/C+仍有相當大的差距,想要更高的性能需要靜態類型的代碼和對其優化的運行環境,于是有了 WASM 的前身 asm.js。AssemblyScript 在實際工作中意義不大,需要改寫成高性能的 AssemblyScript 代碼的面向計算密集型的 JS代碼不多,現有的可以編譯
125、成的 WASM 的高性能 C/C+代碼很多,何必用AssemblyScript 再寫一遍?從當年看到用 asm.js 把 Unity 和虛幻引擎搬到瀏覽器上,到現在 WASM 雖然還不是很火,但一直在發展。特特邀邀評評論論員員杜杜天天微微,獅獅偶偶編編程程語語言言作作者者Microsoft Office 集成 Python 是擁抱開源的一個表現,也是 Python 甚至是開源的一步勝利。特特邀邀評評論論員員王王春春生生,禪禪道道軟軟件件公公司司創創始始人人我們對 PHP 有太多的刻板認知了,是時候來刷新下對 PHP 的印象了。PHP 是最適合用來創業或者做項目的語言,沒有之一 語法靈活,開發效
126、率高,注重實效。性能自 PHP7 以后有了脫胎換骨的變化。99%的業務場景傳統的 PHP 架構可以輕松搞定,更高負載的場景也有了 Swoole 等解決方案。PHP 新版本在保持向下兼容的前提下,也做了大量的語法改進,增強了 PHP 的表現力,也讓 PHP更加嚴謹,更有利于團隊協作。PHP 對開發者很友好,沒有太多強制的規定,寫 PHP 代碼會讓人很自由,很舒服。不像其他的語言有各種各樣奇奇怪怪的強制規定。PHP 社區也有很多更好玩的項目,比如 Swoole,RoadRunner,FrankenPHP。Golang 的出現我認為讓 PHP 有了更多的可能。PHP 背后沒有大廠,完全是社區運作,這
127、就意味著對中國開發者會比較友好,不用擔心被卡脖子。而且 PHP 是中國開發者參與度比較高的一門編程語言。PHP 基金會也成立了有兩年了,累計募集了超過 110 萬美金的資金,截止今天賬面上結余 73 萬美金。PHP 基金會目前雇用了 6 位全職或者兼職的 PHP 開發人員。在新的一年里還會計劃雇用 4 名開發人員。運作良好,更新有保障。我想對 PHP 這三個字母做一個新的解讀:Pragmatic、Humanized、Permanent。這三個單詞也是我們所熟知的注重實效、人性化設計和長期主義。在我看來,PHP 這門編程語言和它背后的開發者社區非常深刻地體現了這三種思想。編程語言有各種的選擇,每
128、個人也都有自己的喜好信仰。我想跟所有的 PHPer說,相信自己的選擇,因為你并不孤單!特特邀邀評評論論員員杜杜天天微微,獅獅偶偶編編程程語語言言作作者者前端支持多語言就像 Node.js 干后端一樣,技術的融合會碰撞出更多的想法。但是這些語言適不適合前端的生態,是一個需要時間驗證的問題。28/8711開源開發者事件回顧雷雷軍軍公公布布小小米米澎澎湃湃 O OS S 完完整整系系統統架架構構2.5GHz 龍芯 3A6000 性能可達英特爾 10 代酷睿 3.6GHz i3-10100 的水平,下一步爭取使用成熟工藝達到英特爾、AMD 先進工藝 CPU 的性能。龍龍芯芯 3 3A A6 60 00
129、 00 0 桌桌面面處處理理器器正正式式發發布布中中國國開開發發者者團團隊隊創創建建編編程程語語言言小米澎湃 OS(Xiaomi HyperOS)是小米推出的全新的操作系統,基于深度進化的 Android 以及自研的 Vela 系統融合,徹底重寫底層架構。雷軍介紹稱,小米澎湃 OS 打造了貫穿內核層、服務框架層、跨端層的全端安全系統,尤其是內核層,小米啟用了完全獨立的“自研微內核安全系統”,保障了安全從最底層實現。深深度度 d de ee ep pi in n-I ID DE E 正正式式亮亮相相deepin 社區于 2023 年 9 月正式官宣 deepin-IDE(深度集成開發環境)由深度
130、公司自主研發,具有多語言、跨平臺兼容特性的輕量級集成開發環境。央央視視新新聞聞評評論論龍芯 3A6000 采用我國自主設計的指令系統和架構,無需依賴任何國外授權技術,是我國自主研發、自主可控的新一代通用處理器,可運行多種類的跨平臺應用,滿足各類大型復雜桌面應用場景。它的推出,標志著我國自主研發的 CPU 在自主可控程度和產品性能方面達到新高度,性能達到國際主流產品水平。O OS SC CH HI IN NA A 社社區區用用戶戶評評論論p ph hp pe er r0 08 8:i3-10100 的 benchmark 的跑分 8723 分,基本滿足辦公的需要,下一步爭取達到 i5-10400
131、,也就是一萬兩千分左右。酒酒肉肉朋朋友友:早點把價格打下來,我挺想試一試的。O OS SC CH HI IN NA A 社社區區用用戶戶評評論論MMi ie eC Ch hi iu u:why you believe this?小小肥肥俠俠:because it is open source.https:/ 2 20 01 14 4:樓上所有說 ide 不是自研的,或者說不行的,都是無知,好好了解工業皇冠上的明珠,有沒有這個。不行,每個孩子包括你學會爬到走,都是父母花費很多心血才成的,深度的 ide 同樣如此,自研加復用,到完全自研,這不是所有現有公司/產品/現實事務,乃至華為芯,一樣的路線嗎
132、,這跟那些套皮肯定不一樣啊,看現在,看未來,不要看自己的鍵盤張張亦亦俊?。哼@ ui 一看就是自研L Lo oo ok kE Ey ye es s:deepin 造這個輪子應該是為了配套將來玲瓏開發環境的吧。不過deepin 真的死磕 C+&Qt 技術了。O OS SC CH HI IN NA A 社社區區用用戶戶評評論論中中醫醫藥藥人人工工智智能能研研究究:雖有 Windows 還是允許 mac,linux 存在嘛,畢竟有競爭才有進步,何況小米一向主打性價比,作為消費者還是喜聞樂見的。n no oy yu ug go o:不太懂?開機顯示:Power by Android 不?MoonBit(
133、月兔)是由粵港澳大灣區數字經濟研究院(IDEA 研究院)基礎軟件中心負責人張宏波領導的團隊開發的一款編程語言。O OS SC CH HI IN NA A 社社區區用用戶戶評評論論D Do oe ee ek ki in ng g:個人覺得 Int 大寫開頭很麻煩,Int 關鍵字肯定用的很多,相比int 每次都輸入可能需要加個 Shift,十分不簡潔。吐槽(:_二二猿猿外外:我感覺就是 rust 的變異版本,工具鏈都一樣,源碼開放一下,看看本質稱稱底底層層全全部部重重構構MMo oo on nB Bi it t(月月兔兔)29/8711開源開發者事件回顧微微軟軟正正在在用用 R Ru us st
134、t 重重寫寫核核心心 WWi in nd do owws s 庫庫C+之父 Bjarne Stroustrup表示,自己幾十年來一直致力于實現更好、更安全、更高效的 C+。在他看來,NSA 報告中提到的“安全”編程語言在重要應用程序中實際上并不優于 C+。C C+之之父父:R Ru us st t 等等內內存存安安全全語語言言的的安安全全性性并并不不優優于于 C C+n no o-G GI IL L P Py yt th ho on n,啟啟動動!O OS SC CH HI IN NA A 社社區區用用戶戶評評論論D Di iy ymmi in ne e:C+都沒有包管理機制,這點就很落后,語
135、法上理解相對 C#、Java等語言太冗余了段段體體華華:現代 C+改進很多,例如引入了 Module 管理機制,儼然一個嶄新的語言。不過他會成為一種強大的遺留語言。新語言的誕生缺失可以忽略 C+原有的假定和負債,但是面臨語言上涉及的相同問題,未必都能擁有完美的方案。日積月累,負債也會越來越多,改進的程度未必趕上 C+的革新程度。例如模板技術在 Java 和 Go 中的誕生過程就可見一斑。之前人們強調語言保持簡潔性,到頭來仍舊會添加了這些內容,不僅語言超著復雜方面進化,實現功力未必趕得上 C+。Bjarne 說過,世界上只有兩種語言,一種沒人用,另一種是一邊用一邊罵的語言。d dw wc cz
136、z:這文章就證明了 C 系語言的沒落。就像匯編的沒落一樣-人們需要的是更先進和更方便的編程方式,而不是語言上的改良?,F在 AI 都可以替代一部分工作了,還在討論語言的安全和高效,已經沒意義了。C+之父還沒理解人們為何拋棄 C+-如同這篇文章一樣,只強調自己理由而無視人們的需求-學院派或當權者經常犯的錯誤,已經成為他們的行為模式。不愧是 C+之父-誰在風頭就“+”誰。好好的語言搞成大雜燴?!办o態分析以驗證沒有不安全的代碼被執行”-說白了,就是窮舉法。這早就被證偽了?!昂喕a的編碼規則,使工業規模的靜態分析可行?!?你那大雜匯,誰能簡化代碼的編碼規則!“使此類簡化代碼相當容易編寫并確保在需要時進
137、行運行時檢查的庫?!?還是那句話-遇到個大雜匯語言,誰能簡化代碼-與其要求別人簡化,還是請先簡化簡化自己語言吧。圖圖亂亂:語言的設計哲學不一樣吧。C/C+(尤其是 C)我記得是說相信程序員知道自己在做什么,這樣靈活性很強,上限會很高,但下限也會很低,你要想 s,語言肯定不會攔著你。后來的語言,像 Java 之類的,就開始從語言層面進行限制,拉高代碼水平的下限了。冰冰峰峰天天王王:雖然人人都可以隨心發言,但是如果沒有經歷過多種硬件的底層開發,沒有經歷過每秒處理數十 G 的數據,甚至連基本的代碼總數都沒有寫過十萬行以上的,根本無法寫軟件是在干什么,如果這樣的人,也在這個噴master 級的人,就有
138、點可笑了。D Dr ra ay yf fi ir re e:從學程序開始就在寫 C+,自從學了 Rust 后,什么都想用 Rust 寫。Rust 代碼如果能寫出來且跑起來,BUG 就很少,這是它的優勢,缺點也很明顯,需要花的很多時間才能寫出來。F Fr ra an nc ce es sc ca a:C+寫出來能跑起來,不代表就沒有問題了,所以也是需要花很多時間才能寫出來一個良好的程序,結果我認為是一樣的,一個是先苦后甜,一個是先甜后苦_ _e en n:Rust 如果能替代 C 的話,那么我認為 C+確實會完蛋,否則 C+將會一直存在下去。以我的經歷來看,很多項目都能用 C 來開發,只是為了方
139、便一些,用上了 C+,底層還是 C,所謂 C+,不過是 C 的擴展罷了。寫 C+核心其實在寫 C,你寫 Rust 核心是寫 C 嗎?O OS SC CH HI IN NA A 社社區區用用戶戶評評論論華華麗麗的的周周遭遭:用 Rust 重寫 C+代碼我是可以理解的。但是重寫 C 代碼就沒必要。新的項目確實應該與時俱進,擁抱 Rust。權權少少:我倒是覺得相反,Rust 開發效率對比 C+沒大優勢,但是比 C 高。D DB BK Ka an ng ga ar ro oo o:C/C+老一代的人要退場了,而新生代學習 Rust 的人多,可能這才是關鍵。圖圖亂亂:我倒是覺得 C/C+太成熟了,需要
140、Rust 來維持 KPI 才是關鍵。F Fr ra an nc ce es sc ca a:Linux 已經支持 Rust 編寫內核模塊,Windows 也正在搞了,那么三大系統里面估計只有蘋果不會用 Rust 了,因為蘋果比較喜歡他的 oc 語言。CPython 核心開發者Thomas Wouters 在2023 年 10 月代表 Python 指導委員會宣布:正式接受 PEP 703 提案(Making theGlobal Interpreter Lock Optional,讓全局解釋器鎖成為可選)no-GIL,或稱為自由線程。全局解釋器鎖(GIL)阻止了同時多線程執行代碼,成為了在多核
141、CPU 上提高 Python 代碼運行效率的一大障礙。特特邀邀評評論論員員杜杜天天微微,獅獅偶偶編編程程語語言言作作者者:Python 對于多線程的支持一直是個大問題,現在終于看到了一絲曙光。O OS SC CH HI IN NA A 社社區區用用戶戶評評論論:范范一一舟舟:趕緊,盡快推動實施,掙脫開 gil 的枷鎖,Python 才能有更好的發展F Fl la as sk k 之之父父用用 R Ru us st t 編編寫寫 P Py yt th ho on n 包包管管理理工工具具:R Ry ye e30/8711開源開發者事件回顧A As sa ah hi i L Li in nu ux
142、 x 致致用用戶戶:停停止止使使用用 X X.O Or rg g,WWa ay yl la an nd d 才才是是未未來來Amazon 的流媒體平臺 PrimeVideo 在 2023 年 3 月 22 日發布了一篇技術博客規?;疨rime Video 的音視頻監控服務,成本降低 90%,副標題:“從分布式微服務架構到單體應用程序的轉變有助于實現更高的規模、彈性和降低成本”。這種話題與業內推崇的微服務架構形成了鮮明的對比,從而在技術圈引起了熱議。是是微微服服務務架架構構不不香香還還是是云云不不香香?Asahi Linux 首席開發人員 Hector Martin 在 mastodon 發表了
143、一篇帖子,鼓勵 Asahi Linux 發行版的用戶停止使用 X.Org,因為 Wayland 才是Linux 的未來。前前端端新新輪輪子子 N Nu ue e J JS S,作作者者稱稱要要打打造造全全新新的的 WWe eb b 生生態態與使用 React 相比,Nue JS 實現同樣的功能代碼量只有前者的 1/10。O OS SC CH HI IN NA A 社社區區用用戶戶評評論論獨獨孤孤影影:Serverless 本來就是一個成本非常高的東西。同樣的坑我們也踩過,用 scf 做接入層日志過濾,然后成本高得嚇人,性價比非常低。o os sc c_ _7 78 86 69 92 28 80
144、 02 2:我們兩三個人的開發團隊開發個并發不到 300 的產品竟然使用 java+spring+微服務。本機調試個項目開一大堆工具、idea 都得開 3 個。改個 java 類還得等熱部署,寫個極其簡單的功能實體類、DTO、mapper、接口等要建 20 多個文件,還要應對經常變化多端的業務,搞毛線啊。nginx+php+db 不香嗎?大規模、高并發 nginx 負債均衡不就完了?簡單的mvc 一個增刪改查 2 個小時完成,java 微服務 2 天,真牛 TMD 逼。A Au ut to oP Pl lu us s:UNIX 50 年前就告訴你們了,小而美,把系統拆成多個小的進程,每個進程負
145、責一個專一的任務,進程之間通過最簡單的字符流交流,從而形成優雅簡單的 ls/|grep|awk 的管道流模型。而微服務沒有錯誤,可以是這種小進程的變體,微服務錯誤的地方在于,很多人用 Spring Cloud 實現微服務,愚不可及,微服務是進程,而不是 Spring Cloud 進程,使用 K8S+containers,每個 container 是一個進程,這是正兒八經的微服務,確切的說,是進程群系統。O OS SC CH HI IN NA A 社社區區用用戶戶評評論論大大風風起起兮兮 9 95 52 27 7:不懂就問,TCP 慢啟動算法這個靠前端能解決?h ho ou uj j2 2:一切
146、都是基于它“小”,它不能修改 HTTP 協議和相關算法,但它“秘訣在于遵守 TCP 慢啟動算法中的 14kb 規則:當包含渲染初始視口的所有內容和樣式的 HTML 內容低于 14kb 時,頁面加載速度會顯著加快”b bi is su u3 33 30 06 6:我選擇 jQuery,只要能達到效果。屎一樣的代碼繼續支行。-S SO OR RA A-:我選擇 vanilla,連 jQuery 都嫌棄。網網友友銳銳評評 我覺著如果是提 issue 求助的,點個 star 作者幫你,無可厚非。如果是提 bug、改進建議或者 pr 什么的還強要 star 是不是不合理了?如果有個惡性 bug,人家給你
147、提,不點 star 就不改,坑誰呢?所以整體來說這種行為是不合適的。別人提交 issue 是幫助你完善你主導的開源項目,用戶才是你的財富。這個意義不大,畢竟靠這個也多不了幾個星星,不過這個做法我覺得還是值得鼓勵的。N No o S St ta ar r,N No o F Fi ix x開發者向開源項目的GitHub倉庫提交issue后,該項目的Bot機器人回復稱,此 issue 將被打上 wontfix 標簽意思是項目作者不會對其進行修復,并且會關閉 issue。原因是提交 issue 的這位開發者沒有 star 該倉庫。O OS SC CH HI IN NA A 社社區區用用戶戶評評論論D
148、De eb bu ug gg ge er rX X-D DE EV V:開發人員的話聽聽就好不必那么當真,其實就是受限于 Mac的封閉,有太多東西需要從頭搞,沒精力兼容X11了。我在m1上裝Asahi Linux,用最新的 GPU 驅動和 Wayland,真就只是能簡單用用,上上網寫寫文檔,完成度和體驗還是差用 X.Org 的主力開發機一大截。楓楓_ _林林_ _海海:奇怪的是現在 Wayland 還不穩定。很多應用也要依賴 X.org.但是感覺發行版都在強推 Waylandg gl lr r:不用 X,wsl 上的 remote window 咋個弄法?31/8711開源開發者事件回顧D D
149、H HH H 銳銳評評“打打包包工工具具”:前前端端根根本本不不需需要要構構建建前端生態系統的復雜性是出了名的。在每一層,似乎都存在著不兼容的,相互競爭的標準。為為什什么么前前端端技技術術棧棧如如此此復復雜雜?R Re ea ac ct t 正正在在經經歷歷 A An ng gu ul la ar r.j js s 的的時時刻刻嗎嗎?Ruby on Rails 作者 DHH:最快的打包工具就是沒有打包(No Build),有了 HTTP/2 以及瀏覽器原生支持 ES Modules,前端根本不需要構建。S Sv ve el lt te e 正正從從 T Ty yp pe eS Sc cr ri
150、 ip pt t 切切換換到到 J Ja av va aS Sc cr ri ip pt t前端 UI 框架 Svelte 創始人 Rich Harris證實了 Svelte 團隊計劃 TypeScript 遷移到 JSDoc 的消息。并表示,該決定不會改變 Svelte 的類型安全。負責 Svelte 編譯器的開發者表示,改用JSDoc 后,代碼不需要編譯構建即可進行調試 簡化了編譯器的開發工作。佚佚名名:jQuery 4.0 歷時 4 年開發,與其問它為什么還在更新,不如問為什么仍有那么多人在使用它。這就好比半個世紀以前,人類第三次工業革命產生的電子計算機技術、微電子技術等,到今天仍被廣泛
151、應用。仍有用武之地和受眾群體,即是 jQuery 仍在更新的理由,它不會突然被所有人棄用,只會在自然規律中慢慢遠去。今天那些炙熱的主流框架,在未來也將進入相同的循環。致敬 jQuery 4.0。O OS SC CH HI IN NA A 社社區區用用戶戶評評論論:a as sd df fg gh hj jk kl l1 12 23 34 45 56 67 78 8:還是喜歡原來的前端,現在前端搞的太復雜了o os sc c_ _9 91 12 22 29 97 77 70 0:jquery 強大在于,一個項目 10 年后還可以穩定運行,也可以修改,現在前端如果找不到原來項目源碼,過了一年可能無
152、法構建了,就無法修改了。特特邀邀評評論論員員杜杜天天微微,獅獅偶偶編編程程語語言言作作者者:我個人更喜歡純粹的前端編程,對我來說 Vue+JS 是非常好的組合,無構建。當然在大多數項目里不使用構建確實無法得到最優的代碼,所以在大型項目中我不得不為了性能使用構建。O OS SC CH HI IN NA A 社社區區用用戶戶評評論論:i in nf fo ow wo or rl ld d:所以 TS 真正的作用就是提供類型安全?那如果 Js 加上類型不就沒 TS 什么事了?i imma an n1 12 23 3:js+jsdoc 還是很方便的,可以使用到類型檢查又可以不用 ts 編譯代碼,各有利
153、弊,根據實際情況靈活選擇即可苦苦行行瓜瓜:對于我這種純后端的人來說,前端技術知識最小化可用原則即可,做原型夠用就行了,TS 學習成本還是太高。特特邀邀評評論論員員杜杜天天微微,獅獅偶偶編編程程語語言言作作者者:前端相對于后端更喜歡用很多單一功能的庫來組合出龐大的系統。這點需要復雜的包管理機制,比如 npm。雖然 npm 并不完美,但是跟 Maven 和 APT 一樣在嘗試解決技術棧問題,未來也會有更多方案。O OS SC CH HI IN NA A 社社區區用用戶戶評評論論:P Py yn ni ix xWWa an ng g:拋開劑量談毒性都是耍流氓。x xl l-x xu ue el li
154、 in ng g:我也覺得前端現在搞的太復雜了,jquery 一把梭有啥不好,老是扯什么模塊化,難道 jquery 封裝好的工具方法就不能叫模塊化了嗎?后端的發展怎么說也是業務推動著發展的,前端的發展就是程序員自己折騰。資 深React開 發 者FranoisZaninotto 發文表示,對 React 官方推廣服務器組件的舉措感到擔憂。因為這種新的構建 Web 應用程序的方式與大多數現有的 React應用程序不符,會讓現有的很多寫法都失效。O OS SC CH HI IN NA A 社社區區用用戶戶評評論論:R Re emmy yZ Za an ne e:本來 react+vite 用得好好
155、的,前幾天看到幾個前端在鼓吹react+nextjs 合流,說什么 nextjs 也支持 spa。就試著遷移過去,結果把自己坑得七葷八素,最后組件狀態保持直接給我勸退了。spa 是從 ssr 進化出來,但又和 ssr 完全不同的產物。一小撮前端為了實現 seo 優化,逆向退化出 nextjs。作為遠古人,我需要你們逆向退化嗎?是 php 實現不了ssr 還是 python 實現不了 ssr?就算 nextjs 比 php 和 python 有優勢(如可以和 spa 項目共享一部分界面組件庫),也不能把 nextjs 吹得無所不能吧。這個 nextjs 所謂的 react 的未來,在我看來除了
156、ssr 簡直一無是處。j jQ Qu ue er ry y 4 4.0 0 開開發發進進度度:已已完完成成 9 99 9%特特邀邀評評論論員員杜杜天天微微,獅獅偶偶編編程程語語言言作作者者:前端技術復雜嗎?這應該是技術和供應鏈進步帶來的結果。就跟城市化一樣,不可逆,不可阻擋。32/8711開開源源中中國國完完成成 B B+輪輪戰戰略略融融資資,7 7.7 75 5 億億開源開發者事件回顧A Ap pa ac ch he e b bR RP PC C正正式式畢畢業業,成成為為 A AS SF F 頂頂級級項項目目近日,開源共識(上海)網絡技術有限公司(開源中國/Gitee)完成了 B+輪戰略融資
157、,此輪融資由天際資本領投,上??苿撈煜潞MY本聯合泰達實業、浦東軟件園及張江科投、君聯資本、上海國際創投、瑞壹投資、容億資本、中國移動旗下中移北京基金、中網投、國調科改、聯想創投及上??苿摴餐鲑Y,融資總額達 7.75 億元人民幣。A Ap pa ac ch he e E Ev ve en nt tMMe es sh h正正式式畢畢業業為為 A AS SF F 頂頂級級項項目目2023 年 6 月 1 日,Apache 軟件基金會正式宣布 Apache SeaTunnel畢業成為 Apache 頂級項目。這是首個由國人主導并貢獻到 ASF 的大數據集成領域的頂級項目。Apache SeaTun
158、nel 原 名Waterdrop,在2021 年10 月 更 名 為SeaTunnel 并申請加入 Apache 孵化器。A Ap pa ac ch he e K Ky yu uu ub bi i正正式式畢畢業業,成成為為 A AS SF F 頂頂級級項項目目2023 年 3 月 9 日,Apache 軟件基金會(ASF)官方宣布 Apache Kyuubi正式畢業,成為頂級項目(TLP)。Apache Kyuubi 是一個分布式和多租戶網關,用于在數據倉庫和湖倉上提供無服務器 SQL。項目最初由網易數帆開發并于 2018 年開源,2021 年 6月捐贈 Apache 基金會,經過 1 年多的
159、孵化,順利畢業成為 Apache 基金會頂級開源項目。A Ap pa ac ch he e S Se ea aT Tu un nn ne el l正正式式畢畢業業為為 A AS SF F 頂頂級級項項目目2023 年 1 月 26 日,Apache 軟件基金會官方宣布 Apache bRPC 正式畢業,成為 Apache 頂級項目(TLP)。bRPC 于 2014 年誕生于百度基礎架構部,用 C+編寫的工業級 RPC 框架,常用于搜索、存儲、機器學習、廣告、推薦等高性能系統。2017 年開源,2018 年11 月正式捐獻給 Apache 軟件基金會。Apache bRPC 是 百 度 繼ECh
160、arts 和Doris 之后,又一里程碑式的開源項目。Apache 軟件基金會(ASF)孵化器于 2023 年2月15日通過了 Apache EventMesh 項目的孵化畢業投票。2023 年 3 月 22 日,ASF 宣布Apache EventMesh 畢業,成為 Apache 頂級項目(TLP)。Apache EventMesh 是一個多功能平臺,它結合了事件驅動和無服務器架構,以簡化復雜分布式系統中事件驅動的應用程序開發。Kvrocks 于2022 年4 月 底 加 入 了Apache 孵化器。Kvrocks 是一款分布式 KV 數據庫,使用RocksDB 作為底層存儲引擎并兼容 R
161、edis協議,旨在解決 Redis 內存成本高以及容量有限的問題,亦可作為海量 KV 數據存儲的解決方案。A Ap pa ac ch he e K Kv vr ro oc ck ks s正正式式畢畢業業,成成為為 A AS SF F 頂頂級級項項目目O Op pe en nT Ti in ny y前前端端組組件件庫庫正正式式開開源源OpenTiny 是一套華為云出品的企業級組件庫解決方案,于 2023 年 3 月宣布開源。適配 PC 端/移動端等多端,涵蓋Vue2/Vue3/Angular 多技術棧,擁有主題配置系統/中后臺模板/CLI 命令行等效率提升工具。重磅官宣2023 年度開源官宣。A
162、pache 軟件基金會于美國時間 2023 年 6 月 28 日宣布 Kvrocks 從孵化器畢業成為頂級項目。33/8711不不再再單單一一看看s st ta ar r數數!開開源源指指南南針針O OS SS S C Co ommp pa as ss s發發布布開源開發者事件回顧估量有尺,開源有道。2023 年 2 月 21 日,開源指南針 OSS Compass 發布會在北京順利舉行。OSS Compass 的發布,標志著我國首個開源生態健康評估平臺正式誕生。OSS Compass 是一個用于開源生態健康評估的平臺,面向 GitHub、Gitee等平臺所有開源項目開放。2023 年 6 月
163、 11 日,騰訊正式宣布將打磨多年的編譯器軟件 OpenKonaJDK 捐贈給開放原子開源基金會,聯合基金會以及數以百萬計開發者,共建國產編譯器基礎軟件,推動數字基礎設施加速突破。2023 年 7 月,百度正式宣布該高性能分布式 MQTT 消息中間件的開源化,并將其命名為 BifroMQ。BifroMQ 的名稱靈感來自于北歐神話中的 Bifrst-一座彩虹之橋,連接著人類世界 Midgard 和神祇居住的世界 Asgard,是兩個世界間堅實而靈活的通道。百百度度正正式式開開源源 B Bi if fr ro oMMQ QA Ar rk kU UI I-X X 預預覽覽版版正正式式開開源源2023
164、 年 9 月,螞蟻研發效能云研發團隊宣布開源其基于 OpenSumi 的純前端 IDE 基礎框架。無需容器資源,僅需瀏覽器即可擁有代碼閱讀、語法高亮、代碼編寫、WebSCM 等能力。o op pe en nK Ky yl li in n 正正式式加加入入 R RI IS SC C-V V 基基金金會會2023 年 7 月,openKylin 社區宣布正式加入 RISC-V 基金會,成為其產業聯盟成員,為 RISC-V 生態建設貢獻更多力量,構筑操作系統與 RISC-V架構軟硬件生態協同發展。L Le ea af fe er rJ JS S發發布布:開開源源、性性能能強強悍悍的的2 2D D 圖
165、圖形形庫庫騰騰訊訊捐捐贈贈 J Ja av va a 編編譯譯器器軟軟件件O Op pe en nK Ko on na a J JD DK KOpenHarmony 項目群技術指導委員會(簡稱“TSC”)-跨平臺應用開發框架 TSG 所孵化項目 ArkUI-X 于 2023 年 8 月正式開源。ArkUI-X 是基于 OpenHarmony官方原生框架 ArkUI 之上擴展的。極極速速版版 I ID DE E 框框架架 C Co od de eB Bl li it tz z 開開源源!N Ne eb bu ul la aG Gr ra ap ph h 出出席席 D Do oc ck ke er
166、 rC Co on n 2 20 02 23 3借助Graph+RAG的契機,NebulaGraph 在國際性技術會議 DockerCon 同世界的技術愛好者們分享了圖數據庫同 LLM 結合之道。34/8711U Un ni it ty y 引引擎擎中中國國版版“團團結結引引擎擎”正正式式發發布布J Je et tB Br ra ai in ns s 發發布布 R Ru us st t I ID DE E:R Ru us st tR Ro ov ve er r開源開發者事件回顧S So ol lo on n 框框架架,單單月月下下載載量量突突破破 2 20 00 0 萬萬2023 年 01 月
167、 18 日,Apache 軟件基金會官方宣布 Apache Linkis 順利畢業,成為 Apache 頂級項目(TLP)。Apache Linkis 計算中間件項目,是由微眾銀行大數據平臺團隊在 2019年 7 月進行開源,并于 2021 年 8 月正式捐獻給 ASF 成為孵化項目,在 2022 年 12 月 03 日通過孵化畢業投票。A Ap pa ac ch he e L Li in nk ki is s 正正式式畢畢業業B By yt te eb ba as se e 突突破破百百萬萬下下載載Bytebase 是一款開源的面向研發組織設計,聚焦業務數據庫開發管理,讓數據庫變更與版本管理
168、更安全的 Database CI/CD 工具。Bytebase 2.0 大版本于 2023 年 5 月正式發布,支持了 15+種數據庫引擎,推出了 Bytebase Cloud 版本,提供完整的 DCM 解決方案,配備了一系列企業級的標準能力,進化成為一個 Database DevOps 平臺,管理整個數據庫的開發生命周期,一站式覆蓋各種數據庫的變更,查詢,安全,治理場景。并于2023 年 8 月迎來了里程碑:下載量突破了 100 萬次。A Ap pa ac ch he e D Do ol lp ph hi in nS Sc ch he ed du ul le er rG Gi it tH H
169、u ub b S St ta ar r 突突破破 1 10 00 00 00 0!2023 年 7 月,Solon 框架宣布單月下載量突破 200 萬。Solon 是一個高效的 Java 應用開發框架:更快、更小、更簡單。不是Spring,沒有 Servlet,也無關 JavaEE;新興獨立的開放生態。主框架僅 0.1MB。2023 年 9 月,JetBrains 發布了專門面向 Rust 開發者打造的獨立 RustIDE:RustRover。公開預覽期間免費 JetBrains 計劃將產品的公開預覽持續到最晚 2024 年 9 月。RustRover 支持 Rust、Cargo、TOML、W
170、eb 和數據庫技術,以及 IntelliJIDEA 的所有功能,包括 VCS 集成。Unity 中國正式推出 Unity 中國版引擎 團結引擎,同時也開啟了Unity 中國本土化進程的全新篇章。作為推動團結引擎落地的核心人物,Unity 中國 CEO 張俊波稱致力于將其打造為一款更懂中國開發者的引擎。由國人主導的大數據調度開源項目,ApacheDolphinScheduler GitHub Star 突破 10000,項目迎來一個重要里程碑。這表明 Apache DolphinScheduler 已經在全球的開發者和用戶中獲得了廣泛的認可和使用。DolphinScheduler 旨在解決公司日
171、常運營中的大數據處理工作流調度和執行問題,2018 年以Apache License 2.0 的開源協議發布。目前,Apache DolphinScheduler 項目已應用于 3000+家公司生產實踐環境。成成為為 A AS SF F 頂頂級級項項目目35/8711渠渠成成開開源源社社區區成成立立兩兩周周年年字字節節跳跳動動開開源源 S Sh hmmi ip pc c開源開發者事件回顧C CN NC CF F 社社區區首首個個,K Ku ub be eE Ed dg ge e 達達到到軟軟件件供供應應鏈鏈 S SL LS SA A L L3 3 等等級級Kuasar 是華為云全新的云原生開源
172、項目。在保留傳統容器運行時功能的基礎上,Kuasar 通過全面 Rust 化以及優化管理模型和框架等手段,進一步降低管理開銷、簡化調用鏈路,靈活擴展對業界主流沙箱技術的支持,實現云原生業務場景全覆蓋。云云原原生生多多沙沙箱箱容容器器運運行行時時 K Ku ua as sa ar r 開開源源TinyEngine 通過對低代碼平臺系統常用的功能進行解構,將其劃分為多個功能模塊,并為每個模塊定義了相應的協議和開發范式,使得開發者可以根據自身的業務需求,輕松定制開發出自己的低代碼開發平臺。新新云云原原生生項項目目 K Kmme es sh h 正正式式開開源源Kmesh 是華為云開源的Serverl
173、ess 流量治理項目。作為集高性能、低開銷及安全可靠于一身的內核級云原生流量治理框架,Kmesh 通過將L4、L7 能力卸載到內核,使得轉發性能分別提升 50%、60%,開銷降低 70%。T Ti in ny yE En ng gi in ne e 低低代代碼碼引引擎擎正正式式發發布布KubeEdge 社區已于 2022 年 7 月份完成整個 KubeEdge 項目的第三方安全審計,并已發布云原生邊緣計算安全威脅分析和防護白皮書。CloudWeGo-Shmipc 是字節跳動服務框架團隊研發的高性能進程間通訊庫。它基于共享內存構建,具有零拷貝的特點。渠成開源社區將服務更多的開發者,幫助大家解決實
174、實在在的問題。百百度度超超級級鏈鏈內內核核將將發發布布國國際際版版:X Xu up pe er rC Co or re e G Gl lo ob ba al l在 2023 開放原子開發者大會上,百度宣布 XuperCore 即將衍生出國際版XuperCore Global,為全球用戶提供更高效、更安全、更易用的區塊鏈解決方案。2020 年,百度完成了開源協議的簽署,將 XuperChain 的內核技術XuperCore 開源。XuperCore 由百度自主研發,擁有完整知識產權,以“高性能”、“自主可控”、“開源”為主要設計目標,致力于創建“更快、更通用、更好用”的區塊鏈底層技術?;?Xu
175、perCore 內核發展起來的 XuperChain是領先的區塊鏈開源技術平臺。R Ru us st tD De es sk k 1 1.2 2 采采用用 F Fl lu ut tt te er r 重重寫寫桌桌面面版版RustDesk 是一款開源遠程桌面軟件,1.2 版本采用 Flutter 重寫桌面版本,支持 Wayland 被控。36/8711A Ap pa ac ch he e D Do ol lp ph hi in nS Sc ch he ed du ul le er r 3 3.2 2.0 0 發發布布O Op pe en nF Fu un nc ct ti io on n v v
176、1 1.0 0.0 0 發發布布開源開發者事件回顧A Ap pa ac ch he e S Se ea aT Tu un nn ne el l 發發布布 1 1.0 0 版版本本“WWe eb b”功功能能開源 Zadig 與 企業版 ZadigX 產品合并,并全面啟用企業版功能,提供一鍵試用。服務端源代碼完全開放,新文檔站和在線教程發布,用戶體驗全面提升。社區用戶獲得更多企業級功能,Zadig v2.0.0 提升易用性和性能,工作流效率提高 50%,資源運行成本降低 30%。Z Za ad di ig g 發發布布 V V2 2.0 0 新新架架構構K Ku ub be eS Sp ph h
177、e er re e 3 3.4 4.0 0 發發布布:支支持持 K K8 8s s v v1 1.2 26 6該版本帶來了值得大家關注的新功能以及增強:擴大對 Kubernetes 的支持范圍,最新穩定性支持 1.26;重構告警策略架構,解耦為告警規則與規則組;提升集群別名展示權重,減少原集群名稱不可修改導致的管理問題;升級 KubeEdge 組件到 v1.13 等。Apache SeaTunnel Web 是 SeaTunnel 項目下的一個新組件,專為那些希望通過圖形化界面管理和監控其大數據流處理任務的用戶設計。不再需要復雜的命令行操作,開發者和數據工程師現在可以在友好的用戶界面上輕松配置
178、、提交和管理他們的任務。流處理應用程序開發管理框架 Apache StreamPark(Incubating)2.0.0 于2023 年 2 月正式發布。這是 StreamPark 加入 Apache 孵化器以來發布的第一個版本,也是一個重大功能更新的版本。3.2.0 大版本帶來眾多更新。包括添加默認租戶、新數據源、新任務類型、任務重跑方向控制、遠程日志功能、參數優化、資源中心改進、頁面易用性增強、云原生支持(包括 Spark on k8S)、新的 Restful API、ETCD 和JDBC 注冊中心,以及架構優化等。F Fl lu ue en nt t O Op pe er ra at t
179、o or r v v2 2.0 0 發發布布該版本新增許多重要功能,如 Fluent Bit 新的部署方式:Fluent BitCollector、支持在 fluent-operator 部署添加注釋、支持為 fluent-operator和 fluent-bit pods 添加標簽、新增在 fluent-bit-watcher 中添加外部插件標志、支持為 Fluent Bit DaemonSet 添加注釋等。S So ol lo on n v v2 2.0 0 大大版版本本發發布布Solon 是一個高效的 Java 應用開發框架:更快、更小、更簡單。不是 Spring,沒有 Servlet,
180、也無關JavaEE;新興獨立的開放生態。主框架僅 0.1 MB。S St tr re ea ammP Pa ar rk k 2 2.0 0.0 0:首首個個 A Ap pa ac ch he e 版版本本37/8711A AP PU US S 發發布布千千億億級級多多模模態態通通用用 A AI I 大大模模型型開源開發者事件回顧12 月 19 日,百度正式推出了 Apollo 開放平臺的全新升級版本-Apollo 開放平臺 9.0,面向所有開發者和生態合作伙伴,以更強的算法能力、更靈活易用的工具框架,以及更易拓展的通用場景能力,繼續構筑自動駕駛開發的領先優勢。Apollo 開放平臺 9.0 的
181、推出,再次讓 Apollo 開放平臺在工程易用性上向前邁進一大步,降低操作難度、操作成本的門檻,讓更多開發者可以簡單方便地上手 Apollo 開放平臺、投身自動駕駛技術領域。百百度度正正式式推推出出 A Ap po ol ll lo o 開開放放平平臺臺 9 9.0 0P Po ol la ar rD DB B-X X V V2 2.3 3 集集中中式式和和分分布布式式Katalyst 是字節跳動對多年大規模業務云原生化場景中資源管理能力的抽象和總結,我們期望通過Katalyst的開源直接或間接地幫助用戶做好資源管理,實現降本增效。2023 年 4 月,APUS 大模型正式發布。APUS 成立
182、于 2014 年,是一家以產品技術為核心競爭力的全球化人工智能企業,產品及服務已遍及全球 200多個國家和地區,用戶量超 24 億。APUS 大模型是千億級多模態通用人工智能大模型,具備對文本、圖像、音頻、視頻的深入理解和生成能力,基于此研發出智能問答大師等系列用戶端AI 產品,在電商、營銷、醫療、網信、教育、制造等多個領域落地應用,致力于為中國定制的 AI 大模型。APUS 積極聚合生態之力,驅動中國 AI 產業高質量發展,與騰訊云、阿里云、百度、深圳大學大數據系統計算技術國家工程實驗室合作,集成各自優勢,積極推動產業聯運等共建方式,與用戶、開發者、產業共創健康 AI 生態,為 AI 應用創
183、新和成長提供支持。2023 年云棲大會,PolarDB-X 正式發布 2.3.0 版本,重點推出 PolarDB-X 標準版(集中式形態),將 PolarDB-X 分布式中的 DN 節點提供單獨服務,支持paxos協議的多副本模式、lizard分布式事務引擎,可以100%兼容MySQL。同時在性能場景上,采用生產級部署和參數(開啟雙 1+Paxos 多副本強同步),相比于開源 MySQL 8.0.34,PolarDB-X 在讀寫混合場景上有 3040%的性能提升,可以作為開源 MySQL 的最佳替代選擇。5 5 倍倍提提升升,N Ne eb bu ul la aG Gr ra ap ph h
184、v v3 3.5 5.0 0支支持持 U UD DF F、重重構構索索引引在年中發布的 v3.5.0 版本主要是優化了 FIND ALL PATH 性能,支持了 UDF功能。其中,FIND ALL PATH 的深度性能有大約 50-500%的提升,其中 1 to5 steps大約有600%的提升;Match2HOP_count的性能有15%幅度的提升。字字節節跳跳動動開開源源 K Ka at ta al ly ys st t:在在離離線線混混部部調調度度成成本本優優化化升升級級一一體體化化開開源源發發布布字字節節跳跳動動發發布布自自研研 WWe eb b 構構建建工工具具 R Rs sp pa
185、 ac ck kRspack 是由 ByteDance Web Infra 團隊孵化的基于 Rust 語言開發的 Web構建工具,擁有高性能、兼容 Webpack 生態、定制性強等多種優點。38/8711“世世界界頭頭號號黑黑客客”K Ke ev vi in n MMi it tn ni ic ck k 去去世世紀紀念念陳陳皓皓(左左耳耳朵朵耗耗子子)開源開發者事件回顧Vim 開源文本編輯器作者 Bram Moolenaar 的家人于 2023 年 8 月 5日,在 Google Groups 論壇中公布了 Bram Moolenaar(1961 年-2023年 8 月 3 日)因病去世的消息
186、,享年 62 歲。Bram 一生的大部分時間都在致力于 Vim,創建、維護并不斷改進該軟件;他為開源軟件運動做出了不可磨滅的重大貢獻。V Vi imm 之之父父 B Br ra amm MMo oo ol le en na aa ar r 因因病病逝逝世世G GN NU U 自自由由軟軟件件項項目目貢貢獻獻者者 T Th hi ie en n-T Th hi iN Ng gu uy ye en n 去去世世GNU Emacs 開發者郵件列表于 2023 年 9 月初公布了一則維護者去世的消息:Goodbye to Thien-Thi Nguyen,并表示他的去世是自由軟件世界的巨大損失。根據郵
187、件的描述,Thien-Thi Nguyen(ttn)于 2022 年 10 月去世,他是一位黑客、藝術家、作家,也是許多 GNU 程序和其他自由軟件的長期維護者和貢獻者。ttn 曾擔任 rcs、guile-sdl、alive 和 superopt 軟件包的 GNU 維護者,同時還在開發 GNU Go。Thien-Thi 特別喜歡 GNU Emacs、GNU Taler 和 GNU Go,他是 xpm,gnugo,ascii-art-to-unicode、和 hideshow GNU Emacs 軟件包的作者和維護者,并對許多其他軟件包做出了重大貢獻,如 vc 等其他軟件包,GNUTaler 及
188、其文檔。MegaEase 創始人兼 CEO、資深 IT 技術專家陳皓(網名:左耳朵耗子)因突發心梗于 2023 年 5 月離世,年僅 47 歲。陳陳皓皓追追思思網網站站:https:/ 公司在 GitHub 創建了紀念左耳朵耗子倉庫,用于記錄關于陳皓本人的點滴回憶?!叭绻J識陳皓,或曾經和陳皓打過交道,可通過 PR 來寫出您和陳皓的故事,幫助他完成他數字人生的夢想?!北环Q為“世界頭號黑客”的凱文米特尼克(Kevin Mitnick)于 7 月 16日因胰腺癌去世,年僅 59 歲。米特尼克出生于 1963 年 8 月 6 日,是美國計算機安全顧問、作家和黑客。他在 1990 年代參與盜竊大量文
189、件入侵不同公司計算機網絡等一系列犯罪行為,被稱為當時的頭號黑客通緝犯。R.I.P.謹以此篇紀念今年離我們而去的行業巨擘。Vim 是一個功能強大且免費的開源文本編輯器,也是目前最受歡迎的文本編輯器之一,尤其是在程序員中被廣泛使用,和 Emacs 并列成為類 Unix系統用戶最喜歡的編輯器。39/8711P Po owwe er rP Po oi in nt t 發發明明者者丹丹尼尼斯斯 奧奧斯斯汀汀去去世世開源開發者事件回顧A Ad do ob be e 聯聯合合創創始始人人 J Jo oh hn n WWa ar rn no oc ck k 去去世世英英特特爾爾聯聯合合創創始始人人、“摩摩爾爾
190、定定律律”提提出出者者Adobe 官網于 2023 年 8 月 20 日宣布,聯合創始人 John Warnock 博士去世,享年 82 歲。Warnock 博士與 Charles Geschke 博士于 1982 年共同創立了 Adobe,第一個產品是 Adobe PostScript。PostScript 是主要用于電子產業和桌面出版領域的一種頁面描述語言和編程語言。PostScript 的發明被視為計算機出版的革命。Warnock 于 2000 年從首席執行官職位上退休,并與 Geschke 共同擔任董事會主席,直至 2017 年。此后他一直擔任董事會成員。2023 年 9 月 1 日,
191、PowerPoint 發明者丹尼斯奧斯汀(Dennis Austin)在美國加利福尼亞州洛斯阿爾托斯(Los Altos)的家中去世,享年 76 歲。奧斯汀的兒子邁克爾奧斯汀(Michael Austin)透露,死亡原因是肺癌轉移到大腦。作為 PowerPoint 的首席軟件開發工程師,丹尼斯奧斯汀是現代社會信息傳播方式的重要塑造者之一。華盛頓郵報的訃告中對 PowerPoint 的評價是:The program was the digital successor of the overhead projector.Itbecame one of the most ubiquitous and
192、 scorned programs of modernoffice life.戈戈登登摩摩爾爾去去世世商商湯湯科科技技創創始始人人湯湯曉曉鷗鷗離離世世,享享年年 5 55 5 歲歲湯曉鷗主要從事計算機視覺相關領域的研究,包括多媒體、計算機視覺、模式識別及視頻處理,是全球人臉識別技術的“開拓者”和“探路者”。湯曉鷗教授是我國人工智能領域的杰出代表。他學識淵博、治學嚴謹、求真務實、開拓創新,富有家國情懷和戰略眼光。他甘為人梯、獎掖后學、矢志創新、勇擔重任,把全部精力奉獻于計算機科學研究,積極推動原創技術發展,為我國人工智能領域科技事業發展做出了卓越的貢獻。他二十多年來悉心培養學生,桃李滿天下。他們
193、將傳承湯曉鷗教授的精神和理念,在發展人工智能的道路上勇往直前。商湯科技創始人、人工智能科學家、浦江實驗室主任、上海人工智能實驗室主任、香港中文大學教授湯曉鷗因病救治無效,于 2023 年 12 月 15 日 23時 45 分,永遠離開了我們,享年 55 歲。英特爾公司和戈登與貝蒂摩爾基金會(Gordon and Betty Moore Foundation)于 2023 年 3 月 24 日宣布,英特爾聯合創始人戈登摩爾去世,享年 94 歲。該基金會由戈登摩爾和妻子貝蒂摩爾于 2000 年共同創立,旨在支持科學發現、環境保護和改善患者護理等。1968 年,戈登摩爾與羅伯特諾伊斯一起創立英特爾并
194、任公司副總裁,1975 年出任總裁和首席執行官。戈登摩爾曾提出知名的“摩爾定律”:當價格不變時,集成電路上可容納的晶體管數目約每隔 18-24 個月便會增加一倍,性能也將提升一倍。換言之,每一美元所能買到的電腦性能,將每隔 18-24 個月翻一倍以上。公開信息顯示,湯曉鷗 1968 年出生于遼寧鞍山,香港中文大學信息工程學系教授、工程學院杰出學人。湯曉鷗于 1990 年從中國科學技術大學畢業;1991 年獲得美國羅切斯特大學碩士學位;1996 年獲得麻省理工學院博士學位,之后進入香港中文大學工作;2001 年創立了香港中文大學多媒體實驗室;2005 年至 2007 年在微軟亞洲研究院工作,擔任
195、視覺計算組主任;2008年在深圳先進技術研究院多媒體集成技術研究室工作,擔任主任和研究員。40/8741/87L LL LMM 技技術術報報告告大語言模型(LLM)技術作為人工智能領域的一項重要創新在今年引起了廣泛的關注。LLM 是利用深度學習和大數據訓練的人工智能系統,專門設計來理解、生成和回應自然語言。這些模型通過分析大量的文本數據來學習語言的結構和用法,從而能夠執行各種語言相關任務。以 GPT 系列為代表,LLM 以其在自然語言處理領域的卓越表現,成為推動語言理解、生成和應用的引擎。LLM 在多個領域都取得了令人矚目的成就。在自然語言處理領域,GPT 系列模型在文本生成、問答系統和對話生
196、成等任務中展現出色的性能。在知識圖譜構建、智能助手開發等方面,LLM 技術也發揮了關鍵作用。此外,它還在代碼生成、文本摘要、翻譯等任務中展現了強大的通用性。本報告從技術人視角出發,將深入探討 LLM 技術的背景、基礎設施、應用現狀,以及相關的工具和平臺。42/87L LL LMM T Te ec ch h MMa ap p 向量數據庫 數據庫向量支持 大模型框架、微調(Fine Tuning)大模型訓練平臺與工具基基礎礎設設施施L LL LMM A Ag ge en nt t 備案上線的中國大模型 知名大模型 知名大模型應用大大模模型型算算力力工工具具和和平平臺臺 LLMOps 大模型聚合平臺
197、 開發工具A AI I 編編程程 插件、IDE、終端 代碼生成工具編編程程語語言言43/87L LL LMM 技技術術背背景景Transformer 架構和預訓練與微調策略是 LLM 技術的核心,隨著大規模語言數據集的可用性和計算能力的提升,研究者們開始設計更大規模的神經網絡,以提高對語言復雜性的理解。GPT(Generative Pre-trained Transformer)的提出標志著 LLM 技術的飛速發展,其預訓練和微調的方法為語言任務提供了前所未有的性能,以此為基礎,多模態融合的應用使得 LLM 更全面地處理各種信息,支持更廣泛的應用領域。圖源:https:/postgresml.
198、org/docs/.gitbook/assets/ml_system.svg44/87L LL LMM 基基礎礎設設施施0 01 10 03 30 02 20 04 4向向量量數數據據庫庫/數數據據庫庫向向量量支支持持為大模型提供高效的存儲和檢索能力大大模模型型框框架架及及微微調調 (F Fi in ne e T Tu un ni in ng g)大模型框架提供基本能力和普適性,而微調則是實現特定應用和優化性能的關鍵環節大模型訓練平臺&工具提供了在不同硬件和環境中訓練大語言模型所需的基礎設施和支持編程語言以 Python 為代表45/87L LL LMM 基基礎礎設設施施:向向量量數數據據庫庫
199、/數數據據庫庫向向量量支支持持向量數據庫是專門用于存儲和檢索向量數據的數據庫,它可以為 LLM 提供高效的存儲和檢索能力。通過數據向量化,實現了在向量數據庫中進行高效的相似性計算和查詢。根據向量數據庫的的實現方式,可以將向量數據庫大致分為兩類:原生的向量數據庫專門為存儲和檢索向量而設計,所管理的數據是基于對象或數據點的向量表示進行組織和索引。包括 等均屬于原生向量數據庫。除了選擇專業的向量數據庫,對傳統數據庫添加“向量支持”也是主流方案。比如 等傳統數據庫均已支持向量檢索。46/87L LL LMM 基基礎礎設設施施:向向量量數數據據庫庫/數數據據庫庫向向量量支支持持自 2022 年 Chat
200、GPT 問世以來,大模型星火初始,向量數據庫不但獲得了技術領域的關注,也逐漸吸引了市場和資本的注意力。近兩年來,向量數據庫公司迎來了一波融資潮:Pinecone:已融資 Zilliz:已融資 Weaviate:已融資 Vespa:已融資 Chroma:已融資 Qdrant:已融資 Marqo:已融資 LanceDB:已融資 據西南證券研究發展中心預測,2025 年向量數據庫滲透率約為 30%,則全球向量數據庫市場規模約為 99.5 億美元,。2023 年前四個月,向量數據庫公司融資額,超過了 2022 年的總和(圖源:https:/ LL LMM 基基礎礎設設施施:大大模模型型框框架架及及微微
201、調調 (F Fi in ne e T Tu un ni in ng g)大模型框架指專門設計用于構建、訓練和部署大型機器學習模型和深度學習模型的軟件框架。這些框架提供了必要的工具和庫,使開發者能夠更容易地處理大量的數據、管理巨大的網絡參數量,并有效地利用硬件資源。微調(Fine Tuning)是在大模型框架基礎上進行的一個關鍵步驟。在模型經過初步的大規模預訓練后,微調是用較小、特定領域的數據集對模型進行后續訓練,以使其更好地適應特定的任務或應用場景。這一步驟使得通用的大型模型能夠在特定任務上表現出更高的精度和更好的效果。大模型框架提供了 LLM 的基本能力和普適性,而微調則是實現特定應用和優化
202、性能的關鍵環節。兩者相結合,使得 LLM 在廣泛的應用場景中都能發揮出色的性能。48/87L LL LMM 基基礎礎設設施施:大大模模型型框框架架及及微微調調 (F Fi in ne e T Tu un ni in ng g)大模型框架有哪些特點:大模型開發框架通過提供高層次的 API 簡化了復雜模型的構建過程。這些 API 抽象掉了許多底層細節,使開發者能夠專注于模型的設計和訓練策略。:這些框架經過優化,以充分利用 GPU、TPU 等高性能計算硬件,以加速模型的訓練和推理過程。:為了處理大型數據集和大規模參數網絡,這些框架通常設計得易于水平擴展,支持在多個處理器或多個服務器上并行處理。:它們
203、提供工具來有效地加載、處理和迭代大型數據集,這對于訓練大型模型尤為重要。國產深度學習框架 OneFlow 架構(圖源:https:/www.oneflow.org/a/chanpin/oneflow/)49/87L LL LMM 基基礎礎設設施施:大大模模型型框框架架及及微微調調 (F Fi in ne e T Tu un ni in ng g)想要微調一個模型,一般包含以下關鍵步驟:1.選擇預訓練模型:選取一個已經在大量數據上進行過預訓練的模型作為起點;2.準備任務特定數據:收集與目標任務直接相關的數據集,這些數據將用于微調模型;3.微調訓練:在任務特定數據上訓練預訓練的模型,調整模型參數以
204、適應特定任務;4.評估:在驗證集上評估模型性能,確保模型對新數據有良好的泛化能力;5.部署:將性能經驗證的模型部署到實際應用中去。微調的過程也是分類模型訓練的過程(圖源:https:/ LL LMM 基基礎礎設設施施:大大模模型型訓訓練練平平臺臺與與工工具具大模型訓練平臺和工具提供了強大且靈活的基礎設施,使得開發和訓練復雜的語言模型變得可行且高效。這些工具提供了先進的算法、預訓練模型和優化技術,極大地簡化了模型開發過程,加速了實驗周期,并使得模型能夠更好地適應各種不同的應用場景。此外,它們還促進了學術界和工業界之間的合作與知識共享,推動了自然語言處理技術的快速發展和廣泛應用。相比前邊的大模型框
205、架和微調,一言以蔽之:、51/87L LL LMM 基基礎礎設設施施:大大模模型型訓訓練練平平臺臺與與工工具具大模型訓練平臺與工具根據其性質不同,可分為以下幾類:這些平臺提供了從模型開發到部署的綜合解決方案,包括計算資源、數據存儲、模型訓練和部署服務。它們通常提供易于使用的界面,支持快速迭代和大規模部署。Amazon SageMaker、Google Cloud AI Platform 和 Microsoft Azure Machine Learning 都是提供端到端機器學習服務的云平臺。這些工具和庫專門為加速機器學習模型的訓練和推理而設計,通常利用 GPU 或 TPU 等硬件。這類工具可以
206、顯著提高訓練和推理的速度,使得處理大規模數據集和復雜模型變得可行。NVIDIA CUDA 和 Google Cloud TPU 均是此類工具。這類工具通常由開源社區支持和維護,提供了靈活、可擴展的工具和庫來構建和訓練大型機器學習模型,如 TensorFlow 和 PyTorch 和 Hugging Face Transformers 等。TensorFlow 架構圖(圖源:https:/www.geeksforgeeks.org/architecture-of-tensorflow/)52/87L LL LMM 基基礎礎設設施施:編編程程語語言言LLM 的訓練和應用通常使用多種編程語言,取決于
207、任務的需求和團隊的偏好。它的廣泛使用得益于其簡潔的語法、強大的庫支持(如)和深度學習框架(如)。此外,C+有時用于優化計算密集型任務,而 Java 在企業環境中處理模型部署和系統集成方面常見。JavaScript 適用于 Web 環境的 LLM 應用。53/87L LL LMM 基基礎礎設設施施:編編程程語語言言2023 年是大語言模型(LLM)之年,Python 作為人工智能領域使用度最高的編程語言,在 2023 年到底有多火?從各種開發者報告、編程語言榜單來看。只要出現有關編程語言流行度的排名,而 Java、C/C+等同樣在 LLM 開發中發揮關鍵作用的語言緊隨其后。54/87L LL L
208、MM 基基礎礎設設施施:編編程程語語言言 2023 年 9 月面向大眾開放創業公司 Modular AI 開發 結合了 Python 的易用性以及 C 語言的 支持與任意 代碼 性能是 Python 的 倍Mojo與其他語言性能對比(圖源:https:/ 年底大模型應用 ChatGPT 發布后,點燃了世界范圍內對于大模型技術及其應用的關注和熱情。2023 年,國內外各大廠商均投身于大模型的浪潮當中,涌現了諸多知名的大模型及應用,它們結合了文本、圖片、視頻、音頻多種介質,在文本生成、圖片生成、AI 編程等方向均有出色的表現。GitHub Copilot56/87大大模模型型應應用用現現狀狀:知知
209、名名大大模模型型在全球范圍內,已經發布了多款知名大模型,這些大模型在各個領域都取得了突破性的進展。處理文本數據的 GPT-4,能同時處理和理解多種類型數據的多模態模型 DALL-E 3,以及開源大模型的代表 Lllama 2 都在短時間內獲得了大量關注和用戶,構成了大模型領域的第一梯隊。訊飛星火57/87大大模模型型應應用用現現狀狀:首首批批備備案案上上線線的的中中國國大大模模型型8 月 31 日,百度、字節、商湯、中科院旗下紫東太初、百川智能、智譜華章等 8 家企業/機構的大模型產品首批通過生成式人工智能服務管理暫行辦法備案,可正式上線面向公眾提供服務。具體包括:百度(文心一言)、抖音(云雀
210、大模型)、智譜 AI(GLM 大模型)、中科院(紫東太初大模型)、百川智能(百川大模型)、商湯(日日新大模型)、MiniMax(ABAB 大模型)、上海人工智能實驗室(書生通用大模型)、騰訊(混元大模型,9月15日通過)。58/87大大模模型型應應用用現現狀狀:知知名名大大模模型型應應用用LLM 已經在多種應用場景中得到了應用,包括文本生成、機器翻譯、問答、自然語言推理等。以 為代表的文本生成應用,為代表的圖片生成應用,以 為代表的 AI 編程應用,以 為代表的數字人生成應用,在推出后都獲得了大量用戶的青睞。自然2023 年度十大人物中,ChatGPT 破例成為第 11 人(圖源:https:
211、/ AI I 編編程程生成式 AI 正經歷前所未有的快速普及,而開發者們正積極將 AI 作為自己的生產力工具,隨著眾多 AI 編程工具的普及,開發者們使用 AI 輔助工作已經逐漸司空見慣。分析公司 OReilly 日前發布一份2023 Generative AI in the Enterprise報告,報告中指出,。圖源:https:/ AI I 編編程程工工具具:插插件件、I ID DE E、終終端端目前最常見的 AI 編程工具大多以插件、IDE 和終端的形式出現,它們大多交互直觀且使用門檻低,大大提高了 AI 編程工具的使用率。GitHub Copilot 和 Codeium 是比較常見的
212、 AI 編程插件,而 Cursor 和 Warp 分別是具有 AI 編程能力 的 IDE 和終端工具。除了海外產品,國內如姜子牙、CodeFuse、CodeGeeX、百度 Comate 等都是十分優秀的 AI 編程工具。GitHub CopilotCodeiumWarpCursor62/87A AI I 編編程程新新形形態態:代代碼碼生生成成工工具具通過原型或圖片直接生成包含代碼的完整頁面,。、都是該形態出色的產品。tldrawv0.devScreenshot to code63/87L LL LMM A Ag ge en nt t(A AI I A Ag ge en nt t)LLM Age
213、nt 是一種基于 LLM 的智能代理,它能夠自主學習和執行任務,具有一定的“認知能力和決策能力”。LLM Agent 的出現,標志著 LLM 從傳統的模型訓練和應用模式,轉向以 Agent 為中心的智能化模式。LLM Agent 打破了傳統 LLM 的被動性,使 LLM 能夠主動學習和執行任務,從而提高了 LLM 的應用范圍和價值;它為 LLM 的智能化發展提供了新的方向,使 LLM 能夠更加接近于人類智能。AutoGPT 就是一個典型的 LLM Agent。在給定 AutoGPT 一個自然語言目標后,它會嘗試將其分解為多個子任務,并在自動循環中使用互聯網和其他工具來實現該目標。它使用的是 O
214、penAI 的 GPT-4 或 GPT-3.5 API,是首個使用 GPT-4 執行自主任務的應用程序實例。AutoGPT 最大的特點在于能根據任務指令自主分析和執行,當收到一個需求或任務時,它會開始分析這個問題,并且給出執行目標和具體任務,然后開始執行。圖源:https:/blog.abacus.ai/blog/2023/08/31/supercharge-productivity-accomplish-10 x-more-with-ai-agents/64/87L LL LMM 的的工工具具和和平平臺臺LLMOps大模型聚合平臺開發工具:LLMOps 平臺專注于提供大模型的部署、運維和優化
215、服務,旨在幫助企業和開發者更高效地管理和使用這些先進的 AI 模型,快速完成從模型到應用的跨越,如、等。:大模型聚合平臺主要用于整合和管理多個大型機器學習模型,在聚合平臺之上,衍生出 MaaS(Model-as-a-Service,大模型即服務)的服務模式通過提供統一的接口和框架,以更高效地部署、運行和優化這些模型,。:其它開發相關的 LLM 工具,如云原生構建多模態AI應用的工具 Jina,嵌入式數據庫 txtai 等。65/87L LL LMM 的的工工具具、平平臺臺和和資資源源另一個視角來看,在大模型繁榮發展的背后,少不了工具和平臺的發力,如 LLMOps 平臺、大模型聚合平臺以及相關的
216、開發工具,此外還有它們所依賴的最重要的資源算力。在這些工具、平臺和資源的有力支撐下,大模型才得以一步一個臺階,引領全球開發者步入一個技術新時代。算力大模型聚合平臺LLMOps開發工具66/87L LL LMM 的的工工具具和和平平臺臺:L LL LMMO Op ps s LangChain 是一個幫助開發者使用 LLM 創建應用的開源框架,它可以將 LLM 與外部數據源進行連接,并允許與 LLM 進行交互。LangChain 于 2022 年 10 月作為開源項目推出,并于 2023 年 4 月注冊成立公司,累計獲得超過 3000 萬美元的投資,估值達到了 2 億美元。在 GitHub 上,L
217、angChain 已經獲得了超過 7 萬個 Star 和超過 2000 名貢獻者LangChain 架構圖(圖源:https:/ LL LMM 的的工工具具和和平平臺臺:MMa aa aS S 平平臺臺Gitee AI 是開源中國旗下的 MaaS 平臺,提供模型、數據集,以及應用托管能力,同時接入了豐富的國產算力平臺,為開發者提供了更高效、實惠的微調方案,降低使用門檻,目前已進入內測階段。68/87L LL LMM 的的工工具具和和平平臺臺:開開發發工工具具比較有代表性的 LLM 開發工具有:幫助用戶極致優化給大模型的提示詞(prompt),使得對大語言模型提問時,可以獲得更理想的輸出。:用于
218、語義搜索、LLM 編排和語言模型工作流的一體化嵌入數據庫,可以使用 SQL、對象存儲、主題建模、圖形分析和多模態索引進行矢量搜索。:專注以 Sketch、PSD、靜態圖片等形式的視覺稿作為輸入,通過智能化技術一鍵生成可維護的前端代碼,包含視圖代碼、數據字段綁定、組件代碼、部分業務邏輯代碼。PromptPerfect69/87L LL LMM 世世界界的的基基石石:算算力力LLM 的算力指的是執行這些模型所需的計算資源。這包括用于訓練和運行模型的硬件(如 GPU 或 TPU)、內存、存儲空間以及處理大量數據的能力。LLM 需要非常強大的算力來處理、理解和生成文本,因為它們涉及到數十億甚至數萬億個
219、參數的訓練和推理。LLM 的基石是算力,而算力的基石是硬件,硬件的性能直接影響著計算任務的速度、效率和能力。是全球領先的 GPU 制造商,提供了強大的圖形處理單元,專門用于深度學習和AI計算。AI 處理器和基礎軟件構建 Atlas 人工智能計算解決方案,打造面向“端、邊、云”的全場景 AI 基礎設施方案,覆蓋深度學習領域推理和訓練全流程。被外界視為打破 NVIDIA 壟斷 AI 算力市場的多一種選擇,其基于第三代 CDNA 架構,為生成式 AI 大語言模型設計的 MI300X 內存高達 192GB,集成了高達 1530 億個晶體管,為歷代產品之最??萍紙F隊自研,面向通用AI計算的芯片核心架構昆
220、侖芯 XPU 從AI落地的實際需求出發,按照復雜前沿的人工智能場景需求開展迭代,致力為開發者提供通用、易用、高性能的算力來源。DCU 系列產品以 GPGPU 架構為基礎,兼容通用的“類 CUDA”環境以及國際主流商業計算軟件和人工智能軟件,可廣泛應用于大數據處理、人工智能、商業計算等應用領域。通用 GPU 高端芯片及超級算力系統提供商。擁有云邊協同、訓推組合的完整通用算力系統全方案,其系統架構、指令集、核心算子、軟件棧均為自主研發,可獨立發展演進。70/87L LL LMM 世世界界的的基基石石:算算力力算力也是全國乃至世界范圍內 LLM 相關企業遇到的最大難題:隨著國內大模型數量激增,AI
221、算力需求從 2022 年開始持續上漲,國內市場出現一卡難求的情況。根據 IDC 預計,到 2026 年 AI 推理的負載比例將進一步提升至62.2%,特別是預訓練大模型幾乎成為 AI 開發的標準范式。同時,這一需求也導致了 NVIDIA A100 GPU 的價格在幾個月內暴漲超過 50%,而且大量斷貨。根據研究測算,單次 GPT-3 模型(175B)訓練,在規模 300B token 下成本約為 35000 卡天(A100),也就是相當于 35000 塊 A100 GPU 跑 1 天能完成單次訓練,或者 2500 塊 A100 GPU 跑 2 周。以每張卡 10 萬人民幣的價格計算,單次訓練成
222、本就將達到 25-35 億人民幣。10月17日,美國商務部工業和安全局(BIS)公布新的先進計算芯片、半導體制造設備出口管制規則,限制中國購買和制造高端芯片的能力,受管制的包括但不限于 NVIDIA A100、H100、A800、H800、L40、L40S 以及集成這些高性能計算的 DGX/HGX 系統,并將中國 GPU 企業及其子公司列入了實體清單。據 OpenAI 測算,自 2012 年以來,人工智能模型訓練算力需求每34個月就翻一番,每年訓練 AI 模型所需算力增長幅度高達 10 倍(圖源:https:/ x OSS Compass Insight中國開發者開源新動向本報告數據來源:20
223、23 年 1 月 1 日至 2023 年 12 月 12 日 Gitee 平臺相關公開數據及 OSS Compass 相關公開數據73/87生態的根基始終是人2023 年是 Gitee 和開發者見面的第十年。過去十年,Gitee 見證了國內開源的風起云涌和中國開發者對開源逐漸高漲的熱情。我們堅信,生態的根基永遠是人,而開源生態的根基永遠是開發者。1200 萬2023 年 Gitee 總用戶數達到 1200 萬200 萬2023 年 Gitee 新增用戶 200 萬3000 萬2023 年 Gitee 總倉庫數量達到 3000 萬500 萬2023 年 Gitee 新倉庫數量 500 萬74/8
224、7生態的根基始終是人2014-2023 Gitee 用戶數增長曲線2014-2023 Gitee 倉庫數增長曲線75/87開源組織日益增長十年間,各類多元的開源組織在 Gitee 上成立,他們協助開發者孵化項目,更好地進行協作與管理。同時 Gitee 也不斷完善產品能力,為他們提供良好的協作平臺。這種研發協同方式打破了傳統組織邊界,鞏固了開源技術迭代,加速了整個中國開源生態發展。2023 年,Gitee 上的開源組織數量達到了 380000 個,除了技術大廠外,個人開發者自發組建的開源組織影響力已經不容小覷。2014-2023 Gitee 開源組織數增長曲線76/872023 年最活躍的開源組
225、織在開源組織活躍度方面,OpenHarmony 憑借其日益強大的生態規模保持著極高的活躍度。在 Gitee 的開源組織中,擁有大廠支撐的開源項目往往擁有著更高的活躍度,這與它們擁有更多的資源,投入了更多的成本不無關系,但這不代表開發者們的民間組織不會被看見。77/872023 年最受關注和喜愛的開源組織最受關注開源組織指2023年獲得關注數最多的開源組織(成員5人及以上)最受喜愛開源組織指2023年獲得 Star 數最多的開源組織(成員5人及以上)2023 Gitee 最受關注的二十個開源組織2023 Gitee 最受喜愛的二十個開源組織從 2023 年最受開發者關注的和喜愛的開源組織中,可以
226、看出技術大廠憑借其技術底蘊和知名度仍然收獲了大部分開發者的關注,但同時由開發者自發形成的開源組織受到了更多開發者的喜愛,如開源組織 Dromara 經過多年發展,已經逐漸有了自己的組織架構、項目捐贈機制和畢業機制,在用心的經營下,Dromara 也在 2023 年共獲得了超過 57000 個 Star,是 Gitee 上非大廠背景的開源組織代表之一。78/87編程語言流行趨勢Gitee 上 2023 年的編程語言流行趨勢與 2022 年相比并沒有特別大的變化,依然是 Java、JavaScript、Python 占據前三名。值得一提的是,PHP 與 Go 在 2023 年趕上了近兩年備受歡迎的
227、 C 語言家族,作為擁有近三十年歷史的老牌語言,PHP 仍在散發著它的光輝。79/872023 增長最快編程語言TypeScript 成為了 Gitee 2023 增長最快的編程語言,增長率達到了 49.04%,這也與過去幾年 TypeScript 的增長趨勢相吻合,隨著支持的框架越來越多,TypeScript 也將迎來更迅猛的發展。除了 TypeScript 外,Rust、Verilog、SQL 也在 2023 年保持著強勁的增長速度。80/872023 年最常用的開源許可證在 2023 年新增的開源項目中,使用 MIT 和 Apache-2.0 許可證的開源項目占比超過了 62%,緊隨其后
228、的是國產開源許可證:木蘭寬松許可證第二版(MulanPSL-2.0),在成為中國首個被 OSI 認定,成為國際類別開源許可證的三年后,木蘭寬松許可證也逐漸成為了中國開發者選擇開源許可證的前列選擇。81/872023 年增長率最快的開源許可證除了保持增長的木蘭寬松許可證外,2023 年更多 Gitee 平臺上的開源項目更重視代碼透明度和共享理念,防止開源代碼被私有化而不貢獻社區的情況出現,選擇了 GPL 和 AGPL 開源許可證。當然,也有很多開發者堅持自由軟件的理念,相對更加寬松的 EPL、BSD 甚至 WTFPL 也在 2023 年受到了更多的歡迎。82/87OSS Compass Insi
229、ght從 Gitee 上線的第一年起,每年都會涌現出許多具有突破性的開源項目。我們選擇了十年里最具代表性的十一個項目,它們至今都仍在 Gitee 上保持活躍和維護,借助 OSS Compass,我們有幸一覽它們的成長軌跡。正是以它們為代表的,在 Gitee 上數以千萬計的開源項目,構成了 Gitee 乃至國內開源生態的堅實地基。Powered by oss-compass.org83/87OSS Compass Insight:協作開發指數開源項目作為人類群體智能的典型表現,是否能夠建立協作式的開發管理,是促成項目成功的關鍵要素。OSS Compass 圍繞一系列與代碼貢獻相關的間接指標,來評
230、估開發流程管理,社區協作式開發做得如何。Powered by oss-compass.org84/87OSS Compass Insight:社區服務與支撐該模型用于評估開發者在貢獻過程中,直接感知到的社區提供的服務和支撐做得如何。其中包含了更新 Issue 數量、關閉 PR 數量、Issue 首次相應時間等指標。Powered by oss-compass.org85/87OSS Compass Insight:活躍度活躍度用來描述一個開源社區或者項目的活躍程度?;钴S度展示了一個項目隨著時間的推移持續展開的工作有多少。高活躍度的社區可能表明該項目是可持續的,低活躍度的社區可能表明該項目面臨風險。Powered by oss-compass.org86/87