《財團法人資訊工業策進會:2025STAR軟體技術年報十大Al關鍵技術與趨勢(繁體版)(138頁).pdf》由會員分享,可在線閱讀,更多相關《財團法人資訊工業策進會:2025STAR軟體技術年報十大Al關鍵技術與趨勢(繁體版)(138頁).pdf(138頁珍藏版)》請在三個皮匠報告上搜索。
1、4STAR 軟體技術年報隨著人工智慧(AI)技術的快速發展,AI 已成為推動技術創新、產業轉型及社會進步的核心動力。2024 年諾貝爾獎也佐證 AI 技術對世界的深刻影響,如物理學獎頒給 Geoffrey Hinton 和 John Hopfield,因為他們的研究促成 AI 快速的發展;化學獎頒給 David Baker、Demis Hassabis 和 John Jumper,他們利用 AI 技術來模擬和預測蛋白質結構,這對生物醫學研究有重大影響。這些研究不僅推動科學進步,也將對未來 AI 應用於實際場景的發展產生持久影響。在此背景下,資策會編撰的STAR 軟體技術年報不僅展示 AI 技術
2、的最新進展,還為學術界、產業界和研發單位之間的深度合作提供具體的指導與洞見。本次年報從技術趨勢到實際應用,從學研合作到專利分析,全面性涵蓋 AI領域的關鍵議題與挑戰。首先,資策會透過嚴謹的技術篩選方法,精選出十大AI 關鍵技術,這些技術不僅代表當前最具潛力的創新方向,也將對未來幾年的技術發展產生深遠影響。這些技術涵蓋人工智慧的各個重要領域,為企業和學術研究提供明確的發展指引??偨Y來說,這份STAR 軟體技術年報不僅是一次對 AI 技術的全面梳理與總結,更是對未來趨勢的展望。資策會以豐富的研究經驗和專業知識,致力於促進多方協作,希望這份年報能為業界及學界提供有價值的參考,推動 AI技術的持續創新
3、與應用落地。序財團法人資訊工業策進會 執行長2 0 2 4 年 1 1 月 7 日隨著全球對人工智慧(AI)技術的投入日益增加,AI 已成為科技創新的核心動力和企業轉型升級的關鍵推手,應用領域涵蓋智慧城市、智慧移動、智慧製造等,從實驗室研究逐步落地至實際應用場景。財團法人資訊工業策進會軟體技術研究院(簡稱資策會軟體院)作為專業的軟體技術研究機構,我們推出STAR 軟體技術年報,旨在促進產業界、學術界與研究機構之間的深度連結,並擔任第三方引水人的角色,推動三方的合作潛力,助力產學研共創 AI技術未來。正因如此,資策會軟體院精心編撰這本STAR 軟體技術年報。作為一個長期致力於推動產、學、研合作的
4、軟體技術研究機構,我們在本年報中匯聚前瞻的技術趨勢分析、學研合作案例、以及全球 AIGC 技術專利的最新動態。年報的目標是成為一座知識橋樑,幫助學界、產業界和研發機構之間進行有效的技術互通,並促成三方之間的深度合作。誠摯邀請您,與我們一同探索 AI 的無限可能!財團法人資訊工業策進會軟體技術研究院 院長 蒙以亨年報的價值洞悉未來第三方引領學研對接成果展示我們深入分析十大 AI 關鍵技術,並對未來發展趨勢進行前瞻性預測,幫助您提前佈局,搶佔市場先機。作為一個中立的第三方平臺,我們將充分發揮自身優勢,為產學研各方搭建橋樑,促進資源共享,實現互利共贏。我們詳細介紹國內重要學術機構在 AI 領域的研究
5、成果,並提供豐富的合作案例,促進產學研之間的深度交流與合作。我們展示本機構在 AI 領域的最新研究成果,以及在推動產學合作方面所取得的成就,與您共同分享 AI 發展的喜悅。前言第一章第二章第三章第四章結語AI 未來趨勢力-十大關鍵技術AI 學術與研究深度解析軟體院 AI 領域前沿研究成就全球專利視角下生成式 AI 發展與臺灣的機會目錄01251041141321STAR 軟體技術年報第一章、AI 未來趨勢力-十大關鍵技術技術篩選方法1國際標竿機構篩選方法技術預測是科技管理中相當重要的一個領域,指的是對技術創新、科技改,以及可能的科技發明,所做的描述與預測。技術預測與篩選的理論基礎是以時間作為技
6、術前瞻的關鍵要素,目的是為降低未來的不確定性,國際上許多政府單位、研究機構或企業,皆運用技術預測方法,篩選並長期觀測影響未來之重要關鍵技術。在技術預測方法上,學術方法包含模型分析法、專家判斷法與整體分析法,在實務操作上,觀察國際標竿機構如世界經濟論壇 WEF 或英國商業能源暨工業策略部(BEIS)等之篩選方法,其流程大致上可分為三個階段:輸入、篩選與輸出,其中篩選過程包含分析、解釋與形塑前景等(表 1-1)。2STAR 軟體技術年報技術篩選母體清單資策會軟體技術研究院(軟體院)與產業情報研究所(產研所)共同合作,於 2024年參考國際標竿機構的篩選方法,以 AI 技術為核心,制定一套系統化的技
7、術篩選流程,目的是從眾多新興技術中,篩選出對未來臺灣 AI 產業發展具有重大影響力的關鍵軟體技術。在技術母體清單的蒐集方面,此方法參考多個國際標竿機構的技術報告,並基於2024 年軟體院與學研網路互動所收集的 AI 技術研究方向,建立包含 201 項技術的母體清單(如表 1-2)。最後以產業應用(Industry Application)、軟體平臺(Software Platforms)、模型部署與管理(Model Deployment and Management)、資料管理(Data Management)、基礎設施(Infrastructure)等五大類別進行技術分群,得到 26 個技術
8、群組(如圖 1-1)。資料來源:WEF、BEIS,MIC 整理,2024 年 9 月WEF 與 BEIS 新興技術篩選方法表 1-1輸 出WEF新興技術篩選方法英國BEIS新興技術篩選方法輸 入篩 選建立技術清單(95):使用德菲法,請專家填寫問卷建立技術清單(300):由顧問公司Frost&Sullivan提供一份含300項新興技術之清單影響力預測:組成10個技術專家小組,針對每一技術進行未來影響力預測產出英國具有商業化潛力之新興技術篩選年度新興趨勢(10):由指導委員會針對95個技術進行討論與排序,分3次會議進行篩選出具政策參考價值之技術(37):以政策重點進行第一階段篩選(從300選出3
9、7)篩選出具研發優勢之技術(25):以英國研發優勢進行第二階段篩選(從37選出25)篩選出具有商業化能力之技術(10):以商業化能力進行第三階段篩選(從25選出10)2STAR 軟體技術年報3STAR 軟體技術年報資料來源:MIC、軟體院整理,2024 年 9 月技術篩選母體清單詳細列表表 1-2出版日期技術觀測來源編號重要性AI相關技術項目1232023/08/17Whats New in Artificial Intelligence from the 2023 Gartner Hype CycleGartner每年發布最新的人工智慧技術及其在不同領域的應用與影響,對於了解AI技術的發展趨
10、勢及其潛在影響具有重要參考價值3242023/09/11Hype Cycle for Generative AI,2023Gartner提供生成式人工智慧技術及其在技術成熟曲線上的進展洞察,有助於了解其進展、應用潛力及挑戰,對技術投資決策具有參考價值5382024/02/23ABI_Research 38 Technology Stats You Need To Know For 202438項關鍵技術統計數據統計提供對技術發展的量化見解,幫助企業更好地理解和把握技術趨勢及其潛在影響7212024/01/11IEEE technology predictions report 2024IEEE
11、針對2024年各領域創新技術的預測,為企業和研究機構提供前瞻性的技術洞察9102023/06/26WEF Top10 Emerging Technologies of 20232023年世界經濟論壇提出的十大新興技術,為企業和政策制定者提供重要的技術方向指引11152024/07/16McKinsey Technology Trends Outlook 2024McKinsey針對新興技術對未來經濟和社會的重要影響分析報告,涵蓋生成式AI、量子計算、清潔能源等關鍵領域,提供企業在新技術採用與創新方面的洞察13152024學研合作網路:陽明交大、臺科大、臺北大、中正、清大、中興、雲科大作為未來本
12、會推動學研網路研究建立具體學研合作項目的參考依據2102023/10/16Gartner Top 10 Strategic Technology Trends 2024Gartner提供企業在制定技術策略時的重要參考,幫助企業識別和抓住未來的技術機遇,提升競爭力4102023/10/23IDC FutureScape:Worldwide IT Industry 2024 PredictionsIDC針對全球IT行業的2024年預測,內容強調未來關鍵趨勢和發展,有助於企業了解未來IT行業的發展趨勢及市場動向662023/12/06Deloitte Tech Trends 2024Deloitte
13、為幫助企業了解數位轉型過程中的關鍵技術趨勢,進而制定有效的數位轉型策略以保持競爭力8152023/10/24Forrester Predictions 2024Forrester針對2024年的預測,涵蓋影響企業和技術的重大趨勢10102024/04/04Artificial Intelligence Index Report 2024(Stanford University)由Stanford University人類中心人工智慧研究院(HAI)發布2024年度報告,追蹤和分析全球AI發展的最新趨勢報告1242024/01/04MIT Technology Review 2024MIT科技評
14、論提供有關最新科技趨勢的文章和報告,經常報導AI技術的進展4STAR 軟體技術年報技術篩選流程第一輪篩選-技術衡量構面第二輪篩選-重要性衡量構面在篩選流程上,首先建構 AI 技術母體清單,接著以技術構面與重要性構面由軟體院各研發中心共同進行兩輪篩選,最終選出十大 AI 關鍵技術。以下介紹二輪技術篩選的指標與衡量標準:在第一輪篩選中,軟體院主要從技術本身的角度對技術群組進行評估,核心構面包括:經過第一輪篩選後,共有 18 個技術群組進入第二輪篩選;第二輪篩選主要從技術對軟體院及其戰略目標的重要性進行評估,評估構面包括:技術準備度(TRL):衡量技術的成熟度,包括其從概念階段到可商業化應用的發展階
15、段。商業準備度(CRI):評估技術進入市場的準備情況,重點在於其市場接受度與商業化潛力。AI 開發的普及性:評估該技術發展對不同人/組織型態的可用程度,包含是否容易使用、開源程度、技術獲取程度等。AI 能力與通用性:評估該技術未來可能具備的能力,包括處理各種複雜程度不同的任務並能夠適應不同情境的能力。政策重要性:該技術與目前政策重點(如數發部、交通部、內政部、國科會SRB 等)的關聯性。數位公共建設特性:分析技術是否具備構建數位公共基礎設施的潛力,顯示對於此技術的社會影響力和可持續發展的重要性。預期產生效益:從經濟效益、社會影響、數位轉型的潛力等方面,評估技術未來可能產生的影響。研發可行性:考
16、察軟體院內部在技術開發上所需的資源、專業能力和時間投入,確保技術的研發工作能夠順利推進。研發競爭優勢:衡量軟體院在研發該技術時的優勢,例如是否擁有獨特的技術基礎或專業團隊,能在競爭中脫穎而出。產業聲譽:該技術是否能夠增強軟體院在相關技術領域中的領導地位及其在產業中的聲譽。技術前瞻性:對未來科技趨勢的匹配度,確定該技術是否符合未來產業的發展方向,並具備前瞻性應用的潛力。125STAR 軟體技術年報技術篩選結果技術母體清單之 26 個技術群組(如圖 1-1)經過第一輪討論與排序分析後,挑選出18 個技術項目,再透過第二輪之重要性討論與排序分析後,最終選出十個關鍵技術:Edge AI、Disinfo
17、rmation Checking、Enterprise LLM(BYOG)、Digital Twins、AI-Augmented Development、AI Agent、Hybrid AI、6G/Low Earth Orbit Satellite、System Integration Optimized for LLM Deployment、AI Trust,Risk,and Security Management(AI TRiSM)),以及產業應用類的 AI in Mobility為重要應用。本方法之技術群組項目圖 1-1Industry Applications(A)Total 26 T
18、echnology ClustersSoftware Platforms(B)Data Management(D)Infrastructure(E)Languate-AugmentedManufacturingAI in SportsAI in MobilityAI in HealthcareAI in MetaverseAI in SustainabilityAI-Augmented DevelopmentCausal AI(Explainable AI)AIOpsDigital TwinsAI AgentDisinformationCheckingEdge AIHybrid AILLM-D
19、rivenChip DesignCyber-Physical Systems(CPS)Risk ManagementAI in QuantumComputing6G/Low EarthOrbit SatelliteModel Depolyment and Management(C)System integration optimizedfor LLM deploymentEnterprise LLM(BYOG)Dynamic Trust-Based Model forGovernanceGen AI WorkloadAcceleratorsAI Trust,Risk,and Security
20、Management(AI TRiSM)Responsible AISynthetic DataFederated Learning資料來源:MIC、軟體院 2024 年 9 月備註:紅色方框為第一輪篩選出技術項目,紅色圓形色塊為第二輪篩選之技術項目,即最終之十大關鍵 AI 技術。6STAR 軟體技術年報十大 AI 關鍵技術簡介21.邊緣 AI(Edge AI)邊緣 AI 泛指將人工智慧能力直接部署在靠近數據生成源的硬體或終端設備上,並進行即時處理任務。此技術透過在本地設備上運行 AI 模型,使得數據處理和決策更加迅速,減少將數據傳輸到雲端伺服器進行分析的需求。邊緣 AI 技術的興起主要是由於
21、雲端運算的限制,包括延遲、網路和隱私問題,因此 AI 運算逐漸從雲端轉移到邊緣和終端設備。隨著邊緣 AI 技術的成熟、設備計算能力的提升,以及物聯網設備的普及,邊緣 AI 將逐漸實現規?;瘧?。邊緣 AI 的重要性在於其能夠在本地進行即時數據處理,從而降低延遲,增強數據隱私和安全性。根據技術趨勢,AI 模型將從通用轉向領域專用,並最終發展為私人專屬的模型,這意味著未來邊緣 AI 將更具客戶導向性,能為不同行業提供更多定制化 AI解決方案。由於 AI 模型的技術日趨成熟,未來邊緣 AI 將成為 AI 運算的主流方向,進一步推動各行業的數位轉型和智慧化發展。軟體院在邊緣 AI 感知技術方面已累積多
22、年經驗,未來將整合多方面技術,如通訊、資安、感測、平臺等,邊緣 AI 的發展規劃將集中在大型與微型邊緣 AI 技術的研發、數據管理與安全的強化,以及領域推廣和生態建設。邊緣 AI 在許多行業中展現出巨大的應用潛力,例如工業自動化、智慧城市、智慧移動、智慧醫療等。AI晶片的發展加速邊緣運算的輕量化,使得各種應用需求都能得到滿足。在智慧安防領域,邊緣 AI 可以即時分析監控影像,實現快速的異常偵測與處理;在智慧城市中,邊緣 AI 可以實現即時的交通管理和環境監測,提升城市的運作效率。許多應用案例一再展現邊緣 AI 在實際場景中的變革力量,未來為各行業帶來更智慧與高效的解決方案。技術簡介:技術重要性
23、與影響:軟體院佈局與方向:產業應用案例:7STAR 軟體技術年報針對現行大語言模型進行雛形開發,並進行模型輕量化,進而建立語言模型服務。針對 Tiny ML 微型模型框架雛型設計,提升微型模型效能優化,建立與提供微型模型服務。研析目前數據管理與隱私強化技術,發展對應工具與建立平臺。透過生成式 AI 與 Tiny ML 技術,建立標竿應用案例,推廣到智慧工廠、智慧安防、智慧城市等領域。探索目前邊緣運算應用服務的生態,制定應用服務標準指引,並依此建構相對應的服務評測機制。大型生成式 AI 研發:微型機器學習(Tiny ML)研發:強化數據管理與隱私保護技術:應用案例推廣至更多領域:建立完整的 Ed
24、ge AI 生態系統:2024研發微型TinyML數據管理與安全領域推廣佈局生態系統建設2025202620272028微型模型框架雛形微型模型效能優化建立微型模型服務研發大型Gen AI語言模型框架雛形語言模型輕量化建立語言模型服務數據管理與隱私強化技術數據管理與隱私強化工具數據管理與隱私強化平臺智慧工廠標竿應用案例智慧安防標竿應用案例智慧城市標竿應用案例生態應用服務探索建立應用服務標準指引建立應用服務評測機制Roadmap發展5 years8STAR 軟體技術年報2.虛假訊息檢測(Disinformation Checking)虛假訊息檢測技術是一種專門用來辨別和偵測虛假或誤導性資訊的技術
25、。此技術的核心特色在於結合深度學習和生成對抗網路(GAN)等技術,能夠識別深度造假(Deepfake)圖像、聲音及影片等內容。這些技術應用包括臉部置換和語音合成的檢測,能有效區分真實與生成的多模態內容。此外,隨著大型語言模型(LLMs)的普及,該技術也能偵測由 AI 生成的錯誤訊息,稱為 FAIGC(Fake AI Generated Content),並識別其中的幻覺效應,糾正生成的錯誤數據。這些技術廣泛應用於媒體、司法調查和網路平臺,幫助防止虛假訊息的傳播和保護數位資訊的可信度。從靜態圖文到動態影音,甚至即時直播,造假技術日益逼真,讓辨別真偽的難度大幅增加,並迅速透過社交媒體散播,這會使大
26、眾對事實與虛構的認知混亂。隨著技術門檻降低,任何人都能製作假影片,影響不再局限於公眾人物,甚至普通人也可能成為目標。更嚴重的是,大型語言模型在生成內容時常出現幻覺,即創造不存在的資訊,這些錯誤訊息難以辨識,加劇錯誤資訊的擴散。這些問題使得虛假訊息檢測技術成為維護資訊真實性、穩定社會信任的關鍵工具,無論是在媒體、司法、還是網路平臺中都至關重要。因此,極需有效的數位監理環境。在產業應用方面,虛假訊息檢測技術已被廣泛應用於多個領域,如網紅經濟、電商詐騙和金融詐騙。以 Gogolook 的防詐/假訊息聯防服務為例,該公司與不同領域的查核服務業者及主管機關形成資料聯盟,透過辨識模型庫與鑑識數據庫共同開發
27、防範詐騙與虛假訊息的技術。這些聯防服務使用跨平臺的數據交換協議與 API,能夠即時查核假新聞、虛假廣告及詐騙資訊,進一步提升網路環境的安全性,減少大眾受到誤導的風險。軟體院已累積多年 Disinformation Checking 技術的經驗,未來將朝生成式 AI 幻覺檢測的強化,建構數位信任基礎建設與 AI 幻覺檢測第三方技術顧問服務。技術簡介:技術重要性與影響:產業應用案例:軟體院佈局與方向:20242025202620272028文字模態(TextModality)大型語言模型幻覺偵測(LLMs Hallucinations Detection)多模態(Multimodal)多模態大型語
28、言模型幻覺偵測(MLLMs Hallucinations Detection)假新聞偵測服務深僞偵測(Deepfake Detection)AI幻覺檢測第三方技術顧問服務9STAR 軟體技術年報3.企業大型語言模型(Enterprise LLM)企業大型語言模型技術是一種專為企業設計的大語言模型,亦可稱為自建企業大腦(Build Your Own GPT,BYOG),目的在降低資料洩漏風險,避免依賴雲端服務。透過結合擴增檢索生成(Retrieval-Augmented Generation,RAG)技術,企業可以建立內部知識庫,搭配較小型的開源語言模型及多模態模型,實現內部應用。這些生成式模型
29、應用於企業內部的各種場景,如協助員工閱讀文件、快速找尋知識,或基於內部資料生成文章等,因此提高企業營運效率與資料管理能力。目前產業應用在企業管理、政府營運管理、AI 智慧助理、客服、行銷、程式開發等用途。如現在正在進行知識管理系統的開發,可讓使用者從企業內部知識庫以自然語言查詢的方式,詢問企業內部資訊,並避免資訊內容到外部網路,只在內網做查詢服務。期末報告助手可以報告書樣板的方式,讓使用者建立報告書樣板,從企業知識庫中找出相關資訊,並以地端大腦生成報告內容段落,來產生初始報告書。企業大型語言模型主要是使用開源的大型語言模型,並搭配地端設備,以非伺服器規格的 GPU 來作為模型推論的算力,提供企
30、業內部使用。大型語言模型的最佳訓練參數量與資料量可被估算出來,並依據需求來選用適當規模的模型。近期也有許多以開源的小模型發展的多模態模型,使應用範圍擴大到影像、聲音等多媒體。代理人系統、企業內部知識查詢也被發展來協助員工改善工作。這些不同的應用,也都需要與最佳化的與地端硬體設備整合,減少企業投入算力設備的成本。軟體院已累積多年在 AI 技術方面的經驗,近幾年來生成式 AI 的盛行,讓 AI 開拓新的使用方向與功能,除感測模型外,更能使用生成模型依據企業使用者需求來選擇對應的目的。技術簡介:產業應用案例:技術重要性與影響:軟體院佈局與方向:10STAR 軟體技術年報結合傳統 AI 與大型語言模型
31、的代理人系統,增加對使用者需求的理解與工具的使用,讓代理人能夠處理更多複雜事件?,F行 AI 需要包裝至 API 或網站等前臺應用,現在已有封閉環境(如遊戲或元宇宙)的成功案例,未來更可搭配機器人往具身智慧(Embodied)代理人的方向在實體中互動?,F行開源模型主要還是以文字與部分類型影像,未來可以深入至多媒體或更精細的影像,並配合企業領域做領域知識的訓練微調,建立專屬模型應用。模型發展也有在不損失太多知識的前提下,將模型與訓練資料減少,應用於有限範圍應用的情境,並運行在小型電腦或是手機上面,擴大服務場合。大型語言模型代理人(Agent):互動機制的改進:模型演進與訓練機制:縮小化的模型:20
32、24指引增強能力評估開源模型硬體伺服器企業資料庫2025202620272028平臺應用基礎代理人進階代理人Embodied代理人RAG程式協作封閉環境互動環境互動AI轉型(社會)AI轉型(個人)AI轉型(企業)集成小模型評估模型評估小模型評估多模態模型與混和預測式模型開源模型多模態模型普遍手機應用伺服器工業電腦開源資料庫指引領域資料領域資料11STAR 軟體技術年報4.數位孿生(Digital Twins)數位孿生是指在虛擬世界中創建真實物件或流程完全相同的數位複製品。它利用感測器收集實體對象的即時數據,並在虛擬環境中實現建模、模擬和預測真實物件的狀態。這種技術可以即時監測、分析和預測實體對
33、象的狀態和性能,幫助優化決策和流程。數位孿生廣泛應用於製造業、智慧城市、醫療保健等領域。例如:工廠可以利用機器設備的數位孿生來預測故障和預測性維護;醫生可以透過患者的數位孿生來模擬治療方案。隨著物聯網設備的普及、晶片算力的提升和 AI/生成式 AI 技術的成熟,推動數位孿生應用的發展,為各行業帶來創新和效率提升。數位孿生技術透過即時數據同步,實現實體世界與數位世界的無縫連接,提供低成本且高效的監控、模擬和預測能力。它克服物理限制,使得實體世界中難以重現的情境(如飛行異常狀況)得以在虛擬空間呈現。這項技術不僅節省成本,還能在虛擬環境中進行模擬測試和優化,大幅降低實際操作成本。數位孿生正從單一設備
34、模擬擴展至複雜系統的全面仿真,推動智慧製造、智慧城市等領域的創新發展,為產業升級和社會進步帶來變革和創新機會。數位孿生技術在多個領域展現強大的應用潛力,如:生產優化、預測性維護、數位養殖、虛擬教練、智慧城市等。在製造業,它即時監控機臺稼動率、進行預測性維護和優化生產流程,提升設計和製造階段的效率與靈活性;在養殖業,它即時監控養漁/蝦池的狀態,搭配專業技術人員的知識,建立數位養殖達人分身,藉以解決人口老化而傳承中斷的議題;在運動健康領域,它持續蒐集個人運動數據歷程、專業教練知識與指導,解決多人多樣的主觀回饋,打造客觀且精準的科技訓練服務;智慧城市方面,新加坡的Virtual Singapore
35、計畫利用數位孿生進行城市規劃和基礎設施管理。這些案例展示數位孿生技術在提升營運效率、模擬預測和創新的巨大價值,推動各行業朝向更智慧與永續的方向發展。技術簡介:技術重要性與影響:產業應用案例:12STAR 軟體技術年報軟體院已累積多年在 Digital Twins 技術方面的經驗,未來將延展其它技術,如資安、標準、模擬等,Digital Twins 的發展規劃將聚焦數位內容快速產製、接口標準化、模擬技術以及系統可視化等技術挑戰,才得以擴展至不同應用場景。軟體院佈局與方向:從強化學習和自主學習服務出發,逐步發展到數位孿生快速產製,最終達到高精度自動化設計生成。這一過程實現 AI 技術從專業領域應用
36、到通用設計工具的轉變,促進各行業的數位轉型,大幅提升決策效率和創新能力。從 接 口 標 準 化 和 互 操 作 性 開 始,透 過 引 入 AR/VR/XR 等 沉 浸 式 技 術,最 終 實 現City-scale 高可靠性服務。這個過程涵蓋從基礎設施到用戶體驗的全方位升級,旨在創造一個高度整合的智慧生態系統,涵蓋製造、交通、運動和能源等多個領域,提升城市營運效率和居民生活品質。生成式 AI 與 AI 技術研發:垂直領域生態構建:2024垂直領域場景開源GenAI/AI算力基礎建設生態系統建設2025202620272028標準化與互操作性技術標準化(ISO和IEEE)跨平臺互操作性沈浸式可
37、視化技術AR/VR/XRCity-scale高可靠性服務製造、交通、運動、能源數位孿生快速產製高精度自動化設計生成邊緣運算與分散式算力Roadmap發展5 years本院技術佈局及深化領域強化學習與自主學習服務特定領域專家知識校調異構運算GPU+CPU+FPGA大規模物聯網Massive IoT可重構智慧面RIS可持續算力綠色能源能源高效的傳輸技術自適應網路技術13STAR 軟體技術年報5.AI 增強開發(AI-Augmented Development)AI 增強開發是指使用人工智慧技術,例如生成式 AI 和機器學習,來協助軟體工程師設計、撰寫和測試應用程式。將 AI 增強開發工具整合到工程
38、師的開發環境中,能自動生成應用程式碼,實現從設計到程式碼的轉換,並加強應用程式的測試能力??蓱迷谲涹w開發、自動化測試、UI/UX 設計、需求管理與規劃、DevOps、版本控制與程式碼管理,以及智慧維運與監控上,具有可提高生產力、減少錯誤、設計到程式碼轉換、適應性強,以及跨領域協作的技術優勢。AI 增強開發的重要性在於能提升開發效率,包括 AI 輔助編碼能自動完成常規性工作,減少人力負擔,加速開發流程,幫助企業更快推出產品;並且減少錯誤與風險,包括透過 AI 進行程式碼審查和測試,能有效降低軟體錯誤率。在 2024 年度 Gartner 研究報告中亦顯示 AI 對大型企業開發團隊的重要影響,以
39、 GitHub Copilot 為例,所產生的效益包括:生產力提高 17%至 20%、超過 90%的受訪者表示每週節省 1-2 小時的時間、50%到 75%的開發者體驗得到改善的開發體驗。目前產業應用在國際上,國際大廠主導開發、測試、部署三主軸發展,例如微軟 Visual Studio 使用 GitHub Copilot 利用 AI 配對程式設計。國內則如聯發科 AI 開發輔助平臺,利用 AI 技術加速 5G 相關軟體開發流程,以及臺積電內部將 AI 應用在 IC 設計自動化,幫助工程師加快設計過程。而資策會則以軟體開發為基礎,於 2023 年 11 月發表生成式 AI 輔助之軟體開發指引,促
40、進資服業透過生成式 AI 協助進行軟體開發的發展;另外,資策會亦研發可自動化解析與重組 docx 文檔,以 RAG 技術結合語言模型快速生成報告書之工具技術。技術簡介:技術重要性與影響:產業應用案例:14STAR 軟體技術年報軟體院已累積多年在 AI 技術方面的經驗,近幾年來生成式 AI 的盛行,讓 AI 開拓新的使用方向與功能,但在軟體開發上,國際大廠主導水平領域應用、共通性高的開發、測試、部署三主軸發展,因此資策會採取布局策略:由需求、設計、評估著手,扮演第三方角色,利用工具、指引及標準(如 ISO 42001)協助實現合規要求,符合 AI 提升開發效率與品質,主要幾個方向為:垂直領域應用
41、、在地化。軟體院佈局與方向:於初期即以先驅角色提出方向性的指導,作為產業運用 AI 增強軟體開發方法的引導者。重點投入 AI 技術研究,開發多功能平臺以支持多樣化開發場景。協助廠商推動開發者掌握 AI 技術,進行 AI 驅動的開發實踐導入。指引先行:需求、設計、評估 AI 輔助技術平臺發展:顧問、第三方角色:20242025階段202620272028引入 NLP 工具;建立需求收集聊天機器人強化 NLP 功能;需求風險預測AI 需求變更管理自動化需求管理平臺自動化需求管理平臺指引建立+人才培訓需求(指引與標準)需求人+工具輔助人配合+工具主導全自動工具設計全自動工具設計使用 AI 輔助設計強
42、化 AI 輔助設計;評估設計風險引入 AI 設計模式;模擬驗證設計AI 主導設計流程AI 主導設計流程指引建立+人才培訓設計(指引與標準)設計人+工具輔助人配合+工具主導全自動工具設計全自動工具設計主流廠商主導(AI 程式開發助手)指引建立+人才培訓開發(指引與標準)開發人+工具輔助人配合+工具主導全自動工具設計全自動工具設計主流廠商主導(AI 增強測試工具)指引建立+人才培訓測試(指引與標準)測試人+工具輔助人配合+工具主導全自動工具設計全自動工具設計主流廠商主導(AI 程式開發助手)部署15STAR 軟體技術年報6.人工智慧代理(AI Agent)IBM 認為 AI Agent 是一個能夠
43、自主地代表使用者或其他系統執行任務的系統或程式,透過設計其工作流程並使用可用的工具。微軟並進一步定義 AI Agent 應該具備下列共通特徵:做規劃、用工具、認知與記憶。AI Agent 技術的特色在於自主性、適應性和學習能力。這些代理能依據目標自動執行任務,並能依據環境變化調整策略,甚至從經驗中學習。主要應用領域包括:電信金融業的自動化客服(如聊天機器人)、旅遊電商業的智慧推薦系統、一般企業的會議安排、行政流程、員工訓練等。AI Agent 技術的重要性在於它能自主執行複雜任務,減少人類干預,提升工作效率。這些代理(Agents)能夠依據預定目標進行決策,並在變動的環境中學習與適應。例如,A
44、I Agents 可用於自動客服、推薦系統、資料分析、智慧家庭等,讓企業和用戶節省時間和資源,進一步優化決策過程,提升生產力。前 Google CEO Eric Schmidt 預言,未來每個人都將擁有自己的專屬 Agent,並且在未來 12 個月內,AI Agent 將具備自主學習的能力,可以持續成長與改進;這些預測突顯 AI Agent 技術的潛力與未來應用的廣泛性。技術簡介:技術重要性與影響:然而,AI Agents 的影響也帶來挑戰,特別是在倫理與隱私領域。例如,自主決策可能會導致預期外的結果,甚至引發安全問題。因此,在推廣這項技術的同時,確保其透明性、公平性和可控性將是未來關鍵。只有
45、在這些挑戰得到有效解決後,AI Agent 才能真正發揮其價值,促進企業和社會的進步。16STAR 軟體技術年報Uber 開發客服員工助理,可以即時摘要客服對話內容、並且自動載入相關的參考資料,提升客服人員工作效率。美國福斯汽車公司開發 AI Agent 車主虛擬助理,可以回答車主用對話或照片提出的車輛保養與使用的問題,提升客戶滿意度,減少客服人員工作量。Google 開發的 Code Assistant 程式助手,可以協助程式師在撰寫程式時,即時產生後續程式碼,或產生程式區塊與函式,提升開發速度。為解決 AI Agent 現有的可靠性不足、校能與成本、客戶信任等議題,目前開發布局由下面幾個方
46、向進行:產業應用案例:軟體院佈局與方向:採取可靠的流程控制,Agent 工作流程預先規劃,AI 只在分支點做決策,提高可靠度。收集用戶回饋做後續改善,以範例學習與微調學習方式,改善 Agent 效能,並用地端模型以控制叫用模型的成本與反應速度。以客製小模型自動檢查 Agent 輸出,提高輸出的可信度,並提供輸出的參考來源,取得客戶信任。流程模組:學習模組:查核模組:2024流程模組學習模組查核模組2025202620272028Interactive Routing&PlanningAI PlanningBatch LearningRoadmap技術模組5 yearsFlow RoutingU
47、ser FeedbackRule BasedContinuous:earningModel Based17STAR 軟體技術年報7.混合式 AI(Hybrid AI)混合式 AI 結合雲端和邊緣計算的優勢,以應對高成本和複雜任務的需求;透過將小型化但功能強大的模型部署於終端裝置,混合式 AI 能在智慧終端、電動車、擴增實境與虛擬實境及無人機等多種場景中提供即時推理與決策,提升應用效率並實現規模效應。這一技術架構允許在雲端進行大規模數據處理和模型訓練,同時在邊緣設備上進行快速運算,減少資料傳輸延遲。主要應用領域包括智慧交通、智慧製造、醫療健康及物聯網等,混合式AI 的發展將促進各行各業的創新,滿
48、足即時分析和長時間資料解析與洞察的需求?;旌鲜?AI 技術的重要性在於充分結合雲端和邊緣計算的優勢,能夠針對不同的任務和環境選擇合適的技術進行問題處理,從而提高系統的靈活性和智慧程度。這種技術架構不僅能夠減少延遲,還可以在保證資料隱私和安全的同時,快速回應即時的需求。隨著 AI 技術的不斷成熟,許多現實世界的複雜問題也開始呈現出多樣性和不確定性,這使得混合式AI 能夠更有效地解決這些挑戰,推動各行業的數位轉型和智慧化發展。特別是在電動車、智慧製造和醫療健康等領域,混合式 AI 提供客製化的解決方案,進一步提升商用價值,並開創新的應用場景,使得未來的 AI 技術更具發展潛力?;旌鲜?AI 在醫療
49、和製造領域展現顯著的應用潛力。以復健醫材為例,透過邊緣裝置即時分析肌力和姿勢,並結合雲端伺服器的大 型 語 言 模 型(LLM),實現個人化的復健建議,將醫療照護從醫院延伸至家庭。技術簡介:技術重要性與影響:產業應用案例:針對化學纖維生產廠的實務需求,開發一套智慧巡檢系統,巡檢員可使用手機拍攝爐火影片,並在終端裝置即時辨識火焰狀態。工作結束後,影片將上傳至伺服器進行辨識模型的優化,提升檢查的客觀性與效率,降低異常風險。這些案例突顯混合式 AI 在不同產業中的應用價值,為數位轉型提供強有力的支持。18STAR 軟體技術年報軟體院在雲端 AI、邊緣 AI 及混合式 AI 方面累積多年經驗,未來將專
50、注於三個關鍵要點:軟體院佈局與方向:透 過 隨 選 算 力(On-Demand Computing Power)和 敏 捷 開 發 方 法(Agile Development Methodology),協助企業以低成本、高效率驗證混合式 AI 應用的可行性,加速數位轉型。針對臺灣在垂直領域的優勢,運用混合式 AI 架構最大化 LLM 的效益,專注發展領域型的 AI 解決方案,例如自動化文字生成、內容創作或客製化知識管理系統等,從而提升新創企業的競爭力。結合臺灣硬體製造的能量,培養具備混合式 AI 軟硬體整合能力的人才,勇於面對Edge AI、AI PC 及混合式 AI 的挑戰;透過這些佈局,混
51、合式 AI 將提升各行業的應用效率,促進企業創新與成長。發掘高價值應用場景:專注領域型的 AI 解決方案:培養混合式 AI 軟硬整合人才:18STAR 軟體技術年報19STAR 軟體技術年報8.6G 與低軌衛星(6G/Low Earth Orbit Satellite)通訊向來是臺灣的重點科技產業,更是賴總統五大信賴產業之一。次世代通訊技術包含 6G 與 NTN 或簡化為低軌衛星,世界各國無不積極投入研發以搶得重要戰略地位。6G 的潛在應用包括全息通訊、智慧城市、遠端操控(手術)、智慧交通、虛擬實境和擴增實境、自動6G 技術的發展將在多個層面上產生深遠的影響,除更大速率、更低延遲、更加可靠等K
52、PI 提升外,6G 的發展將促使全新的科技創新,如邊緣計算、自動駕駛和無人機技術等,這些技術將重塑產業結構。另外,透過 AI 和機器學習,6G 將實現更高效的網路管理和資源配置,提升網路的安全性和穩定性;低軌衛星則扮演數位延伸及數位韌性的賦能者,它不僅能提升全球的連接性,還能在教育、醫療、環保等多個方面產生深遠影響,推動社會和經濟的可持續發展。通訊如同陽光空氣水,在各種的應用中扮演不可或缺的角色。資策會攜手聯發科與Inmarsat 成功完成世界首次 5G 衛星物聯網資料傳輸測試,開啟行動網路與衛星通訊的融合,即便身處海洋或是偏遠山區,所有固定或移動式載體都可接入這全球物聯網的覆蓋之下,未來的應
53、用領域相當廣泛,例如遠洋物流、風力、電力能源設備監測管理、環境監控、防救災等,將開創出新的商業模式與藍海市場。技術簡介:技術重要性與影響:產業應用案例:化物聯網等。低軌衛星的應用則包含臺灣山林、沿岸、近海等網路延伸,為未覆蓋的地區提供高速網路接入;緊急通訊,如在自然災害或基礎設施故障時提供穩定的通訊服務;物聯網,如支援遠端設備的資料傳輸和監控;農業監測,如透過衛星進行農作物生長監測和氣象預報;國防與安控,支援軍事通訊和國安公安監控。20STAR 軟體技術年報6G AI-Native 網路:設計下世代網路架構,深度融合人工智慧技術,並以此為基礎進行網路管理和營運的系統。軟體院佈局與方向:以 SB
54、A(Service Based Architecture)及微服務化 5GC(5G Core)為基礎,發展 6G 關鍵核心網元。移植資策會 5GC 於微型 SBC(Single Board Computer)硬體,應用於防救災、船舶、海事應用等專網系統。整合無人機、行動車、衛星網路、行動專網等系統,提供動態網路服務。整合有線、無線、衛星等異質寬頻網路,結合 AI/ML 技術自動最佳化切換並保持韌性網路服務。以生成式 AI 模型為工具,發展以 3GPP 標準規範為數據資料的專用問答機器人與程式生成工具。Cloud-Native 智慧核心網路:專網微型核心網路:按需佈網技術:多重韌性網路:無線通訊
55、生成式 AI:20246G AI-Native網路架構技術2025202620272028Roadmap技術模組5 yearsAI-Native網路基礎架構建立AI驅動自動化管理機制整合Hierarchical AI階層式技術開發Distributed AI分散式技術開發國際產學研合作展示網路節能技術通訊網路節能技術需求分析基地臺與核心網路能耗優化解決方案引入AI技術進行節能管理與動態資源調配現實多層節能策略的應用強化通訊網路能效最大化與服務穩定性雲原生核心網路技術建立容器化服務基礎實現核心網路功能的微服務化實現動態資源調配與容錯機制提升網路效率與自我修復能力支援動態部署應用並確??煽啃院诵木W
56、路微服務架構技術設計微服務架構支援動態擴展和資源優化強化微服務架構的彈性與可靠性實現微服務架構自主調控支援跨域與多層網路需求衛星通訊多層網路韌性技術建立多重網路連接架構與通訊協議實現多重路徑自動故障切換提升網路異常檢測與恢復能力強化在極端情況下的高可用性實現無縫網路切換,維持服務不間段21STAR 軟體技術年報9.大型語言模型部署優化的系統整合 (System Integration Optimized for LLM Deployment)針對大型語言模型部署優化的系統整合,在面對不同的硬體和軟體時,可以藉由大型語言模型維運(Large Language Model Operations,L
57、LMOps)來最大化 LLM 的性能。LLMOps 是指管理、營運和優化大型語言模型(如 GPT 等)在各種應用中的工作流程和基礎設施的實現。這包括模型訓練、部署、監控、測試和持續改進的過程。LLMOps 的目標是確保語言模型能夠穩定、高效、符合需求地提供服務,並能應對模型更新、資源管理、數據隱私、安全性等挑戰。隨著 AI 和 NLP 應用在各個領域的爆炸性增長,對 LLMOps 平臺和工具的需求也在增加。從醫療、金融到電子商務,企業越來越多地依賴大型語言模型來實現自動化、智慧客服、語義搜索、文本生成等功能。這些模型的營運和管理變得至關重要,特別是在大規模環境中,企業需要高效的基礎設施來支援這
58、些應用。企業需要高效的基礎設施來支援 AI 各種應用。以下是幾個關鍵點說明其重要性:模型管理:LLMOps 可有效地管理大型語言模型的訓練、部署和更新,確保模型在不同運作環境中的一致性;數據處理:LLMOps 提供數據收集、清洗和標註的工具和流程,確保模型訓練所需的數據品質與正確性;監控和維護:透過 LLMOps,可即時監控模型的性能,及時發現和解決問題,確保模型在服務環境中的穩定運作;安全性和合規性:LLMOps 幫助確保模型的開發和部署符合相關的法律法規和安全標準,保護用戶數據隱私和安全;協作和自動化:LLMOps 促進團隊之間協作,並透過自動化工具減少手動操作,提高工作效率。德 國 主
59、要 新 聞 平 臺 Zeit Online 使 用 LLMOps 平 臺 開 發 一 個 名 為Ask Zeit Online,允許讀者提出有關時事的問題,並根據 Zeit Online 的新聞檔案獲得答案,提供簡短的摘要、引文和原始來源的連結。使用 LLMOps 平臺能夠專注於快速迭代和用戶回饋,以完善 LLM 應用服務。技術簡介:技術重要性與影響:產業應用案例:22STAR 軟體技術年報針對國內產業需求,軟體院預計針對以下方向進行佈局:軟體院佈局與方向:因應目前並非每家公司皆有足夠之算力,預計開發在低資源的限制下仍可以進行模型微調的技術,預計可以協助更多中小企業進行模型微調,提升模型準確度
60、。整合無人機、行動車、衛星網路、行動專網等系統,提供動態網路服務。為可以讓企業使用 LLM 時取得更符合自身需求的結果,軟體院預計開發提示工程與前後文管理的工具,讓模型更準確地理解和生成所需的內容,減少模型在複雜任務中的錯誤和偏差,提升整體性能。為協助企業解決內部多種需求,預計透過整合多個 LLM,以利用不同模型的優勢,提升整體系統的服務多樣性。模型微調:按需佈網技術:多模型整合部署:提示工程與前後文管理:2024模型服務顧問服務2025202620272028低資源模型微調技術多模型整合部署技術提示工程與前後文管理技術部署維運效能優化5 years22STAR 軟體技術年報23STAR 軟體
61、技術年報10.AI 信任、風險和安全管理 (AI Trust,Risk,Security Management,AI TRiSM)在 AI 技術廣為應用的趨勢下,確保人工智慧的可靠度與安全性成為重要的議題,AI TRiSM 所涉及的問題包括:1.Trust,建立使用者、開發者和社會 AI 系統的信心。2.Risk,識別、評估與解決 AI 系統所可能帶來的潛在風險並進行管理。3.Security,保護 AI 系統避免受到惡意攻擊和未經授權的入侵與竄改。因此,在 AI TRiSM 的發展上,建立大眾對AI 技術的信任是最為重要的目標,各式開發透明化、可解釋性管理技術、AI 產品評測技術也隨之應運而
62、生。多元應用的 AI 所帶來的可靠度風險是多樣化的,目前最為盛行的大型語言模型 LLM 應用中,頻(繁體版)出現資訊錯誤與模型幻覺的問題;醫療輔助判讀與智慧輔助駕駛功能中的 AI 功能也都帶來數據偏見、判讀失誤的狀況。因此在 AI 可靠度的強化上,其一是採取更為透明與可解釋化的開發流程,讓幻覺與偏見發生時,可以回覆之前模型的狀態,或是更容易的察覺發展過程中的問題;另外一方面則是建立 AI 風險與可靠度的管理細則,不論是指引、法規、標準等,都需要進一步的建立,加上檢驗流程中所需的量化工具研究,形塑完整的 AI 評測服務。AI 可靠度在產業應用上是全面性的,如同在金融機構進行信用評分時,依賴 AI
63、 來確保公平性,或是利用 AI 來偵測異常交易,保護消費者;在醫療行為上,提供 AI 建議來輔助醫生決策,或輔助偵測系統的數據隱私安全;社交媒體也大量採用 AI 識別有害內容,但同時要尊重言論自由,或是進行假新聞的檢測,確保資訊的正確性;智慧駕駛上,則需要確保 AI 決策系統的可靠度跟穩定性。以上的案例都再再顯示,AI 在快速應用的過程中,需要提高模型開發的透明度,以協助理解與管理風險,並符合監管的要求。技術簡介:技術重要性與影響:產業應用案例:24STAR 軟體技術年報在軟體院多年的技術累積下,AI 應用已深入社會產業各個領域,也深諳 AI 可靠度與的重要,目前正積極以建立完整 AI 可靠度
64、與安全管理為目標,針對法規面、技術面、以及各應用領域進行布局。在法規面,以 AI 信任框架標準、評測流程、認證制度的建立為目標;在大型語言模型 LLM 發展中,則以開發流程透明化,幻覺穩定度量化機制為發展重點;另外針對智慧製造、醫療、移動載具的智慧 AI 控管,也同時以發展檢驗評測工具,建立完整服務機制為目標進行布局。希望透過 AI 可靠度的機制建立,讓社會與產業在 AI 技術應用上都能夠更進一步提升信任度與安全性。軟體院佈局與方向:2024領域LLM智慧製造智慧醫療未來移動2025202620272028LLM開發透明化流程LLM幻覺與穩定度量化機制LLM可靠度評測服務法規標準建立AI信任框
65、架草案建立各領域AI信任框架標準與認證制度建立AI製造模組風險控管AI製造模組效能評估工具AI智慧製造可靠度評測服務醫療AI輔助判讀穩定度風險控管醫療AI判讀穩定度檢驗工具醫療AI判讀穩定度評測服務移動AI可靠度風險控管移動AI模組多元環境評測工具智慧系統AI可靠度評測服務Roadmap發展5 years24STAR 軟體技術年報25STAR 軟體技術年報第二章:AI 學術與研究深度解析本章深入探討人工智慧(AI)學術與研究,包括 AI 前瞻技術與研究趨勢、實驗室及研究機構的技術成果介紹、學術界合作的案例以及重要研究成果。此外,並將概述國際重要的學術期刊與會議,全面呈現 AI 技術的最新發展與
66、應用。前瞻技術與研究趨勢資策會肩負鏈結臺灣資通訊領域學研單位與產業發展之使命,旨在發展與導入最新資通訊相關之軟體技術於國內外產業應用,並立足於第三方服務之角色。軟體技術研究院為資策會最主要之技術研究單位,近年聚焦 AI 技術之發展。是以,軟體院統整近年來與未來五年內人工智慧技術與應用繪圖(STI-AI Tech.&App Landscape);此技術繪圖之目的為協助資策會、國內產業、學研單位研究者、與政府機關掌握 AI 發展與應用趨勢,了解前瞻技術與產業脈動,進而制定資策會技術發展重心。126STAR 軟體技術年報資料來源:資策會軟體院人工智慧技術與應用繪圖圖 2-1IndustryAppli
67、cationsLayerSoftwarePlatformsLayerAI in SportsTechnology layeringAI-Augmented Development-AI Text Analysis-Doc/Code Generation-AI Development ToolsCausal AI/Explainable AIDigitalTwinsDisinformationCheckingText toActionAI AgentsAI OpsAI in MobilityAI in SustainabilityAI in MetaverseLanguage-Augmented
68、ManufacturingAI in Healthcare.DataManagementLayerAI TRiSM-Detection Alarm-Network O&M-Image identificationAuto DrivingAI SensingModelDevelopment&ManagementLayerSystem Integration Optimizedfor LLM Deployment-NLP-AI Secure ToolsSynthetic Data-Dataset-AI Labeling ToolsTime data generationResponsible AI
69、InfrastructureLayerEdgeAIHybridAILLM-Driven ChipDesignCyber-PhysicalSystems(CPS)RiskManagementComputing Power-AI in Quantum ComputingCommunication-6G/Low Earth Orbit SatelliteMemory&StorageEnergyEnterprise LLM/BYOG-LLM-Foundation ModelDynamic Trust-Based Model forGovernance-AI Language Model Evaluat
70、ion Tools-AI Evaluation Tools-AI performance testing toolsGen AI WorkloadAccelerators-Deep Learning Networks該人工智慧發展與應用之技術繪圖將 AI 技術與應用以五層式階層架構進行統整,由 上 而 下 分 別 為:Industry Applications Layer、Software Platforms Layer、Model Deployment and Management Layer、Data Management Layer、Infrastructure Layer 下層技術/應
71、用可進一步支援與服務上層技術/應用:Industry Applications Layer 包 含 有:AI in Sports(使 用 AI 技 術 進 行 即 時 分析、訓 練 優 化 和 運 動 活 動 的 策 略)、AI in Mobility(運 用 AI 優 化 交 通 系 統,包 括 交通 管 理、自 動 駕 駛 和 公 共 交 通,提 升 整 體 效 率 和 安 全 性)、AI in Healthcare(利 用AI 進行醫療診斷、個性化治療計畫、患者管理和預測分析,以改善醫療結果)、AI in Sustainability(發展 AI 技術發展環境監測、資源優化,以及推動各行
72、業的永續活動)、AI in Metaverse(使用 AI 建立、管理和增強元宇宙中的沉浸式虛擬環境和體驗,發展虛擬互動創新)、Language-Augmented Manufacturing(語言增強製造是一種將自然語言處理(NLP)技術應用於製造過程的方法,此技術旨在透過語音或文字指令來優化和自動化製造系統,以提高生產效率)。27STAR 軟體技術年報Software Platforms Layer 包含有:AI-Augmented Development(使用 AI 工具強化軟體開發工作流程,包括代碼生成、錯誤檢測和項目管理,提高生產力和品質)、Causal AI/Explainable
73、 AI(專注於開發能提供可解釋和因果關係的 AI 系統,提升透明度和信任度)、AIOps(將 AI 與 IT 營運結合,自動化和優化 IT 過程,提高效率和可靠性)、Digital Twins(使用 AI 建立物理系統的數位孿生,進行實時監控、模擬和優化,提升營運效率和決策能力)、AI Agent(AI 代理人能夠自主執行任務或根據數據分析、機器學習和人工智慧算法進行決策。這些代理人可以設計用於各種應用,包括客戶服務、數據分析、機器人等)、Disinformation Checking(透過 AI 技術來識別、分析和減少網路上的假信息)、Text to Action(透過 AI 技術,協助文字
74、產生對應的行動)。Model Deployment and Management Layer 包 含 有:System Integration Optimized for LLM Deployment(針 對 大 型 語 言 模 型(LLM)部 署 優 化 的 整 合 系統,利 用 高 效 的 硬 體 和 軟 體 協 同 運 作,最 大 化 LLM 的 性 能 和 可 擴 展 性)、Enterprise LLM(客製化建置企業使用的大語言模型,協助企業優化營運流程、增強決策等工作以賦能於企業)、Dynamic Trust-Based Model for Governance(動態信任治理模型強
75、調在治理框架內的適應性信任管理機制,該模型利用即時數據、利益相關者反饋和 AI 來動態評估和調整參與者之間的信任水平,從而提升決策過程中的透明度、問責性和效率)、Gen AI Workload Accelerators(生成式人工智慧工作負載加速器是一種專為提升生成式 AI 模型運行效率而設計的硬體或軟體演算法)。28STAR 軟體技術年報D a t a M a n a g e m e n t L a y e r 包含有:A I Tr u s t,R i s k,a n d S e c u r i t y Management(AI TRiSM)(使用全面的 AI 治理框架管理 AI 系統的信
76、任、風險和安全性)、Responsible AI(確保 AI 的開發和部署符合倫理道德,特別是 AI 系統的公平性、透明度和可問責)、Synthetic Data(使用 AI 生成用於訓練機器學習模型的合成數據集,增強數據多樣性和隱私性)、Time data generation(基於時間的數據生成技術,通常用於模擬和預測。)。Infrastructure Layer 包含有:Edge AI(邊緣 AI 是在本地設備上運行 AI 演算法,而不是集中在伺服器上;這樣可以減少延遲、節省帶寬並提高數據隱私)、Hybrid AI(結合邊緣計算與雲端運算,將 AI 運算分散在不同終端裝置或雲端運行,以提
77、高效率、降低延遲,並加強數據隱私與安全性)、LLM-Driven Chip Design(設計專門優化的芯片,使用 AI 來運行大規模語言模型(LLM),提高性能和效率)、Cyber-Physical Systems(CPS)Risk Management(使用 AI 管理和減輕與網宇實體系統相關的風險,確保其安全 性 和 可 靠 性)、Computing Power:AI in Quantum Computing(使 用 量 子 計 算技術發展 AI 應用技術,比傳統電腦更快更高效地解決複雜問題)、Communication:6G/Low Earth Orbit Satellite(支援 A
78、I 系統內部及與外部進行數據交換的通訊技術,並使用 AI 開發下一代通訊技術和衛星系統,以改善連接性和數據傳輸)、Memory&Storage(記憶體與存儲設備,負責保存和快速檢索 AI 所需的大量數據)、Energy(為 AI系統的運作提供穩定的電力支援)。此人工智慧技術與應用繪圖,透過五層架構,解析 AI 技術在未來五年的關鍵應用和技術突破,涵蓋從產業應用到基礎設施的全面發展趨勢。資策會軟體院將繼續作為產學研合作推動者,促進前瞻技術落地,確保臺灣在全球 AI 技術競爭中的重要地位,並為產學研等單位提供清晰的發展指引與技術策略。29STAR 軟體技術年報實驗室與研究機構技術與成果介紹本節介紹
79、我國重要大學及研究機構在 A I 技術之研究發展,目前已有豐碩之重要成果;下列研究單位不代表所有的單位,未來發行的年報會再持續介紹與探索,歡迎更多學術機構共同合作,深化我國 AI 技術能量。21.國立陽明交通大學 電腦遊戲與智慧實驗室國 立 陽 明 交 通 大 學 資 訊 工 程 學 系 電 腦 遊 戲 與 智 慧 實 驗 室(Computer Games and Intelligence Lab,CGI Lab),由美國卡內基美隆大學計算機科學博士吳毅成教授(Professor I-Chen Wu)擔任指導教授,其為國際知名的 AI 與電腦遊戲專家,專注於棋盤遊戲和解謎遊戲的 AI 研究,並
80、在多項國際競賽中獲得佳績,帶領實驗室進行多方面的創新研究。CGI Lab 成立於國立陽明交通大學,目的是推動 AI 技術在電腦遊戲中的應用,尤其是策略性棋盤遊戲。該實驗室旨在透過創新研究和應用,提升遊戲 AI 的智慧和效能,並推動學術界與業界的緊密合作。該實驗室目前主要研究方向有:電腦遊戲 AI,主要集中於棋盤遊戲、卡牌遊戲和解謎遊戲等;機器學習應用於遊戲及數學最佳化問題;深度強化學習及生成式 AI 的應用。並且具有專長技術為:深度強化學習及 AI 代理人技術在遊戲中的應用、可信任生成式 AI 開發與應用、以人類回饋訓練 AI(Reinforcement Learning from Human
81、 Feedback,RLHF)。該實驗室目前進行中研究項目有:TAIDE 計畫,該實驗室參與開發多模態視覺語言模型,探索視覺與語言理解的深度結合,推動臺灣本土可信賴的生成式 AI 技術。研究領域與專長研究項目與成果生成式 AI 風險評估指引,該實驗室與資策會合作編寫生成式 AI 的風險評估指引,旨在幫助企業在導入生成式 AI 之前進行自我審查,避免潛在的數據洩漏風險。30STAR 軟體技術年報未來,實驗室將持續深入研究 AI 技術在策略性遊戲中的應用,並探討強化學習和生成對抗網絡等技術的創新應用。同時,透過生成式 AI 的發展,為企業和產業提供更多的可信任 AI 解決方案。CGI Lab 希望
82、與業界及其他研究機構展開更多的合作,將其技術應用於各種遊戲及智慧系統,推動 AI 技術的實際應用與技術轉移。未來展望此外,該實驗室具有的重要成果有:六子棋發明:吳毅成教授發明棋盤遊戲六子棋,這是一款新型的策略性遊戲,並成為國際電腦奧林匹亞比賽的正式項目。TAIDE 計 畫 參 與:該 實 驗 室 積 極 參 與 TAIDE(Trustworthy AI Dialog Engine)計 畫,專 注 於 使 用 RLHF(Reinforcement Learning from Human Feedback)技術,開發臺灣本土可信任的大規模語言模型(LLM)。DeepRacer 競賽得名:該實驗室團
83、隊在 Amazon 的 DeepRacer 自主賽車競賽中取得了優異成績,展示了在強化學習應用於自動駕駛領域的領先技術。31STAR 軟體技術年報該中心主要研究方向有語音語言 AI 技術:文語轉換:文字轉語音、語音轉文字,語言翻譯:語音或文字為輸出入之機器翻譯,語言交談:基於大語言模型之語意理解和語言生成。以及多?;?AI 技術:多模(語音、文字、影像、影片)基礎模型,透過影片之影音多模自主學習 AI。該中心的專長技術有,低資源語言之 AI 技術:現代生成式 AI 技術都建立在巨量資料上,但對於低資源語言如臺語、客語、原住民族語等,都是一個現實上難以克服的問題。該中心企圖透過其他相關資源(例
84、如同為漢語語系之華臺客語)的轉移訓練來挑戰此一難題。以及多模自主學習 AI 技術:藉由社群媒體時代大量的影音資訊,該中心企圖研究可透過影片中語音、文字、圖像等多模資訊來進行自主學習。藉此也可克服缺乏文字資訊之語言的 AI 技術研發。該中心進行中項目:2022-2026 教育部臺語文語料庫,臺語語音辨認、即時字幕、華臺翻譯、臺文自然語言剖析;2023-2025 客委會客語語音語料庫,客華英語語音辨認、客語華英語音合成、客華英翻譯/口譯、手機語音輸入鍵盤。研究領域與專長研究項目與成果2.國立陽明交通大學 人工智慧語音研發中心國立陽明交通大學人工智慧語音研發中心(Speech AI Research
85、 Center),由國立交通大學通訊工程學系博士廖元甫教授負責,廖教授為陽明交通大學產學創新研究學院智能系統研究所教授兼所長及人工智慧語音研發中心主任。國 立 陽 明 交 通 大 學 依 據 國 家 重 點 領 域 產 學 合 作 及 人 才 培 育 創 新 條 例,率 先於 2021 年 7 月 奉 教 育 部 核 準 成 立 產 學 創 新 研 究 學 院(Industry Academia Innovation School)。該 院 秉 持 CCIC 理 念 Connect(連 結),Collaborate(合 作),Innovation(創新),Co-Creation(共創),以永續
86、經營為目標,設立包括智能系統研究所以及相關之人工智慧語音研發中心。該研發中心長期目標:通用智慧口語人機介面(口語對話 AI),未來人類將能直接使用口語與通用智慧機器人進行溝通、指示它們進行合作。所以,下一代的電腦與機器人必須能準確解讀人類語言、處理多模態資訊、深刻理解世界的運作原理以及利用各種工具(包括程式設計)來執行人類的命令。短期目標:多模態生成式 AI(能看,能聽,能說,能讀,能寫),期待開發一種機器人,光是看電視就能獨立獲取人類語言知識和對世界的基本了解。32STAR 軟體技術年報該中心 CCIC 理念,Connect 連結、Collaborate 合作、Innovation 創新、C
87、o-Creation 共創,即強調產學合作創新,故樂於與業界進行各種形式合作。期能各自發揮所長、彼此搭配,以加速研發與落實應用。未來展望資料來源:人工智慧語音研發中心Speech AI Research Center 功能圖 2-2重要成果有:本土語言大型語料庫建置,2017-2019 科技部華臺語語音語料庫,中英即時字幕、臺語合成;2019-2022 教育部臺語文語音語料,臺語語音辨認、合成與轉換、2022 Meta 發表 AI 翻譯,廖元甫教授團隊為幕後功臣;2021-2023 客委會客語語音語料庫。語音辨認轉文字技術,2020-2023 防疫期間 CDC 記者會即時字幕、2023 總統府
88、 520 記者會即時字幕。文字轉語音合成技術,2022 流麻溝十五號-蔣經國原音重現(個人語音合成)、2023 蔣渭水說話影像模擬(人物說話影音合成)。33STAR 軟體技術年報3.國立陽明交通大學 電腦架構與系統實驗室國 立 陽 明 交 通 大 學 資 訊 工 程 系 電 腦 架 構 與 系 統(Computer Architecture and System)實驗室,由美國普度大學(Purdue University)電機資訊工程博士葉宗泰教授擔任指導教授,研究領域專注在電腦架構以及編譯器設計,近年研究特別著重在開發高效能低耗電的特殊領域加速器以及其相關系統,葉宗泰教授榮獲美國普度大學 L
89、ynn Fellowship 以及曾經在 AMD 的研究部門工作,除此之外,葉宗泰教授也在 2017 年獲得 ACM PPoPP 頂尖會議的最佳論文提名,並且其研究也發表在多個頂尖會議和期刊。隨著人類科技的進步,新興的科技應用所需要的計算量不斷上升,急需要更高效能的電腦處理器以及特殊領域加速器以降低這些新興科技應用的處理時間,以加速人們在各項科技與 AI 的發展進程,該實驗室目標在於開發出各式高效能,低功耗的特殊領域加速器(domain-specific accelerator)硬體以其軟體(例如:GPU,TPU,NPU),並且也開發和優化這些相對應的硬體加速器的編譯器,利用編譯器優化程式碼以
90、及深度學習模型的生成來加速深度學習模型在 AI 加速器硬體上的執行效率。該實驗室研究領域專注在 AI 模型編譯器、特殊領域加速器架構、以及系統安全。研究領域與專長資料來源:國立陽明交通大學資工系電腦系統與架構實驗室該實驗室研究重點圖 2-3AI Model Compiler1.Graph to Graph Compilation2.Operator Scheduling3.Tensor Memory Allocation E.g TVM,TensorFlow LiteDomain-Specific Accelerator1.Dataflow AI Accelerator2.Specialize
91、d ISAs3.Sparse Matrix AcceleratorSystem Security1.Hardware Security2.Secure DNN Model (adversarial attack)Tiny ML&Edge AI34STAR 軟體技術年報實驗室目前正在進行的研究在於開發高效能,低功耗的特殊領域加速器的軟硬體,該實驗室在 TinyML compiler 的研究成果曾獲得 2024 鴻??萍吉?,並且在特殊領域加 速 器 以 及 TinyML 和 Edge AI 的 系 統 研 究 也 跟 Google,Synopsys,MediaTek,AMD,ITRI,資策會,Ph
92、ison 等公司進行產學合作。研究項目與成果資料來源:國立陽明交通大學資工系電腦系統與架構實驗室該實驗室重要研究成果圖 2-4TinyML model compiler,利用既有的 AI model compiler(例如:TensorFlow 和 TVM)分 析 深 度 學 習 模 型,開 發 在 編 譯 器 中 的 operator fusion,scheduling,tensor memory planner 各項技術,並且參考不同 AI 加速器(GPU,TPU,NPU)的硬體規格,優化深度學習模型圖的轉換,降低深度學習推論在各式 AI 加速器的延遲以及能源消耗。特殊領域加速器(Doma
93、in-Specific Accelerator),開發 RISC-V 延伸指令集,以及設計各式的特殊指令集的和優化處理器和 dataflow 加速器的架構,加快不同應用領域的主要運算單元速度。系統安全(System Security),開發偵測與防禦系統有有效的強化深度學習在adversarial attack 的 威 脅,並 且 也 發 展 更 強 固 的 SSD 韌 體 以 抵 擋 勒 索 軟 體 的 攻擊,除此之外,也著眼改善處理器架構設計以防禦各種 side-channel attack(例如:meltdown 以及 Spectre attack)的問題。GPU Scheduler H
94、PCA 21 Graph Processing ASP-DAC 24 NoC on GPU ASP-DAC 23 Memory Optimization HPCA 24 Operator Scheduler NeuraIPS 23 Operator Mapping on Dataflow Accelerator TACO 24GPUArchitectureTinyMLEdge AIAIAccelerator由於未來不論在 AI 或是各種應用領域對於計算量的需求不斷的增加,高耗能的計算硬體單元將無法應付未來科技發展的需求,因此該實驗室未來持續著重在高效能,低功耗的特殊領域加速器的軟硬體開發,不僅
95、持續跟業界繼續合作,也預期能將所開發的加速器應用到更多的領域,另如:量子電腦模擬,大型語言模型推論與訓練等。未來展望35STAR 軟體技術年報此實驗室之主要研究方向:智慧駕駛系統、輔助機器人、電腦視覺、機器學習。並且專長技術有:電腦視覺與場景理解,包括 3D 場景重建、互動場景的理解,應用於自動駕駛系統中的風險評估與情境感知。自動駕駛的風險感知與預測,針對智慧駕駛中的風險識別與評估,利用鳥瞰圖表示學習方法來進行精確的風險預測。多模態學習,結合視覺、觸覺和語言進行機器人的操控,特別是在食物操作和工具使用方面。少樣本模仿學習,專精於如何從少量數據中學習人類的操作技能,並應用於機器人操作任務中。研究
96、領域與專長4.國立陽明交通大學 人本智慧系統實驗室國 立 陽 明 交 通 大 學 資 訊 工 程 學 系 人 本 智 慧 系 統 實 驗 室(Human-centered Intelligent System Lab,HCIS Lab),由美國普渡大學電機資訊工程博士陳奕廷(Yi-Ting Chen)教授擔任指導教授,其亦為前 Honda Research Institute 資深研究員。曾榮獲:國科會 2030 跨世代-國際年輕傑出學者、教育部玉山學者計畫、陽明交大青年講座教授、國際高教會士、陽明交大校級優良教學獎、陽明交大資訊學院英語教學獎。該實驗室創立願景定位在建立以人為本的智慧系統,旨
97、在提升人類的能力和生活品質。為實現這一願景,致力於開發賦能智慧駕駛系統與輔助機器人的用於行為之場景理解與安全驗證技術。36STAR 軟體技術年報該實驗室目前進行中的研究項目有:智 慧 駕 駛 系 統,Scenario-based Safety Validation(情 境 式 安 全 確 認),互動情景檢索與風險情景生成、鳥瞰圖語意分割、三維場景分析與重建;Risk-aware Intelligent Driving Systems(基於風險感知的智慧駕駛系統),風險感知和動態道路場景表示法。輔助機器人,Tool-use Skills for Food Manipulation,主動感知和多模
98、態視覺融合(視覺、觸覺與自然語言);Learning Manipulation Skills from Humans,任務導向表示學習、少樣本模仿學習與課程學習。此 實 驗 室 目 前 重 要 成 果 有:Adaptable Error Detection for Few-shot Imitation(link1)、Action-centric Representation Learning(link2)、SKT-Hang(link3)、Risk Identification via Causal Inference(link4)、Food Item Property Understandin
99、g via Action Perception(link5)、Fine-grained Interactive Traffic Scenario Understanding(link6)、Real-time Monocular Visual SLAM(link7)、Birds Eye View Segmentation Using Lifted 2D Semantic Features(link8),其專利及技術轉移項目則有基於鳥瞰圖與軌跡預測之風險物體辨識。研究項目與成果資料來源:人本智慧系統實驗室基於鳥瞰圖語意分割與可供性預測之風險物體辨識圖 2-5BCPRisk ScoreEstimat
100、ionOursBEV-SEGPotential FieldModuleTarget PointPredictor37STAR 軟體技術年報資料來源:人本智慧系統實驗室基於槽注意機制之互動行為辨識圖 2-6該實驗室在智慧駕駛系統與輔助機器人的未來研究方向有:智慧駕駛系統,Scenario-based Safety Validation(情境式安全確認),如何設計一套安全確認系統,用於評估智慧駕駛系統的功能?Risk-aware Intelligent Driving Systems(基於風險感知的智慧駕駛系統),如何評估動態場景中道路使用者的風險?輔助機器人,Learning Tool-use
101、Skills for Food Manipulation,如何讓機器人具備使用工具的技能,以便操作各種食品物品?Learning Manipulation Skills from Humans,如何讓機器人像人類一般,具備各種不同的操縱技能?此外,在未來的合作願景有:資策會軟體院長期致力於臺灣的規?;瘮祿占瓣P鍵資訊標註。為了開發下一代自動駕駛系統,陳教授的團隊願與資策會軟體院攜手合作,共同開發具備深度理解與認知能力的多模態基石模型(Multimodal Foundation Model),而規?;瘮祿瞧渲胁豢苫蛉钡年P鍵基石。此外,這些數據還可以用於構建可學習的高擬真虛擬環境(Differ
102、entiable Autonomy Stacks),以訓練具有深度理解與認知能力的自動駕駛系統。更重要的是,規?;瘮祿矊渺陡兄c決策系統的安全評測,這與資策會軟體院近期成立的車輛軟體評測單位(FAITH)的目標高度契合,並有望共同創造全新的成果。未來展望Link1:https:/arxiv.org/pdf/2402.03860Link2:https:/ 軟體技術年報5.國立陽明交通大學 網路與系統實驗室國立陽明交通大學網路與系統實驗室,由美國哈佛大學電腦科學博士王協源教授擔任指導教授,王教授在陽明交大任教期間擔任過電機資訊學士班主任、資訊科學與工程研究所所長、網路工程研究所所長等職務。於
103、 2012 年獲得中華民國資訊月傑出資訊人才獎和傑出資訊應用及產品獎、2014 年獲得日本東京理科大學校長獎、2021 年獲得第十九屆有庠科技論文獎資通訊科技領域、2021、2022、2023、2024 年經史丹佛大學的專家學者根據 Scopus 論文影響力數據,從近 900 餘萬名科學家中被遴選為終身科學影響力世界排名前 2%的頂尖科學家。該實驗室創立於 2000 年 2 月,那時正是網際網路正在快速發展的時候,各種網路技術和通訊協定如雨後春筍般蓬勃發展。該實驗室的宗旨是研發、設計、實作、佈署與效能量測網路相關的技術與通訊協定,範圍涵蓋有線和無線網路的各種類型網路、研究的議題包含網際網路通訊
104、協定堆疊中的資料鏈結層、網路層、傳輸層、和應用層。目標是開發網路的創新功能、增進網路的運作效能、以及提升網路運行的安全性。該實驗室目前主要研究方向包含先進網路模擬,數位分身應用於網路、可程式化網路、以及AI 和機器學習。在上述這些研究方向,實驗室都已經開發出對應的專長技術且將之發表為知名的國際期刊或國際會議論文。目前正在進行中的研究項目及目標有:進行網路數位分身的研究和技術開發且為國內第一大網路公司開發其網路數位分身。目標是使用所開發的數位分身進一步提升其網路的品質。進行低軌道衛星網路的研究和技術開發,此種網路的拓樸是由數千顆快速運動的衛星所動態組成,因此 TCP 通訊協定在此類網路上的傳輸效
105、能低落。目標是大幅提升TCP 通訊協定在此種網路上傳輸資料時的效能。運用 AI 和機器學習技術對 5G 和 6G 核心網路進行智慧導流。目標是透過智慧導流來對多個 UPF 設備進行它們之間的 CPU 負載平衡,以及在核心網路上對多個傳輸線路進行網路流量負載平衡,藉此提升使用者所感受到的服務品質(Quality of Service)。發展高效能運算(High Performance Computing)和雲計算技術,同一時間使用雲平臺上的龐大數量的運算節點對半導體製程和 IC 設計驗證工作進行平行加速處理。目標是大幅縮短半導體製程和 IC 設計和驗證工作,進一步提升臺灣在半導體製程和 IC設計
106、和驗證領域的優勢。研究領域與專長研究項目與成果39STAR 軟體技術年報此外,在重要成果有以下 2 個領域:先進網路模擬研究領域,該實驗室開發出一個創新的網路模擬技術,不僅在多個知名國際期刊和國際會議上發表此技術,更使用此技術開發出一個開源NCTUns 網路模擬器軟體,在世界上被很多大學和研究機構用來進行網路研究且發表學術論文,此開源軟體因為有很多世界知名的大公司願意購買使用,之後轉為商用版EstiNet 網路模擬器且成立公司銷售??沙淌交W路研究領域,該實驗室在可程式化交換機中開發出一個能精準控制一條 TCP 連線所能獲得的網路吞吐量(throughput)的流量計(meter),比起所設定
107、的目標值(target rate),誤差只有 5%。相反的,目前所測試過的多個商業交換機(switch)內的流量計在管制一條 TCP 連線所能獲得的網路吞吐量時,誤差高達 90%。此研究成果已 經 發 表 為 一 篇 知 名 的 國 際 期 刊 論 文 Design and Implementation of TCP-Friendly Meters in P4 Switches(IEEE/ACM Transactions on Networking,Volume:28,Issue:4,August 2020)並獲得第十九屆有庠科技論文獎資通訊科技領域。而該實驗室已有的專利及技術轉移項目為:“流
108、量控制方法,”Patent No.I792981、“Method for Regulating Traffic of TCP Flow,”Patent No.US 11,552,894 B2、“Packet Aggregation and Disaggregation Method,”Patent No.US 11,343,360 B2、“網路交換器的流量管理方法,”Patent No.I746060、“封包聚合及解聚合方法,”Patent No.I745034、“High-speed Data-plane Packet Aggregation and Disaggregation Metho
109、d,”Patent No.US 11,190,628 B2、“高 速 資 料 平 面 封 包 聚 合 及 解 聚 合 方 法,”Patent No.I690185、“網 路 拓 樸 實 機 模 擬 方 法 與 系 統,”Patent No.106113462、“Method and system for extracting in-tunnel flow data over a virtual network,”Patent No.US20190230039A1、“Methods for Constructing Hybrid Network Spanning Trees,Method of
110、Redundancy,and Control System Thereof,”Patent No.US 9,807,000 B2、“混合型網路生成樹建立方法、備援方法與其控制系統,”No.I561034、時間還原方法及應用其的網絡仿真系統,”No.200910223813.6、“Apparatus,Method,Application Program,and Computer Readable Medium thereof for Simultaneously Establishing Links with a Plurality of Nodes,”No.1319669,、“Connecti
111、on Node,Method,Application Program,and Computer Readable Medium thereof for Recalculating a Transmission Opportunity When an Apparatus Requests to Enter a Wireless Network,”No.200826705、A System,Method,and Storage for Improving the Network Performance of Wireless Communication Systems,No.1281329。40S
112、TAR 軟體技術年報該實驗室目前正把 AI 和機器學習技術運用於網路和通訊技術,近幾年已經獲得成果。例如在這篇發表於知名國際期刊的論文中S.Y.Wang and C.D.Lin,“Using Deep Reinforcement Learning to Train and Periodically Re-Train A Data-Collecting Drone based on Real-life Measurements,”Journal of Network and Computer Applications,Volume:221,January 2024 已經使用深度強化式學習技術來訓
113、練無人機,讓它可以使用更有效率的飛行路徑去很多地方的智慧物聯網裝置,然後利用無線通訊的方式在空中收集這些物聯網設備的資料。在未來,該實驗室將著重在生成式 AI 技術,目標是使用此新興技術來開發創新的智慧網路生活功能且用生成式 AI 的方式來進行網路管理、監控和安全提升。此外,該實驗室著重在網路系統設計與實作,能提供業界所需的實務型研究成果。該實驗室近年與臺灣最大的網路公司合作研究計畫且與臺灣最大的網路交換機製造商合作研究計畫。在未來,該實驗室期待能與網路和通訊產業中的知名公司一起進行先進的研究。未來展望41STAR 軟體技術年報該實驗室專注於 AI 與電腦視覺技術研究,近期主要研究領域包含但不
114、限於:人臉辨識、人臉深偽偵測、人體動作辨識、多目標追蹤、生成式電腦視覺以及智慧製造異常偵測。人臉辨識,近年 2D 人臉辨識已有相當高的正確率,但在人臉拍攝角度有大幅度變動時,人臉辨識就變得更加困難。該團隊利用 RGBD 資訊應用於困難的人臉辨識場景,在原有的兩種模態辨識分支加上特徵分離損失函數,進而得到有利於人臉辨識的臉部特徵。發表於國際期刊IEEE Transactions on Biometrics,Behavior,and Identity Science(Volume:5,Issue:3,July 2023).人臉防偽偵測,人臉防偽旨在保護人臉識別系統免受假冒攻擊。然而,近期的研究往往
115、忽視現實影像品質不佳的問題,如光線變化、面部角度變化以及影片中的運動模糊等問題,針對此問題,該實驗室提出基於人臉圖像品質評估的防偽系統,該系統將人臉圖像品質評估模組與防偽模組結合,並使用品質分數來計算加權預測,以決定影片中的人臉是真實還是假冒,如此可提升在影像品質不佳時的人臉防偽精確度。此研究發表在國際會議 CVPR workshop 2024.人體動作辨識,該實驗室針對人體動作辨識問題在 WACV 2023 發表一種新穎的多模態整體互動轉換器網絡(HIT),該網絡充分利用常被忽視但對大多數人類行為至關重要的手部與姿態資訊。所提出的 HIT 網絡是一個雙模態框架,包含 RGB 流與姿態流,分別
116、對人物、物體及手部互動進行建模,最後從時間上下文中提取線索,利用緩存記憶來更好地分類正在發生的行動。過去的人體動作辨識研究中,大多數全監督學習方法需要大量的訓練數據。該團隊利用預訓練的視覺-語言模型提取代表性的圖像和文本特徵,並引入交互 CLIP 提取周圍上下文資訊,從而實現出色的零樣本空間-時間動作檢測準確度,發表於國際會議 ICCV Workshop 2023。研究領域與專長研究項目與成果6.國立清華大學 電腦視覺實驗室國立清華大學資訊工程學系電腦視覺實驗室,由美國佛羅里達大學電機與計算機工程賴尚宏博士擔任指導教授,賴教授現任國立清華大學資訊工程學系教授且兼任電資院副院長。他從事電腦視覺相
117、關的研究三十多年,在相關的國際期刊與會議上已發表超過 300篇的論文,此外他在電腦視覺及醫學影像的研究也獲得約 30 項專利。賴教授近年來擔任多個國際會議的領域主席,包括 CVPR、ICCV、ECCV、ICML、NeurIPS、IJCAI、AAAI、ACCV、以及 ICPR。此外,目前還擔任 International Journal of Computer Vision 及 Pattern Recognition 等多個著名國際期刊的副編輯。42STAR 軟體技術年報該實驗室未來會繼續專注在電腦視覺相關的 AI 技術,並與產業界合作,一同推動 AI 在臺灣之發展。該實驗室與醫療院所合作,利用
118、生成式電腦視覺技術增強醫療影像 AI 模型的強健性及公平性。另外該實驗室最近也研究以生成式擴散模型應用於紅外線人臉影像的生成,以提升多模態臉部辨識模型的精確度,並強化人臉影像隱私保護與安全性。實驗室研究的異常偵測模型,更是與國科會補助人工智慧製造系統研究中心密切合作,將半導體製造生產線上數據以系統性的方式彙整,從中萃取出有價值的資訊,轉換為聰明生產與智慧精準製造之數位決策。期望未來能持續的與產業界合作,培育具有產學合作經驗之 AI 專業人才,共同為臺灣之電腦視覺 AI 技術發展作出貢獻。未來展望智慧製造異常偵測,大多數影像異常檢測方法將異常檢測視為一個無監督任務,因為異常的訓練數據和標籤通常很
119、少或不可用。該團隊在近期發表以下兩個研究:(1)Masked Attention ConvNeXt Unet with Multi-Synthesis Dynamic Weighting for Anomaly Detection and Localization 合成多樣化數據,並加入自監督預測卷積塊多注意力模塊以增強特徵提取能力。在多個異常檢測數據集,結果優於最先進的方法。發表於國際會議 BMVC 2023.(2)TAB:Text-Align Anomaly Backbone Model for Industrial Inspection Tasks 在該研究中,該實驗室提出一個創新的框架
120、,利用視覺-語言模型 CLIP 來巧妙地訓練專門針對製造領域的主幹模型。同時考慮針對正常與異常情況的視覺與文本對齊的嵌入空間,使用該實驗室的預訓練主幹權重使得先前的研究在小樣本學習中取得更優異的性能。此研究發表於國際會議 CVPR workshop 2024.多目標追蹤,該實驗室在近期針對多目標跟蹤問題發表以下兩個研究:(1)Robust Multi-Object Tracking With Spatial Uncertainty 提出 SSUTracker 衡量空間不確定性,更好地代表檢測框的遮擋程度。此論文是首個將空間不確定性應用於多目標追蹤遮擋的研究,發表於國際會議 ICASSP 202
121、3.(2)ReST:A Reconfigurable Spatial-Temporal Graph Model for Multi-Camera Multi-Object Trackin 利用多視角資訊來更好地處理遮擋和擁擠場景等問題。在空間上將所有檢測到的物體進行關聯,然後將其重新配置為時間圖以進行時間關聯。實驗結果表明,所提出的圖模型能夠提取出更具區分性的特徵進行目標跟蹤,並在多個公開數據集上實現最先進的性能。發表於國際會議 ICCV 2023.43STAR 軟體技術年報7.國立清華大學 人本機器智慧實驗室國 立 清 華 大 學 資 訊 工 程 學 系 人 本 機 器 智 慧 實 驗 室(
122、Human-centered Machine Intelligence;HMI),是由郭柏志博士擔任主持人。郭教授於國立交通大學資訊科學與工程研究所取得博士學位,從 2016 年至 2019 年,曾在中央研究院統計科學研究所擔任博士後研究員,隨後於 2019 年至 2020 年,在麻省理工學院(MIT)醫學工程與科學研究所擔任博士後研究員。此外,2015 年至 2016 年,他曾是美國加州大學聖地亞哥分校(UCSD)Swartz 計算神經科學中心的訪問學生。2017 年,他曾拜訪日本東京的統計數學研究所,並於 2019 年擔任德國于利希研究中心神經科學與醫學研究所的訪問研究員。該實驗室的宗旨是
123、開發以人為中心的 AI 技術,強調技術的可解釋性、穩健性、公平性和信賴性,特別是在醫療與神經科學應用領域,建立能夠理解並尊重人類需求的 AI 系統,促進人機協作,重視社會影響與實際應用價值。透過結合先進的 AI 算法與多模態神經影像技術,希望推動神經科學與 AI 的結合,探索大腦運作機制,同時為臨床醫療提供具可靠性的智慧解決方案。該實驗室在醫學影像分析中應用多種先進技術,例如深度學習和遷移學習,用於建構精準的診斷模型。處理各種醫學影像技術方面經驗豐富,涵蓋 X 光、超音波、電腦斷層掃描(CT)、磁振造影(MRI),並融合多模態影像數據來增強診斷的全面性與準確性。實驗室積極探索自學習(self-
124、supervised learning)和元學習(meta-learning)技術,旨在提升 AI 模型的自適應能力與泛化能力,近期實驗室更是致力於研究大型語言模型(LLM)與生成式 AI 於臨床的應用。此外,該團隊積極探索先進的神經科學與 AI 技術融合,特別是在腦電圖(EEG)、腦磁圖(MEG)及功能性磁振造影(fMRI)的數據分析上,運用時間序列分析、圖卷積網路(GCN)及長短期記憶網路(LSTM)等技術來解讀複雜的腦部訊號。該實驗室的研究不僅關注於大腦如何處理空間資訊,還專注於開發能夠進行精確腦部活動預測和解碼的模型,進一步提升 AI 在神經科學領域的應用能力。該團隊的目標是將這些技術
125、轉化為臨床可用的 AI系統,為腦科學研究和醫學診療提供可靠且創新的技術支援。該實驗室自 2020 成立以來,已發表 16 篇期刊文章、10 篇國際會議全文、6 篇重要國際會議摘要,以及 3 個數據集。實驗室密切與麻省理工學院、哈佛大學、Emory 大學、中央研究院、臺灣大學醫院和臺北醫學大學醫院等機構進行合作。該團隊積極探討 AI 可能帶來的倫研究領域與專長研究項目與成果44STAR 軟體技術年報HMI 實驗室未來將繼續推動神經科學與 AI 的深度整合,力求在這兩個領域取得突破性的進展。透過結合神經科學的洞察與 AI 技術,開發出更加聰明化且可解釋的系統。除了技術的創新,更致力於推動跨領域的協
126、作與應用,實現神經科學與 AI 的相互發展,並將其應用於各種以人為本的 AI 場景中。未來展望資料來源:人本機器智慧實驗室結合神經造影技術與 AI 影像模型開發類人腦編碼器圖 2-7理影響,自 2021 年開始努力引導研究走向更大的公正性,過程也促使一篇發表在The Lancet Digital Health的重要國際合作論文。後續也持續嘗試解決深度學習模型中的偏見問題。此外,也嘗試發展臨床決策的創新技術,包括通過語音分析診斷阿茲海默病,以及使用智慧手機進行肺部影像異常檢測,並分別發表論文於訊號處理重要會議 ICASSP 與智慧醫療重要期刊npj Digital Medicine。此外,另一個
127、目標為連結神經科學與 AI。其研究目標是理解大腦如何處理外界訊息,並期望藉此增強 AI 模型學習的能力。郭教授目前領導團隊進行結合神經科學和 AI 的跨領域研究。已經使用訊號處理與機器學習技術對 fMRI 和 EEG 資料進行研究,探索大腦的運作機制,例如研究人對於氣味的感知能力或電腦視覺模型與人腦於空間處理的異同(如下圖)。45STAR 軟體技術年報8.國立清華大學 人本訊號運算研究室國立清華大學電機工程學系人本訊號運算研究室(Behavioral Informatics and Interaction Computation Lab,BIIC Lab),是由於美國南加州大學獲電子工程學位的
128、李祈均(LEE Chi-Chun)博士成立,致力於提供開放研究環境、進行前瞻技術研究,以推進人本科技應用。人本訊號運算研究室的研究核心聚焦在人本資訊處理(human-centered information processing),透過開發 AI 演算法結合專業知識以提供人類生活中之智慧決策;目前工作的領域可以被概括為三塊領域:研究領域與專長資料來源:BIIC Lab李祈均教授圖 2-8口語互動智慧計算,綜合言談、語言、非言語表達等人際互動表徵,就情緒辨識、行為定量、社會理解等面向分析人類行動。相關核心技術已經落地應用,譬如,企業管理上於求職者評估與電話客服品管、醫療照護上於精神醫療診斷及疾病
129、風險預測等。李 祈 均 教 授 於 2024 年 九 月 起 任NVIDIA 國立清華大學聯合創新中心主任。除主聘於電機系,李祈均教授亦於中央研究院資訊科技創新研究中心任合聘研究員,以及清華大學通訊工程研究所、半導體研究學院、智慧生醫博士學位學程、跨院國際博士班學位學程、精準醫療博士學位學程任合聘教授。返臺至今,李祈均教授獲許多國內外重要獎項,以下簡列近三年獎項:國立清華資料來源:BIIC Lab口語互動智慧計算圖 2-9大學傑出人才發展基金傑出研究獎(2024)、中華民國資訊學會李國鼎磐石獎(2024)、國家科學與技術委員會傑出研究獎(2024)、國立清華大學產學合作績優獎(2023)、國立
130、清華大學傑出產學研究獎(2023、2021)、中華民國資訊學會李國鼎青年研究獎(2021),詳請見:https:/biic.ee.nthu.edu.tw/jeremy。46STAR 軟體技術年報該實驗室進行中的計畫有:適用於智慧服務的可信賴 AI 先進技術研究 II(1/2)、iMGenie DataFlow&MLFlow 開發研究、以深度學習建構重癥病患呼吸重癥預測模組、透過強健性可泛化且具信賴的情感訊號模型來實現普適情緒辨識科技、電訪語音辨識技術、AI 專案技術研究。此外,目前共同持有的專利有:處理細胞計數資料之方法及裝置(Methods And Devices Of Processing
131、 Cytometric Data)、流 式 細 胞 儀 資 料 之 免 疫 表 型 自 動 分 類(Automated Classification Of Immunophenotypes Represented In Flow Cytometry Data)、跨血液性惡性腫瘤遷移學習(Transfer Learning Across Hematological Malignancies)、處理細胞計數資料之方法及裝置(Methods And Devices Of Processing Cytometric Data)。人本訊號運算研究室持續積極參與學術研究、產學合作與開放文化的實踐,透過讓技
132、術在社會不同領域發揮其作用,希望能多元地以所具備的知識與資源推動以人為本的智慧運算,讓技術理解人、了解人、分析人並幫助人,進而推動社會發展!期待能更加全面地與來自各產業的夥伴合作創造價值,一同探索從技術創新到技術落地,為臺灣產業帶來嶄新視角的可能!研究項目與成果未來展望資料來源:BIIC Lab資料來源:BIIC Lab智慧醫療健康分析可信賴式 AI圖 2-10圖 2-11智慧醫療健康分析,從臨床需求出發結合 AI 技術,運用臨床分析與行為判讀開發專精演算法,以提高診斷效率與準確度。目前實驗室開發技術已使用在精神醫療診斷、各大疾病風險預測、預後分析等場景??尚刨囀?AI(Trustworthy
133、 AI),以使用者為中心,就安全、隱私、公平三面向全面考慮 AI 應用,確保 AI 從資料搜集到應用的各環節都能以使用者權益為前提達成其任務。實驗室現正與法律研究員共同研發相關技術,並積極整合其進入醫療與產業的實作現場中。47STAR 軟體技術年報9.國立中正大學 無線通訊實驗室國立中正大學電機工程系無線通訊實驗室(Wireless Communication Lab,Lab 543),由美國威斯康辛大學麥迪森分校電機工程博士張盛富教授於 1994 年設立,隨著張嘉展教授(2004 年 2 月)、吳建華教授(2015 年 8 月)、林士程教授(2020 年 2 月)的加入,逐漸擴大為 4 位指
134、導教授、7 位博士生和 35 位碩士生的團隊。張盛富教授在電磁領域已有 25 年的研究經驗,主要專長在 Beamforming 陣列射頻收發系統、室內定位、心肺生醫雷達等技術。除學界的研究經歷外,亦有豐富的產業界經驗包括 Hyton Technology Inc.(2.5 年),與創傑(4 年)、群田(3 年)、大紘(2 年)等公司,以及中科院(6 年)、工研院(4 年)合作,並擔任工研院技術顧問。主要研究成果包含Beamforming 陣列、射頻收發系統、室內定位、心肺生醫雷達、射頻收發系統;張教授並曾擔任 IEEE MTT Society Technical Committee-21 委員
135、。指導研究生參加旺宏電子暨旺宏教育基金會主辦之半導體設計與應用大賽-2010 金矽獎,獲得設計組鑽石大賞、以及最佳創意獎。指導研究生參加 IEEE Microwave Theory and Technique Society Filter 設計競賽,連續 10 年(2008-2017)獲獎。獲邀 2012 ISSCC Beamforming and RF Transceiver Design Forum,發 表 Butler Beamforming Phased Array,此 Forum 主 席 為 Gabriel Rebeiz(UC San Diego)。獲邀 2013 European
136、Microwave Symposium invited talk、2014 IWS、2014-2015 IMS workshop lecturer。無線通訊實驗室主要研究方向涵蓋電磁理論應用,微波及毫米波電路及晶片設計,天線及陣列波束合成技術,以及各種雷達相關的應用系統。此外,專長技術有:可重構智慧面鏡技術與應用,包含單元設計、控制電路、電路佈局、效能驗證以及場域測試;可重構智慧面鏡之電磁環境感測技術,包含方向角、極化、頻率等感測參數;CMOS 毫米波收發機、天線設計、以及系統整合;OTA 量測平臺設計。目前進行中項目有:在 2018 至 2021 年間,實驗室參與科技部的 5G 專案計畫,開
137、發多種靜態可重構智慧面(Static RIS)技術,包括反射面、透射面和繞射面,有效解決 4G 和5G 通訊中的盲區問題?;哆@些技術,該實驗室目前正進行兩項國科會整合型總計畫,分別為下世代可重構電磁智慧面之創新關鍵技術研發與調控電磁環境之可重構智慧面雛形平臺開發。這些計畫旨在開發具備波束成形、波束切換和電磁環境感測等關鍵功能的可重構智慧電磁面(RIS),並專注於建立 RIS 建模技術、6G 實體層通道量測技術,以及研究領域與專長研究項目與成果48STAR 軟體技術年報網路資源分配與最佳化組態。實驗室也與法人機構合作,將 RIS 硬體融入商用通訊平臺(如O-RAN),並開發智慧化演算法,提升
138、RIS 的應用效能。重要成果為:證明可重構智慧面具備改善通訊效能的能力、演算法應用於客製化可重構智慧面的波束成型、研發大尺寸的可重構智慧面以及遠距離的場域測試、可重構智慧面與O-RAN 成功整合以及能動態追蹤使用者終端維持良好通訊效能。無線通訊實驗室在可重構智慧面鏡相關技術已申請多項專利,並佈局於多國(包含中華民國、美國、日本等),涵蓋單元設計、電路系統、以及佈建方法。其中電磁波反射結構以及電磁波傳輸結構已經技術轉移給稜研科技股份有限公司。資料來源:無線通訊實驗室目前已開發多種靜態可重構智慧面(Static RIS)技術圖 2-12RIS 1.0:RIS 2.0:ReflectionTrans
139、missionDiffractionCharacteristics:Zero power consumption Excellent for blind-spot Conformal to architectureCharacteristics:Little power consumption Adaptive to dynamic EM change Engineering Radio Environment49STAR 軟體技術年報資料來源:無線通訊實驗室與資策會智慧通訊技術中心共同合作 AI-Native O-RAN RIS,提升 RIS 應用效能圖 2-13 Development o
140、f the O-RAN platform and AI/ML algorithms.Connection between the Near-RT RIC and the RIS through the E2 Agent.Define and design the communication parameters and formats.Implement the RIS parameter formats defined by CCU.Development of FR1 RIS hardware.RIS control design including:Beam control codebo
141、ok (Phase Distributions)Fast switching approach Define formats for the RIS Returned information and control parameters.Field test plaining for AI-Native O-RAN RIS.基於實驗 RIS 的設計與實作經驗,該實驗室未來將研究設計具有更低的功率消耗以及低成本的 RIS。並透過強化學術與業界的連結,該實驗室的技術得以更貼近產業需求。同時,通過培養相關人才並推動產學合作,不僅有助於學界在研究上融入實務考量,還能激發更多創新的研究成果,實現技術的實
142、際應用與突破。未來展望50STAR 軟體技術年報10.國立中興大學 智慧系統實驗室國立中興大學應用數學系智慧系統實驗室,由國立中正大學資訊工程博士蔡鴻旭教授擔任負責人,蔡教授為現任國立中興大學理學院副院長與大數據產業博士學位學程主任,該實驗室成立宗旨與目標為訓練學生研究 AI 建模並應用於解決實際問題,將學術研究成果應用於產學合作。該實驗室主要研究,深度學習與機器學習理論與技術應用於智慧醫療、永續環境、精準教育、多媒體防詐等熱門領域,並提供網頁展示研究成果達到共享目的。四大研究主軸為:理論研讀,人工智慧、深度學習、機器學習、類神經網路、電腦視覺、多模態網路、領域泛化、多尺度特徵融合、異常檢測&
143、定位、模糊邏輯、進化演算法、強化學習。技術研發,以數學為基礎之深度學習建模技術、AI 大數據分析。應用領域,智慧醫療、智慧異常檢測、永續環境、反電子多媒體欺騙、圖形識別。實 現 技 術,雲 端 服 務、Python、R、Docker、Visual Studio.NET、Mobile Web Programming、Web-Database Programming、Matlab。目前進行中項目有:大型語言模型應用:研製函釋生成系統,基於生成式 AI 系統,生成水土保持坡地管理相關函釋文檔,減少人工撰寫時間,提高處理效率和強化新人培訓效能。頭頸癌動脈粥化支架裝設預測:利用頸部超音波數據來建預測模型
144、,預測病患頭頸癌動脈粥化狀況並監控裝支架預警。重要成果有:智 慧 醫 療,咳 嗽 偵 測 COVID-19:以 咳 嗽 錄 音 資 料 為 基 礎,由 STFT、DCT、Mel filter bank 等音訊處理將一維音訊轉二維時頻圖,再用 CNN 和對比損失來建模預測COVID-19 患者。CXR 影像偵測 COVID-19:以 X 光影像為基礎,由 CHALE 增強影像,設計 attention branch 強化卷積能力,改善傳統 CNN 網路 receptive field 問題,偵測COVID-19 患者。多模態系統偵測 COVID-19:透過整合肺部的 X 光影像及咳嗽音檔兩種模態
145、資料進行學習,以 cross-attention 融合機制結合不同模態特徵,偵測 COVID-19 患者。研究領域與專長研究項目與成果51STAR 軟體技術年報影像定位腦部及肝臟腫瘤:醫學影像異常檢測經常使用影像重建的方法來篩選器官異常的部分(腫瘤),目前挑戰是提昇原影像異常部分重建導致在偵測時效果不佳。利用小波轉換拆解影像部分資訊特性,挑戰不用 LL band 下建置 VAE 模型。設計三種特徵(LH,HL,HH,Gaussian Fourier feature,VAE latent feature)使重建影像保持高品質且降地離群影像資訊重建能力,此兩優點能精準與有效地捕捉器官異常部分。肺部
146、聽診聲異常檢測:以肺部聽診器資料集為基礎,經由 STFT、DCT、Mel filter bank 等音訊處理,將一維音訊轉成二維時頻圖,再用 CNN 為主的編碼器抽取特徵,同時用對比中心損失函數強化編碼器特徵群聚能力,如此使分類器可更精準地判識異常肺音。影像分割,水土保持設施異常監測:基於領域泛化建構護岸表面裂縫語意分割框架。此框架利用蒐集空拍護岸影像與公開裂隙資料集來訓練深度學習模型。成功解決四問題:少有裂隙影像護岸表面、空拍機與護岸距離不易提供、背景物件(如消波塊間隙)易誤判為裂隙、裂縫隙面積占比小導致類別不平衡問題。因此,框架能有效地分割影像裂隙區域。影音生成,Image to Imag
147、e transformation:為現在熱門的生成模型技術,輸入一張影像,模型將影像轉換成另一影像,如貓轉換成狗、無腫瘤器官轉成含腫瘤。這技術常用在異常檢測中,因異常資料少無法估計真正分布,遭遇這問題時會將正常影像輸入生成模型以產生大量異常影像。研製無監督物件形變方法可解決 Image-to-image transformation 易發生 overfitting,因模型過度記憶源影像形狀而難判斷一些未見過輸入影像為源影像或目標影像。主要設計是透過產生器預測像素移動方式使源影像能夠重新排列像素,並用 patch-wise 限制形變後影像和最後輸出影像間語意不變,以訓練產生器搜索形狀。生成聲音識
148、別:生成偽造語音技術發展為人類帶來娛樂和便利,是成語音真實性難分辨,造成安全和倫理問題。為防範和預防生成偽造語音引發社會負面影響,急需研製檢測生成語音方法。傳統方法僅驗證單一語言但現實存在多語言應用場景,仍是最大挑戰。直接使用多種語言訓練模型也遭遇整合不同語言資料集困難。該實驗室提出多語言識別生成偽造語音模型。多種語言含中英日文,擴展模型語言覆蓋範圍。同時,採領域泛化技術有效整合所有語言資料集,再設計領域對齊法,模型保留各領域特徵與找出領域間共有特徵,提高模型對多語言強適應性與準確性,因此有效地捕捉語音信號關鍵特徵,對已知攻擊情境與未知攻擊情境皆展現顯著效能。52STAR 軟體技術年報物種辨識
149、,蟬聲分類(宸):手持錄音機資料集為基礎,經由 STFT 音訊處理將一維音訊轉成二維時頻圖,再用 CNN 作為編碼器來識別蟬聲種類。另外,以自動錄音資料集含少量標註為基礎,經由 STFT、DCT、Mel filter bank 等音訊處理將一維音訊轉成二維時頻圖,再設計 Knowledge distillation 架構對無標籤資料以非監督式訓練編碼器,最後再以少量標註資料來訓練分類器識別蟬聲種類。潛旋蛾分類:番茄潛旋蛾計數系統可協助監測該類蟲數量作業。模型用多種卷積神經網路組合,初估比人力計數時間減縮約 90%以上,可降低數蛾人力成本、提升數蛾速度、更精確農藥使用量估算,有效控制潛旋蛾擴散感
150、染與協助防治管理工作。智慧製造,瑕疵品偵測:在高記憶半導體製程產線瑕疵品檢測時發生機器與人發生不一致判識,此導致整產線停擺浪費時間與產出。這問題面臨兩挑戰,因瑕疵品影像非常少與正常影像大於常規異常檢測,導致目前方法無法解決上述問題。該實驗室提出兩解決方法,(一)用調整預訓練語言模型發現工程師感知相符合 prompt;(二)用 GNN 建模記憶高記憶中 pillars 間關聯,可幫助在偵測時能參考 GNN 結構和鄰近 pillars。生產環境異常檢測:基於長短期記憶與注意力機制的自編碼器,將其應用在具有高度不平衡數據特性的工業環境中做異常偵測。實驗結果證明提出方法能有效偵測出所有異常模式以實現更
151、高效生產監控和良率控制。顧客退租預測:傳統顧客退租預測模型為預測哪些用戶會退租,但並未明確預測將退租用戶多久會退租;研製建構基於深度神經網路之多任務學習模型,可預測用戶退租及何時退租,此可有效用於預防客戶流失以維持企業永續經營。該實驗未來研究方向有 AI 輔助決策:以 AI 分析大數據實現精準預測,生成式 AI 應用:發展生成式 AI 技術與運用生成式 AI 功能解決百工百業應用問題。以及合作願景為積極研製自動化技術與應用產品、積極推動產官學合作以提升學生競爭優勢、強化創意設計,提升技術價值、打造 AI 數據分析優質環境。未來展望52STAR 軟體技術年報53STAR 軟體技術年報11.國立中
152、興大學 邵皓強老師實驗室國立中興大學資料科學所邵皓強老師實驗室,由國立清華大學電機博士邵皓強教授負責指導。邵教授曾任職於工業技術研究院巨量資訊科技中心,擔任數個自動化光學檢測計畫的計畫主持人,並獲 107 年度工研院傑出研究獎銅牌獎,獲獎主題為工業視覺深度學習技術。自 2018 轉任教職迄今,除已執行多個國科會(科技部)計畫、工研院產學合作計畫之外,也因兩項中華民國與美國發明專利,吸引國外企業完成議約,並自 2024 年起開始國際產學合作研究。此外,2024 年一月起,另與長庚醫院眼科的視網膜流行病學研究計畫(任協同主持人)、中山大學的國科會三年期整合型計畫(任子計畫共同主持人)開始進行。20
153、24 年時,參與 ICASSP 訊號處理競賽獲全球第 4 名,競賽主題為高光譜影像信號重建。該實驗室以工業或醫學領域有關之電腦視覺應用技術、與巨量資料分析技術為研究主軸,以期待能建立有助於解決實際跨領域問題的通用技術。邵老師主要研究方向高度不平衡資料的分類演算法,影像切割技術,異常檢測與主動式學習演算法,電子設計自動化,生醫實驗影像變偽造偵檢技術,2D+Z 影像堆疊資料圖譜化與 3D 網格點處理技術,深度學習與電腦視覺等。專 長 技 術 則 包 括:分 類 演 算 法、Lithography simulation,layout novelty and hotspot detection、主動式
154、學習演算法與影像切割技術等。清華大學的產學合作計畫,目前研究任務為高度不平衡資料的分類演算法、Testing-time-adaptation 技術、與可對應於分類模型的 novelty detection 技術。以提高分類演算法正確率,降低處理資料的人力占比為主要目標。國科會三年期整合型計畫的子計畫,子計畫主題為Transformer 之弱監督式細粒度屬性預標記演算法開發與應用,擬以三年期間,研究可製備細粒度屬性辨識之資料集之技術為目標,主要策略則是整合既有的注意力機制(attention mechanism)或Transformer 架構進入現有雛型系統。年度目標依序為:1.改善已建立的針對
155、平衡資料的細粒度屬性預標記技術原型,2.完成針對不平衡資料的細粒度屬性預標記技術原型,3.完成一個高度不平衡真實世界資料集的細粒度屬性標記(fine-grained annotation)、並產出一個基於細粒度屬性辨識的高度不平衡資料分類演算法。其希望該計畫成果可做為未來發展細粒度屬性物件辨識通用技術的基礎。研究領域與專長研究項目與成果54STAR 軟體技術年報研究發展目標仍為高度不平衡資料的分類技術、醫學影像切割與拼接技術、異常檢測與主動式學習演算法,電子設計自動化,生醫實驗影像變偽造偵檢技術等。未來期待建立具學術研究價值、且有助於解決真實問題的泛用技術。針對視網膜眼底鏡影像,建立動靜脈血管
156、辨識切割演算法,並發展基於視網膜眼底鏡影像的眼中風風險評估技術。並有針對 2D+Z 醫學影像、或海洋廢棄物影片,建立有助於降低資料標註量、提升資料標註效率的主動式學習演算法。該實驗室目前具有以下三大類的重要論文與專利技術:IC 設 計 與 光 刻 技 術 相 關,“LithoHoD:A Litho Simulator-Powered Framework for IC Layout Hotspot Detection”,IEEE TCAD、“Keeping Deep Lithography Simulators Updated:Global-Local Shape-Based Novelty D
157、etection and Active Learning”,IEEE TCAD,2023、“From IC Layout to Die Photograph:A CNN-based Data-Driven Approach”,IEEE TCAD 2021 等三項重要成果。影 像 處 理 相 關,“Retina-TransNet:A Gradient-Guided Few-Shot Retinal Vessel Segmentation Net”,IEEE JBHI,2023、“Detecting Biomedical Copy-Move Forgery by Attention-based M
158、ultiscale Deep Descriptors”,IEEE ICIP 2024、“DotFAN:A Domain-Transferred Face Augmentation Net”,IEEE TIP,2022、“RGBT2HS-Net:Reconstructing a hyper-spectral volume from an RGB-T stack via an attention-powered multiresolution framework”,IEEE ICASSP 2024,以 及 美 國 專 利Forgery detection system and its method
159、 for falsified biomedical experiment images。數據與標籤處理技術相關,“Ensemble Learning with Manifold-Based Data Splitting for Noisy Label Correction”,IEEE TMM,2022、“A Fine-grained Attribute Pre-labelling Method Based on Label Dependency and Feature Similarity Dynamics”,IEEE ICASSP 2024 等重要成果。未來展望55STAR 軟體技術年報12
160、.國立中興大學 人工智慧與應用實驗室國立中興大學資訊管理學系人工智慧與應用實驗室,由國立成功大學資訊工程所博士英家慶教授擔任負責人,創立宗旨與目標:近年來 AI 技術的迅速發展,對各個領域產生深遠影響。隨著大數據、深度學習等技術的成熟,AI 不僅在學術研究中佔有一席之地,亦逐漸滲透至工業、商業、醫療等應用場景。然而,技術的創新往往伴隨著應用的挑戰,為此,實驗室的宗旨在於推動 AI 技術的前沿研究,並將這些技術有效應用於解決實際問題。該實驗室主要研究方向有:深度類神經網路的應用、多模態醫學數據處理、大語言模型知識蒸餾、邊緣運算。該實驗室的專長技術有:深度類神經網路的應用,深度類神經網路可以處理大
161、量非結構化數據並進行精確的預測和分類,尤其在圖像識別、自然語言處理、語音識別等領域有顯著表現。但研究上大多數的研究多半是追求通用型的深度類神經網路,這導致了學用之間的巨大 Gap。該實驗室擅長針對實際應用的情境,將目前既有的深度類神經網路修改使其可以落地於實際應用的情境。多模態醫學數據處理,醫學領域往往存在大量的非結構化數據,如醫囑、CT 影像等。由於深度類神經網路可以處理大量非結構化數據,將其應用於醫學資訊領域顯然是一個必要且可行的趨勢,但在應用的過程中往往會面對多模態模型建構的問題,舉例來說一個病患往往會有檢驗的資料(結構化資料)、身理訊號資料(時間序列資料)、醫囑(文本型資料)、CT 影
162、像(影像資料),要如何充分利用這些資料建構模型來對病患未來的狀態做預測往往就需要建立一個多模態的模型架構。該實驗室長期與榮總與彰基合作,已累積大量建構多模態模型並實際應於實際醫學資訊系統之技術與經驗。大型語言模型知識蒸餾,大型語言模型(Large Language Models,LLMs)是基於深度學習的模型,通常具有數十億到上千億的參數,能夠進行自然語言處理任務如文本生成、翻譯、摘要和問題回答。然而,這些模型往往過於龐大且計算資源需求極高,難以在資源有限的環境下高效運行。知識蒸餾(Knowledge Distillation)是一種常見的模型壓縮技術,用於將這些大型模型的知識轉移到更小的模型
163、上,從而達到提升效能和降低資源需求的目的。該實驗室目前正在針對此項技術進行開發,初步成果已與臺中榮總合作,並用於醫囑資料的處理與重癥病患的情緒預測。邊緣運算,一般而言,深度類神經網路的運作會消耗大量的運算資源,因此,在工業上的很多應用會需要使用邊緣運算的技術將部分的運算資源直接投放在邊緣端來爭取運算的時效性。該實驗室過去曾分別與臺灣積體電路公司以及勞動部職業安全衛生署合作將邊緣運算技術應用於工業以及營建登場域。研究領域與專長56STAR 軟體技術年報該實驗室進行中項目有:透過多重提示以及知識蒸餾進行大型語言模型(Large Language Models,LLM)應用建構、電腦影像少樣本學習、
164、邊緣運算與聯邦學習。目前已經具有重要成果:預測終末期腎病患者不施行心肺復甦術決策之多重提示框架(圖 2-14)、基於少樣本學習架構之住院患者死亡率預測、基於少樣本學習之人體姿態估計、可使用弱標記影像進行少樣本學習之語意分割模型、可應用於邊緣運算之階層式聯邦學習架構。未來的研究方向將透過多重提示以及知識蒸餾進行多模態模型(Large Multimodal Models,LMM)應 用 建 構。而 AI 模 型 目 前 已 從 大 型 語 言 模 型(Large Language Models,LLM)逐漸向多模態模型(Large Multimodal Models,LMM)演進,這也意味著模型會
165、變得更大。但是日常的應用往往不需要大過龐大的模型即可完成,因此,該實驗室未來將致力於針對 Large Multimodal Models 進行多重提示以及知識蒸餾,使得模型可以針對個別的應用建構起高品質且大小適中的模型,甚至可以讓 Large Multimodal Models 可以在邊緣裝置上執行以確保在工業環境中可以維持一定的運算時效。研究項目與成果未來展望資料來源:人工智慧與應用實驗室預測終末期腎病患者不施行心肺復甦術決策之多重提示框架圖 2-14Nursing NotePreprocessedDataScored DataPredictTesting DataTraining Data
166、DataPreprocessingKnowledgeTransferPredictor(4)(3)(1)(2)Multiple PromptEngineeringDLLM57STAR 軟體技術年報13.國立臺灣科技大學 自然語言處理實驗室國立臺灣科技大學資訊工程學系自然語言處理實驗室,由國立臺灣大學資訊工程博士陳冠宇教授擔任指導教授。該實驗室致力於發展前瞻的機器學習理論,並將新穎的技術運用於文字處理(Text Processing)及語音處理(Speech Processing)兩大研究方向。該實驗室的目標是讓機器看得懂人類的語言、聽得懂人們說的話,並且能夠像人一般地擁有情緒與感受!該實驗室的
167、主要研究方向有自然語言、語音與地球訊號處理,包含有大型語言模型及其應用、自動語音辨識、語音辨識後處理、及時語音辨識系統、語音翻譯、文本摘要、資訊檢索、地震相位偵測、震度預測、現地與區域型地震訊號處理。隨著深度學習技術的發展,未來該實驗室將持續探討 AI 在語言、語音與地球訊號處理等方向上的應用。過去已累積與中研院、中央氣象署、工研院、臺大醫院、臺北醫學大學等機構有多年合作開發經驗,不論是在實際應用或理論發展上,都有獨特且成功的合作成果。未來,也將持續與產、官、學界溝通與合作,了解產業的需求、配合政策的發展、學習學界的創新技術,讓實驗室的研發方向可以持續新穎且前瞻,也讓實驗室的成果能夠落地使用,
168、造福社會。結合大型語言模型的語音辨識系統,隨著大型預訓練語言模型不斷地提出,首先提出一套以語言模型為主,聲學特徵為輔的創新性語音辨識系統。此一研究也成為後續各種結合預訓練語言模型之語音辨識系統之基石。語音辨識結果後處理,是提升語音辨識結果一個簡單且低負擔的方式。該實驗室利用大型語言模型分析語音辨識結果,希望藉由大型語言模型豐富的語言與文字知識,將辨識結果修正或重新排序,最終輸出一個更好的的辨識結果。大型語言模型的調適與應用,在醫療方面,著眼於醫療輔助機器人的相關應用,目標為訓練出具有醫療背景知識的模型。在病患服務方面,只需提供相關癥狀,就可以提出相對應的建議;或在意識到病患有潛在的風險後,開始
169、提供相關衛教文本。在醫療人員輔助方面,病歷摘要、教育範本製作等研究,皆是希望可以協助醫院利用更快速、有條理的技術整理內部資料,並快速檢索出需要的文件。在多種語言的語音與文字翻譯任務上,利用訓練技巧的不同以改善翻譯效能。地球訊號處理,運用深度學習技術改善地震預警系統之模組,如相位偵測、震度預測,目標是替換系統中現有模組,開發出一套以深度學習為主的預警系統。結合大型預訓練模型之技術,套用至地震領域中,目標為利用單一模型,在大量無標註資料下訓練,產生的權重再進一步為下游任務產生可靠的模型,以提升各任務之效能。與氣象署合作,釋出一個收錄臺灣過去 10 年的地震資料集。研究領域與專長未來展望研究項目與成
170、果58STAR 軟體技術年報14.國立臺灣科技大學 人工智慧研究中心國立臺灣科技大學人工智慧研究中心 Taiwan Tech Artificial Intelligence(AI)Center,網頁:https:/ai.ntust.edu.tw/,是由美國普渡大學電機與電腦工程博士陳永耀教授擔任中心主任。AI中心包含共 9 位專任教授,研究主題涵蓋 AI/深度學習、智慧自動化、大數據、多媒體、金融科技等等領域,致力於以最符合人性的方式,將 AI 技術應用融於人們的生活、工作與休閒於無形之中。並希望能從應用 AI 技術解決現有產業問題中摘取實用經驗,追求技術突破及創新應用,並成為此領域之國際級研
171、究中心。陳永耀教授同時也是人機互動暨影像系統實驗室主持人,該實驗室研究興趣在於生成式 AI 大型語言模型、AI深度學習、影像自動化、機器視覺、電子影像系統、多媒體系統、自駕車感知。實驗室具備豐富的研究經驗和項目管理能力,致力於將先進的 AI 技術應用於實際場景,推動科技進步和產業發展。圖 2-15(左四)陳永耀教授與實驗室部分學生。為陳教授團隊獲得工業局 AI 產業實戰應用人才淬煉計畫110 年 AIGO 競賽優等獎,接受中央通訊社採訪之合影。陳永耀教授與實驗室部分學生受訪合影圖 2-1559STAR 軟體技術年報陳永耀教授團隊近年(個人/團隊)獎項與榮譽有:2024 年國立臺灣科技大學-學術
172、研究優良獎、2023 年國際研討會 International Automatic Control Conference(CACS)研討會最佳論文獎佳作、第 19 屆全國電子設計創意競賽亞軍、國際研討會 Int.Conf.Advanced Robotics and Intelligent Systems(ARIS)研討會最佳論文獎佳作、2022 年國立臺灣科技大學 年輕學者研究獎、中華民國系統學會 111 年度傑出青年獎、111 年自動控制學會青年自動控制工程獎、第 17 屆教育部技專院校 DSP 設計競賽 佳作、第十八屆全國電子設計創意競賽 亞軍、2022 IEEE Internationa
173、l Conference on Consumer Electronics-Taiwan服務獎、車用電子創新發明競賽 系統整合組第一名、2021 年國立臺灣科技大學 優良研究獎、智慧運輸電子應用聯盟第二屆自駕車專題競賽 冠軍、全國電子設計創意競賽 第二名、中華民國消費電子學會 傑出青年獎、經濟部工業局 AI 產業實戰應用人才淬煉計畫AIGO 競賽優等獎、教育部全國大專校院人工智慧競賽(AI CUP)佳作、2020 年國立臺灣科技大學 學術研究優良獎、全國電子設計創意競賽 特別獎、中華民國科技部 優秀年輕學者獎勵計畫、中華民國科技部 吳大猷先生紀念獎、臺灣機器人學會 青年機器人工程獎、中國電機工程
174、學會 優秀青年電機工程師獎。隨著大型語言模型的快速發展,如 OpenAI 的 ChatGPT、Google 的 Gemini、Meta AI 的 LLaMA,以及 Microsoft 的 Microsoft 365 Copilot 等,臺科大 AI 研究中心將繼續在生成式 AI 領域深入研究,持續推動技術創新。這不僅促進了學術界的突破,也為產業界帶來了具體的技術進展。特別是 AutoGen 技術的應用,顯著提升了生成式模型的靈活性和效率,打破了依賴單一模型的局限。透過多個模型協同運作,AutoGen 能更全面地理解和處理複雜的內容,並提供更智慧且具體的解決方案,展現了應對現實世界多元挑戰的強大
175、適應力。展望未來,臺科大 AI 研究中心將持續專注於生成式 AI 及大型語言模型的研究,致力於探索更加智慧且高效的應用模式。此外,與臺科大 AI 研究中心的緊密合作,將進一步擴展研究的深度和廣度。臺科大 AI 研究中心自成立以來,從分析式 AI 研究起步,逐漸拓展到生成式 AI 領域,結合分析與生成兩項 AI 技術,實現了從數據分析到自動化生成的完整技術鏈。未來,研究中心將繼續在這兩大方向精進,推動 AI 技術的整合與創新,為學術界和產業界帶來更多突破性的成果。團隊在這樣的合作框架下,持續探索生成式 AI 在多元領域的應用,推動技術轉移與產業落地,並致力於培養跨學科的合作模式,進一步提升 AI
176、 技術在實際場景中的應用價值。這樣的發展不僅有助於技術進步,也將為社會的未來創造更多便利和機遇。研究項目與成果未來展望60STAR 軟體技術年報15.國立臺北大學 智慧金融創新科技實驗室國立臺北大學資訊管理研究所智慧金融創新科技實驗室(Intelligent Financial Innovation Technology Lab,IFIT Lab,NTPU),由國立臺灣大學資訊管理博士戴敏育教授擔任指導教授,戴博士目前是國立臺北大學資訊管理研究所教授,兼任永續辦公室 永續發展組組長、與金融科技暨綠色金融研究中心主任。國立臺北大學智慧金融創新科技實驗室(IFIT Lab)創成立於 2021 年,
177、致力於整合資訊管理、AI、永續綠色金融科技等跨領域創新研究與應用,目標在培育兼具資訊管理思維與金融科技創新應用的專業人才,並促進產學合作,推動學術研究和實務應用。實驗室的目標在於發展前瞻的智慧金融創新科技服務與應用,並將研究成果轉化為實際應用,為產業的發展做出貢獻。該實驗室主要研究方向:人工智慧(Artificial Intelligence)、生成式 AI(Generative AI)、永續綠色金融科技(ESG and Green Financial Technology)、大數據分析(Big Data Analytics)、電子商務(Electronic Commerce)、資訊系統評量(
178、Information Systems Evaluation)、生物醫學資訊(Biomedical Informatics)。具有專長技術有,AI 與機器學習、深度學習與自然語言處理、生成式 AI 應用於永續綠色金融科技、金融科技知識圖譜建構與分析、大數據分析與探勘、資訊系統開發與評估。該實驗室進行中的研究計畫有:智慧城市大型語言模型代理人系統,該計畫與財團法人資訊工業策進會合作,探討如何利用大型語言模型建構智慧城市代理人系統,用於提升城市治理效率和市民生活品質。生成式 AI 驅動的 ESG 報告生成技術,該計畫與工業技術研究院合作,探討如何利用生成式 AI 技術自動化生成 ESG 報告,以提
179、高報告效率和品質。元宇宙 AI 多模態跨語言任務導向對話系統,該計畫與千如電機公司合作,開發基於 AI 的多模態跨語言任務導向對話系統,應用於元宇宙虛擬世界中的商業和金融場景。研究領域與專長研究成果60STAR 軟體技術年報61STAR 軟體技術年報金融科技綠色金融於碳市場指標與公司環境策略,該計畫整合 AI 文本分析技術,探討碳市場情緒指標,以及公司財務和環境政策。該實驗室的研究成果已發表多篇學術論文於國際知名期刊與國際學術研討會,並參與 NTCIR 等國際競賽獲得佳績,如:NTCIR-17 最佳海報展示獎,日本 NTCIR-17 FinArg-1:財務金融分析中的細粒度論證理解、日本 NT
180、CIR-17 MedNLP-SC:社群媒體與臨床文本之醫療自然語言處理;NTCIR-16 第一名日本 NTCIR-16 FinNum-3:投資者與管理者的細粒度聲明檢測。此外在專利及技術轉移項目有:模型建模指令生成方法及其系統:中華民國發明專利,發明第 1817921 號;授信風險評估系統:中華民國新型專利,新型第 M654639 號。該實驗室的研究方向將持續專注於 AI 與生成式 AI 技術於永續綠色金融科技的創新服務應用:生成式 AI 的永續綠色金融科技創新服務應用,探索生成式 AI 模型與 AI 代理人在永續綠色金融科技創新服務的應用,例如:智慧客服機器人、自動化報告生成、永續投資分析等
181、。多模態 AI 的跨語言永續綠色金融科技創新服務,開發結合語音、文字、圖像等多模態資訊的 AI 系統,提供更人性化和便捷的跨語言永續綠色金融科技創新服務。此外該實驗室亦積極尋求與業界的合作機會,共同開展:產學合作研究計畫,針對業界實際問題,結合實驗室的研發能量,開展產學合作研究計畫,例如:智慧永續綠色金融科技創新產品開發、風險管理模型建構、客戶關係管理系統優化等。與人才培育與技術轉移,與產業合作,共同培育智慧永續綠色金融科技創新服務應用人才,並將實驗室研發的技術轉移到業界,例如:舉辦工作坊、提供顧問諮詢、技術授權等。整體而言,期望透過與產業界的緊密合作,將學術研究成果轉化為實際應用,為推動智慧
182、永續綠色金融科技的發展和服務創新做出貢獻。未來展望62STAR 軟體技術年報16.國立臺北大學 智慧型多媒體系統實驗室國 立 臺 北 大 學 資 工 系 智 慧 型 多 媒 體 系 統 實 驗 室(Intelligent Multimedia System Lab,IMSLab),由美國馬里蘭大學電機工程博士林道通特聘教授擔任實驗室主持人,該實驗室強調I3,包含智慧型(Intelligence)、互動式(Interaction)和創新性(innovation)三項研究精神,並以研究與開發 I3 的主題方向作為實驗室創立宗旨與目標。林道通特聘教授研究專長為 AI、深度學習、影像處理、電腦視覺。近
183、年已將 AI 研究專長拓展至智慧城市、自然語言處理法律文本分析、永續公司治理等相關議題,並累積 25 年產學合作經驗,執行 120 件各類研發計畫,曾榮獲科技部產學傑出獎,與 25 家以上公司合作,包含中華電信、資策會、工研院、桃園捷運、律碁科技、中興保全、新眾電腦、傑作陶藝等,擁有美國專利 4 件、中華民國專利 9 件。林道通特聘教授研究成果豐富,連續三年(2022 2024)年榮獲美國史丹佛大學全球排名 2%頂尖科學家。資料來源:IMSLab 實驗室資料來源:IMSLab 實驗室IMSLAB 實驗室 LogoIMSLAB 實驗室主持人 林道通特聘教授圖 2-16圖 2-1763STAR 軟
184、體技術年報IMSLab 實驗室研究方向包含影像處理、圖形辨識、電腦視覺、機器學習、深度學習、AI、智慧型視訊監控、醫學影像處理、嵌入式系統及行動裝置、自適應網站開發等等,該實驗室強調研究人員的獨立思考、創新設計及實作能力之培養與訓練,依照選定之研究重點領域方向,進行前瞻性、整合性及長期性之影像與視訊方面之研究。該實驗室專長在 AI與電腦視覺的相關特定技術,包含使用物件偵測技術進行許多應用,如使用物件偵測器進行產品瑕疵檢測;光學字元辨識應用於車牌辨識、車票辨識。目前實驗室進行中的研究項目與計畫包含:(1)應用深度學習於輕度認知障礙失智癥畫鐘測驗評估之實證研究、(2)運用多模態預訓練模型及注意力可
185、解釋性分析進行多樣態手寫請款憑證內容辨識、(3)企金 ESG 評等雲端轉地端專案、(4)智慧城市大型語言模型代理人系統、(5)AI 研究專業諮詢服務、(6)數據科學專業諮詢服務、(7)運用 AI 技術輔助交通事故撫慰金損害賠償請求:資料庫搜尋優化、額度預測機書狀生成、(8)ESG 與永續績效策略面、財務面與 AI 面的跨域實踐、(9)永續授信自動化解決方案 ESG 負向裁罰資料庫。最近五年主要研究成果包含 AI+AOI 產品瑕疵檢測、視訊移動車輛偵測與追蹤、陶瓷創意擴增實境、失智癥早期評估與行為預警,如下圖所示。研究領域與專長研究項目與成果產品瑕疵檢測 視訊移動車輛偵測與追蹤圖 2-18圖 2
186、-19資料來源:IMSLab 實驗室64STAR 軟體技術年報研究成果榮獲多項專利,並進行技術轉移,專利發表 Method of Detecting Moving Object U.S.Patent,US8126212、以分層掃描法實現即時人數計數,中華民國專利證書號:發明第 I448990 號、Real-Time people counting system using layer-scanning method,U.S.Patent,US9122908 B2、基於移動變化量之適應性區域局部迭代更新之背景建立方法,中華民國專利證書號:I526988、影片事件處理方法,中華民國專利證號:發明第
187、 I534758 號、影像處理方法及影像處理裝置,中華民國專利證書號:I665638、移動物體偵測方法,中華民國專利證書號:發明第 I676152、虛擬廣告置換方法及電子裝置,中華民國專利證書號:I701642、擴增實境物件顯示裝置及擴增實境物件顯示方法,中華民國專利證書號:I740275、三維邊界框重建方法、三維邊界框重建系統及非暫態電腦可讀取媒體,中華民國專利證書號:I778756、3D BOUNDING BOX RECONSTRUCTION METHOD,3D BOUNDING BOX RECONSTRUCTION SYSTEM AND NON-TRANSITORY COMPUTER R
188、EADABLE MEDIUM.U.S.Patent,US2023/0055783、授 信 風 險 評 估 系統,中華民國專利證書號:M654639、Image Synchronization System for Multiple Cameras and Method Thereof.U.S.Patent,US2024/0137662 A1。該實驗室進行許多 AI 相關計畫,致力於推動前沿技術的發展與實際應用,。目標進行跨領域的研究,並提供創新的解決方案,利用 AI 深度學習、多模態分析、大型語言模型等技術,解決包括醫療健康、智慧城市等相關議題。此外,透過與公司的合作與專業諮詢服務,實驗室致力
189、於推動 ESG 與永續發展的跨領域實踐,為社會創造更大的價值,未來研究方向也將持續朝 I3 智慧型、互動式、創新性為目標,持續推動前沿技術。未來展望陶瓷創意擴增實境 失智癥早期評估與行為預警圖 2-20圖 2-21資料來源:IMSLab 實驗室65STAR 軟體技術年報另外,該實驗室對於未來產學合作抱持高度的期待,不論是過去合作過的公司或是新公司,該實驗室皆期望透過產學合作的方式,將學術研究的創新與業界的實際需求緊密結合,實現學界與業界雙贏的局面。該實驗室期望成為企業可信賴的 AI 研發夥伴,提供使用 AI 解決方案到應用開發面的全方位支持。期待與產業界的合作,不僅限於技術的落地應用,更包括共
190、同探索未來趨勢。透過與業界的合作,一起加速科技發展的進步。該實驗室合作過的相關公司圖 2-22資料來源:IMSLab 實驗室66STAR 軟體技術年報Power ElectronicsSystem IntegrationAutomatic ControlSystem IntetrationCommun NetworkSystem IntegrationLow-PowerComputingMultimediaCodecReal-Time Operating System LibrariesEmbedded SoC Hardware PlatformKernelLoadable ModuleBoo
191、tloaderDriverComputerVisionProtocolStack嵌入式軟硬韌體課程地圖(實務)圖 2-23資料來源:嵌入式系統晶片實驗室17.國立雲林科技大學 嵌入式系統晶片實驗室國立雲林科技大學電機工程系嵌入式系統晶片實驗室,由國立中正大學電機博士何前程教授所創建與主持,主要是為培育雲林科技大學電機系學生的軟硬韌體實作能力,以實現電力電子、自動控制及通訊資訊等領域的系統整合。何教授曾經在中華電信研究院從事五年的網路電話系統晶片的研究工作,在雲林科技大學研發處就業暨校友聯絡組從事十一年的就業輔導、實習媒合及校友經營的行政工作,目前兼任雲林科技大學未來學院智慧機器人學士學位學程主
192、任工作。何教授擅長將產學研究成果轉化為教學實作範例,其研究專長同時也是教學專長如下:1)嵌入式處理器韌體(ARM,Cortex-M);2)即時作業系統整合(eLinux,Android);3)視覺機器人學應用(OpenCV,ROS),以研發電力電子領域的智慧電表與電動載具等技術,自動控制領域的工業 4.0 與智慧自駕等技術,以及通訊資訊領域的智慧醫療與多車聯網等技術。目的:建立雲科大電機系所學生的軟硬韌體實作能力,以實現電力、控制或通訊等領域的系統整合研究領域與專長67STAR 軟體技術年報產學合作典範案例,與均豪精密工業股份有限公司在 2021 年 10 月簽訂成立均豪 雲林科大共同研發中心
193、,其主要任務為:1)產學技術合作;2)碩班產業實習;3)學生獎助學金;4)學生畢業留任。只有產學技術合作卻無實習人才培育,產業界技術無法紮根。只有實習人才培育卻無產學技術合作,產業界人才無法精進。唯有相輔相成的產學技術合作與實習人才培育,才能讓產業界與學術界共創雙贏。該實驗室期望透過技優一條龍的典範合作流程:創新教材特色課程證照檢定實務競賽產學技轉專利論文校外實習就業媒合創新創業在地連結接軌國際,以共創產業升級、學生就業及大學致用的三贏裨益。國際合作典範案例,與馬來西亞雙威大學工程科技學院在 2024 年 08 月簽訂學術研究與產學計畫的合作備忘錄,並實質地透過共同執行自主採收油棕果實農車與先
194、進機器人國家級計畫,奠定雲林科技大學與馬來西亞雙威大學日後技術研發與師生交換的國際交流合作基礎。嵌入式系統晶片實驗室的研究成果與展示影片,https:/esoclab.yuntech.edu.tw/。研究項目與成果未來展望68STAR 軟體技術年報18.國立宜蘭大學 無線通訊網路實驗室國立宜蘭大學電機工程學系無線通訊網路實驗室,由國立臺灣大學電信工程曾志成博士擔任指導教授。曾教授於 1996 年在工業技術研究院資訊與通信研究所擔任通信系統副工程師協助內政部警政署於臺北市、臺中市與高雄市佈建全臺首套數位集群警用無線電系統。因參與歐盟計畫,於 2007 年至丹麥奧爾堡大學的電信基礎設施研究中心擔任
195、為期三個月的訪問研究員。截至目前為止,總計期刊論文與國內外會議論文共發表百餘篇,執行研究與教學計畫 30 餘件,擔任期刊副編輯與國際學術會議的籌辦委員將近 50 次以及學術會議之技術議程委員會委員將近 80 次。主要的研究興趣包括次世代行動通信技術與 Open RAN 相關之智慧控制技術。為強化在無線通訊網路相關的研究以及集中相關研究的軟硬體資源,曾教授於 2009 年正式成立無線通訊網路實驗室並開始指導研究生進行從 4G、5G 迄今 6G 與 Open RAN(Radio Access Network)之相關研究。一直以來,該實驗室的研究主題除理論探討之外也與產業界密切結合進行實務專案技術的
196、開發與系統設計。此外,鑑於有限的研究人力與軟硬體資源,該實驗室除與院內具通訊網路專長的郭芳璋教授與梁耀仁教授共同組成研究團隊外並與陽明交通大學 AI 學院連紹宇教授的實驗室進行跨校際的實際合作,藉此拓展該實驗室成員的研究視野外,並將該實驗室的研究能量與成果最大化。該實驗室近期主要專注的研究主軸有:6G NTN(Non-Terrestrial Networks)、基於Open RAN 之智慧節能技術、Open RAN 網路架構下之異常偵測、流量導引與可重構智慧表面(Reconfigurable Intelligent Surface)之波束調控技術。此外,該實驗室的專長技術有:導入賽局理論於行動
197、通訊網路之干擾控制技術與Device-to-Device(D2D)通訊下無線電資源之排程技術、5G 隨機存取程序之優化技術、導入 AI/ML 於 Open RAN 的智慧運算控制(RAN Intelligence Controller,RIC)平臺之應用以及於 Open RAN 架構下對可重構智慧表面反射波束之智慧調控技術。該實驗室進行中重要工作有:因實際基站價格高昂且多數尚未支援 E2 介面以及實驗場域之取得與建置不易等現實面的問題,現階段要在建置有大量支援 E2 介面之 5G 基站的實際場域中導入 Open RAN 的架構來取得進行特定應用之 AI/ML 智慧型調控技術開發所需之訓練與測試
198、用之資料集、在 AI/ML 模型訓練完成後之上線運作以及持續進行模型的優化作業實屬不易。有鑑於此困境,該實驗室便著手開發可支援 Open RAN 架構之場域模擬器。希望藉此來提供進行 Open RAN 相關研發時能依研究自身的需求以最具經濟成本效益的方式來取得進行AI/ML 智慧演算法所需之資料集俾利在最短時間內 AI/ML 智慧演算法之開發與模型之訓練、測試甚至是將所訓練的 AI/ML 模型結合模擬器進行即時的效能驗證與模型的優化。研究領域與專長研究項目與成果69STAR 軟體技術年報此外,在 OSC 所建議的流量導引技術中已將 AI/ML 演算法導入到 Anomaly Detection(
199、AD)與 QoE Prediction(QP)的設計中。然而,OSC 所使用的 AI/ML 演算法之效能存在著改善的空間。因此,目前正著手重新設計 AD 與 QP 的智慧運算演算法。該實驗室目前具有的重要成果有:在經濟部工業局所舉辦的 5G Craft 競賽中在 Open RAN 的架構中以 AI/ML 的演算法分別提出智慧換手機制與無人機飛行軌跡預測並連兩年皆獲得創意科技獎。並且,分析Open RAN Software Community(OSC)所釋出的KPI Monitor(KPIMON)、AD、QP 與 Traffic Steering(TS)等 4 個 xApps 之運作原理與追蹤其
200、原始碼。緊接著經過適當的修改後成功將將 KPIMON、AD、QP 與 TS 等 4 個 xApps 與 Near-RT(Near-Real-Time)RIC 整合進行流量導引應用情境之驗證。此外,為驗證 Near-RT RIC 能透過 A1 介面接收與執行來自 Non-RT(Non-Real-Tine)RIC 針對流量導引的應用情境所下達之 Policy,如下圖所示,參考 OSC 的建議來定義 Policy的內容與格式並透過重新設計 TS xApp 來驗證如何透過 A1 介面來串接 Non-RT RIC 與 Near-RT RIC 並進行 Policy 的傳遞以及 Policy 如何在 Nea
201、r-RT RIC 中影響相關 xApp 的運行。整合 Non-RT RIC,Near-RT RIC 與 Emulator 進行 Policy-Based 流量導引之驗證圖 2-24資料來源:無線通訊網路實驗室70STAR 軟體技術年報該實驗室的研究方向有持續開發與優化可支援 Open RAN 架構下不同應用場景之場域模擬器;在 Near-RT RIC 上針對 Energy Saving 的應用情境來開發智慧型基站功率調控演算法;因目前 OSC 所釋出的 TS xApp 並未導入任何 AI/ML 演算法,在流量導引的應用情境中仍存在藉由導入智慧運算技術來進行優化之潛在技術;因 OSC 目前尚未實
202、現與釋出 R1介面,除持續關注 OSC 在 R1 介面原始碼開發之進度外,規劃在流量導引的應用情境下,嘗試在 Non-RT RIC 上開發具 AI/ML 演算法的 rApp 並先透過現有之 O1 或是 A1 介面來與Near-RT RIC 上的 xApp 以及所開發的場域模擬器整合後來驗證 Policy 的產生、推送、執行與執行後系統效能之再反饋回 Non-RT RIC 來重新調整 Policy 之閉迴路控制機制。此外,自從開始投入 Open RAN 之研究領域後,該實驗室對於與業界合作皆抱持著開放的態度也積極參與相關的媒合機會,期待能與業界在特定應用情境下共同發展出更接近實務需求的關鍵技術。
203、未來展望71STAR 軟體技術年報19.資策會軟體院 AI 工程技術中心資策會軟體院 AI 工程技術中心專注於前瞻 AI 技術研究,願景是以 AI 技術協助產業數智轉型,推動創新應用,培育 AI 人才,並促進產業升級與提升企業國際競爭力。該中心定位聚焦前瞻 AI 技術、生態服務與驗證以及協助資服業者導入新興前瞻 AI,推動數據驅動產業智慧決策、創新轉型。其核心任務包括研發與應用前瞻 AI 技術,建構 AI 產業生態系統,並促進跨領域合作,支持企業有效導入 AI 解決方案。此外,該中心參與之 AI 133 Lab 可提供實驗與驗證平臺,確保新技術的可行性與市場應用。透過培育 AI 人才,深化技術
204、合作,該中心希望成為促進產業升級與數智轉型的重要推動者。目前該中心專注於生成式 AI、影像式 AI 以及大數據智慧分析等領域。生成式 AI 著重在能自主完成任務的 AI Agent 上,例如撰寫文章、回答問題或進行客製化內容生成;AI Agent 能夠整合多種能力,像是語言理解、圖像生成,並依據使用者的需求作出回應;或是應用於自動摘要功能,從大量文本資料中提取關鍵資訊。影像式 AI 則著重在醫學與工業上之影像辨識與分析,例如乳房、肺結核、骨折等 X 光影像、工廠爐火影像等;其中乳房攝影品質 AI 輔助評量系統可協助改善拍攝水準,以 AI 分級進行排序,減輕醫師閱片負擔。大數據智慧分析應用於產線
205、可減輕生產現場人力負擔,結合最佳化搜尋與漸進式學習技術,具備關聯分析、異常警示、建模預測、參數調校等自動化應用,協助企業高效解決產線問題。過去幾年,該中心取得多項重要的研究成果。在生成式 AI 方面,開發 Akasha 為開源的生成式 AI 工具,可協助企業自行建立自己的知識問答服務。另外也與資策會軟體院智慧通訊技術中心合作開發之 5G 未來工廠(AR 智慧眼鏡協作方案)獲 APICTA 工業應用類銀牌。在影像 AI 方面,該中心開發乳篩 AI,已導入三家醫院,服務超過四萬五千名民眾,並獲得 R&D 100 以及愛迪生獎。在大數據智慧分析方面,製程大數據即時分析系統聚焦整廠人、機、料、法、環全
206、製程資料,即時融合與分析,提升設備效能,優化產線產能,亦獲得R&D 100 獎項。定位與任務關鍵技術重要成果72STAR 軟體技術年報20.資策會軟體院 前瞻技術實驗室資策會軟體院前瞻技術實驗室專注於軟體前瞻技術研究,致力於探索未來技術發展,成為前瞻技術與新興生態引領者。該實驗室定位為前瞻技術主題探索與新興生態先導實證的推動者,旨在引領技術創新與生態系統發展。其任務是透過跨領域研究和產業實證,挖掘具潛力的創新技術,並推動技術應用落地。藉由產業、學術及研究機構的合作,期望建立促進技術突破和知識轉移的平臺,加速技術的商業化與產業化,帶動整體生態系的進化。其專注於三大技術領域:邊緣人工智慧(Edge
207、 AI)、AI 信任、風險與安全管理(AI TRiSM)、以及道路影片與 GPS 數據分析技術。在 Edge AI 領域,研究如何透過分散式計算將 AI 模型部署至邊緣設備,以提升數據處理效率,特別是在智慧移動和物聯網應用中發揮重要作用。在道路 AI 感知與 GPS 數據分析方面,其開發技術用於車輛駕駛輔助(AI-ADAS)、即時車流分析和動態路線優化,提升智慧交通系統的運行效率。AI TRiSM 則聚焦於 AI 應用中的風險管理、透明性及信任問題,透過情境設計、模型監控、數據治理和風險評估確保應用的安全與信賴。過去幾年,該實驗室取得多項重要研究成果。在智慧移動領域,其開發的 Edge AI
208、感知解決方案與臺灣街景行車影像訓練資料庫平臺(FORMOSA DATASET),成功降低大型車輛的事故率,並已在多個智慧城市項目中實現應用。此外,該實驗室的 GPS 資料分析技術已被導入智慧運輸系統,用於即時車流分析與動態路線優化,顯著提升城市道路的通行效率。此外,為進一步確保移動安全性,該實驗室於 2024 年成立未來移動安全信賴評測中心,結合 AI TRiSM 技術,針對 AI、通訊及資安進行評測,協助國內產業提升車用智慧化產品的安全性與可信度。這項評測大幅提升未來移動應用中的 AI 感知安全、數據通訊安全與資訊安全信賴效益。這些成果不僅展現其在前瞻技術研究上的實力,也為未來技術在各產業的
209、廣泛應用奠定堅實基礎。定位與任務關鍵技術重要成果72STAR 軟體技術年報73STAR 軟體技術年報21.資策會軟體院 先進軟體工程中心資策會軟體院先進軟體工程中心以先進軟體工程為主軸、以數位信任為核心、以第三方服務為目的,擘劃建構未來知識工作者之軟體工程基盤及創新生態系,期能與我國軟體服務供需方攜手合作,共創數位轉型新紀元。隨著 AI 技術與應用的迅速崛起,軟體系統開發建置及數位信任等議題亦發生劃時代的改變。因應 AI 趨勢的浪潮及需求,該中心定位為構築可信任 AI 軟體工程基盤、拓展技術策進第三方服務,促進我國企業及政府邁向 AI 轉型。其任務是結合產官學研各界能量,探索實踐先進 AI 軟
210、體工程技術,建構可信任 AI 服務價創平臺,提供第三方服務,促進我國朝向產業 AI 化、AI 產業化之政策方向發展。該中心核心技術聚焦三大領域:可信任 AI 企業應用技術,協助企業建構可靠的 AI 應用環境,從 AI 發展指引、生成式AI 應用到 AI 軟體基盤,皆以國際標準為依歸,確保 AI 系統的公平性、透明度與有效性,幫助企業充分利用數據資產,創造更高價值。智慧道路 AI 技術,以 AIoT 技術為基礎,深耕智慧交通領域。其開發智慧道路 AI 安全防護技術與系統,並協助政府建立智慧道路分級標準,期能促進臺灣智慧交通產業蓬勃發展。軟體系統第三方服務,提供符合國際與國內標準的軟體規劃設計、驗
211、證確認服務。其擁有 AI 高階顧問團隊,並建置技術架構輔導平臺、評測工具及通過 ISO 17025 認證的專業測試實驗室,提供全方位的軟體服務。近年來其發展出多項重要技術與應用成果,並且榮獲多項國際獎項。在可信任 AI 應用方面,以資策會為場域打造企業大腦的基礎架構,並發布一系列生成式 AI 的導入指引。透過將生成式人工智慧與軟體工程緊密結合,為 AI 軟體開發提供一套完善的方法論,以確保 AI 系統的可靠性、安全性與透明度;為 AI 產業的健康發展奠定堅實的基礎。在智慧道路 AI 技術方面,在全臺建置 265 處場域,累計 400 萬筆物件標記資料庫,完成路口安全、機車安全、輕軌防護、科技監
212、理等事件辨識及事件預測技術,帶動產業系統整合進軍海內外市場,協助道路主管機關強化道路安全,提升管理及執法效率。定位與任務關鍵技術重要成果74STAR 軟體技術年報22.資策會軟體院 資料智慧技術中心資策會軟體院資料智慧技術中心專注於數位分身技術與生成式 AI 的研究,目標是成為公共智慧服務應用的領航者。致力於豐富與深化軟體基盤關鍵技術,並透過規劃生態系與落地實證,推動公共智慧服務的應用與第三方業務的持續發展。其定位是豐富與深化軟體基盤關鍵技術與推動數位分身應用,旨在豐富與深化數位分身(Digital Twins)與 AI 生成內容(AIGC)技術,規劃新興生態系並進行實證,包括PISA、綠色永
213、續、畜牧業、運動等領域。其任務是將數位分身技術應用於多個領域,如 Human Digital Twin(專家數位分身),模擬、預測、最佳化專家知識的應用,打破時間與地點的限制。在畜牧業、綠色永續等方面,結合 AIoT 和數位分身,強化應用並推動在地發展,並透過第三方服務與生態佈局,協助制定科技養殖和低碳製程的規範。同時,該中心也在運動領域發展 AI 虛擬教練分身,提升訓練成效,帶動智慧高球等科技訓練服務,為產業轉型升級提供第三方解決方案。涵蓋數位分身(Digital Twins)開發工具、AI 運動表現分析引擎及領域專家知識的融合應用。其中,數位分身技術包括 Digital Twins 生命周
214、期管理、場景建構工具及針對特定領域的軟體與數據,為 AI 應用做好準備。此外,智慧高球科技訓練服務結合輕量化 AI 揮桿姿態感知技術與擊球策略生成,提供精確的運動表現分析,並透過專家知識增強技術,提升訓練效果。在 ESG 與 PCB 碳排放管理方面,該中心開發專家分身技術,提供企業永續發展的數據支援與解決方案。過去幾年,其取得多項重要的研究成果。在智慧感知領域,推動科技畜牧產業轉型上取得重要成果;透過整合產官學研資源,建立科技養殖/畜牧示範範例,包含宜蘭宜佳畜牧場與屏東畜牧場,運用虛擬模擬技術與 AI 豬隻型態辨識技術,進行精準化飼養與生產預測。結合 AIoT 技術監控飼養環境,並透過影像辨識
215、、作業建議與設備控制等手段提升畜牧業生產效率,實現數位化轉型,並且有效應對環境變遷的挑戰。在智慧運動領域,GolfMaster 智慧高球專家系統,在跨領域的技術整合與應用上取得顯著成果。結合 AI 運動表現分析引擎與專家知識,並與高球學院、裝置設備商及場域實驗驗證合作,推動高球科技訓練服務的第三方服務與生態系佈局。定位與任務關鍵技術重要成果在軟體監審驗證方面,該中心建立一套符合國際標準的軟體品質保證體系;透過嚴格的審核與驗證流程,確保軟體產品的品質與可靠性。同時,還成立 ISO 17025 認證的智慧桿資通訊測試實驗室,為相關產品提供專業的檢測服務。75STAR 軟體技術年報23.資策會軟體院
216、 智慧通訊技術中心資策會軟體院智慧通訊技術中心領先佈局前瞻通訊技術,從標準制定、技術研發到場域試驗,提供產業完整解決方案,加速產品開發,提升國際競爭力。該中心致力於布局 5G-Advanced 與 6G 等前瞻技術,透過產學研合作,將研發成果轉化為實際應用,提升產業競爭力?;对诨嘏_、核心網路與 AI 整合的豐富經驗,其聚焦於 AI、節能、覆蓋與韌性等技術研發,並結合國際標準,提供產業完整的技術解決方案,從研發、驗證到應用試煉,協助產業進行數位轉型。定位與任務前瞻通訊技術開發暨顧問團隊圖 2-25資料來源:資策會軟體院智慧通訊技術中心76STAR 軟體技術年報該中心的關鍵技術主要包含以下六大
217、類:5G 無線接取網路技術,5G 實體層 Channel Coding 技術(LDPC、Polar)、5G 協定層軟體技術。5G 核心網路,基於微服務架構,提供相容於 3GPP 標準規格之等 5G 核心網路控制元件功能,可彈性配置,滿足大頻寬、大連結、低延遲等 5G 應用需求。低軌衛星技術,實體層演算法設計、軟體模擬與驗證。低軌衛星Broadband Internet、Video Conference、IoT 三大應用服務設計與驗證。V2X 通訊安全檢測技術,V2X 無線射頻合規檢測、封包數據安全檢測。6G AI-Native 網路智慧演算技術,通訊系統架構導入 AI 技術,包含 AI-Nat
218、ive 智慧演算架構、基地臺中介層接取及開放介面、Near-RAN 智慧演算節點、核心網路智慧演算及時敏通訊等技術。6G 核心網路雛形架構與技術,包含 Cloud-Native 雲原生架構、Micro-Service 微服務架構、Ultra-Lightweight核心網路、容器共享記憶體機制、彈性動態佈署、動態調控資源、智慧演算分析、開放架構與服務代理等技術。過去幾年,該中心取得多項重要研究成果。2020 年,攜手聯發科與 Inmarsat 完成世界首次 5G 衛星物聯網(IoT)資料傳輸測試;將 5G 基地臺解決方案技術轉移衍生新創公司,信曜科技。2021 年,成立泰雅科技,基於 5G 核心
219、網路技術發展 5G 專網系統解決方案;與友嘉集團、凌華合作,發表亞洲首座 5G 智慧工廠,榮獲 APICTA Awards 2022 銀牌。2024 年,5G 及 AI 賦能的智慧床墊照護系統(iMat for Smart Care)獲 R&D 100 Awards 大獎,及臺灣參賽史第一面企業社會責任特殊貢獻獎銀牌。參與臺灣與歐盟合作計畫,包含 Clear5G、5G DIVE、5G CONNI,驗證 5G 企業專網整合工業應用的端到端服務。關鍵技術重要成果77STAR 軟體技術年報學術界合作案例-重要研究成果31.生成式 AI 風險評估指引隨著生成式 AI 技術的進步,越來越多的企業開始導入
220、這些技術以提升業務效率並加速創新。從金融服務到醫療健康,生成式 AI 技術正在各個行業中廣泛應用,涵蓋自動化客服、資料生成、預測分析等多個領域。然而,在這些技術帶來巨大商業價值的同時,也伴隨著一系列風險,如數據隱私洩露、模型偏見、技術濫用、以及技術可靠性等問題。企業在導入這些技術時,面臨著如何平衡創新與風險管理的挑戰。該研究由國立陽明交通大學吳毅成教授為計畫主要執行人,並由孟昶緻博士生、陳建樺碩士生共同參與研究。在該合作中,專注於針對生成式 AI 技術導入中的三種類型風險設計一套全面的風險管理指引,包括組織風險、資料風險及系統風險。組織風險,解決企業內部在技術導入過程中可能面臨的管理挑戰,例如
221、缺乏明確的技術策略、內部溝通不足或資源分配不合理。開發一套風險評估問卷,協助企業進行內部風險識別,並針對組織結構提出具體的風險管理建議。資料風險,資料的隱私與安全是 AI 技術應用的核心問題。針對資料洩露、非法資料使用及資料不一致性設計具體的數據安全防護措施,並提出自動化數據清洗工具來識別敏感資料,確保資料使用的合法性與安全性。系統風險,技術故障與模型可靠性風險是 AI 技術導入時不可忽視的部分。針對此一風險,該研究設計技術故障的預防與應急響應流程,並研發即時監控系統,能夠即時檢測 AI模型的異常運作和輸出結果的準確性,進一步提高系統的穩定性。成果雛形:展示目前所取得的初步成果,包括技術原型或
222、研究成果。其合作目標是開發一套 AI 驅動的風險管理工具,幫助企業在應用生成式 AI 技術的過程中有效地識別和管理風險,確保技術應用的合法性、安全性及可靠性。該次合作由資策會主導,旨在協助企業在數位轉型中應用生成式 AI 技術,並妥善管理相關風險。資策會在推動產業數位轉型中具有豐富經驗,且與學界保持密切合作。期望透過結合資策會的產業實踐經驗和學術界的技術研究,開發出一套適合多種行業應用的風險評估與管理方案。研究目標發展現況介紹78STAR 軟體技術年報應用面向該套指引和工具主要針對各類正在導入生成式 AI 技術的企業,特別是金融、醫療和科技領域,這些領域對數據隱私與技術穩定性要求極高。該技術指
223、引和工具能夠協助企業在技術導入初期就建立起有效的風險管理體系,保障其在營運過程中的安全性與合規性。後續發展潛力未來,該套風險評估指引有望進一步擴展至更多行業,特別是那些依賴數據安全與隱私保護的行業,如政府機構與教育行業。此外,改研究計畫強化技術工具的功能,進一步開發更精細的數據加密技術和 AI 系統的監控儀表板,確保風險管理能夠涵蓋技術運作的各個層面。有效地整合學術界和產業界的資源和知識,不僅提升生成式 AI 技術在實際業務中的應用效果,也在數據隱私和安全管理上取得突破性進展。雙方對合作成果表示滿意,並期待未來進一步的深度合作。該合作在學術界和產業界中均具有重要的示範效應,成功證明生成式 AI
224、 技術與風險管理策略的結合可以有效地應對當前企業數位轉型中的重大挑戰。未來,該合作成果將有望在更廣泛的領域內產生深遠影響。成果雛形結語79STAR 軟體技術年報2.動態資料服務節點與 AI 智慧導流技術 AI/ML 運用於 B5G 智慧導流技術由於近年來 5G 網路使用者逐年增加,以及 5G 網路未來也將支援如智慧城市中物聯網及自駕車的應用等等,使得 5G 核心網路(以下簡稱 5G 核網)需要同時滿足大量使用者的需求。在 5G核網中,UPF(User Plane Function)主要用於進行流量轉送以及擔任與 5G 核網的控制平面(Control Plane)溝通的橋樑。若在一個核網中只使用
225、一個 UPF 來處理流量,可能會在面臨大量使用者流量時,出現網路極度壅塞的情況,這會造成單一 UPF 的 CPU 負擔過重,此時不僅會限制 5G 網路能同時服務的最大使用者數量,還會嚴重影響使用者的網路品質體驗。因此在這個計畫中,開發讓 5G 核網可以同時使用多個 UPF 來進行 load balancing 的智慧導流機制,並使用AI/ML 技術來獲得最佳智慧導流的決策,目的是提升 5G 核網處理大量流量的能力以減少因為發生壅塞因而造成網路服務品質的下降。該研究由國立陽明交通大學網路與系統實驗室王協源教授為計畫主要執行人,並由洪晨語、黃漢軒、林哲緯碩士生及資策會江肇元技術經理等技術團隊共同參
226、與研究。全球行動網路數據流量(EB/月)圖 2-26資料來源:愛立信行動趨勢報告 2024/680STAR 軟體技術年報技術上,期望能夠實現:(1)使 5G 核心網路能夠同時使用多個 UPF,並能夠使 gNB、Control Plane 與 DN(Data Network)透過各自的通道進行流量轉發,以及(2)使多個UPF 間能夠透過 AI/ML 相關技術進行智慧導流,使硬體資源的使用率最佳化。透過以上兩個設計,該計畫的方法將能提升 5G 核網處理大量流量的能力且提升網路的服務品質。在檢索相關的文獻後,發現許多有關 5G 智慧導流(Traffic Steering)相關的論文,但發現這些論文僅
227、針對 5G 網路的 UE(User Equipment)與 gNB(Next Generation Node B)之間進行導流優化,而缺乏針對 gNB、Control Plane 與多個 UPF 之間進行導流的相關研究。在缺乏相關研究的情況下,能夠使 5G 核網同時使用多個 UPF 的技術,為該研究的第一個目標。因此,透過該計畫使 5G 核網同時使用多個 UPF,並且透過 AI/ML 技術獲得最佳的智慧導流決策,藉此讓多個 UPF 的硬體資源使用率能夠大幅提升。隨著物聯網、自駕車、智慧城市等應用的蓬勃發展,5G 網路的流量也大幅增加,導致現有 5G 網路所面臨的流量壓力日益加劇,不僅設備負擔過
228、重,也影響使用者的使用服務體驗。因此提升網路服務品質為目前的當務之急。另外,AI/ML 技術近期也被廣泛的應用在網路優化之相關應用,因此將 AI/ML 技術引入 5G 核網來選擇最優路徑和在多個 UPF 間進行智慧化的 load balancing 是一個具有很多優點的創新技術。該合作得益於資策會目前在 5G 網路領域的技術積累,特別是 UPF 設備的應用與開發,期許雙方在該合作中能夠共同推動技術突破,完成 B5G 網路下的 AI/ML 智慧導流技術,以達成提升網路品質與使用者體驗的目標。在該計畫中,使用一個利用 ARP request/reply 的導流機制,把 UE 的流量經過其上網的gN
229、B 後導流到某特定的 UPF。讓多個 UPF 的 N3 與 N6 通道共用一個邏輯 IP 地址(logical IP address),並透過當 gNB 使用 ARP 詢問此邏輯 IP 地址時,讓智慧導流模組所動態選定的 UPF 回覆此 ARP request。該方法是以 layer-2 binding 的方式來使 gNB 導流 UE 發出的流量至特定的 UPF 上(這是上行方向)或使 DN 導流要送給 UE 的流量至特定的 UPF 上(這是下行方向)。研究目標發展現況介紹81STAR 軟體技術年報另外,亦設計與實作一個 Controller,使得當前架構能夠處理多個 UPF 間狀態資料(st
230、ate)不流通的情況,讓多個 UPF 主動去此 Controller 抓取 UE 的狀態資料,藉此讓多個 UPF 可以各自同步 UE 建立的 PDU Session 的相關資料。此外,結合 AI/ML 相關技術,使 Controller 能夠根據訓練好的 AI/ML 模型發出指令給多個 UPF,讓它們知道應該由哪一個UPF 來回應收到的 ARP request,藉此達到將多個 UE 的流量用智慧的方式導到不同的 UPF。上述所提到的 AI/ML 相關技術,目前提出以下兩種方式:第一種方式為監督式學習(Supervised Learning),預計使用 KNN(K Nearest Neighbo
231、r)來進行訓練。根據下圖的架構,共有 4 個 SIM 以及 4 個 UPF,每個 SIM 會連接到不同數量的 UPF,因此預計會訓練 11 個(24-4=11)KNN 模型。此外,收集各個 UPF 的 CPU Usage、Packet Loss Rate、Queuing Delay 來作為訓練和推論時所用的特徵(feature)。在生成訓練資料時(training data)時,並依據這些特徵的組合用人工的方式來標註正確的 label,這個 label 的可能值是 1,2,3,或 4,代表在這些特徵的組合當下,智慧導流的最佳決策是把此時的 UE 流量導到 UPF 1,2,3 或 4。利用這些生
232、成的訓練集資料來訓練 KNN 模型之後,每當 gNB 為 UE 建立 GTP-U tunnel 而發出 ARP request 時,就會根據此 gNB 所可能連接到的 UPF 選擇那個對應的 KNN模型,並收集當前這些 UPF 的 CPU Usage、Packet Loss Rate、Queuing Delay 以做為所選 KNN 模型的 input(features),然後以此模型的 output(prediction)來選擇當前最適合的 UPF,並由它來回覆此 ARP request。Network Architecture 圖 2-27資料來源:該計畫繪製82STAR 軟體技術年報提出的
233、第二種方式為強化學習(Reinforcement Learning),將使用 DQN(Deep Q Network)Model 來進行訓練,使用 CPU Usage、Packet Loss Rate、Queuing Delay 為狀態(State),並根據 Equation(1)自定義的獎勵函數(Reward Function),來學習最佳決策,並據此來選擇最適合的 UPF。Equation(1)中的為代表 UE 對於 delay 的敏感程度,若某個 UE 的 request 中所帶的值非常高,代表此 UE 所傳輸的資料對網路 delay 非常敏感且需要非常小的 delay,透過此公式的設計,
234、RL 在進行強化式學習後即會學習到針對這種 delay sensitive 的 UE 要優先選擇 Queuing Delay 低的 UPF,因為這樣 RL 才能獲得最大的獎勵。在效能提升方面,透過該計畫的方法,多個 UPF 可以同時被 AI/ML 機制進行智慧導流,因此預計使用該計畫所提出的智慧導流方法時,在一段時間內所有 UE 所獲得的平均throughput 會有所提升,此外一段時間內所有 UE 的 request/reply 的平均 delay 也會降低結語該計畫透過同時使用多個 UPF 於 5G 網路且使用 AI/ML 技術做為智慧導流的決策,期望可以達到在多個 UPF 之間的 loa
235、d balancing,進而提升 5G 網路的服務品質以及使用者體驗。目前 AI/ML 技術先採用 supervised learning 和 reinforcement learning 的方法進行功能開發和功效評估,未來若有機會,將探索使用生成式 AI 的方式來進行智慧導流。83STAR 軟體技術年報3.基於多視角視覺鳥瞰圖語意分割與動態物體行為預測之風險物體檢測此研究計畫透過與學界合作,以臺灣街景交通之車輛駕駛情境,先以鳥瞰圖視覺語意分割模組作為特徵輸入,透過物體行為預測並開發碰撞偵測演算法進而達到實時風險預測。將在現有開源資料集 nuScenes 上進行可行性評估,最終部屬在臺灣交通資
236、料集。該研究由國立陽明交通大學資工系陳奕廷教授為計畫主要執行人,並由呂書緯研究員共同參與研究。風險物體實時偵測技術,包含三項模組:多視角視覺鳥瞰圖語意分割(Multi-view BEV segmentation),這項技術將來自多個視角的影像數據透過相機內外參數投影到鳥瞰圖視角中,並進行語意分割。它能夠識別道路、車輛、行人等交通元素,並生成具有語意標籤的統一視圖,這些語意標籤幫助自動駕駛系統理解複雜交通環境,為後續的行為預測與風險偵測提供更可靠、更高層次的輸入特徵,進而提升系統的安全性與精確性。動態物體行為預測(Intention prediction),這項技術通過結合深度學習與傳統運動學方
237、法,基於交通場景中的歷史運動數據,進行精確的未來行為預測。它通常使用序列數據(例如時序相機數據)來預測行人或車輛的未來運動軌跡。行為預測模組除了單純的運動軌跡預測,還可以考慮行為者的意圖(如是否要穿越馬路、變換車道、轉彎、直行等等),以提升對潛在風險的提前預警能力,從而讓自動駕駛系統做出更智慧的反應。碰撞偵測演算法(Collision checking),該模組的核心目標是將語意分割與行為預測結果相結合,進行實時的碰撞風險評估。碰撞偵測演算法通過計算車輛與其他動態物體(如行人、其他車輛)的未來運動軌跡,預測兩者是否可能在未來的某個時刻相交,從而提前判斷碰撞風險?;杜鲎诧L險的實時評估,該技術能
238、及時觸發自動駕駛車輛的緊急制動或轉向操作,從而避免事故發生。整理研究方法與數據結果,並以技術文件、研究報告、風險預測視覺化呈現。陳教授團隊近年來開發多項基於鳥瞰圖的感知演算法(link)與風險感知演算法(link1,link2)。資策會軟體院當前專注於提升自動駕駛系統認知能力的技術開發,與陳教授團隊研發的風險感知技術高度契合,這也促成此次產學合作計畫的開展。研究目標84STAR 軟體技術年報臺灣的街景中包含多種交通元素,例如道路、道路標線、人行道、斑馬線、行人、汽車、摩托車等,這些物體在影像中具有多樣的形態和動態性,現有的鳥瞰圖語意分割模型僅專注在汽車類別上。並採用最先進的多視角鳥瞰圖語意分割
239、模型,在公開資料集 nuScenes 上訓練,將多個視角的影像數據融合,生成統一的鳥瞰圖視圖,並進行語意分割,準確識別上述多個常見的交通元素,已在臺灣複雜的交通環境上做應用。在現有的 nuScenes 開源資料集上,該研究的多視角視覺鳥瞰圖語意分割模組已達到 SOTA 表現。它能夠有效將多角度影像數據轉換為統一的 BEV(Birds Eye View)表示,並精確進行語意分割,包括道路、車輛、行人等交通元素。這為後續的動態物體行為預測、碰撞偵測模組提供準確且可靠的數據輸入。下圖為預測結果視覺化。由左至右分別為:多視角相機照片輸入、鳥瞰圖語意分割真實類別(Ground truth)、鳥瞰圖語意分
240、割預測結果。注:僅包含車輛類別。該技術的主要應用場景在於自動駕駛汽車的風險管理系統。自動駕駛需要精確的環境感知和即時風險預測,該系統為自動駕駛車輛提供一套完整的風險感知與預測模組,提升其在臺灣以及類似複雜城市街景中的行駛安全性。在更廣泛的應用中,這些技術可以融入智慧交通基礎設施,例如用於交通監控與管理系統。它們能夠判斷並預測道路上的潛在風險,幫助交通管理者分析交通數據,釐清肇事原因,擬定解決方案並且減少事故發生率。該技術有望提升公共交通安全性,特別是在行人和機車混合車流的臺灣街景中,通過更精確的風險識別與提前預警,該系統可減少交通事故,保障行人、車輛和騎士的安全。發展現況介紹應用面向85STA
241、R 軟體技術年報跨資料集應用與模型泛化,透過進行本地化部署,把目前的系統應用於臺灣街景的專有資料集上,確保模型在當地交通環境中的適應性。探索跨資料集的模型泛化能力,還能擴大系統在全球不同地區的自動駕駛應用。系統性能與實時性優化:在未來的研究中,將重點提升語意分割與行為預測的運算效率,使得這些模組能夠在更低延遲的情況下提供即時預測結果。同時,進一步優化碰撞偵測演算法的精度,使其能夠應對更加複雜且高動態性的交通環境。多模態融合:除了視覺數據之外,未來的發展可能會結合雷達、光達等其他感測技術,實現多模態數據融合,進一步提升系統的穩定性和對物體的感知精度,為自動駕駛車輛提供更全面的環境感知能力?;抖?/p>
242、鏡頭感測資料之鳥瞰圖轉換後,預測潛在碰撞事件之 AI 運算,代表著智慧車電由感知進入認知的關鍵代表性任務,是下個世代智慧車電產品重點發展目標,後續可結合資策會團隊技術資產 Formosa 臺灣街景深度學習資料庫,進一步建立臺灣智慧車電新的突破性技術,帶動臺灣車電產業升級。該研究團隊具有此領域頂尖理論與技術背景,也具有全臺灣最豐富之道路街景多元感測資料集,結合兩者優勢建立兼具前瞻性與符合國內車電產業需求之突破性技術、帶動國內車電產業持續升級,為具象徵指標性之產學合作案例。後續發展潛力結語link:https:/www.bmvc2021- 軟體技術年報4.智慧城市大型語言模型代理人系統智慧城市的發
243、展隨著全球城市化進程加速而愈加重要,如何有效運用 AI 技術來提升城市管理效率是各大城市面臨的挑戰之一。智慧城市大型語言模型代理人系統的開發,旨在整合各類數據並提供決策支援,特別針對交通管理、自主駕駛及事故預測等領域進行深度應用。儘管目前已有多項技術應用,但數據整合、即時反應、隱私保護與系統在地化仍是主要的技術挑戰。該研究由國立臺北大學資訊工程學系林道通特聘教授為計畫主持人,並由國立臺北大學資訊管理研究所戴敏育教授擔任共同主持人,以及蘇宇帆研究助理、盧信廷研究助理、籃勗祐研究助理、陳柏臻研究助理共同參與研究。在開發一個能夠整合多領域數據、提高決策精度的大型語言模型代理人系統,以提升智慧城市管理
244、的效率。重點包括解決系統的數據處理和分析問題,並探討其在交通管理中的應用潛力。該合作契機來自智慧城市對數據整合和管理效率的迫切需求,隨著 AI 技術的不斷進步,結合學術界在大型語言模型方面的技術突破,促成此次合作。在智慧城市的發展中,其針對智慧城市中的交通管理問題進行深入探索,重點聚焦於整合跨領域數據、提供決策支援。根據前瞻技術報告,該案提出一個基於大型語言模型的代理人系統架構,該系統專注於應對城市交通中的即時反應需求,同時提升數據處理的精準度。目前面臨的主要挑戰包括如何實現跨領域數據的有效整合、保障數據隱私,以及推動模型的在地化適應,這些問題是系統廣泛應用中的重要阻礙。成果雛形,智慧城市大型
245、語言模型代理人系統的部分功能已進行初步測試與驗證。系統能夠整合來自交通領域的多源數據,並在提供交通事故資訊和管理交通流量方面展示卓越的能力。系統持續對模型進行訓練,確保能快速提供使用者即時資訊,使其能夠應對不同城市的突發狀況與需求。研究目標發展現況介紹87STAR 軟體技術年報應用面向,該系統著重應用於智慧城市的交通管理領域,能夠提供即時交通狀況預測、事故預測和決策支援服務。透過數據分析,系統能幫助決策者進行更加精確的路線規劃及事件應對能力。未來系統還有望擴展應用於公共安全、環境監測等其他智慧城市的管理領域。後續發展潛力,隨著系統的進一步開發,預期將引入多模態技術來提升系統的數據處理能力和即時
246、反應能力。未來可能將系統擴展至更多的城市管理應用場景,尤其在智慧交通決策及公共安全等領域發揮關鍵作用。智慧城市大型語言模型代理人系統的開發已經在交通管理方面展示其潛力,尤其是在交通事故預測與即時反應方面表現出色。未來隨著更多技術的引入及系統的優化,該系統預計將在智慧城市的其他應用場景中發揮更大作用。此項合作不僅有助於提升城市管理效率,對智慧城市技術在國內外的推廣具有重要意義。隨著技術的不斷發展,該系統將進一步促進智慧城市的創新與發展,為城市的永續發展和市民生活品質的提升做出貢獻。結語88STAR 軟體技術年報5.使用 AutoGen 進行多模型整合於公文回覆應用 陳永耀教授在擔任臺科大 AI
247、中心主任期間,透過他在學術界與產業界的廣泛影響力與協調能力,匯集七至八位教授共同協作於生成式 AI 和大型語言模型(LLM),形成強大的跨學科團隊、集中力量攻克技術瓶頸,並致力於推動實際應用,特別是在大型語言模型的微調(Fine-tuning)、提示調整(Prompt Tuning)、檢索增強生成(Retrieval-augmented Generation,RAG)以及透過 Microsoft AutoGen 進行多模型整合方面,取得顯著成果。這種合作不僅結合團隊在生成式 AI、自然語言處理及電腦視覺領域的專業,還透過多項研究計畫與產學合作項目,對學術界與產業界產生深遠影響。該研究除教授外,
248、還有林昕駿博士生、陳尚富博士生、李尚霖碩士生、吳宜宸碩士生、徐慧哲碩士生、楊智皓碩士生共同參與。利用 ChatGPT 等大型語言模型對遊戲中的大量文字訊息進行摘要和主題分類,快速了解玩家的反饋,協助營運與後端人員定期察看各國家的摘要報告。針對長文本處理和文本主題分群,研究最佳的提示工程(Prompt Engineering)優化任務描述。Azure OpenAI 於文本分析主題模型之應用導入文本分析主題模型示意圖圖 2-28資料來源:研究計畫繪製89STAR 軟體技術年報結合大型語言模型、自然語言處理、機器人技術和數位孿生,開發智慧機器人手術輔助系統。智慧機器人能理解醫師的語音指令,根據醫學先
249、驗資訊及即時回饋進行調整與執行,提升手術效率並降低風險。近年,大型語言模型(LLM)取得驚人的發展,尤其是 2022 年 OpenAI 推出的 ChatGPT,不僅掀起全球熱潮,還推動生成式 AI 的技術革新。此後,Google 的 Gemini、Meta AI 的 LLaMA、以及 Microsoft 的 Microsoft 365 Copilot 等多款大型語言模型相繼問世,這些模型在語言理解、內容生成和任務執行上展現出前所未有的強大能力,為許多領域提供高效的解決方案。然而,單一大型語言模型在處理複雜任務時仍存在某些局限性。為克服這些挑戰,實驗室積極研究 Microsoft 的 AutoG
250、en 框架,探索多個大型語言模型協同工作的新模式。AutoGen 的核心理念是知人善任、各司其職,將不同的模型作為專門的代理人(Agent),每個代理人負責特定任務,通過協作解決複雜的問題。生成式 AI 於醫學場景的應用發展現況與結語生成式 AI 於醫學場景應用之系統概念圖圖 2-29資料來源:研究計畫繪製90STAR 軟體技術年報AutoGen 的優勢 在於它突破單一模型能力的限制。透過多模型協同工作,AutoGen 不僅能更全面地理解和處理複雜的內容,還能提供更智慧、更具針對性的解決方案。這使得它在生成式 AI 領域中表現出巨大的潛力,尤其在需要多步驟解決方案和跨領域的複雜任務中,Auto
251、Gen 展現卓越的應用前景??蓱迷谙铝袔讉€情境:智慧客服與自動化交互,AutoGen 可以整合多個語言模型,實現智慧客服系統中更具人性化的自動回應,處理更高難度的客戶需求,並能根據不同語境靈活應對。數據分析與內容生成,通過 AutoGen,企業可以同時運行不同的模型分析大型數據集,並生成定制化的報告和見解,從而提高效率??珙I域協作與解決方案提供,AutoGen 能夠協同不同模型,如自然語言處理、圖像識別和數據推理模型,共同完成跨領域的複雜任務,推動自動化系統的智慧升級。隨著生成式 AI 的持續發展和應用場景的不斷擴展,AutoGen 技術有望在多領域中發揮更為關鍵的作用。實驗室將繼續深入研究
252、和優化這一框架,以實現更多具體且實際的應用,推動智慧科技的進一步發展。透過 AutoGen 整合複數大語言模型,並應用於智慧答詢系統圖 2-30資料來源:研究計畫繪製Retrieve User Proxy Agent法規 Assistant AgentRAGUser ProxyAgentInput:人民陳情公文Retrieve User Proxy Agent回覆 Assistant Agent臺北市單一陳情系統HELLO TAIPEIRAG勞動基準法Output:回覆公文91STAR 軟體技術年報6.AI-Native O-RAN RIS 技術基於國科會調控電磁環境之可重構智慧面雛形平臺開發
253、計畫的前瞻性展望,結合學術界、法人機構及產業界在電磁學、系統與網路領域的研究能量,中正大學電機系無線通訊實驗室團隊與資策會自 2022 年 6 月起正式展開針對 O-RAN RIS 技術的合作研究,並由該國科會計畫的子計畫主持人陽明交通大學連紹宇教授以及共同主持人宜蘭大學曾志成教授負責與資策會進行 O-RAN 技術的相關研究。該研究針對第五代行動通訊(5G)多元存取網路架構中的開放式無線存取網路(Open Radio Access Network,O-RAN),將中正大學團隊開發的可重構智慧面鏡(Reconfigurable Intelligent Surface,RIS)、資策會研發的開放式
254、 5G 核心網路,結合光寶科技的 5G 商用 O-RAN 基站與仁寶電腦的商用使用者設備(User Equipment,UE)進行整合,旨在構建一個更加智慧化的通訊網路平臺。2023 年 3 月初步完成的 RIS 與 O-RAN 的整合,中正大學團隊開發 FR1 頻段的 RIS 並與資策會合作完成 RIS 與 O-RAN 的初步整合,成為 O-RAN RIS 的架構。近即時智能控制器(Near-Real Time RIC,Near-RT RIC)與開放式 5G gNB 的中央單元(Central Unit,CU)以及集中式單元(Distributed Unit,DU)透過 E2 介面(E2 A
255、gent)連接,進行 RAN 的相關資料進行分析,如接收資訊與品質等。為實現 O-RAN RIS 之場景,可重構智慧表面(RIS)的 RIS 控制器將透過 E2 介面與 Near-Real Time RIC(近即時無線存取網路智慧控制器)連接成為新網元,如圖 2-31 所示。O-RAN RIS 架構的基本訊號傳遞流程如圖 2-32。發展現況介紹RIS 透過 E2 介面與 Near-Real Timee RIC 串接成為 O-RAN 的新網元圖 2-31資料來源:研究計畫繪製Service Management and Orchestration FrameworkO2O1E2O-eNBNon-
256、Real Time RICE2E1F1-cE2E2E2O1F1-uNear-Real Time RICO-CU-CPO-DUO-RUO-CloudO-CU-UPNew network elementRISControllerRISLegendX2-cX2-uNG-uXn-uXn-cNG-cOpen FH M-PlaneOpen FH CUS-PlaneOpen FH M-Plane3GPP interfacesO-RANInterfaces forfuture study92STAR 軟體技術年報該團隊與資策會共同開發的 O-RAN RIS 技術,透過圖 2-32 所示的傳遞流程,已初步完成單
257、一 UE 與 O-RAN RIS 的通訊測試,架設情況如圖 2-33 所示。測試場景設計為當UE 在面對 RIS 的方向上,由右側+40逐步移動至左側-40範圍內。在系統尚未精確定位 UE 時,UE 會回傳不佳的接收資訊,包括 RSRP(Reference Signal Received Power)、RSRQ(Reference Signal Received Quality)、及 SINR(Signal-to-Interference-plus-Noise Ratio)至 Near-RT RIC。此時,RIC 將持續發送 40範圍內的波束掃描指令給 RIS,直到收到滿足閾值要求的 UE 接
258、收資訊,才停止掃描。在該實驗中,以 RSRP 作為訊號品質判斷的主要標準,其閾值設定為-102 dBm。量測結果顯示,當系統尚未找到 UE 時,RSRP 值介於-105 至-110 dBm 之間,RSRQ 值介於-11 至-10 dB,SINR 值則落在 15 至 23 dB 之間;當系統成功找到 UE 後,穩定的接收資訊顯示 RSRP 為-100 dBm、RSRQ 為-10 dB、SINR 為 23 dB。O-RAN RIS 的基本訊號傳遞流程圖 2-325GCore Network5G gNBO-RAN E2RIS reflectionphase adjustmentRIS Control
259、lerBetter RX signal qualityPoor RX signal qualityRSRP/RSRQ/SINR/throughput5G UERIS3GPP NGdownlinktrafficE2 AgentPredict and decidereflection phases of RISxAppE2 Agent12456387O-RANNear-RT RIC資料來源:該研究計畫繪製93STAR 軟體技術年報O-RAN RIS 與單一 UE 的通訊場景測試架設圖 2-33資料來源:研究計畫繪製2024 年 7 月驗證 AI-Native O-RAN RIS 的單 UE 追蹤技
260、術,為實現如自動化流量調控、智慧波形設計等創新無線通訊功能,最大程度發揮 RIS 主動重塑電磁環境的潛能?;渡系腛-RAN RIS 架構,輔以 AI-Native 智慧網路強大的運算能力,將能充分釋放兩者的協同優勢,為 5G/6G 系統帶來全方位的性能增強,助力實現萬物互聯、全球無縫覆蓋的通訊願景。AI-Native O-RAN RIS 使 RIS 透過人工智慧算法調控大量可程式化無源天線元件,能主動重塑無線電磁環境,突破傳統被動環境的限制。RIS 不僅能補足無線覆蓋死角、延長傳輸距離,更能顯著提升頻譜和能量利用效率,對提升整體網路性能、節省基礎設施部署成本等具有重大意義。94STAR 軟體
261、技術年報AI-Native O-RAN RIS:單一 UE 追蹤場景(a)系統方塊圖(b)實際拍照圖(a)(b)圖 2-34資料來源:研究計畫繪製該研究團隊以及資策會將 AI-Native 技術融入 O-RAN RIS,透過 AI/ML 演算法,將實際 UE 的移動,並考慮環境變因,如溫濕度變化、人們走動、以及場景的牆壁等因素影響的接收情形收集成為演算法的資料集。Near-RT RIC 根據設定的接收強度(RSRP)的閾值去判斷 UE 的狀態,若低於閾值,則判斷 UE 改變位置,RIC 上的演算法根據訓練的資料集判斷UE 的可能位置,發出相對應的波束控制,使 UE 保持良好的接收品質,達到 U
262、E 的追縱。目前已進行 UE 追縱的系統量測驗證,系統拍照以及方塊圖如圖 2-3495STAR 軟體技術年報AI-Native O-RAN RIS:單一 UE 追蹤場景結果圖 2-35資料來源:研究計畫繪製此驗證方式是讓自走車承載 UE 以 0.38/S 的速度在 30 來回移動,並在隨機幾個角度停止10秒再移動,UE接收的接收強度(RSRP)的閾值為-94 dBm,當UE移動且RSRP低於-94 dBm 時,Near-RT RIC 會透過演算法判斷 UE 的移動方向並下達波束控制。結果如圖 2-35,證明 Near-RT RIC 可追蹤到 UE 的位置,使 UE 接收的 RSRP 幾乎穩定在
263、閾值-94 dBm 以上。透過該計畫的執行,中正大學無線通訊實驗室團隊與資策會在 O-RAN RIS 技術領域的合作對於5G甚至未來6G系統的發展有一定的潛力。該研究不僅完成RIS與O-RAN的初步整合,還成功驗證 AI-Native O-RAN RIS 在單一用戶追蹤技術上的應用。該研究的成果不僅為提升無線通訊品質、擴大覆蓋範圍及提高頻譜利用效率奠定基礎,更為未來實現萬物互聯的通訊願景提供切實可行的解決方案。展望未來,將持續深化與各方的合作,進一步探索和優化 O-RAN RIS 技術的應用,促進智慧網路的發展,以滿足日益增長的通訊需求。結語96STAR 軟體技術年報7.AI 原生 O-RAN
264、 架構中的策略驅動流量導引技術隨著 5G 網路技術的快速發展,如何在提供高效、穩定的連線品質的同時,動態管理網路資源成為業界面臨的重大技術挑戰。當前的網路管理需要在不同的情境下靈活調整基站運作,以滿足用戶的多樣化需求,這對於提高網路效率和降低能源消耗尤為重要。然而,現有的網路架構中,Non-RT RIC 和 Near-RT RIC 之間的串聯機制尚未得到充分驗證,尤其是在 A1 Policy 的制定、傳輸和解析方面,還缺乏有效的解決方案。該研究主要由國立宜蘭大學曾志成教授與游竣棋研究生共同擔任。該合作旨在透過開發基於 Policy 來運行的 TS xApp 來驗證中正大學資工系所發展的Non-
265、RT RIC 平臺在不同應用場景中的功能,尤其是針對 A1 介面的功能進行測試。由於目前中正大學資工系的 Non-RT RIC 平臺尚未在多樣化的情境下得到充分驗證,為確保其能有效運作,該研究設定以下具體目標:根據 A1 Policy 的格式,設計 TS xApp,確保其能處理Non-RT RIC 通過 A1 介面下達的流量調控 A1 Policy。該研究的契機源自於當前產業在 5G O-RAN 技術上的挑戰與突破需求,學術界與業界的緊密合作變得尤為重要。該團隊先前曾與資策會軟體院合作,修改由 O-RAN Software Community(OSC)所 釋 出 的 一 系 列 針 對 Nea
266、r-RT RIC 的 xApp,包 括 TS xApp、Anomaly Detection(AD)xApp、Quality of Experience Predictor(QP)xApp 以及 KPI Monitor(KPIMON)xApp,並成功將其整合運行於 Near-RT RIC 後對其功能進行全面的驗證。這些技術成果為後續的深度合作奠定堅實基礎,也促成此次進一步合作的契機。針對 ES 情境中遇到的具體問題提出相應的解決方案。如圖 2-36 所示,在被 1 個大基站(編號為 1)與 4 個小基站(編號為 2,3,4,5)所共同涵蓋的環境下,依序在小下行流量需求與大下行流量需求的條件下進行
267、下 ES 的驗證。如圖 2-36-(a)所示,第一階段考慮在小下行流量需求時,ES 的 Policy 是將大基站 1 開啟,小基站 2、3、4 和 5 關閉。然後,如圖2-36-(b)所示,第二階段則考慮在大下行流量需求的條件下,小基站 2、3、4 和 5 被開啟而大基站 1 的服務範圍則因發射功率被降低而縮小。研究目標發展現況介紹97STAR 軟體技術年報ES 情境之示意圖ES 情境下的系統架構圖圖 2-36圖 2-37資料來源:研究計畫繪製資料來源:研究計畫繪製第一階段第二階段如圖 2-37 所示,所設計的 TS xApp 必須能夠接收來自 Non-RT RIC 中的 rApp 所傳遞的
268、A1 Policy,並發出相應的控制指令,包含:UE 的換手、啟動或關閉小基站以及調整大基站發射功率等。此外,TS xApp 會透過傳遞 Feedback 請求來將所收到的 Indication Report 內容通知 Non-RT RIC 中的 rApp 俾利其下達新的 Policy 來更新 Near-RT RIC 內的 TS xApp 的調控準則。Non-RT RICA1 PolicyA1 interfaceFeedbackrApp5G RAN EmulatorE2 AgentNear-RT RICQP xAppTS xAppAD xAppKPIMON xAppIndication Rep
269、ortE2 interfaceHandover ControlorSmall Cell ON/OFForAdjust Macro Cell TX power98STAR 軟體技術年報TS xApp 接收到的 A1 Policy圖 2-38資料來源:研究計畫繪製當 ES 模擬情境從第一階段轉換到第二階段時,TS xApp 檢測到因為環境負載增高,導致 80%之 UE 下載需求量無法被滿足。TS xApp 透過將 description 欄位設為 201 的Feedback 請求訊息傳送給 Non-RT RIC,藉此來反映目前的環境中下行流量需求增加的狀況,如圖 2-38-(a)。在 Non-RT
270、 RIC 內的 rApp 接收此 Feedback 請求訊息後便下達新的A1 Policy 給 Near-RT RIC。根據所收到之新的 A1 Policy 的內容,TS xApp 先發出開啟 2、3、4 和 5 號小基站的控制指令,並在 10 秒後下達降低 1 號大基站發射功率的控制指令。反之,當 ES 模擬情境從第二階段回到第一階段時,環境內的下行流量需求開始降低。當 TS xApp 觀察到所有小基站的 PRB(Physical Resource Block)剩餘率大於 80%且大基站的PRB 剩餘率大於 50%。TS xApp 首先主動下達增加 1 號大基站發射功率的指令,隨後回應 de
271、scription 為 200 的 Feedback 請求訊息給 Non-RT RIC。接著,當 TS xApp 接收到Non-RT RIC 下達如圖 2-38-(b)的 A1 Policy 後,先送出控制訊息將所有 UE 換手至 1 號大基站。10 秒後,TS xApp 再發出關閉 2、3、4 和 5 號小基站的指令,藉此達到 ES 的目的。(a)TS xApp 回應 Feedback 中的description 是 201 時(b)TS xApp 回應 Feedback 中的description 是 200 時99STAR 軟體技術年報ES 情境在第一階段 5 個基站剩餘的 PRBES
272、情境在第二階段且 TS xApp 未實施任何控制前 5 個基站剩餘的 PRB圖 2-39圖 2-40資料來源:研究計畫繪製資料來源:研究計畫繪製目前的模擬初步成果已通過 Grafana 進行展示,並顯示出 TS xApp 在不同階段對基站管理的有效性。首先,在 ES 情境的第一階段,如圖 2-39 所示,模擬環境中僅有 5 個 UE,因此 1 號大基站能夠輕鬆應對這些需求。當進入第二階段時,UE 數量增加至 30 個,導致 1號大基站的 PRB 被完全佔用,無法滿足所有 UE 的下載需求。100STAR 軟體技術年報經過 TS xApp 下達控制指令後 5 個基站剩餘的 PRB經過 TS xA
273、pp 下達控制指令後 5 個基站剩餘的 PRB圖 2-41圖 2-42資料來源:研究計畫繪製資料來源:研究計畫繪製從圖 2-41 可以看到,在 TS xApp 下達指令開啟 2、3、4 和 5 號小基站並在 10 秒後下達將 1 號大基站發射功率降低的控制指令後,所有 5 個基站均有 UE 服務,且沒有基站的PRB 被耗盡,這表明每個 UE 的下載需求都得到滿足。當 ES 情境返回到第一階段時,模擬環境中的負載明顯降低。在 TS xApp 下達調大 1 號基站發射功率的指令並將所有 UE 都成功換手至 1 號大基站,TS xApp 在 10 秒後便發出關閉 2、3、4 和 5 號小基站的指令。
274、最終結果如圖 2-42 所示,此時僅需 1 號大基站便可滿足所有 UE 的下載需求。101STAR 軟體技術年報該研究主要聚焦於 Near-RT RIC 內部的 TS xApp,並探討如何根據 Non-RT RIC 透過A1 介面下達的 A1 Policy 來實現流量調控與引導。此項技術的應用在 5G O-RAN 中具有重要的實踐價值,尤其是在動態網路管理和資源優化方面。通過成功驗證 A1 介面的串接以及對 A1 Policy 格式的制定和解析,該技術能夠協助電信業者更靈活地調控網路流量,確保用戶體驗的穩定與網路性能的最大化。這項研究成果可廣泛應用於 5G 網路的商業場景中,如智慧城市、交通管
275、理、能源節約等,通過動態調整基站負載和優化資源配置,降低營運成本並提升網路效能。此外,藉由此技術,電信業者可以在特定情境下提供定制化的網路服務,以應對不同用戶需求,達成更精細化的流量管理。這項技術的未來發展潛力極為廣闊。首先,針對 Non-RT RIC 與 Near-RT RIC 之間 A1介面政策傳輸與解析的研究,未來可以進一步擴展至更多樣化的網路場景,實現更高效的網路自動化和智慧化流量管理。這項技術將可幫助營運商在面對日益增長的數據需求時,動態調整網路資源,達到更佳的服務質量和能源效率。此外,隨著人工智慧與機器學習技術的進一步整合,TS xApp 未來將具備更強大的預測與自適應能力,能夠根
276、據網路狀況即時調整政策,提升網路的靈活性與響應速度。這項技術在自駕車輛、物聯網以及大規模工業自動化等新興領域中,也將展現其強大的應用潛力,為未來的網路技術創新奠定基礎。該研究成功驗證 Non-RT RIC 與 Near-RT RIC 之間的 A1 介面功能,並展示 TS xApp 在流量調控與導引中的實際應用。透過這次合作,不僅解決 A1 Policy 制定與解析的技術挑戰,還實現在實際模擬環境中的有效部署,為 5G 網路 ES 的動態管理提供可行的解決方案。未來的合作將可以在此基礎上進行更深入的技術擴展,如增強 A1 介面的靈活性與適應性,並引入更先進的自動化技術。隨著 6G AI-Nati
277、ve O-RAN 架構的興起與發展,該研究奠定長期合作的基礎,未來可以共同開發更多應用場景,進一步推動網路技術創新,實現更高效、智慧化的網路效能優化與管理。該合作不僅在學術界具有重要意義,為 5G O-RAN 管理中的 A1 Policy 進行 ES 的控制與流量調控提供創新解決方案,還對產業界有著深遠的影響。該技術的成功驗證,為電信營運商提供實際操作的依據,有助於提高網路資源利用效率並降低營運成本。從長遠來看,此技術不僅可提升 5G 網路的 ES 管理效率,還為 6G AI-Native O-RAN 技術的發展奠定基礎。在更廣泛的社會層面,這項合作將促進智慧城市、物聯網和自動駕駛等領域的應用
278、發展,並通過節能減排的技術支持,對全球的可持續發展目標產生積極的影響。結語102STAR 軟體技術年報國際重要學術期刊與會議摘要本節將國際上重要的 AI 相關學術期刊與會議摘要介紹,以方便找尋對應的重要技術期刊或會議。4重要學術期刊介紹 Artificial Intelligence(AI)Journal發行機構為 Elsevier,這是 AI 領域歷史最悠久且具影響力的期刊之一,涵蓋 AI 基礎理論、應用、以及最新技術發展。特色為發表大量 AI 核心理論、演算法、知識表達、推理、機器學習等方面的研究。Journal of Machine Learning Research(JMLR)發行機構
279、為 Microtome Publishing,JMLR 專注於機器學習理論、方法和應用,並具有較高的影響力和引用率。它是機器學習研究者的重要參考來源。特色為發表最新的機器學習理論發展和應用成果,文章質量高且深度分析為主。IEEE Transactions on Neural Networks and Learning Systems(TNNLS)發行機構為 IEEE,該期刊專注於神經網路和學習系統,涵蓋深度學習、神經網路應用和學習演算法。特色為聚焦於神經網路的最新理論、架構與應用,並且廣泛應用於智慧系統。Pattern Recognition發行機構為 Elsevier,主要關注模式識別領域的
280、研究,包含影像處理、視覺感知、模式分類等。特色為電腦視覺與 AI 研究的核心期刊,著重於技術應用與方法的發展。AI and Society發行機構為 Springer,該期刊探索 AI 技術對社會、文化、倫理等層面的影響。特色為 以跨學科方式探討 AI 的社會影響,適合涉及 AI 倫理與社會責任的研究者。Journal of Artificial Intelligence Research(JAIR)發行機構為 AI Access Foundation,JAIR 專注於 AI 的理論、技術及應用,享有良好聲譽。特色在於快速發表高質量的論文,涵蓋知識表達、推理、機器學習及多智慧體系統等主題。IE
281、EE Transactions on Pattern Analysis and Machine Intelligence(TPAMI)發行機構為 IEEE,該期刊專注於模式分析和機器智慧,涵蓋電腦視覺、圖像處理及模式識別。特色是發表深度與廣度兼具的研究,重點在於創新算法及其應用。1234567103STAR 軟體技術年報 Machine Learning Journal(MLJ)發行機構為 Springer,MLJ 專注於機器學習的理論與實踐,涵蓋從基礎理論到算法開發的範疇。特色在於推動前沿研究,強調理論與實驗的關聯。Neural Networks發行機構為 Elsevier,該期刊專注於神經
282、網路及其應用,涵蓋深度學習、機器學習和神經計算。特色在於發表關於神經網路模型、算法及其在不同領域應用的創新研究,促進相關技術的發展。89重要研討會介紹 Neural Information Processing Systems(NeurIPS)會議簡介:NeurIPS 是 AI 與機器學習領域規模最大、最具影響力的國際會議之一。涵蓋神經網絡、深度學習、強化學習、數據科學等技術。特色:每年吸引來自學術界和產業界的大量研究者參加,發表最新的技術研究和應用。International Conference on Learning Representations(ICLR)會議簡介:ICLR 專注於深
283、度學習和表徵學習的最新進展,涉及如何通過數據表示優化模型性能。特色:探討深度學習中的創新理論和實踐,適合深度學習研究者參加。International Joint Conference on Artificial Intelligence(IJCAI)會議簡介:IJCAI 是 AI 領域歷史悠久且聲譽卓著的國際會議之一,主要涵蓋廣泛的 AI 研究主題,如推理系統、知識表示、機器學習等。特色:與 AAAI 共同主辦,匯集了全球頂尖AI 研究人員,討論 AI 的最新進展和應用。Association for the Advancement of Artificial Intelligence(AA
284、AI)Conference會議簡介:AAAI 是美國最具影響力的 AI 學術會議之一,涵蓋 AI 研究的理論基礎和前沿應用。特色:重視理論研究與實踐應用的結合,是 AI 研究界的頂級盛會。Conference on Computer Vision and Pattern Recognition(CVPR)會議簡介:CVPR 是電腦視覺和模式識別領域最具影響力的國際會議之一,吸引了大量 AI 和視覺計算研究者。特色:發表電腦視覺、圖像處理、模式識別等領域的最新研究成果。International Conference on Machine Learning(ICML)會議簡介:ICML 專注於機
285、器學習的理論與應用,涵蓋廣泛的研究主題,包括算法、模型和實驗。特色:這是機器學習領域的頂尖盛會,匯聚全球頂尖學者,討論最新的研究成果及應用技術。123456104STAR 軟體技術年報第三章、軟體院 AI 領域前沿研究成就本章介紹資策會軟體院在 AI 領域研究多年耕耘成果獲得國際大獎之相關技術,以及協助臺灣數位產業公私協作方式建立公共智慧服務基盤,並且資策會本身策略性投資的可信任生成式 AI 企業應用發展、未來移動安全信賴生態發展等兩項重要研究介紹,歡迎有興趣的產官學研各界共同合作發展 AI 軟體生態系。國際獎項肯定Artificial Intelligence Excellence Awar
286、ds資策會軟體院在 AI 技術佈局多年,已陸續得到國際大獎肯定,包含 2024 年所獲得的 Artificial Intelligence Excellence Awards、WITSA Global ICT Excellence Awards、R&D 100 Awards 三項大獎:資策會軟體院在數位發展部數位產業署補助之智慧移動空間感知協作與智慧分析系統研發暨應用計畫,針對路口通行之弱勢輪椅用路人與緊急需求救護車,結合 AI 影像辨識技術,發展可提醒車輛禮讓之警示系統,目前已導入臺北市士林區新光醫院周邊道路進行實證,提升醫院附近往來的人車安全。該計畫針對路口安全,以 AI 深度學習技術,發
287、展生命守護通道系統,透過路側攝影機結合 AI 影像辨識技術,能夠準確辨識行人穿越道上的輪椅使用者,提醒即將通過的車輛注意,降低碰撞危險;同時系統也能在路口偵測通過的救護車,預先提醒下一路口車輛禮讓,從而提高救護車的路口安全和救護效率。1105STAR 軟體技術年報生命守護通道系統的優勢在於針對弱勢行人與緊急車輛的特殊辨識需求,能有效識別通過路口的輪椅使用者和救護車。其中,在日間的辨識準確率約92%,在夜間及雨天平均也有約 9 成的準確率。除了辨識效果佳,該技術能根據道路事件資訊進行數據分析,像是輪椅穿越路口頻率、救護車通過對旅行速度影響等,同時,也能進行道路車流預測。而這些數據內容將以可視化圖
288、形呈現,方便道路管理單位快速掌握路口重要資訊,以此調整交通管理策略,改善路口安全。因此該系統於 2024 年 4 月榮獲 Business Intelligence Group 美國商業協會所頒發之 Artificial Intelligence Excellence Awards(人工智慧卓越獎)(圖 3-1)。由,旨在表彰在人工智慧領域中具有顯著影響的個人、組織和產品。該獎項競爭激烈,每年僅選出少數的優秀參賽者。資料來源:資策會軟體院生命守護通道系統榮獲國際 2024 Artificial Intelligence Excellence Awards圖 3-1106STAR 軟體技術年報W
289、ITSA Global ICT Excellence Awards資策會軟體院在數位發展部數位產業署的支持下,成功運用交通安全防護 AI技術打造生命守護通道系統,利用 AI 影像辨識輪椅與救護車,提醒車輛主動禮讓,此項智慧交通系統,2024 年 10 月 7 日在亞美尼亞共和國 WCIT 2024 舉行的 WITSA 全球頒獎典禮上,該系統一舉奪下媲美資通訊界奧斯卡的 2024 年WITSA ICT Excellence Award智慧城市獎首獎。WITSA ICT Excellence Award智慧城市獎是由世界資訊科技暨服務業聯盟(World Information Technology
290、 and Services Alliance,WITSA)所頒發的全球性獎項,主要在表彰智慧城市技術領域中展現出色成就的項目或組織。該獎項強調智慧城市技術在提升城市管理、能源效率、交通控制、數位基礎設施等方面的應用,推動城市的可持續發展和智能化進程。資策會研發的生命守護通道系統從眾多方案中脫穎而出。該系統是以資策會自行研發的 Sardina AI 數據集進行混合車流環境的影像辨識訓練,場域實測階段該系統部署在臺北市士林區新光醫院周邊進行實地應用,聚焦行人與車輛的安全性。透過路側攝影機與 AI 技術的結合,系統能夠辨識輪椅使用者和救護車的通行狀況,並即時通知其他駕駛人減速讓道,降低事故風險,協助
291、緊急救援效率。除此之外,系統還具備路口事件分析與車流預測功能,透過可視化圖表,協助交通管理單位做出更好的決策以支援路口安全應用。並與產業夥伴合作,將交通安全防護 AI 技術應用於即時偵測路口交通,無論是白天黑夜或是晴天雨天系統皆能運作。截至 2024 年 9 月底,該技術已經在臺北、新北、臺中、高雄等地超過 200 處佈建使用。未來,資策會將持續推動技術優化,並促進交通數據加值應用,為臺灣智慧交通的發展提供有力支援,提升駕駛人對交通規則的遵守意識。107STAR 軟體技術年報R&D 100 Awards資 策 會 軟 體 院 開 發 的5G 及 AI 賦 能 的 智 慧 床 墊 照 護 系 統
292、(iMat for Smart Care)和交通安全防護 AI 技術榮獲 2024 年 R&D 100 Awards,展現臺灣在 AI 技術領域的卓越實力。長照機構中的跌倒事件頻(繁體版)發生,主要原因是照護人員無法隨時陪伴,而長者夜間自行起床或步態不穩。為解決此問題,數產署致力推動數位賦能的相關應用,支持資策會軟體院運用 AI 技術整合仁寶電腦的 5G通訊系統,並結合維思感創的智慧床墊,開發出5G 及 AI 智慧床墊照護系統。此系統可在長者起床前 90 秒發出預警,讓照護人員提前介入,預防跌倒,解決傳統靠頻(繁體版)巡房的困擾,顯著降低跌倒風險,已在永信心佳社區長照機構應用,惠及超過 5,4
293、00 人次。資料來源:資策會軟體院生命守護通道系統,透過 AI 影像辨識技術,當輪椅和救護車通過路口時,路邊警示標誌提醒車輛留意弱勢行人與救護車通行圖 3-2108STAR 軟體技術年報另外,資策會軟體院與雷昇科技合作,運用交通安全防護 AI 技術,結合影像辨識、軌跡追蹤、車牌辨識等技術,即時偵測路口交通違規行為,無論是左轉、闖紅燈或車道違規,都能準確識別。該技術可在混合車流環境中運作,且不受天氣或光線影響,顯著提升執法效率與行車安全。實施後,違規行為減少 42%。該技術基於臺灣的多元車流數據訓練,精準識別各類車輛與行為,截至 2024 年6 月已於全臺灣北中南 200 多處路口部署,並榮獲
294、2024 年全球百大科技研發獎。這些獲獎技術的成功推動得益於數位發展部及經濟部的支持,資策會持續致力於創新研發,為智慧長照與交通安全提供有效解決方案,提升臺灣科技的國際形象。資料來源:資策會軟體院資策會軟體院研發的5G 及 AI 賦能的智慧床墊照護系統、交通安全防護 AI 技術勇奪 R&D 100 Awards 全球百大科技研發獎,圖為資策會副執行長楊仁達(後排左五)、數發部數產署通傳組副組長陳慧慧(後排左六)、資策會軟體院副院長蔡澤銘(後排左七)與獲獎團隊及合作廠商共同合影圖 3-3109STAR 軟體技術年報產業躍升:為臺灣數位產業打好公共智慧服務基盤為加速產業開發 AI 驅動之智慧公共服
295、務,帶動以程式碼、數據、算力為基礎的軟體基盤發展,期能解決資服業者重複開發投資的痛點,促進產業跨域合作和創新數位經濟發展,資策會規劃與建置所需的公共智慧服務基盤(PISA,Public Intelligent Service Architecture),吸引資服業者,以公私協力方式,參與智慧公共服務的打造,發展有感的數位公共智慧服務。隨著數位化的迅速進展,數位公共智慧服務系統,在數位轉型、治理和數位生態方面顯得至關重要,尤其在 OpenAI 的 ChatGPT 發表後,引爆一股生成式 AI 熱潮,資服業者前仆後繼嘗試投入 AI 模型訓練;甚至政府需要制定整體數位公共智慧服務推動戰略和數位治理政
296、策。生成式 AI 的使用需要串聯多種訓練資料、再進行 AI 模型訓練,進而衍生大量算力需求,故公共智慧服務基盤需要提供以下重要的三元素。訓練資料、AI 模型以及大量算力為 AI 必備三元素 AI 模型訓練需要訓練資料、模型和大量算力,這些因素已成為發展 AI 應用的痛點。對於資服業者來說,這三者的高成本和需求迫切需要解決方案。新創團隊過去往往得自行處理所有訓練資料與工具,導致開發過程困難重重。我國資服業者面對 AI 模型訓練時,因資源限制,只能利用通用型語言模型進行初步練習。但通用模型難以直接應用於特定領域,還需客製化導入專業知識,才能符合實際需求。AI 模型訓練的另一大挑戰是算力需求。模型訓
297、練需要大量的算力來進行反覆嘗試與優化,才能達到高精準度的成果。算力的高成本與資源短缺,使許多新創團隊難以實現其雄心壯志,導致許多項目因無法持續進行而中途放棄。訓練資料AI模型大量算力2110STAR 軟體技術年報公共智慧服務基盤加速發展,開發省時省力開源共享,公共智慧服務落地公私協力共創,促進數位公共智慧服務應用為解決資服業者在開發 AI 應用過程中的痛點,PISA 匯集有訓練資料、算力與 AI 模型,讓業者能更快開發並部署 AI 應用程序,且可進行資源共享。就像政府建設工業區,PISA 為資服業者準備了所需的基礎設施,幫助業者快速跨越 AI 訓練門檻。例如某資服業者欲開發金融服務,但缺乏數據
298、,透過 PISA 可直接取得相關訓練資料與模型,結合專業知識快速開發。此外,平臺還會推薦相關數據的應用範例與開源程式碼,提供新創團隊參考,提升開發效率。PISA 的資料與程式碼都經過隱私與資安驗證,業者可放心使用,專注於開發需求解決方案,避免重複開發,進而降低成本。過去 3 個月的開發時程,透過PISA 可縮短至 1.5 個月,節省 50%以上的時間與資源。PISA 基於普惠共享理念,鏈結政府與企業訓練資料,透過區塊鏈技術存證,實現規範、互信的資料交換,並串接第三方線上計費及金流服務。大語言模型 Llama2 7B 訓練微調需使用雲端 GPU 跑 7 天,用 PISA 僅需半天。還提供戰情室觀
299、測系統,讓用戶了解使用狀態。此外,PISA 提供 AI 模型程式碼的資安檢核、弱點掃描及 SBOM 分析,確保在安全環境中進行開發。透過 PISA,業者可根據不同應用場景打造數位公共智慧服務及AI 解決方案,強化軟體的公共基礎建設。舉例來說,PISA 可幫助社福機構簡化(繁體版)瑣的核銷流程,透過串接不同單位的資料庫,並使用 AI 模型自動辨識單據,提升效率。對於照顧機構,PISA 可生成智慧照顧文件,減少人力負擔,讓員工有更多時間關注長者需求與提供貼心服務。公共智慧服務基盤將是臺灣數位產業發展及數位轉型的重要基礎建設,以生態系發展方式,引導公私協力創新,催生典範公共智慧服務,期盼建構良好 A
300、I 產業發展環境。以軟體基盤為基礎,資服業者可放心在平臺上設計解決方案,為消費者打造更好的產品與服務。未來,業者可利用與貢獻公共智慧服務基盤,產生良善的數位生態系;PISA 也可進行典範轉移,擴及到其他數位公共建設,促進公共服務共創,推進基礎建設領域的建設,為臺灣打造優質的數位產業生態系,提升數位國力。111STAR 軟體技術年報可信任生成式 AI 企業應用發展隨著人工智慧的快速發展,AI 取代部分工作已經成為現實,尤其是在知識密集的文書工作領域,如辦公室和行政支援、律師助理、會計等,AI 的影響尤為顯著。根據國際市場調查機構 Statista 公布資料,臺灣生成式 AI 市場規模 2024
301、年將達 3 億美元,預估成長至 2030年 29.5 億美元,年複合成長率(CAGR)為 40%。然而如何導入可信任的生成式 AI應用,仍是各企業必需面對的關鍵議題。此研究鎖定知識型工作者的“生成式 AI 企業應用”市場區隔,包括各行業需要處理大量文書和數據分析工作的專業人士。針對生成式 AI 企業應用“需求方”(民營及公營)及“供給方”(資服業)之目標市場,以“成為我國生成式 AI 企業應用數位信任治理第三方服務領導者”為市場定位,協助企業確保生成式 AI 應用的透明度、安全性和可靠性,助力企業實現更高的價值創造和業務增長。因此資策會為了提供企業或政府單位對部署生成式 AI 的以上需求,故將
302、致力成為政府及企業在數位轉型過程中的重要合作夥伴,結合 one III 四大主軸能量,建立 AI 133 Lab 品牌,提供基礎素養培育顧問服務(Awareness)、需求分析規劃顧問服務(Blueprint)、系統架構輔助顧問服務(Co-Pilot)、開發技術輔助顧問服務(Development)、評測輔助顧問服務(Evaluation)。為了完善產業生態系,也同時提升產業的國際競爭力,故資策會致力以第三方的角色提供推動技術與標準合規認證服務,提供數位轉型諮詢、前瞻產業智庫與專業人才培育,填補產業標準規範、資安服務需求及技術諮詢等產業的不足。故此計畫案為提供需求端及供給端專業第三方服務,團隊
303、持續建立與提升專業顧問所需之能量,包括以下四類概略說明:資料來源:資策會軟體院生成式 AI 企業服務能量建構圖 3-4服務能量建構診斷:梳理數位需求生成式AI企業大腦開發指引企業知識庫工具快速建立GenAI雛形應用以及評估導入成效資策會場域實證Akasha(2024年7月正式發表)策略:訂定發展方向培育:建構數位知識共創:協作可行方案次世代GenAI KM專案預結小幫手(1)結案報告小幫手(2)經費預結小幫手(3)績效指標小幫手決策輔助智慧助手安全合規建立數位轉型方法論制定GenAI企業開發指引建構GenAI企業應用平臺展開GenAI開發評測工具3112STAR 軟體技術年報建立數位轉型方法論
304、,輔導協助企業有系統有效率的分析及導入數位轉型及 AI 應用,此方法論包括“共創:協作可行方案”、“培育:建構數位知識”、“策略:訂定發展方向”、“診斷:梳理數位需求”。制訂生成式 AI 企業應用指引,此指引目的為協助軟體開發者快速掌握生成式 AI 企業大腦開發基礎與能量,並於 2024 年 7 月於資策會官網正式對外發表。指引內容包括生成式AI 企業大腦概述、生成式 AI 企業大腦開發方法、資料前處理、大型語言模型訓練、大型語言模型評測、及企業大腦應用執行環境建構等六章節。建構生成式 AI 企業應用平臺,以資策會為場域建立生成式 AI 企業應用實證,發展“次世代 GenAI KM”及“專案預
305、結小幫手(包括結案報告小幫手、經費預結小幫手、績效指標小幫手),已建立決策輔助、智慧助手、安全合規之生成式 AI 企業應用平臺架構。發展生成式 AI 開發與評測工具,發展企業知識庫相關工具集(命名為 Akasha),以快速建立生成式 AI 雛型應用,以及評估導入成效。依據功能的差異,此工具集區包括一般版本及專業版本,以提供不同客戶之需求。未來移動安全信賴生態發展隨著未來移動載具所搭載的的智慧服務逐步邁向 AI 化、聯網化的趨勢,在車電與聯網產業面對安全合規的挑戰下,資策會軟體院期望藉由成立全國第一個未來移動安全信賴評測中心,為國內移動載具的軟體安全信賴進一步把關。未來移動載具在智慧化的過程中將
306、遭遇到以下的挑戰:智駕感知中眾多 AI 功能的可靠度如何評價?聯網服務依賴度逐年提升,數據安全與通訊韌性如何確保?面對智慧服務所遭遇的資安威脅,是否具備抵抗能力?而迎接未來的挑戰,未來移動安全信賴評測中心的成立,預計為產業帶來包括標準化規範、產品規劃、以及深度評測等服務:AI 感知效能的可靠度評測、數據安全與韌性通訊的機制評估、資訊安全及威脅抵抗能力的評價。同時,評測中心將以發展 4D 未來移動安全信賴評測為目標,連結國際標準,發展在地化規範與指引,建立需求設計與評測服務,未來更擴大到邊緣設備(無人機、安防監控)等領域的跨域信賴評測服務,以四個維度擴大面向市場,延伸服務範圍:鏈結國際在地化規範
307、倡議、產品需求情境設計服務、產品效能可靠度評測服務、擴大產業跨域評測服務。4113STAR 軟體技術年報面對產品發展中的需求,一方面在產品的設計初期,需要依循功能、車廠、產業、法規的諸多需求;另一方面則是所生產的產品,在測試階段,亦需要評價系統產品之安全性與功能優劣,確保產品品質與合規:需求階段 針對產品初期功能進行需求規劃,並依照下游/車廠所規範的應用情境進行設計,還需要符合國際標準,此時也伴隨著在地化的法規調適,才能夠符合各地情境的挑戰與要求。評測階段 在產品的測試階段,則需要建立功能的評測機制,確保功能可靠度以及優劣水準,並確保產品是否合乎規範,保障安全及可靠度。目前本計畫已於 2024
308、 年中成立全國首創的未來移動安全信賴評測中心,作為國內移動載具軟體安全的評測單位,促進效能可靠、確保安全合規。AI 辨識效能的可靠度評測,主要負責進行 AI 辨識效能的可靠性測試。評測計畫包括利用多元情境、天候及混合人車流資料,取得 AI 感知能力的全面評價,並適用於多重型態感測器(如影像、雷達、光達及熱成像)測試,以確保評測結果能夠符合現行 ADAS 標準規範。數據安全與韌性通訊機制評估,聯網安全的評估將集中在數據安全與通訊韌性機制的強化,目標是防止潛在的聯網威脅並降低數據暴露風險。透過監測車載聯網裝置,偵測潛在聯網威脅加以分析,降低車聯網、無人機聯網等國安疑慮。評測服務可幫助裝置製造商和營
309、運商確保合規和修復安全漏洞,提高設備通訊的正確性與安全性。資訊安全及威脅抵抗能力評測,針對移動載具的資訊安全及威脅抵抗能力進行測試,以提升抵禦攻擊的能力。整體工作規劃還會幫助進行資訊安全驗證合規。因應產業需求,評測中心分為需求與評測兩個階段提供服務圖 3-5評價系統產品之安全性與功能優劣,確保產品品質與合規所生產之產品 需要依循功能需求車廠需求法規需求產業需求Products for vehicle-OEMs/Tier1/Module-Other interests groups0ImplementationConceptOverallRequirementsSimulation Test規格
310、需求產品概念整車測試系統模擬測試DesignTest產品規格分析量化分析/環境需求產品功能評測需求國際/產業/車廠標準國內外產業標準規範制定推動廠規要求國際產業標準在地法規允入車電產品開發系統設計系統製作初步測試從初期的 VV 走向目標的 IV&V透過情境建立帶動功能安全升級確保感知功能的安全性效能評價功能可能度測試報告車輛設計需求Requirements系統情境效能評測ODD,Scoring車輛上路整車封閉場域測試整車開放道路測試評測階段效能評測服務2需求階段規格制定1資料來源:資策會軟體院114STAR 軟體技術年報第四章、全球專利視角下生成式 AI 發展與臺灣的機會本 報 告 由 全 球
311、 AI 技 術 的 專 利 發 展 趨 勢,逐 步 聚 焦 到 生 成 式 AI(Generative AI,GenAI)技術的專利布局與臺灣的機會。生成式 AI 在深度學習、大規模數據訓練及生成對抗網路技術推動下,自 2014 年起專利數量快速成長,全球領先企業如 OpenAI、Google、Microsoft 及騰訊積極布局,顯示技術創新的驅動力。臺灣企業如鴻海、中華電信在圖像與影片生成領域已有初步布局,但仍需持續強化。資訊工業策進會的軟體技術研究院,透過整合數據資源和提供算力平臺的數位軟體基盤,來協助政府整合資源、支援數位轉型與促進 AI 發展。未來,臺灣須持續加強研發、專利布局及國際合
312、作,才能在全球生成式 AI 技術競賽中取得更具領先的地位,提升市場競爭力。隨著人工智慧技術的飛速發展,相關專利申請數量在過去十年間已大幅增長。根據世界智慧財產權組織(WIPO)的統計,自 2016 年以來,專利申請量幾乎增加 8 倍,呈現出爆炸性的增長,這一趨勢主要受益於計算能力的提升、數據資源的豐富以及演算法的持續創新,也反映 AI 技術在全球多個領域的廣泛應用與蓬勃發展,為全球經濟創造龐大的增長潛力。115STAR 軟體技術年報AI 技術專利應用領域AI 技術全球主要專利申請權人分析AI 技術的核心在於透過電腦和演算法來模擬人類智慧,包括學習、推理、問題解決、自然語言理解及感知等能力。根據
313、最新的專利數據,AI 技術的專利大致可分為三大類別:機器學習、神經網路及深度學習;其中,機器學習的相關專利佔據近三分之二的比重,充分體現其在 AI 領域中的關鍵性地位。而 AI 技術專利的應用範圍十分廣泛,例如在醫療健康領域,AI 可透過分析醫學影像輔助診斷疾病,制定個性化治療方案,並監測病人健康,提供早期預警。在金融科技方面,AI 技術能分析金融數據,輔助智慧投資、風險管理和欺詐檢測,提升投資回報和安全性。在自動駕駛與智慧交通領域,AI 技術可幫助汽車進行環境感知、路徑規劃,並優化交通信號燈控制,提高交通運行效率。從國家別的角度來看,美國公司擁有全球 60%的 AI 專利,且從全球 AI 技
314、術專利的分佈顯示出美國企業的主導地位,尤其是在歐洲市場中,美國公司持有的專利數量甚至還超過歐洲的本地企業。在大學和研究機構方面,美國和中國的研究機構專利數量領先全球。這一趨勢突顯美國在 AI 技術領域的領先地位,以及中國在全球 AI 競賽中的強勁增長。而在全球 AI 技術的主要專利申請權人為一些大型科技公司,如 IBM、Microsoft、Google、Samsung 和 Amazon 等企業。這些公司在 AI 的核心技術領域擁有大量專利,且在全球市場上佔據重要地位。這些專利涵蓋從機器學習算法到各行各業應用的 AI解決方案,他們的專利申請不僅僅集中在技術本身,還包括應用場景、技術優化和與其他技
315、術的融合,利用專利形成一個廣泛而深厚的技術壁壘,保護這些企業在全球市場的競爭優勢。例如,IBM 在 AI 技術的專利布局主要集中在機器學習、自然語言處理和電腦視覺等領域。其專利策略包括廣泛申請核心技術專利,並且在 AI 技術的應用場景中進行深入布局,從而構建強大的專利防禦體系。Microsoft 則在深度學習、雲端計算和智慧助理等領域擁有大量專利,其專利布局策略包括保護核心技術創新,並且積極推動技術標準的制定,推動行業規範的建立,從而進一步鞏固其市場地位。在介紹 AI 技術的基本概念後,本報告將進一步聚焦於生成式 AI,這是 AI 技術中一個快速崛起的重要分支。生成式 AI 不僅擴展了 AI
316、的應用範疇,更由於其能夠自動生成圖像、文本、音樂等多種新內容而獲得了廣泛的關注和市場需求。隨著深度學習技術的突破、巨量數據資源的積累以及計算能力的顯著提升,生成式 AI 在近幾年實現了前所未有的技術進展,並帶動了專利申請量的爆發式增長。因此,接下來的章節將重點分析生成式 AI 技術的專利發展趨勢,並深入探討其在全球和臺灣市場中的應用潛力與面臨的挑戰。116STAR 軟體技術年報生成式 AI 專利的全球發展現況生成式 AI 技術其核心在於透過對大量數據的學習來生成新的內容,如文本、圖像、影片和音樂等。自 2014 年以來,生成式 AI 技術有快速的發展,特別是深度學習、大規模數據訓練的推動,及生
317、成對抗網路(Generative Adversarial Networks,GAN)、變分自編碼器(Variational Autoencoder,VAE)等技術的廣泛應用,為該領域開闢廣泛的創新機會。2022 年末,OpenAI 的 ChatGPT 問世後,更大幅提高大眾對生成式 AI 的熱情,ChatGPT 的推出也使得生成式 AI 成為全球關注的焦點,並促使該技術應用於更多的行業和應用場景中。如圖 4-1 所示,隨著生成式 AI 技術的不斷創新,全球的專利申請量也迅速增加,根據 WIPO 最新的分析報告,從 2014 年到 2023 年,全球生成式 AI 專利數量從 733 個增長到超過
318、 14,000 個。從所有的專利和論文的數量來看,2023 年就有超過 25%的生成式 AI 專利和超過 45%的生成式 AI 科學論文是在 2023 年時發表的,這種激增主要是在 2017 年後 Transformer 架構和大型語言模型(Large language models,LLM)等技術的突破性進展,促使專利申請量和科學出版物(包含期刊論文、會議論文等)均大幅增加,且在 2022 年 ChatGPT 發布後,科學出版物再度呈爆炸式增長並達到新的高峰。資料來源:WIPO,2024/042014-2023 年全球專利與科學出版物的發展圖 4-140000(件)3500030000250
319、00200001500010000500020140201520162017201820192020202120222023GenAI專利家族Introduction oftransformer modelsRelease of ChatGPT科學出版品1117STAR 軟體技術年報主要申請權人國家別分析根據生成式 AI 專利的申請權人的國家別,發現主要集中於全球幾個科技發展領先的國家,這些國家不但擁有卓越的技術研發能力,同時也具備完善的智慧財產權制度。如圖 4-2 所示,2014 年至 2023 年間,中國共申請超過 38,000 件專利,佔全球專利數量將近 70,同時自 2017 年以來,
320、中國每年在該領域申請的專利數量甚至超過其他所有國家的總和。更值得注意的是,儘管中國已經擁有龐大的生成式 AI 專利組合,但在此期間,其專利的平均成長率每年仍維持在 50%高水準的速度成長中,這也是中國持續躋身頂尖發明地區的重要原因。而在主要領先國家中,雖然目前印度的專利數量排名第5,但其近年的成長率更高於中國達到每年 56%,後續發展也值得關注。以下是針對其中幾個主要領先國家的細部專利布局做一說明:資料來源:WIPO,2024/042014-2023 年專利權人國家別專利量和成長率比較圖 4-2400500(件)35045030025020015010050中國24.30%38.30%55.8
321、0%13.20%29.90%11.70%0801006040200美國韓國日本印度英國德國專利數量成長率49.80%118STAR 軟體技術年報美國作為人工智慧技術的發源地,仍然是生成式 AI 專利申請和發明人數量最多的國家之一。美國的科技巨頭如 IBM、Google、Microsoft、和 Adob e 在生成式 AI 領域的研發投入最多,這些公司在語言模型、生成對抗網路和強化學習技術的應用和發展上都有顯著成就;例如 IBM 開發生成式 AI 平臺 watsonx,使公司能夠使用和自訂 LLM,確保資料的安全性和合規性,因此公司可以建立基於自己的資料所訓練的 AI 模型。Alphabet旗下
322、 AI 部門 DeepMind 最近公佈其最新的 LLM 模型 Gemini,該模型最終將整合到Google 的搜尋引擎、廣告產品、Chrome 瀏覽器等產品中。微軟是生成式 AI 的主要參與者,不僅透過其對 OpenAI 的大量投資,還透過其他研究活動擴大其應用版圖,例如,微軟的 InnerEye 計畫透過分析醫學掃描來檢測異常、診斷疾病並建議治療計劃。美國的發明專利主要集中於 AI 驅動的內容生成技術、智慧助理系統和醫療 AI 技術等。美國的強大技術生態系統、豐富的數據資源和強大的學術研究支持,使得該國成為全球生成式 AI 技術的領導者之一。1.中國3.韓國2.美國中國是生成式 AI 專利
323、申請和技術發明的主要國家之一,特別是在近幾年,在人工智慧技術領域的投入極為顯著。中國的科技公司如騰訊、百度、阿里巴巴等在生成式 AI 技術中投入大量資源,並成為專利申請的主力軍。中國的學研機構(中國科學院、清華大學、浙江大學等)和前述的企業,在深度學習、自然語言處理和圖像生成等技術上申請大量的專利,這些發明人推動中國在生成式 AI 領域的全球競爭力。中國政府的支持政策以及國內龐大的市場需求,使得生成式 AI 技術迅速應用於商業和工業場景,例如社交媒體、電商平臺和自動駕駛技術,而中國的發明人主要集中於這些應用場景的技術創新,並利用生成式 AI 技術提升產業自動化和服務智慧化。韓國也是生成式 AI
324、 技術的重要參與者,特別是在影像生成和電子產品中的應用領域。三星電子等韓國企業積極投入生成式 AI 技術的研發,尤其是在圖像處理、虛擬現實和人工智慧芯片技術上。韓國申請的專利主要集中於生成式 AI 在消費電子產品中的應用,這些技術可以提升用戶體驗和產品性能。此外,韓國專利在生成式 AI 技術的工業自動化和智慧製造領域也有相關布局,這些技術應用於製造過程的智慧化控制和優化,幫助企業提高生產效率和產品品質。119STAR 軟體技術年報應用模式與類型生成式 AI 的模式是指生成式 AI 模型所處理的數據類型,無論是輸入數據還是輸出結果,隨著生成式 AI 技術的進步,也進一步帶動多種模式的誕生。這些數
325、據類型不僅限於文本和圖像,還包括語音、音樂、3D 圖像模型、基因序列等。生成式 AI 模式可以根據不同的應用需求進行調整,應用範圍和功能也在不斷擴大,下圖為各種應用模式累積的專利數量與相關說明:資料來源:WIPO,2024/04全球不同生成式 AI 應用模式發展趨勢圖 4-34000(件)3500450050003000250020001500100050020140201520162017201820192020202120222023圖片/影片文本語音/聲音/音樂3D影像建模分子/基因/蛋白質軟體/程式碼120STAR 軟體技術年報1.圖片和影片模式2.文字模式3.語音、聲音和音樂模式 2
326、014 年至 2023 年間,此模式的專利數量已累積接近 18,000 個,光是 2023 年一年就有超過 5,100 個專利申請,圖片和影片生成模式可說是生成式 AI 中最具代表性的應用類型之一,尤其是以生成對抗網路技術在圖像生成中的廣泛應用。GAN 模型透過生成和判別兩個神經網路的互動來生成高度擬真的圖像,並應用於圖像增強、風格轉換以及虛擬現實中的場景生成等。自 2023 年圖像生成技術的發展達到新的高峰,此類技術的進步使得 AI 模型能夠根據簡短的文字描述生成高解析度的圖像。隨著數據量的增加和神經網絡架構的改進,圖像生成模式的準確性和創新性顯著提升。文本生成模式主要依賴於大語言模型,如
327、GPT 系列模型,是目前全球專利申請量排名第 2 的模式項目。這些模型被廣泛應用於自然語言處理中,包括文本生成、自動摘要、機器翻譯和風格改進。自 OpenAI 推出 GPT 模型以來,生成式 AI 在文本處理方面的能力得到顯著提升,特別是在自動生成符合上下文的文本方面。隨著 ChatGPT 的發布,LLM 的應用範圍得到極大的擴展,這些模型能夠根據使用者的輸入生成自然流暢的對話,並在各種文本生成任務中表現出色,未來,文本生成模式將繼續推動自動化編輯和生成高水準的內容。生 成 式 AI 在 語 音 和 音 樂 生 成 中 的 應 用 日 益 增 多。DeepMind 於 2016 年 推 出 的
328、WaveNet 模型是語音生成技術的一個重要里程碑,該技術能夠生成自然流暢的語音,並被應用於各種語音合成系統中。與傳統的語音合成方法相比,WaveNet 僅需少量錄音數據即可生成高品質的語音,這為語音助手、語音導航等應用服務的發展,往前邁進一大步?,F今的音樂生成領域的技術發展,已能夠根據簡單的文字提示生成完整的音樂歌曲,這一模式的進步使得 AI 可以在音樂創作過程中發揮更加主動的作用,並為藝術家提供創作時的靈感。121STAR 軟體技術年報臺灣主要申請權人於各 AI 模式的布局現況依據現今的音樂生成領域的技術發展,已能夠根據簡單的文字提示生成完整的音樂歌曲,這一模式的進步使得 AI 可以在音樂
329、創作過程中發揮更加主動的作用,並為藝術家提供創作時的靈感。資料來源:資策會軟體院整理,2024/09專利數前幾名臺灣專利權人於各模式的專利布局狀態圖 4-4211宏達國際電子股份有限公司3宏碁股份有限公司11財團法人資訊工業策進會財團法人工業技術研究院2國立中央大學11251113聯發科技21緯創資通股份有限公司411國立清華大學2國立臺灣大學2專利總量文本圖片/影片語音/音樂/聲音軟體/程式碼3D影像模型分子/基因/蛋白質249020107242鴻海精密工業股份有限公司中華電信股份有限公司2523英業達股份有限公司122181122STAR 軟體技術年報在臺灣廠商與學研機構的專利申請方面,我
330、們將專利數量前幾名的申請權人與其布局的應用模式做成圖 4 的對應矩陣表,可以發現同樣是以圖片/影片模式的專利數量最多,共有 90 件,同時前三名的模式類型與全球的排序一致,而有關軟體/程式碼的部份,則排名第 4,不過目前相關的專利數量仍不多僅有 10 件。上圖列出申請數量較多的前幾名申請權人,其於各不同模式的專利布局方布狀態與申請數量,明顯看到鴻海為臺灣申請生成式 AI 相關專利最多的企業,不過目前的布局幾乎都落於圖片/影片處理方面,其次如中華電信、英業達與我們資策會,在相對較多個模式中都有一些專利的布局,不過數量都仍僅有零星的個位數,其中英業達公司在 2023 年連續申請 5 件有關聊天機器
331、人的相關專利,為該公司目前布局最多的模式項目;其他如工研院與其他的學研機構,專利多半是較集中在圖片/影片模式。不過綜合來看,由於目前臺灣企業的專利總量僅有鴻海的數量有20 多件,其餘的公司都在 10 件以內,未來的發展動向仍有很大變化。應用領域行業別生成式 AI 的應用正迅速擴展至各行各業,推動著技術創新和生產力提升,也持續廣泛影響著全球多個產業。根據 WIPO 的專利分析報告,可以從所申請的專利資料分出 21 個應用領域行業別,我們根據過去十年內公佈的專利數量進行排名,前 10 名的應用領域如下:全球前 10 名生成式 AI 應用領域別專利數量圖 4-5生命科學軟體/其他應用程式298925
332、34649764801252222672226219414361345文件管理和出版商業解決方案工業和製造業運輸安全電信個人裝置銀行/金融資料來源:WIPO,2024/04123STAR 軟體技術年報針對前幾名主要集中的幾個領域進行說明:軟體與其他應用程式生命科學軟 體 相 關 應 用 是 生 成 式 AI 專 利 的 主 要 領 域 之 一,總 專 利 數 達 到29,892 件。這些應用涵蓋 AI 輔助的軟體開發、自動化工具和數據分析等,生成式 AI 能夠用來提升編碼效率、降低錯誤率,並縮短產品的開發時程,透過 各種生成式 AI 應用程式融入到產品、服務和流程中,將為內容創作和生產力提升注
333、入一鼓強勁推力。(軟體類別是最大的應用領域,然而需要注意的是,WIPO 的分析方式是將無法分配或專利中沒特別說明應用情境的案件,會將其分配到軟體/其他應用程式類別中)中國騰訊公司是生成式 AI 技術在軟體及其他應用程式領域的全球領導者,其專利數量達到 1,363 件,位居榜首。作為中國最大的科技公司之一以及社交媒體與遊戲行業的巨頭,騰訊的專利涵蓋程式碼生成工具、遊戲開發自動化以及應用程式的增強,這些技術不僅提高軟體開發的效率,還幫助開發者減少人為錯誤並提升生產力;同時騰訊也將生成式 AI技術應用於優化用戶體驗,透過自動化內容創作和智慧化推薦系統來提升使用者的互動性。生成式 AI 技術在生命科學領域,尤其是藥物設計和基因工程中的應用日益增多。自 2014 年以來,生命科學領域的專利申請達到 5,346 件,顯示 AI 技術對於醫療和科學研究的顯著影響。這領域中是以中國的平安保險集團的專利布局表現最為出色,它已從傳統的金融服