1、明略科技-多模態數據驅動的 RAG 增強實踐董振興0102030405目錄智能時代對多模態搜索的需求多模態數據的解析與向量化多模態信息的檢索增強多模態場景下的Agentic RAG總結和展望01背景介紹RAG技術演進02明略多模態解析實踐企業多模態數據面臨的挑戰Pipeline文件解析Pipeline文件解析問題Pipeline文件表格解析問題端到端模型文件解析明略科技多模態解析混合架構03明略。
2、菜低代碼創新實踐:全棧轉型與技術效能突破唐爽菜體驗平臺中負責原 阿巴巴前端委員會聯席主席0102030405錄背景以及臨的挑戰實現案和技術架構實施效果和痛點權衡案例:新的職責所帶來的突破展望:AI時代前端能為企業帶來的價值01為什么菜業務常適合全?;_發菜全?;尘白兦暗难邪l模式BDPD 上線 測試 后端開發 前端開發 設計 產品項UEDFERDQCMRDPRD設計稿界接BugList業務菜業務。
3、1 1端智能在即時物流場景的落地王云生(追詩)餓了么-物流技術-終端負責人020401即時物流行業介紹騎手運動狀態推斷及應用端智能在騎手履約場景的未來了解騎手作業流程通過運動狀態刻畫騎手真實的作業情景未來不遠03圖像識別在即時物流場景的應用通過圖像識別提升商戶門頭照質量什么是即時物流顧客選餐下單等待配送商家接單制作出餐騎手接單到店送達取餐即時物流對比即時物流傳統物流配送時間較短,分鐘或小時級別較。
4、作業幫檢索系統重構:程童Havenask實踐案例分享Havenask(HA3)0102030405目錄結果很重要業務場景及核心問題思路和決策實踐過程總結01結果很重要成本問題20212022202320242025成本/萬qps單位成本注:統計時間節點為每年年末高峰,年取元旦后數值索引容量瓶頸業務需求問題結果很重要強化向量檢索,快速支持基于RAG及多模態大模型的AI業務落地大規模復雜算法系統年省。
5、梁加易目錄主倉主倉業務組件業務組件業務組件業務組件主倉主倉業務組件業務組件業務組件業務組件業務組件業務組件業務基礎組件業務組件業務組件新問題&老問題基于 Bazel 的適配和改造低成本&低風險&高效率分布式能力-依賴解析優化正確性&穩定性分布式能力-緩存優化構建效率標準協議維護模塊&組件管理合入管控舊流程就存在,在 Monorepo 下會劣化的問題time。
6、性能全閃件系統的設計與實踐張濤焱融科技CTO0102030405錄模型時代的存儲挑戰YRCloudFile的設計案級運維特性AI訓練推理解決案總結和未來規劃01模型時代的存儲挑戰AI數據增的挑戰AI 數據處理的挑戰數據采集數據預處理數據訓練推理數據歸檔 多協議訪問 容量 并發 寬帶 多協議訪問 數據檢索 IO 混合 IO 讀寫混合 量讀請求 寬帶 海量件 模型部署 寬帶 KV Cache 卸載 。
7、家故障應急保障體系實戰 穩中求勝的構建之道 付冰堯機IoT SRE負責0102030405錄IoT技術架構全景IoT質量保障的問題和挑戰應急體系的科學構建億級設備故障處置案例復盤互動研討01IoT技術架構全景億級設備連接的核架構解析全球領先的消費級 AIoT 平臺全球領先的消費級 AIoT 平臺8.61億設備接戶活1億開發者1.3萬本地化演進,打造快速、穩定、合規的全球性 IoT 平臺 全球 6。
8、超越工具:超越工具:AIAI驅動內生型技術管理新范式驅動內生型技術管理新范式混沌創新領教騰訊云最具價值專家阿里云最具價值專家TGO鯤鵬會杭州分會榮譽會長騰訊云架構師技術同盟主席團成員前有贊技術副總裁、大搜車高級副總裁、車易拍 CTO資深互聯網專家,擁有20多年的互聯網產品研發經驗。深度參與互聯網金融、電商、零售、SaaS等多個領域。親歷主導了余額寶、彈個車、有贊云等多個有影響力的互聯網產品從0到。
9、王云霏目錄WHY LAKEHOUSE?1.數據類型多樣化2.成本與擴展性3.高級數據分析(AI)問題與挑戰核心優勢1.數據質量2.查詢性能3.事務支持1.復雜的ETL鏈路,2.降低時效性3.數據一致性,冗余存儲問題與挑戰核心優勢1.統一入湖2.開放訪問BI、ReportsAI、MLLakehouse的業務價值One data,all analytics1.開放統一的數據存儲,Single sou。
10、閔文俊目錄不同的存儲引擎之間的數據孤島,數據的價值無法被充分挖掘流批統一近實時化開放格式,打破數據孤島降本增效2022.01以 Flink 子項目 FlinkTable Store的形式孵化2023.03捐贈給 Apache 基金會,成為 Apache 的孵化項目,面向更開放的開源社區2024.030.4 0.7 版本發布,畢業成為 Apache 頂級項目2024.12發布具有里程碑意義的1.0。
11、石雪峰目錄規?;M織中構建平臺工程“無休止”的功能累加導致產品變成大雜燴降低用戶”認知負荷”與產品復雜度的沖突標準姿勢帶來的約束與用戶自由度的沖突管理訴求層層加碼與一線開發者體驗的沖突標準研發模式背后的思考和方法論1元數據加工流以及標準加工動作從IDEA到可運行的程序信息如何加工?2從IDEA到可運行的程序創造用戶價值的鏈路是起止點?3創造用戶價值軟件交付的目標是什么?4高質高效的軟件交付標準研。
12、楊晨目錄大模型API價格以逐年1/10的趨勢下降開源與閉源模型的能力差距在逐步縮小越來越多能處理復雜任務的Agent出現由容器、微服務及聲明式API所構建的微服務應用架構由模型、AI Agent及Tool共同構筑的AI Native應用架構解決系統復雜性問題解決智能決策問題LLM 嵌入預定義代碼路徑LLM 主導控制流 基于大模型的應用開發迭代方式有何不同?如何高效開發?如何進行模型選型?怎樣寫出。
13、演講人 李洋 by 小米目錄資源浪費導致集群容量不足,發布“pending”,間接導致無法容納更多的業務,導致集群資源利用率低分配率在很高的情況下,利用率卻不足分配率的50%,說明有大量的資源分配出去卻沒有得到充分的使用近7天的集群cpu均值利用率峰值(usage/capacity):39%近7天的集群cpu申請率均值(cpu-request/allocatabel):91%于此同時 cpu的使。
14、姓名目錄流動不足,工具孤島與業務協同困難DEV、QA、OPS 不同團隊瀑布式研發開發者認知負荷:低開發周期:數月或數年2000 年前 傳統研發2000 年代 敏捷開發2020 年代 云原生2010 年代 DevOps 運動DEV 與 QA 混合,但 OPS 依然分離,迭代式研發開發者認知負荷:中開發周期:幾周或幾個月OPS 加入,持續集成與發布You build it,You run it開發者。
15、快有狀態服務規模上云實踐姓名 劉裕惺Title Senior Software Engineer 0102030405錄快有狀態服務上云演進有狀態服務是否應該上云?有狀態服務上云案-開箱即有狀態服務上云案-規?;a落地有狀態服務上云-未來探討01快有狀態服務上云演進快有狀態服務云原化演進02有狀態服務是否要上云有狀態服務是否要上云?在汽時代堅持騎你可以做到,但注定法享受公路絡的全新可能性。成本收。
16、張建飛目錄絲綢公司的設計難題兩個控制點的貝塞爾曲線AI對于軟件研發,什么變了?局部效率提升基礎編碼能力的知識平權AI對于軟件研發,什么沒變?復雜柔性不可見難度量軟件內在特性流程長+非標無完美設計,只有權衡需求難以描述,評估困難軟件工程系統規模團隊規模軟件規模軟件是手藝活,軟件工程本質上是“手工作坊”,是知識手工業者的大規模協作。工程師要如何和AI共生抽象思維能力:發現共性,映射到LLM的知識結構。
17、清華大學 鄭緯民報告內容AIAI基礎大模型基礎大模型輸入小標題輸入小標題人工智能進入大模型時代人工智能進入大模型時代從單模態向多模態發展從單模態向多模態發展ChatGPT實現真正像人類一樣來聊天交流文本交互Midjourney AIGC 畫作太空歌劇院獲得人類藝術比賽冠軍圖像創作阿里云視頻生成大模型 I2VGen-XL,上傳1張圖后2分鐘生成高清視頻視頻生成行業行業+AI+AI加速行業智能化升級。
18、鄭予彬開發者是核心生產力優化開發工具鏈提升生產力改善可維護性持續改進和創新優化開發體驗,提高開發效率簡化工作流程提升開發者滿意度和幸福感開發速度:實現的自動化和輔助功能,有助于更快地完成編碼、調試和重構等任務,從而提高整體開發速度和效率。滿意度:提供智能代碼建議、自動補全和代碼生成等功能,減輕開發人員的工作負擔,降低認知負荷,從而提高開發人員的滿意度和幸福感代碼質量:自動檢測并發現代碼中的錯誤和。
19、存量互聯時代的 前端存之道周全快 基礎架構中負責00開頭聊點話過去輝煌的移動前端互聯突然就越挫越勇?接棒Web2.0,空前熱DAU億以下的21個獨產品中近半戶數量下滑來源:晚點 https:/ 基礎架構中心負責人架構師 AI初學者架構師,越挫越勇落地了KMP跨端技術45%鴻蒙代碼由Android復來 1000+天收益領域化架構演進 啟動+次留顯著上漲AI DevOpsAI續寫覆蓋80%AI On。
20、楊少華目錄需求側優化供給側優化商務手段:折扣技術手段:彈性資源池 存算分離 多類型實例綜合使用 包年/包月實例 按量/Spot實例 多云實例運營手段 梳理下線無效、低效任務技術手段 業務邏輯優化 資源優化:RightSizing&HBO實施成本穩定性優化效果大數據任務異常大數據服務或主機異常 低侵入性,業務無感 全自動優化 實施周期短 降低任務總時長、基線完成時間 降低資源使用量(內存/。
21、賈瑋賈瑋螞蟻集團 NoSQL數據庫 和 向量數據庫 技術負責人2016年加入螞蟻集團,專注于存儲基礎設施對計算存儲基礎設施、中間件、向量檢索有一定實踐經驗目錄vs 增長趨勢數倉數據數倉數據 vsvs 多媒體數據增速多媒體數據增速螞蟻集團數據+10%+10%+143%+143%向量化表示向量化表示語義表達能力語義表達能力圖圖/倒排倒排大量浮點(距離)大量浮點(距離)Vector Search向量檢。
22、呂帆嗶哩嗶哩目錄傳統架構的局限性分析 新一代客服系統的轉型方向系統穩定性差擴展能力受限通信不即時丟消息原系統來自外部采購,外部代碼,部署物理機,單體架構智能化水平低1分布式部署,彈性擴展,高可用性和多活的容災能力全云化架構2智能問答,智能檢索,智能坐席調度智能化3彈性智能資源調度,數據驅動的智能決策云化與智能化的結合云客服整體架構資源部署和微服務服務拆分多活接入層網關層應用層支撐層權限校驗參數校。
23、李志偉目錄VS模型訓練方式:數據中心或云端模型推理方式:服務器或云端參數量:多為百億/千級別模型訓練方式:云端模型推理方式:端側參數量:多為十億級別端側大模型AI大模型82131476179030609020232024E2025E2026E2027E2028E市場規模單位:億數據來源:【頭豹研究院】2024年中國端側大模型行業研究預估未來4年,端側大模型市場每年會以4050%的增長率保持快速增。
24、AI Demo:AI Prompt:material/webHome,Sensors,SettingsPUAVibe Coding530Yes Browser Server SQL DevOpsCDK Infra As Code GenAI AI:1 https:/it20.info/2024/5/a-framework-to-adopt-generative-ai-assistants-for。
25、uni-app雙引擎助開發者效構建鴻蒙應崔紅保DCloud CTO個介紹崔紅保 DCloud CTO uni-app 跨端框架負責 跨平臺開發兵 深耕開發者服務領域,在跨平臺、前端 UI、程序性能優化等經驗較多。01020304錄鴻蒙應開發的核挑戰uni-app:更簡單、更快捷的鴻蒙化案 uni-app x:更性能、更好體驗的鴻蒙化案總結與展望01開發效率與運性能如何兼得?鴻蒙應開發的核挑戰開發。
26、李虎目錄xAI-10萬卡 2024.7 META-2.4萬卡*2 2024.4 2025-2026 國內十萬卡2023.3.16文心一言發布,萬卡-ROCE集群2024交付10萬卡+單集群最大3.2萬2021年底交付 萬卡-IB集群演進方向超大規模超大算力超大帶寬ChatGpt-1萬卡 2022.11 集群規模 3.2T超高帶寬接入(8*400G)單集群支持10萬卡+支持跨AZ RDMA訓練性能。
27、曾國洋面壁智能:端側大模型主要內容大模型技術發展歷史趨勢大模型前沿技術與實踐大模型未來發展格局的預測:了解大模型技術趨勢,提前布局應用:掌握行業應用發展規律,輔助長期研判:交換認知收獲靈感,推動 AGI 早日到來開源大模型利好大模型應用落地沒有智能的產品會落后于時代,跟不上趨勢將會被洗牌。DS 出圈將智能的需求植入到廣大消費者的心中,大模型正在改變工作模式+LLM+LLM+LLM大模型技術發展歷。
28、趙嘉鐸目錄典型的復雜B端集成式集成式業務平臺,業務上呈現出鮮明的和特征:客觀原因:標準化邏輯拆解與封裝機制缺失不同場景業務邏輯互相交織,系統拓展性差,導致開發者對變更的接受度低,甚至不得不讓業務方做出妥協業務邏輯缺少邊界約束,邏輯四處逃逸,業務梳理、問題定位與需求影響范圍評估效率低下,缺陷擴散及變更影響范圍大復雜業務流程代碼實現冗長晦澀,迭代過程中只會進行局部修改,造成數據重復及碎片化讀寫,系統。
29、快時應可觀測挑戰 及應對實踐演講:王輝快/移動端數據架構負責個介紹王輝 快/移動端數據架構負責 團隊主要負責快的埋點體系、研發數倉等可觀測基礎設施 在互聯業從事開發作多年,開發過前端、后端、客戶端、數據,也帶過業務、架構等不同類型的團隊01020304錄超路徑帶來的挑戰可觀測體系構建路徑歸因實踐總結與展望01時 短內容=超路徑超路徑帶來的挑戰背景:鏈路數據基建,嚴重影響了決策效率、實驗效率、排障。
30、畢鳴一深耕大前端性能優化多年,先后負責過多個大型項目的性能穩定性測試及測試工具平臺的研發工作,當前負責終端、前端和跨端可觀測產品的技術研發和平臺建設先后對接了多個ToC、ToB和ToG的項目支持;進行了多次公有云、私有云、混合云的項目部署;落地了國內、亞太、中東、北美、歐盟等多種客戶的交付實施行業分享及知識社區QConQConHarmonyOSHarmonyOS開發者論壇開發者論壇 廣州廣州等行。
31、Vickie ZengAgenda1 12 23 34 45 5Scaling laws continueReasoning,Planning&MemoryEvery Developer(Employee)is an AI DeveloperMultimodal and Multi-model including cost/performanceFrom“use-case”to resh。
32、王濤產品研發和工程架構-App Health 監控產品構建:Slardar、APMPlus業務性能優化:通用優化能力、業務指標優化插件熱修:插件框架、熱修框架編譯構建:打包發布、編譯優化王濤 2019 年至今,任職于字節跳動,負責Android APM 性能監控產品的構建,幫助頭條等業務方優化內存等性能指標。目前擔任火山引擎 APMPlus 平臺Android/鴻蒙監控產品客戶端技術負責人。擁有。
33、羅宇俠目錄結構化數據文本圖像多模態數據Unify CatalogOpen Datalake format多模態數據統一存儲,滿足 AI模型訓練對多模態數據的要求統一元數據實現數據血緣追蹤,權限管理,確保 AI 模型調用的數據質量和可追溯數據湖廉價存儲特性允許企業積累海量數據,為 AI 提供海量訓練語料1234實時更新大語言模型的知識庫實時感知用戶的上下文實時數據支持模型的在線學習模型根據用戶實時。
34、梁啟成目錄7+供應商200+云產品6+地域千萬核級CPU算力萬卡級GPU算力成本洞察云資源成本多少,業務知不知道自己花了多少錢?資源用量歸屬是否準確,成本分攤規則是否合理?業務目標和資源動因是什么,單位資源成本是多少?成本優化云產品折扣是否有下降空間,是否存在供應商獨家“壟斷”?是否存在閑置資源,是否正確配置數據存儲周期以及介質?有沒有辦法提升有效工作負載占比,充分發揮昂貴資源的超強算力?成本運。
35、AI 驅動的大數據自治:智能應對復雜運維挑戰熊訓德目錄大數據系統自治背景與挑戰大數據智能管家技術框架及關鍵實現路徑實踐效果與案例分享探討智能管家未來發展方向與潛在影響算法決策離線服務主機參數調優預測分析自助轉冷知識/評測庫模型/算法庫異常收斂HDFSSPARKYARN巡檢報表成本分析元啟根因分析APISDK權限管控消息管道網絡HIVE規則引擎告警收斂預處理定時巡檢評估推薦模型訓練資源調度Sql熔。
36、王璟堯阿里云智能集團瓴羊 高級技術專家大語言模型企業私域數據BI工具高性能分析引擎可視化技術安全、協同開放集成基礎大模型專業領域大模型Agent能力進階企業私域數據行業知識企業內部知識02PART通用大模型通用大模型03PART多端透出多端透出核心能力核心能力能力能力工具鏈工具鏈分析引擎分析引擎渲染引擎渲染引擎DSL靈活性較弱查詢能力受限于BI引擎的能力邊界業務場景明確、分析要求復雜大型團隊和企。
37、戚仕鵬呂松霖GraphRAGAIGraphRAGGraphRAGAB12CXDFE項目員工公司員工關系參項關系好友關系親屬關系通訊關系公司信息表雇傭關系表項目信息表員工信息表好友關系表參項關系表圖(Graph):圖譜的圖由頂點和它們之間的邊構成的數據結構表示實體或概念頂點邊表示實體和概念之間的關系安全風控全圖風控、安全風控、會員關系螞蟻森林、新春紅包、關系網絡、營銷推薦、數據血緣、異常檢測、基礎。
38、螞蟻 mPaaS 為鴻蒙應用高效開發注入創新動力婁星騁嘉賓介紹婁星騁螞蟻數科端智能平臺 mPaaS 產品的核心成員擁有 10 年移動互聯網研發經驗,專注于移動應用的基礎架構、性能監控優化、隱私合規及移動安全等領域。作為 mPaaS 產品建設與演進的推動者,他參與解決了 mPaaSmPaaS 鴻蒙鴻蒙版本,版本,從研發、構建、測試、發布到運維的全鏈路問題,為企業提供從研發、構建、測試、發布到運維的。
39、李飛公司概況部分代表客戶投資機構數勢科技為企業提供基于大模型增強的數據分析 AI Agent,提升企業的數字化決策能力,推動企業數字化升級。2020年,由原京東技術副總裁黎科峰博士創立 行業首個商業化落地的數據分析智能體SwiftAgent 在金融、零售、先進制造領域有深度技術和業務know-how目錄企業數字化建設進度不一,大致分為以下三類數據倉庫BI系統指標平臺現狀:1.少部分企業仍處在數倉。
40、演講人:??↓埬夸汚I在研發領域帶來的變化AI大模型井噴期AI大模型加速商用期20232024互聯網21%金融 16%醫療 12%教育 12%政務 11%工業 10%其他 18%行業結構信息來源:Dora Research:2024系統分析研發編碼測試驗證提交部署CodeFuse插件技術架構模型能力本地核心服務模塊詳解數量編碼單輪多輪SearchThink Model+Search單維度多維度經。
41、張棟目錄效率 VS 成本安全左移大模型賦能傳統靜態工具傳統規則添加方式Source/Sink提取流程開源框架提取新框架提取賬密:點邏輯場景SQL 注入:鏈邏輯場景以上代碼段是以直接拼接 SQL 查詢語句的方式進行查詢。然而,這種方式存在SQL 注入的風險。當 param 參數的值直接拼接到 SQL 查詢語句中時,如果param 的內容被惡意構造為一個合法的 SQL 語句片段,攻擊者可以修改原始的。
42、AI應用落地進行時司巧蕾Selina從技術爆發到產業滲透AI應用落地進行時極客邦科技年度主題:AI應用落地 訓練成本 推理成本 適配成本 隱性成本成本!成本!成本!從模型開發到部署運維,工程化流程復雜。企業AI項目落地周期長,成功率低,技術與業務融合困難。工程化能力場景碎片化領域知識壁壘動態適應能力場景化能力AI人才缺口顯著系統化/點對點提升技能提升技術側:成本!成本!成本!成本=訓練成本+推理。
43、楊克特目錄實時讀寫應用應用服務實時讀寫搜索服務快照CDC快照CDC全量處理增量處理離線分析實時分析ProsConsooooooooRDS實時讀寫應用應用服務實時讀寫快照CDC快照CDCS3RedshiftCloudSearch全量處理增量處理搜索服務離線分析實時分析RDS應用應用服務S3事務和分析混合負載事務和分析混合負載?RedshiftCloudSearch實時離線處理一體化實時離線處理一體。
44、李培殿1.小米數據湖架構及上云實踐2.從離線湖倉到實時湖倉3.數據湖在AI場景實踐4.未來規劃目錄 手機研產供 新零售 IOT設備信息化 互聯網廣告 互聯網應用 信息流推薦互聯網 基座大模型 小愛同學AI 智能座艙 自動駕駛汽車FlinkSparkTrinoDorisRayGravitinoHiveIcebergPaimonFilesetJuiceFSHDFS計算引擎元數據數據湖存儲層數據工場平。
45、孫偉祥目錄背景說明業務視角的混合云架構 多云提供商:多云提供商:阿里云、騰訊云、AWS、華為、火山、自建云 多區域部署:多區域部署:上海、南京、杭州、蕪湖、烏蘭、海外 多形式部署:多形式部署:在線核心鏈路異地多活;離線鏈路、LLM推理全域部署理想中資源視角的混合云架構現實中資源視角的混合云架構核心解決思路向上對業務屏蔽集群概念向上對業務屏蔽集群概念向下對資源調度合池統一向下對資源調度合池統一解決。
46、章毅俞舟AI Agents Labs-WorldZhou(Jo)YuColumbia University&Arklex AILLMLLMLLM 2025 Arklex.AI-All rights reservedArklex.AIFounder,CEODr.Zhou(Jo)YuColumbia University CS Professor(CMU PhD)Open-source AI。
47、從分鐘到秒:抖如何通過動態庫優化實現效構建演講:張星宇字節跳動/軟件程師01020304錄背景動態庫的優勢與挑戰核作流程與原理收益與規劃01構建耗時的瓶頸與思考背景抖線下開發成本每天構建次數約 4000 次改代碼到跑起來時(優化前)平均每次超過 3 分鐘均構建成本(優化前)超過 200 時90%的構建屬于增量構建,其耗時直接決定研發效率增量構建代碼改動量極,緩存命中率,付出的等待時間是否合理增量。
48、李宇明傳統數字人技術介紹生成式數字人技術介紹技術細節與亮點實驗結果分析生成式數字人結合大語言模型的實時交互生成式數字人結合音樂生成模型的AI創作生成式數字人結合商品的視頻廣告生成式數字人存在的問題和挑戰生成式數字人開發新范式方法基于GAN的算法。通過對抗訓練學習,對人物圖像的嘴部進行精準編輯,確保嘴型與輸入的語音同步,實現數字人語音播報?;贜eRF的算法。通過構建神經輻射場對數字人進行個性化建。