
? 谷歌:更新 Gemini 1.5 系列模型,發布多模態大模型全家桶 繼 2023 年 12 月谷歌推出其規模最大、功能最強的多模態大模型 Gemini 系列之后,今年 2 月,谷歌發布 Gemini 1.5,在版本中首個登場的多模態通用模型Gemini 1.5 Pro,將穩定處理上下文的上限擴大至 100 萬 tokens;5 月,在谷歌 IO 開發者大會上,谷歌大模型迎來多項升級,基礎大模型方面,Gemini 1.5 Pro 將上下文窗口長度從之前的 100 萬 tokens 進一步擴展至 200 萬 tokens,谷歌首席執行官Pichai 稱這是目前市場處理上下文長度規模最大的基礎大模型。多模態大模型方面,谷歌發布了視頻生成模型 Veo 以及文生圖模型 Imagen 3,Veo 模型對標 Sora,能夠根據文字、圖片和視頻的提示生成長度超過 1 分鐘、分辨率最高 1080p 的視頻;Imagen 3 文生圖模型是 Imagen 系列的升級版,從細節擬真度來看對標Midjourney v6。