
SAM 發力圖像分割,靈活性與通用性表現出眾。SAM(Segment-Anything Model)是一款應用于 CV(計算機視覺)圖像分割領域的 AI 模型。圖像分割意指像素級地識別圖像,對圖像中每個像素所屬類別進行標注,在自動駕駛、醫療影像、圖像美化等領域用途廣泛。SAM 發布于 2023年 4 月,是一款面向通用場景的圖像分割模型,允許用戶通過自然語言指令進行任意圖像分割,其特點為無需用戶進行額外訓練,既可遷移使用,行業領先。SAM 模型基于 SA-1B 圖像注釋數據集進行訓練,在首次自行訓練后進行人工注釋,再使用注釋數據集對模型進行更新,多次循環,對模型進行優化。SAM 模型的發布被認為是 CV 領域的“GPT-3時刻”,其支持多方式完成圖像分割任務,可以對圖像進行多形式的靈活分割,可以處理復雜圖像,對于邏輯不清晰的場景,SAM 模型仍表現出出色的效果,且對于未針對訓練過的樣本,仍能夠進行精確識別與分割,這使得 SAM 具有強大的靈活性與通用性,允許用戶在不經額外訓練的前提下進行遷移使用,極大降低了圖像識別訓練的成本與門檻。