計算機視覺原理
計算機視覺就是用各種成像系統代替視覺器官作為輸入敏感手段,由計算機來代替大腦完成處理和解釋。
計算機視覺的最終研究目標就是使計算機能象人那樣通過視覺觀察和理解世界,具有自主適應環境的能力。
但是這個需要經過很長一段時間的的努力才可以達到的目標,所以,在實現最終目標之前,人們努力的中期目標是建立一種視覺系統,這個系統能依據視覺敏感和反饋的某種程度的智能完成一定的任務。

例如:計算機視覺的一個重要應用領域就是自主車輛的視覺導航,還沒有條件實現像人那樣能識別和理解任何環境,完成自主導航的系統,所以,人們努力的研究目標是實現在高速公路上具有道路跟蹤能力,可避免與前方車輛碰撞的視覺輔助駕駛系統。
這里要注意的是,計算機視覺可以而且應該根據計算機系統的特點來進行視覺信息的處理,這是人類視覺系統是迄今為止,人們所知道的功能最強大和完善的視覺系統。
計算機視覺發展史
計算機視覺最早可以追溯到1966年,著名的人工智能學家馬文·明斯基給他的本科學生布置了一道非常有趣的暑假作業,他讓學生在電腦前面連一個攝像頭,然后寫一個程序,讓計算機告訴我們攝像頭看到了什么,這被看做是計算機視覺的一個起點。
上世紀70年代,研究者開始去試圖解決讓計算機告知他到底看到了什么東西這個問題,研究者認為要讓計算機認知到底看到了什么,可能首先要了解人是怎樣去理解這個世界的,因為那時有一種普遍的認知,認為人之所以理解這個世界,是因為人是有兩只眼睛,他看到的世界是立體的,他能夠從這個立體的形狀里面理解這個世界。
在這種認知情況下,研究者希望先把三維結構從圖像里面恢復出來,在此基礎上再去做理解和判斷。
上世紀80年代,是人工智能發展的一個非常重要的階段。80年代出現了很多方法,包括幾何以及代數的方法,將我們已知的物品轉化成一些先驗表征,然后和計算機看到的物品圖像進行匹配。
上世紀90年代,人工智能界又出現了一次比較大的變革,也就是統計方法的出現和流行。隨著90年代統計方法的流行,研究者找到了一種統計手段,能夠刻畫物品最本質的一些局部特征,例如:要識別一輛卡車,通過形狀、顏色、紋理,可能并不穩定,如果通過局部特征,即使視角變化了,也會準確對其進行辨識。局部特征的發展,其實也導致了后來很多應用的出現。例如:圖像搜索技術真正的實用,也是由于局部特征的出現。
到2000年左右,機器學習方法開始盛行,在這之前需要通過一些規則、知識或者統計模型去識別圖像所代表的物品是什么,但是機器學習的方法和以前是完全不同的,機器學習能夠從海量數據里面去自動歸納物品的特征,然后去識別它。在這樣一個時間點,計算機視覺界立交典型的代表有人臉識別。
機器學習的盛行其實是伴隨著一個必要條件出現的,就是在2000年左右,整個互聯網的出現和爆發,產生了海量的數據,大規模數據集也相伴而生,這為通過機器學習的方法來做計算機視覺提供了很好的土壤。
在這期間,出現了大量學術官方的,針對不同領域評測的數據集,其中人臉檢測最具有代表性是一個叫FDDB的數據集,除此之外,在這期間,還出現了其他非常有影響力的數據集,其中比較有代表性的就是由李飛飛教授發起的一個項目IMAGEMET。
在2000年代,人工智能經歷了一個快速發展期以后,整個人工智能在很多行業取得了非常好的應用,例如:視覺之外有搜索引擎排序和計算廣告等等,視覺領域人臉檢測器也被用在了各種各樣的相機里面。
到2010年代,人工智能進入了一個最激動人心的年代,它就是深度學習的年代。深度學習從本質上給整個人工智能帶來了一次革命。2006年Hinton教授在《科學》發表了對于深層神經網絡的訓練方法,帶來了深度學習的蓬勃發展。
自2006年開始,在接近10年的時間里,整個計算機視覺界產生了質的變化,深度學習的出現真正改變了計算機視覺之前的定義。
文本由@鄧鄧 整理發布于三個皮匠報告網站,未經授權禁止轉載。
推薦閱讀:
【精選】2021年計算機機器視覺行業供需現狀及相關企業分析報告(37頁).pdf
【研報】計算機行業:計算機視覺龍頭陸續申請上市行業景氣上行-210124(14頁).pdf
什么是計算機視覺?和機器視覺有什么區別?