“眼鏡是心靈的窗戶,打開心靈之窗請到XX眼科醫(yī)院”這是一則廣告語,但我并不是來打廣告的,我只是想通過它,說明眼睛對人類的重要性。不僅人類需要眼睛,機器人同樣需要一雙能看清一切的明眸。
看清一切的明眸
機器視覺給機器人一雙“慧眼”
看清楚是做好一件事情的基礎(chǔ),人工智能沒有視覺也就不可能成為真的智能。機器視覺系統(tǒng)便是讓這一切變成現(xiàn)實的的神奇發(fā)明。
當(dāng)前,面向特定領(lǐng)域的專用人工智能技術(shù)取得了突破性進展,甚至可以在單點突破、局部智能水平的單項測試中超越人類智能。比如日本仿人機器人、美國獵豹機器人、德國工業(yè)機器人,還有我國的人臉識別、虹膜識別、步態(tài)識別等人工智能發(fā)展很快。
但是就目前水平來看,距離我們理想中的機器人差的還是太遠。作為人類理想中的機器人,就應(yīng)該是《我,機器人》中的桑尼那樣,具備一切人類擁有而更出色的本領(lǐng)。人工智能的目的是幫人類解決更多更復(fù)雜的問題,那才能算得上成功,但是如果連“看”都做不到,你還能指望他們做好更難的事情嗎?這是作為智能機器人的基礎(chǔ)條件之一,也是十分關(guān)鍵的一點。不僅如此,大量的工業(yè)檢測系統(tǒng)也需要機器人能看的見,比如顏色、圖形檢測,你說盲人能完成這份工作嗎?大概傻子都不會信!
基于機器視覺對人工智能發(fā)展的重要意義,一些科技公司已經(jīng)提前布局視覺技術(shù)研究。
谷歌最新發(fā)布的機器視覺工具Cloud Vision API,可以幫助開發(fā)者構(gòu)建能夠“理解”圖像內(nèi)容的應(yīng)用,也就是圖像識別。這款視覺工具的應(yīng)用體現(xiàn)在四個方面:一是安全搜索檢測工具(Safe Search Detection)是為那些開發(fā)大眾圖片分享應(yīng)用準備的,而此工具的作用就是讓開發(fā)者利用谷歌的Safe Search安全搜索技術(shù),屏蔽一些內(nèi)容不符合規(guī)定的圖片內(nèi)容;二是特性臉部檢測(Facial Detection)。關(guān)于這個應(yīng)用,中間也發(fā)生過一個小插曲,不久前有新聞報道稱谷歌的人臉識別誤將一位黑人判定為大猩猩,谷歌也為此做出道歉;三是地標檢測(Landmark Detection),可讓應(yīng)用識別照片中的標志性建筑,比如艾弗爾鐵塔,而且能明確標出這就是艾弗爾鐵塔,而不只是說那是個塔,同時定位照片拍攝所在位置,自然景觀也是適用的;四是實體檢測(Entity Detection),可用于識別照片中主體內(nèi)容,并且識別那是什么,比如農(nóng)場的照片就可自動貼上“生產(chǎn)”的標簽了。
從上面不難發(fā)現(xiàn),這些都還只是一些簡單的圖片識別功能,距離達到人類水準并超越人類的標準差距甚大。
機器視覺是一門涉及了人工智能、神經(jīng)生物學(xué)、心理物理學(xué)、計算機科學(xué)、圖像處理、模式識別等諸多領(lǐng)域的交叉學(xué)科。一個典型的工業(yè)機器視覺應(yīng)用系統(tǒng),包括數(shù)字圖像處理技術(shù)、機械工程技術(shù)、控制技術(shù)、光源照明技術(shù)、光學(xué)成像技術(shù)、傳感器技術(shù)、模擬與數(shù)字視頻技術(shù)、計算機軟硬件技術(shù)、人機接口技術(shù)等。這其中涉及到的技術(shù)大多還處于發(fā)展階段,受此類因素影響,機器視覺研究的進程也十分緩慢。
要實現(xiàn)高層度的人工智能,讓機器人能夠看見是最基本的條件之一。機器視覺的研究當(dāng)前還面臨著大量的障礙,看見并識別物體也需要其他技術(shù)的支撐,所以這必將是一個漫長的過程。
(審核編輯: 智匯先鋒)