計(jì)算機(jī)視覺+深度學(xué)習(xí) 格林深瞳要用人臉識(shí)別技術(shù)讓世界無處遁形
點(diǎn)擊:1403
A+ A-
所屬頻道:新聞中心
沿著玉帶路向前,滿地的銀杏樹葉,紅的黃的鋪滿了這條狹窄冷清的道路。道路左手旁是京密引水渠,與之僅一座矮墻之隔的,就是頤和園。古老的樹木探出身,迎著北京初冬的風(fēng)肆意而舞。云彩就這樣悠閑地晃蕩在淡藍(lán)色的調(diào)染盤上,在陽光照射下,若隱若現(xiàn)的分了層,白色的如玉,灰暗的如影,交錯(cuò)著呈現(xiàn)出古老廟宇殿堂的莊嚴(yán)和肅靜。格靈深瞳就在路盡頭的一側(cè),門口端坐著兩只石獅,院子里某處隱藏著人眼攝像機(jī)。敞亮的屋內(nèi),橫排擺放著的不是香爐書畫,而是最先進(jìn)的電腦,桌前則坐著最優(yōu)秀的科技人才。
古老與現(xiàn)代,傳統(tǒng)與科技就這樣交融著,時(shí)空穿越般地打亂了時(shí)間和空間的界限。大千世界溶于這一方院落,場(chǎng)景魔幻又現(xiàn)實(shí),如夢(mèng)又寫真。
人工智能成掘金場(chǎng)大市場(chǎng)點(diǎn)燃中國(guó)創(chuàng)業(yè)熱土
Gartner公司公布了2017年具備戰(zhàn)略意義的重大科技發(fā)展趨勢(shì),這十大技術(shù)趨勢(shì)可總結(jié)概括為:以智能為中心,通過數(shù)字化實(shí)現(xiàn)萬物互聯(lián)。Gartner預(yù)計(jì),這些趨勢(shì)在未來五年內(nèi)會(huì)迅速增長(zhǎng)、高度波動(dòng),預(yù)計(jì)達(dá)到臨界點(diǎn)。在十大趨勢(shì)排名前三的分別為人工智能和高級(jí)機(jī)器學(xué)習(xí)、智能App以及智能事物。人工智能和高級(jí)機(jī)器學(xué)習(xí)由許多科技和技術(shù)(例如,深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、自然語言處理)組成。更先進(jìn)的技術(shù)超越了傳統(tǒng)的基于規(guī)則的算法,以創(chuàng)建理解、學(xué)習(xí)、預(yù)測(cè)、適應(yīng)和潛在地自主操作的系統(tǒng),使機(jī)器真正具備類人的“大腦”。未來,智能將無處不在。
在回到中國(guó)前,畢業(yè)于布朗大學(xué)的趙勇就職谷歌公司,讓世界科技領(lǐng)域聞之興奮的谷歌眼鏡就出自他所在的團(tuán)隊(duì)之手。職位是令人艷羨的、生活是富足的、接觸到的是來自世界頂級(jí)的最前沿信息、任職的都是谷歌的大腦部門。但這一切都沒能阻擋他踏上回國(guó)創(chuàng)業(yè)之路。
上海復(fù)旦大學(xué)研究生畢業(yè)后的趙勇選擇遠(yuǎn)去美國(guó)繼續(xù)深造。此去經(jīng)年,在美國(guó)讀書工作已十年有余,他親眼驗(yàn)證了中國(guó)國(guó)際地位的變遷?!拔?003年到美國(guó),那個(gè)時(shí)候美國(guó)媒體對(duì)中國(guó)的報(bào)道是非常少的,即便偶爾出現(xiàn)在報(bào)端也是負(fù)面新聞。但是到了2010年,突然間發(fā)現(xiàn)全世界大多有趣的事都是發(fā)生在中國(guó)?!?2010年,《TIMES》雜志對(duì)過去十年間發(fā)生的國(guó)際大事進(jìn)行了回顧,所關(guān)注的只有一個(gè)主題:CHINA。這篇文章由三次榮獲普利策獎(jiǎng)的Thomas L.Friedman撰寫,從中國(guó)社會(huì)、文化、政治、經(jīng)濟(jì)、科技等領(lǐng)域事無巨細(xì)的報(bào)道和描寫了中國(guó)在十年間的變化和進(jìn)步,這一切讓趙勇萌生了回國(guó)的念頭。
“美國(guó)有亞馬遜、谷歌、Facebook,中國(guó)有BAT,但整個(gè)歐洲卻沒有一個(gè)能讓人印象深刻的互聯(lián)網(wǎng)公司。goole.com在美國(guó)市場(chǎng)占有率是60 %,但是在歐洲則高達(dá)95%。不是歐洲人不懂技術(shù),而是他們沒有統(tǒng)一文化的區(qū)域,因?yàn)樗麄兊恼Z言都是分裂的,沒有足夠大的市場(chǎng)。在中國(guó),餓了吧這樣的公司可以在一兩年內(nèi)變得很強(qiáng)大是與大市場(chǎng)有著密切關(guān)系的?!?/span>
在谷歌任職時(shí),趙勇每年都會(huì)抽出2個(gè)月時(shí)間回到中國(guó)進(jìn)行調(diào)研。在他看來,美國(guó)生活的十幾年,讓他錯(cuò)過了中國(guó)發(fā)展最快的時(shí)間,這是一筆很大的損失。2012年底,趙勇在硅谷認(rèn)識(shí)了徐小平,一次深談后,趙勇決定回國(guó):“恨不得馬上就辭職?!被貒?guó)后,他為自己選定的方向是計(jì)算機(jī)視覺。
“計(jì)算機(jī)視覺+深度學(xué)習(xí)” 助力智能未來提前到場(chǎng)
根據(jù)艾瑞咨詢預(yù)計(jì),2020年全球人工智能市場(chǎng)規(guī)模將達(dá)到1190億元,年復(fù)合增速約19.7%;同期中國(guó)人工智能市場(chǎng)規(guī)模將達(dá)91億元,年復(fù)合增速超50%。時(shí)間倒退回2013年,趙勇剛剛回國(guó)并打算在計(jì)算機(jī)視覺領(lǐng)域大展宏圖時(shí),卻遭受了現(xiàn)實(shí)的打擊。顯然這一年,中國(guó)創(chuàng)業(yè)的標(biāo)簽是可穿戴設(shè)備和O2O。對(duì)于他而言的偉大事業(yè)還鮮有人了解。
“很多人問我為什么不依靠谷歌眼鏡的技術(shù)做一個(gè)趙勇眼鏡或者格靈眼鏡,但對(duì)我來說這是違背職業(yè)道德的。更何況在我看來,計(jì)算機(jī)視覺有更加美好的未來?!?/span>
不斷接觸投資人,不斷受挫,“有投資人告訴我,中國(guó)不適合技術(shù)創(chuàng)新,創(chuàng)新的成本太高了。”在堅(jiān)持了一年后,谷歌以約6億美元的價(jià)格收購(gòu)了英國(guó)初創(chuàng)公司DeepMind Technologies。自此,創(chuàng)投圈開始刮起了人工智能之風(fēng),投資商們迅速轉(zhuǎn)變了想法。但快速局部的火熱后接踵而來的是過度炒作,趙勇將其形容為“泡沫”。9月后,經(jīng)歷股災(zāi)的投資市場(chǎng)變冷,人工智能落地等一系列問題也再一次提升了融資的難度。幸運(yùn)的是,重壓之下產(chǎn)生了巨大動(dòng)力,“我們開始思考賺錢的問題。這個(gè)壓力使得我們6個(gè)月內(nèi)解決了很多問題,產(chǎn)品也快速落地。同時(shí)也對(duì)格靈深瞳未來的發(fā)展方向和路徑做出了更加清晰的判斷和規(guī)劃?!?/span>
面對(duì)數(shù)據(jù)的大爆炸以及對(duì)未來的憧憬,人們開始探索更廣闊的世界。技術(shù)的衍變將人們推向了視覺搜索的時(shí)代。在這個(gè)空間中,一切的圖像,不管是平面的還是立體的,都可以被標(biāo)注、被搜索??苹秒娪爸兴尸F(xiàn)的令人眼花繚亂的技術(shù),已經(jīng)不僅是夢(mèng)想。在這個(gè)巨大的寶藏掩蓋下,下一個(gè)獨(dú)角獸或許正在蠢蠢而動(dòng),伺機(jī)爆發(fā),誰能最先定義智能未來,誰就掌握著先機(jī)。
成立之初,格靈深瞳利用三維計(jì)算機(jī)視覺增加了物體的深度信息,更完整真實(shí)地還原了物體信息,解決了相互遮擋、比例混淆、影隨人動(dòng)等問題,提高了智能檢測(cè)和分析的準(zhǔn)確度。并借由深度學(xué)習(xí)幫助計(jì)算機(jī)像人一樣在真實(shí)世界中吸收、學(xué)習(xí)和理解復(fù)雜的信息,完成高難度的識(shí)別任務(wù)。
成立三年,格靈深瞳已經(jīng)借助自主研發(fā)的深瞳技術(shù)在人和車的檢測(cè)、跟蹤與識(shí)別方面居于世界領(lǐng)先水平。三年中,趙勇帶領(lǐng)團(tuán)隊(duì)成員先后研發(fā)了皓目行為分析儀、威目車輛大數(shù)據(jù)系統(tǒng)、威目視頻結(jié)構(gòu)化系統(tǒng)、威目人臉識(shí)別系統(tǒng)、威目視圖大數(shù)據(jù)平臺(tái)、深瞳人眼攝像機(jī)?!白罾щy的時(shí)期就是現(xiàn)在,因?yàn)槲覀冮_始需要為自己負(fù)責(zé)了。剛開始是理想驅(qū)動(dòng),沒有現(xiàn)實(shí)的壓力,甚至不需要考慮競(jìng)爭(zhēng)對(duì)手,因?yàn)槲覀儍H僅是北京20萬創(chuàng)業(yè)企業(yè)中的一個(gè)。現(xiàn)在隨著我們逐漸擴(kuò)大的規(guī)模,開始需要制定長(zhǎng)遠(yuǎn)的戰(zhàn)略,需要不斷分析我們的機(jī)會(huì)在哪,我們的競(jìng)爭(zhēng)對(duì)手是誰?!?/span>
現(xiàn)在,格靈深瞳擁有的不僅是技術(shù),更是落地后的產(chǎn)品?!皩⒃技夹g(shù)變成產(chǎn)品的這個(gè)過程很難,但是現(xiàn)在我們已經(jīng)做到了。用戶在我們這里得到的不僅僅是產(chǎn)品和清晰的商業(yè)應(yīng)用解決方案,更是背后的大數(shù)據(jù)平臺(tái)。”
深瞳技術(shù)筑競(jìng)爭(zhēng)壁壘“天眼”讓世界無處遁形
在電影《速度與激情7》中,女駭客Ramsey利用“天眼”系統(tǒng)對(duì)敵人進(jìn)行實(shí)時(shí)追蹤,互聯(lián)網(wǎng)天眼主要是依靠世界上互聯(lián)的監(jiān)控?cái)z像頭。電影中的敵對(duì)組織頭目利用人臉識(shí)別來確認(rèn)一行人的行蹤,這項(xiàng)讓人印象深刻的技術(shù)是“人臉識(shí)別”。實(shí)際上,人臉識(shí)別這項(xiàng)戴著高科技光環(huán)的技術(shù)已經(jīng)被實(shí)現(xiàn)。
深瞳人眼攝像機(jī)是格靈深瞳的拳頭產(chǎn)品,也是世界上首款基于人眼工作原理的攝像機(jī)。趙勇介紹,深瞳人眼攝像機(jī)采用獨(dú)創(chuàng)的像素動(dòng)態(tài)瞬時(shí)分配技術(shù),瞬間將局部畫面的有效像素提升百倍以上,整體畫面達(dá)到數(shù)億級(jí)等效像素,可實(shí)現(xiàn)對(duì)多類型目標(biāo)的檢測(cè)與抓拍,兼具超高抓拍準(zhǔn)確率與超低漏檢率,使得遠(yuǎn)距離、大廣角等泛場(chǎng)景下的人臉和車輛識(shí)別變?yōu)楝F(xiàn)實(shí)。
在格靈深瞳辦公區(qū)的院落中安裝了數(shù)臺(tái)深瞳人眼攝像機(jī),到訪者從剛踏入的一瞬間就被攝像機(jī)所記錄下來?!霸?000萬的人臉數(shù)據(jù)庫(kù)中找到這個(gè)到訪者并完成識(shí)別,整個(gè)過程只需要幾秒鐘?!壁w勇介紹,深瞳人眼攝像機(jī)具備人眼般的精密結(jié)構(gòu),可以捕捉遠(yuǎn)距離高清特寫,并且具有超大廣角視野。人腦般的深度智慧則可以讓相機(jī)識(shí)別得更精準(zhǔn),捕捉速度更快,類型更加多樣,保證了超高抓拍準(zhǔn)確率。并能夠?qū)θ撕蛙囘M(jìn)行全場(chǎng)景急速抓拍,無論人、車處于站、坐、蹲、步行、跑動(dòng)、騎行等各種姿態(tài)都能精準(zhǔn)捕捉?!肮部蛻羰俏覀兎?wù)的一個(gè)領(lǐng)域,這要求我們能夠在最短的時(shí)間內(nèi)識(shí)別出犯罪嫌疑人。”趙勇舉了一個(gè)例子:“例如在競(jìng)標(biāo)時(shí),某個(gè)省的公安人員會(huì)將全省3000萬居民的身份證照片放到我們的服務(wù)器上。我們將這些人臉入庫(kù),把每個(gè)人的臉變成一個(gè)特征,一個(gè)人需要花費(fèi)100-200毫秒,相當(dāng)于一秒鐘可以做5-10個(gè)人。幾天就將這些人全部入庫(kù)。在競(jìng)標(biāo)時(shí),警方給出幾張測(cè)試照片,誰能在最短的時(shí)間內(nèi)識(shí)別出照片中的人是誰,誰就將贏得競(jìng)標(biāo)。”現(xiàn)在這項(xiàng)技術(shù)掌握在極少的幾家企業(yè)中,這也標(biāo)志著格靈深瞳已進(jìn)入行業(yè)的最高水準(zhǔn)。
行業(yè)雖然仍處于上升階段,但已有??颠@樣的大廠占據(jù)了更多的機(jī)會(huì)。師夷長(zhǎng)技以制夷,只有不斷進(jìn)步才能突出重圍在行業(yè)內(nèi)站穩(wěn)腳跟?,F(xiàn)在,深瞳人眼攝像機(jī)最遠(yuǎn)可拍攝到50米外的圖像,超過競(jìng)爭(zhēng)對(duì)手10倍之多,2億有效高清像素也處于行業(yè)絕對(duì)領(lǐng)先位置。
“已知犯罪嫌疑人將出現(xiàn)在天通苑這樣人流密集的地方,哪怕再有經(jīng)驗(yàn)的警察也無法準(zhǔn)確識(shí)別。但在技術(shù)和大數(shù)據(jù)的幫助下,我們可以快速縮小目標(biāo)的范圍并將他鎖定。”
對(duì)于格靈深瞳另一款產(chǎn)品威目車輛特征識(shí)別系統(tǒng),趙勇也顯得十分驕傲。目前,威目車輛特征識(shí)別系統(tǒng)可以在復(fù)雜場(chǎng)景中同時(shí)檢測(cè)多個(gè)目標(biāo),并精確區(qū)分機(jī)動(dòng)車、二輪車、三輪車和行人,且能夠可識(shí)別19種細(xì)分車型、4000多種車款、12種車身顏色,白天識(shí)別率大于95%,夜間識(shí)別率大于90%。最令人驚奇的是,這款系統(tǒng)不依賴車牌信息就可以識(shí)別部分被遮擋或位于畫面邊緣的車輛,這一功能也將幫助其在安防領(lǐng)域大顯身手。
“如果犯罪分子偽造車牌,我們還是可以依靠威目系統(tǒng)通過擋風(fēng)玻璃上的裝飾品等信息綜合之下識(shí)別車輛?!边@并不是趙勇想象中的場(chǎng)景,它已經(jīng)實(shí)際應(yīng)用在天津市的重要交通卡口。每天有3000余萬車輛不斷通過,系統(tǒng)通過大數(shù)據(jù)識(shí)別車輛身份、軌跡和行為,并利用模糊識(shí)別將不確定的信息變成具體目標(biāo),“如果發(fā)現(xiàn)逃逸車輛,我們可以通過事發(fā)時(shí)間和地點(diǎn)以及當(dāng)事人提供的殘缺信息快速縮小目標(biāo)車輛范圍,最終找到他的位置?!?/span>
從備受冷遇的投資荒到逐漸走熱的行業(yè)趨勢(shì),人工智能將賦予未來更多的想象力?!疤煅邸钡臒o所不能在未來某一天或?qū)⒉辉偈羌∑媸?,技術(shù)的強(qiáng)大震撼力將在安防、醫(yī)療、出行等領(lǐng)域創(chuàng)造出更加安全、便捷的生活方式。以技術(shù)創(chuàng)新為驅(qū)動(dòng)力的格靈深瞳現(xiàn)在正處于發(fā)展的關(guān)鍵節(jié)點(diǎn),在不斷強(qiáng)大的路上,還將遭遇更多坎坷。這些棘手的難題或?qū)碓从谑袌?chǎng)的占位,或有關(guān)技術(shù)的革新。但無論如何,在智能世界到來之前,他已經(jīng)走出了第一步。
(審核編輯: 智匯小蟹)
分享