大數(shù)據(jù)驅(qū)動的通用人工智能 學術(shù)產(chǎn)業(yè)界雙贏
點擊:833
A+ A-
所屬頻道:新聞中心
在Deepmind和AlphaGo獲得的巨大成功吸引了全世界的目光的同時,新一代人工智能德比大戰(zhàn)已經(jīng)開始。
Deepmind之前開發(fā)的玩雅達利(Atari)街機游戲的人工智能是全新一代的智能技術(shù)——大數(shù)據(jù)驅(qū)動通用人工智能(Big Data-driven Artificial General Intelligence)。
就像這個名字所提到的,這里有兩個重要的因素,一是“大數(shù)據(jù)”驅(qū)動,二是通用人工智能。大數(shù)據(jù)驅(qū)動的機器學習使得機器盡量脫離人類的經(jīng)驗指導,自動在海量數(shù)據(jù)和工作環(huán)境中挖掘知識取得進步。而通用人工智能基于端對端(end-to-end)的深度強化學習(Deep Reinforcement Learning),幫助機器能在不同的任務中共享一套學習框架,無需人類進一步調(diào)試。
這兩個因素同時作用出一個效果,即人需要的干預越來越少,而機器在與環(huán)境交互反饋中的自主學習比重越來越大。
“大數(shù)據(jù)”驅(qū)動的機器學習
AlphaGo的圍棋棋力來自于30萬張人類對弈棋譜以及3千萬次自我對弈,這是一個典型的大數(shù)據(jù)機器學習產(chǎn)物。
相比之下,1996年擊敗國際象棋大師卡斯帕羅夫的IBM深藍(DeepBlue)人工智能,其依賴的是大量人類總結(jié)出來的走子規(guī)則的手動輸入,以及基于超級計算機每秒上億次搜索的全寬度(full-width)搜索解決方案。
簡單地說,深藍的人工智能相當于人類把自己下象棋的知識和經(jīng)驗手動輸入電腦中,而AlphaGo的人工智能是人類把一堆棋譜“丟”給電腦,后者自己學習總結(jié)出來甚至進一步超出人類圍棋認知范疇的知識。
基于機器學習來搭建人工智能,人類不需要通過顯示地編程來教機器如何工作,而是給出一個學習框架,告訴機器如何根據(jù)自身當前設置以及提取環(huán)境的反饋去進一步更新參數(shù),進而達到一個更好的工作表現(xiàn)。
然后人類只需要把大量數(shù)據(jù)“喂”進機器,機器就可以不斷學習不斷優(yōu)化自身的參數(shù)了。這樣,人類就不需要自己首先去總結(jié)經(jīng)驗再交給機器,而是變成了“甩手掌柜”,在一邊看著機器學習起來就行。
隨著機器學習的模型先進性以及機器處理大數(shù)據(jù)的能力不斷升級,基于大數(shù)據(jù)的人工智能已經(jīng)在人們的生活當中扮演越來越重要的角色。
過去10年間,基于大數(shù)據(jù)的人工智能已經(jīng)在各個領域展露頭角,包括在線廣告的精準投放、搜索引擎?zhèn)€性化網(wǎng)頁排序、電商的個性化商品推薦、社交網(wǎng)絡的好友建議、人臉識別、圖像識別、自然語言理解、機器翻譯、語音識別、無人機跟蹤技術(shù)、汽車自動駕駛等等。
很明顯,未來的10年內(nèi),越來越多的應用場景會裝配上人工智能,而且機器會不斷學習,做得越來越好。
通用人工智能
Deepmind和其它做機器學習的科技公司的不同在于它提出來的通用人工智能(ArtificialGeneralIntelligence)的概念和產(chǎn)品。通用人工智能背后的技術(shù)是深度強化學習,其主要有兩個特點,一是端對端(end-to-end)的學習,二是自適應,無需人類調(diào)參而勝任不同的任務。
Deepmind之前推出的玩街機游戲的通用人工智能技術(shù)就完美地詮釋了這兩個特點。
首先,機器的輸入直接是游戲屏幕的像素,不需要任何特征設計和編碼。這里要歸功于最近4年來名聲大噪的深度學習技術(shù)。深度學習通過建立較深層數(shù)的人工神經(jīng)網(wǎng)絡模型,使機器能夠自動從原始輸入信息中提取、學習出適用于預測、決策的高層特征。
例如在人臉識別這一場景中,深度卷積網(wǎng)絡(deepconvolutionalnetworks)輸入層得到圖片像素本身,底層網(wǎng)絡學習出點、直線、曲線、拐角等初級特征,中層網(wǎng)絡在這些點、線、角的基礎上學習出眼睛、鼻子、嘴等器官特征,高層網(wǎng)絡則進一步組合這些器官特征判斷出圖片是否包含人臉。
其次,同樣設置的機器可以做不同的任務,只要“喂”進去的數(shù)據(jù)不同,無需人類調(diào)參或者只需要極小的人類工作花銷。Deepmind使用同一個深度Q學習網(wǎng)絡(DQN,deep-q-network)模型可以玩不同的街機游戲,只需要讓機器玩某個游戲幾天,它就能學會并超過人類玩家。
通用人工智能可以理解為是在強化學習的框架下,結(jié)合其在不同任務下的適應性、模型零耦合(model-free)的優(yōu)勢和深度學習的特征自動提取的優(yōu)勢,實現(xiàn)出的能勝任多種任務端對端學習的超級人工智能。這已經(jīng)十分接近人類學習和工作的方式了。
正是由于以上兩點優(yōu)勢,人類在開發(fā)新一代人工智能的過程中需要做的干涉越來越少,交給機器去自動完善的學習比重越來越大,這為人工智能的工作水平的提升以及在各個領域的普及帶來了本質(zhì)的飛躍。
萬物互聯(lián)的人工智能時代
最近這三年,我們總是被各種耀眼的技術(shù)詞匯轟炸著:大數(shù)據(jù)、機器學習、人工智能、物聯(lián)網(wǎng)、工業(yè)4.0、互聯(lián)網(wǎng) ……我認為,這些五花八門的詞匯其實都在指向同一個未來:一個萬物互聯(lián)的人工智能時代。
我希望從三個維度上的趨勢來解釋這個觀點:互聯(lián)化、數(shù)據(jù)化和智能化。
互聯(lián)化是指我們真實世界的設備與設備互聯(lián),而不只是一臺服務器上的網(wǎng)站和另一臺服務器的網(wǎng)站相連。以汽車舉例,我們的汽車可以連接到家里的空調(diào),這樣我們在回家的路上就可以發(fā)出指令啟動房間里的空調(diào);汽車也可以和路邊的建筑設施互聯(lián),找到適合的停車位或者商場中的服務。
汽車之間也可以互聯(lián),通訊汽車間距、速度等信息,自動保障行車安全。這就是物聯(lián)網(wǎng)(在汽車垂直領域稱作車聯(lián)網(wǎng)),其在制造業(yè)的應用被德國稱為工業(yè)4.0,在生活上的應用則被我們中國稱為互聯(lián)網(wǎng) 。
數(shù)據(jù)化是指盡可能多的設備信息、工作狀態(tài)被量化成數(shù)據(jù)并可在設備之間通訊。同樣舉汽車的例子,司機每天開車的路徑、其中各個地點的速度、加速度、油門深淺、剎車輕重、路況等信息都可以通過傳感器產(chǎn)生可記錄、通訊和分析的數(shù)據(jù)。
目前,以特斯拉為代表的新能源汽車已經(jīng)在數(shù)據(jù)化進程上走得很遠了。其他領域,例如家居、健康,也在推進數(shù)據(jù)化進程。由于越來越多的設備互聯(lián),各個設備的狀態(tài)也進一步數(shù)據(jù)化,人類在接下來的10年內(nèi)產(chǎn)生的數(shù)據(jù)量將會比互聯(lián)網(wǎng)時代更上一個新臺階。
從大數(shù)據(jù)的角度來講,“大”不但指數(shù)據(jù)規(guī)模大,更指的是數(shù)據(jù)維度高。而設備的互聯(lián)化和數(shù)據(jù)化將會產(chǎn)生比當今互聯(lián)網(wǎng)大數(shù)據(jù)更加名副其實的大數(shù)據(jù)。
智能化則是在設備互聯(lián)化、數(shù)據(jù)化的基礎上通過數(shù)據(jù)驅(qū)動的人工智能解決各種各樣的快速有效的預測和決策問題。從機器學習的角度來講,用于訓練的數(shù)據(jù)規(guī)模越大、維度越高,就越能學習出更復雜的高級模型,勝任更高難度的智能工作。
大數(shù)據(jù)是原材料,機器學習是原材料加工廠,而新一代人工智能服務則是工廠出爐的產(chǎn)品被消費在越來越多的日常生活中。我們看到最近這三年這樣一個新型產(chǎn)業(yè)鏈的每個環(huán)節(jié)都在蓬勃發(fā)展,而在AlphaGo戰(zhàn)勝李世石的今天,更多的人開始注意到這條產(chǎn)業(yè)鏈帶來的人工智能產(chǎn)品將會在未來10年間給人們的生活帶來翻天覆地的改善。
學術(shù)界與產(chǎn)業(yè)界雙贏
結(jié)合真實大數(shù)據(jù)并在人們?nèi)粘I钪邪l(fā)揮作用的人工智能研究是目前最有效率并最符合整個產(chǎn)業(yè)鏈發(fā)展趨勢的研究方式。研究大數(shù)據(jù)驅(qū)動的人工智能,首先得有“活的”大數(shù)據(jù)可供研究,才在真實環(huán)境中不斷嘗試研發(fā)新的人工智能模型。
這樣一個交互式的研究環(huán)境最能夠促進新成果的誕生。這也是當今許多世界級并且奮戰(zhàn)在人工智能研究一線的大學教授會選擇在一家科技企業(yè)兼職的原因。
而幾年前高校的數(shù)據(jù)挖掘和機器學習研究仍然傾向于靠著一個許多年前生成的數(shù)據(jù)集不斷地測試新模型。從實踐經(jīng)驗來看,這樣工作在一個老的小數(shù)據(jù)集上的模型很難勝任現(xiàn)實生活中的大規(guī)模動態(tài)數(shù)據(jù)。而高校實驗室需要作出最前沿的人工智能技術(shù)就需要奮斗在大數(shù)據(jù)處理的第一線?!癎ethandsdirty?!边@樣才能切身感受到最真實最野性的數(shù)據(jù),才能真正理解數(shù)據(jù)和基于數(shù)據(jù)搭建起來的人工智能。
我認為在大數(shù)據(jù)驅(qū)動的人工智能研究中,大學科研團隊與工業(yè)界算法團隊相比,其優(yōu)勢在于能將主要精力投入在算法研究中,能在擁有大數(shù)據(jù)和測試平臺的基礎上,產(chǎn)出一般企業(yè)想不到的有效算法;另外大學研究者由于長期保持相關(guān)文獻的收集整理,對領域內(nèi)的最新技術(shù)以及新舊技術(shù)的全局理解有很深的體會。
大數(shù)據(jù)驅(qū)動的人工智能是一個產(chǎn)業(yè)界和學術(shù)界雙贏合作的領域。
我在倫敦大學學院的博士課題是互聯(lián)網(wǎng)精準展示廣告算法。互聯(lián)網(wǎng)廣告領域的數(shù)據(jù)由于涉及廣告拍賣交易中的價格信息而十分敏感,所以該領域在2012年之前并不存在任何互聯(lián)網(wǎng)廣告領域的公開數(shù)據(jù)集可供高校研究者做研究。該領域絕大多數(shù)研究論文皆來自涉足互聯(lián)網(wǎng)廣告的科技公司,例如谷歌、微軟、雅虎等等。
對于高校研究者來說,做互聯(lián)網(wǎng)廣告大數(shù)據(jù)的研究,首要任務就是同相關(guān)企業(yè)建立研究合作,獲取最新的廣告投放數(shù)據(jù),并在合作企業(yè)的商業(yè)平臺上直接做面向真實用戶流量的實驗。我們研究組在倫敦、北京和硅谷尋找到了多家廣告科技企業(yè)進行合作,其中既有業(yè)務量和數(shù)據(jù)龐大的IT巨人,也有迭代速度極快的初創(chuàng)公司。
我在博士期間發(fā)表的數(shù)篇互聯(lián)網(wǎng)廣告技術(shù)方面的論文,都包含了在這些企業(yè)平臺上做的在線實驗。我也在和企業(yè)的交互中學習到了很多在高校實驗室無法接觸到的實踐經(jīng)驗。根據(jù)我們的研究產(chǎn)出,合作的企業(yè)也都有效提升了廣告投放的效益。
(審核編輯: 智慧羽毛)
分享