人工智能領(lǐng)域的領(lǐng)軍人物,需過人工智能協(xié)會(huì)首位華人Fellow、第四范式首席科學(xué)家、香港科技大學(xué)計(jì)算機(jī)系主任楊強(qiáng)教授在論壇上提了這樣一個(gè)問題:“現(xiàn)在像Google這樣的公司是有人工智能的能力,一些大的銀行和機(jī)構(gòu)也開始做人工智能,我們平頭老百姓什么時(shí)候也可以用起來人工智能呢?”
楊強(qiáng)表示:人工智能的范圍很大,問題比較局限,問題的邊界非常地清晰,比如說圍棋是一個(gè)問題,金融是另外一個(gè)問題,無人車是下一個(gè)問題,這個(gè)問題的定義越清晰它的成功概率就越低。
為此,他提出了人工智能要成功的5個(gè)條件。
人工智能成功的五要素
1、數(shù)據(jù)量需要有足夠的積累:
在2000年之后就有不同的網(wǎng)站開始收集人和人之間對(duì)弈的數(shù)據(jù),經(jīng)過10年的積累才收集了3000萬盤的數(shù)據(jù),5年前這種數(shù)據(jù)很顯然是不夠的。因此,人工智能并不是說對(duì)任何問題都是迎刃而解的,馬上立竿見影的,而是需要有一定的數(shù)據(jù)積累的過程,也許我們今天看好的某個(gè)領(lǐng)域可能是醫(yī)療,也許從今天開始收數(shù)據(jù),我們收獲碩果的時(shí)候是10年以后。
2、邊界清晰:
這也是DIGMIND這樣的公司首選做游戲的原因,在這個(gè)游戲之前做了很多單人的打飛船的游戲,這些游戲都可以從數(shù)學(xué)上來定義動(dòng)作。
3、外部反饋:
楊強(qiáng)表示:這個(gè)反饋就等于是老師在教我們,如果沒有這些老師我們是不是可以學(xué)出來?現(xiàn)在有一些學(xué)者在研究非接入學(xué)習(xí),這是不是可以成功?非常少。我們?cè)谥Z亞方舟實(shí)驗(yàn)室的時(shí)候和吳文達(dá)的研究小組有一個(gè)溝通,他們非常希望在華為得到一些訓(xùn)練數(shù)據(jù)大家一起合作做一些語音方面的工作,他們的第一個(gè)問題是你的數(shù)據(jù)有沒有標(biāo)注,如果沒有標(biāo)注就完全不感興趣,所以外部的反饋是非常非常重要的。
4、龐大的計(jì)算資源:
楊強(qiáng)舉例了AlphaGo所需要的計(jì)算資源:如果說李世石一天吃一個(gè)漢堡包,AlphaGo需要吃300個(gè),換算成硬件來說就是大概用了300個(gè)CPU,普通大學(xué)的實(shí)驗(yàn)室有6個(gè)CPU已經(jīng)非常不錯(cuò)了,這樣一個(gè)“土豪型”的實(shí)驗(yàn)室的量是必不可少的。之后是頂級(jí)的數(shù)據(jù)科學(xué)家了。
5、深度學(xué)習(xí)
這五個(gè)條件實(shí)際上都是門檻,就是說一般的老百姓、一般的公司甚至是大公司沒有人工智能積累的公司,如果要進(jìn)入人工智能取得這樣的成功是不可能的。
人工智能的發(fā)展方向
未來的人工智能方向是怎樣的?楊強(qiáng)表示可以從亮點(diǎn)去看:
1、“強(qiáng)化學(xué)習(xí)”
首先我們要知道延遲反饋這一概念,舉個(gè)例子只能在一個(gè)學(xué)期到學(xué)期尾才知道我們期末模式考得好考得壞;在投資股票、在理財(cái)產(chǎn)品,過幾天才知道這個(gè)投資是對(duì)還是錯(cuò),這種現(xiàn)象被稱為延遲反饋。
得到延遲反饋的時(shí)候中間已經(jīng)有了很多的步驟,我們不清楚哪個(gè)步驟是使得我們得到反饋的,因此我們要用到強(qiáng)化學(xué)習(xí)。
楊強(qiáng):“說起強(qiáng)化學(xué)習(xí)我不得不提到Google去年在自然雜志上發(fā)表的一篇文章,橫向是得到的分?jǐn)?shù),每一個(gè)欄是個(gè)人的游戲,這個(gè)是個(gè)人學(xué)習(xí)的系統(tǒng),每一次打游戲?qū)W會(huì),再一次再打輸再學(xué)會(huì)是自學(xué)習(xí)的過程,中間的這條線是humanlevel,去年5月份已經(jīng)有一大半超過人類的水平,現(xiàn)在是所有的都超過人類的水平了,而且完全是自學(xué)習(xí)的,我們?cè)趯?shí)驗(yàn)室里面也實(shí)現(xiàn)了打乒乓的游戲,我們發(fā)現(xiàn)拿一個(gè)單一的GPU來算花了三天三夜的時(shí)間不斷地打乒乓,最后可以達(dá)到日類的最高水平?!?/span>
所以說強(qiáng)化學(xué)習(xí)是一個(gè)在狀態(tài)空間的搜索,在過去人工智能的研究中,錯(cuò)誤地認(rèn)為一些狀態(tài)應(yīng)該是由人來定義的,因此它就一直是止步不前,甚至是有幾十年的功夫都沒有很大的突破,最近兩年通過Google和其他的研究者的研究,發(fā)現(xiàn)這些狀態(tài)原來可以通過深度學(xué)習(xí)來定義,那么有了深度學(xué)習(xí)以后,強(qiáng)化學(xué)習(xí)里面的難題也就迎刃而解了,我們現(xiàn)在不在乎來定義這些狀態(tài)我只需要來定義輸入和輸出,這個(gè)有一個(gè)特別的名詞叫端到端的學(xué)習(xí),也就是說我們只關(guān)心它的輸入,比如說Google打游戲的只關(guān)心一個(gè)屏幕的截圖作為輸入,它的輸出就是贏了為贏,就這么簡(jiǎn)單叫做端到端的學(xué)習(xí)。
2、遷移學(xué)習(xí)
遷移學(xué)習(xí)里是分兩個(gè)領(lǐng)域的,假設(shè)我們有一個(gè)領(lǐng)域已經(jīng)做得很好了,比如說我們學(xué)會(huì)了法語,那么我們?cè)賹W(xué)一個(gè)新的語言如果說學(xué)英語的時(shí)候,我們會(huì)或多或少地利用法語,因?yàn)樗鼈兌际抢∠怠?/span>
假設(shè)現(xiàn)在我們有很多的穿戴式設(shè)備,比如說手表,我們希望通過穿戴式數(shù)據(jù)來知道這個(gè)人做什么,比如說是在開車、跑步還是在睡覺還是在聽講,但這樣標(biāo)注數(shù)據(jù)是非常少的,怎么辦呢?我們可以到虛擬世界找更多的數(shù)據(jù),比如說微博和微信,我們發(fā)現(xiàn)里面有很多大家談?wù)摰男袨榈臄?shù)據(jù)和地點(diǎn)的數(shù)據(jù),我們把這兩個(gè)數(shù)據(jù)加關(guān)聯(lián),我們有大量的虛擬世界的模型遷移到現(xiàn)實(shí)世界,我們就可以有更好的模型來告訴我們這個(gè)人到底在做什么,可以幫助穿戴式的硬件公司做一個(gè)行為模型。
強(qiáng)化學(xué)習(xí)加上遷移學(xué)習(xí),實(shí)際上還可以做另外一件事,除了能夠把小數(shù)據(jù)也用起來,還可以實(shí)現(xiàn)個(gè)性化。
總結(jié)一下,我們按照現(xiàn)在的方式走下去只是AIFORSOMEONE,我們希望能夠達(dá)到AIFOREVERYONE,因此我們能夠個(gè)性化的情況下,讓中小公司和非人工智能的公司用起來的話,一定要在技術(shù)上努力,包括我們現(xiàn)在推的“先知”平臺(tái),包括我們用的遷移學(xué)習(xí)。
(審核編輯: 智匯小蟹)
分享