人工智能的下一個(gè)風(fēng)口:知識(shí)計(jì)算將如何幫助實(shí)現(xiàn)智能未來(lái)?
點(diǎn)擊:1396
A+ A-
所屬頻道:新聞中心
不久前,微軟AI講堂來(lái)到了哈爾濱工業(yè)大學(xué)。微軟亞洲研究院首席研究員林欽佑博士在此次分享中深入淺出地帶來(lái)知識(shí)計(jì)算方向的滿滿干貨。今天就讓我們回顧一下林欽佑博士的演講——人工智能的下一個(gè)風(fēng)口:知識(shí)計(jì)算,來(lái)了解什么是知識(shí)計(jì)算,以及知識(shí)計(jì)算將如何幫助實(shí)現(xiàn)智能未來(lái)。
演講全文如下(文字內(nèi)容略有精簡(jiǎn))
很高興回到哈工大,今天跟各位分享一下微軟研究院在人工智能所做的方向,以及未來(lái)大家可以準(zhǔn)備朝哪個(gè)方向發(fā)展。
人工智能不是過(guò)去兩三年才發(fā)生的事情,事實(shí)上,在1960年就有很多人工智能的發(fā)展。首先我想用很短的一個(gè)時(shí)間軸跟大家一起來(lái)看看最近這幾年的發(fā)展。
2010年,微軟XBox推出了Kinect,那個(gè)時(shí)候大家覺(jué)得計(jì)算機(jī)真的很了不起,能看到人的動(dòng)作,并把動(dòng)作融入到游戲里面。這是第一次工業(yè)界的產(chǎn)品能夠?qū)崟r(shí)追蹤每個(gè)人的關(guān)節(jié)、動(dòng)作,是一個(gè)很大的突破,就好像機(jī)器有眼睛,可以看到人是怎么做動(dòng)作的一樣。
2011年,IBM Watson在美國(guó)的Jeoparody!秀里做猜謎游戲時(shí)擊敗了Ken Jennings和Brad Rutter。2012年,微軟研究院的創(chuàng)始人Rick Rashid在天津舉辦的“二十一世紀(jì)的計(jì)算”學(xué)術(shù)大會(huì)上展示了實(shí)時(shí)語(yǔ)音翻譯技術(shù),造成了很大的震撼。
到了2014年,微軟把這個(gè)實(shí)時(shí)語(yǔ)音翻譯技術(shù)運(yùn)用到了Skype Translator里。不管是iOS系統(tǒng)、安卓系統(tǒng)還是Window系統(tǒng),你都可以下載安裝Skype,并使用Skype Translator實(shí)時(shí)語(yǔ)音翻譯技術(shù)。
接下來(lái)2016年不用多講了,AlphaGo在圍棋比賽中戰(zhàn)勝了李世石。今年5月AlphaGo還會(huì)再戰(zhàn)一場(chǎng)。而在2017年1月,CMU的一個(gè)團(tuán)隊(duì)寫(xiě)了一個(gè)AI程序,贏了德州撲克。所以可以想象接下來(lái)幾年,我們可能要經(jīng)常遭受類(lèi)似的打擊——機(jī)器贏過(guò)人的某項(xiàng)技能。因此,我想利用這個(gè)機(jī)會(huì)跟各位解釋一下,今天AI到底做到了什么程度,還有哪些方面可以做研究的。
人工智能在1960年左右就已經(jīng)開(kāi)始了,那為什么在過(guò)去這幾年人工智能這個(gè)洪流又開(kāi)始爆發(fā)了呢?主要有幾項(xiàng):
第一,有很大的數(shù)據(jù)。大家現(xiàn)在用手機(jī)傳短信、在微信上和朋友聊天、搜索內(nèi)容等等,這里面所有的數(shù)據(jù)都會(huì)被記錄下來(lái),從而使得我們有很大的數(shù)據(jù)。當(dāng)有了很多你跟同學(xué)、朋友交互的過(guò)程,或者即使不看你和朋友間的聊天記錄,也可以在網(wǎng)上、微博上看到你發(fā)表的內(nèi)容。而這些數(shù)據(jù)就可以讓機(jī)器看到人在對(duì)話的時(shí)候,可以講什么,會(huì)講什么。
所以,因?yàn)橛写髷?shù)據(jù)的關(guān)系,現(xiàn)在的機(jī)器可以把有些很難的事情變得簡(jiǎn)單。因?yàn)闄C(jī)器知道你以前在什么場(chǎng)合下講過(guò)什么話。
第二,云計(jì)算?,F(xiàn)在大家都希望手機(jī)有超大的內(nèi)存,比如64G、128G的。以前我在學(xué)校剛剛念書(shū)的時(shí)候,一個(gè)機(jī)器只要有2MB,我就已經(jīng)很高興了,但是現(xiàn)在手機(jī)和它的計(jì)算能力實(shí)際上比20年前電腦的計(jì)算能力還要強(qiáng)。所以,有了大數(shù)據(jù)之后,又有了很多的計(jì)算能力,很大的儲(chǔ)存能力。
二三十年前,架一個(gè)網(wǎng)站,我們還需要去想要買(mǎi)什么樣的PC機(jī),要裝什么操作系統(tǒng),可能還要租一條線,再設(shè)計(jì)個(gè)網(wǎng)頁(yè),然后上線。而現(xiàn)在不用了,你可以用微軟的Azure云或者用亞馬遜的云系統(tǒng),只要一上線你就可以有自己的網(wǎng)站。因?yàn)槭窃朴?jì)算,所以每個(gè)人都可以通過(guò)各種不同的終端設(shè)備看到自己的數(shù)據(jù)。
第三,算法。有了這些數(shù)據(jù)和存儲(chǔ)能力的時(shí)候,我們就要有一些算法。過(guò)去幾年,在計(jì)算機(jī)領(lǐng)域,大家會(huì)經(jīng)常聽(tīng)到深度學(xué)習(xí)。深度學(xué)習(xí)的前身其實(shí)在1960年就已經(jīng)有了,但是當(dāng)時(shí)它叫做神經(jīng)網(wǎng)絡(luò)。現(xiàn)在因?yàn)樯窠?jīng)網(wǎng)絡(luò)做深了,計(jì)算能力提高了,數(shù)據(jù)增多了,才讓深度學(xué)習(xí)有了它可以發(fā)展、發(fā)揮、發(fā)力的機(jī)會(huì)。
所以,這幾個(gè)關(guān)鍵技術(shù)結(jié)合在一起,促使了現(xiàn)在AI的爆發(fā)。
在微軟,我們的AI技術(shù)有四個(gè)方向,我們看看,微軟在這四方面都做了哪些事情。
第一,讓機(jī)器能看得到。視覺(jué)方面,我們?cè)?015年做了一個(gè)152層的深層神經(jīng)網(wǎng)絡(luò),它能夠在像素級(jí)別上知道一張圖上有一只蜘蛛。甚至在有些醫(yī)學(xué)上的應(yīng)用,比如判斷切片影像中是否有癌細(xì)胞,最新的消息是機(jī)器判斷的正確率已經(jīng)比醫(yī)生更高了。
第二,讓機(jī)器能夠聽(tīng)。學(xué)術(shù)界在評(píng)價(jià)技術(shù)的進(jìn)步與否時(shí)都有一個(gè)標(biāo)準(zhǔn)的測(cè)試集??纯聪聢D的這些線,每個(gè)點(diǎn)都是一個(gè)語(yǔ)音識(shí)別測(cè)試數(shù)據(jù)的結(jié)果,線越往下就表示做得越好,錯(cuò)誤率低??梢钥吹阶钣疫叺倪@條線,微軟去年做的錯(cuò)誤率在5.9%左右,5.9%已經(jīng)達(dá)到了人類(lèi)水平。
第三個(gè)是語(yǔ)言,機(jī)器還要能讀。在語(yǔ)言方面微軟亞洲研究院也一直都有深入的研究,讓機(jī)器可以更好的閱讀、理解文字內(nèi)容,并且我們?cè)谶@方面也取得了十分優(yōu)異的成績(jī)。未來(lái)會(huì)與大家有更多的分享。
最后,機(jī)器要能夠?qū)Υ鹑缌鳎兄R(shí)。知識(shí)方面有一個(gè)測(cè)試叫做Knowledge Base Acceleration(KBA)。為什么我們說(shuō)做一個(gè)像人一樣的人工智能比較難?先舉個(gè)例子,今天我講了一些有關(guān)AI的內(nèi)容,有些東西你可能知道,有些東西你可能不知道,但是你今天聽(tīng)到的一些之前不知道的事情,明天你就應(yīng)該知道了。也就是說(shuō),人是有學(xué)習(xí)能力的。
機(jī)器有沒(méi)有學(xué)習(xí)能力呢?機(jī)器可以識(shí)別人臉,但是人要先告訴機(jī)器說(shuō)這是我,學(xué)習(xí)了之后它才能找到圖片里哪個(gè)是我。現(xiàn)在還沒(méi)有一種人臉識(shí)別的算法可以識(shí)別它沒(méi)看過(guò)的人。所以在做KBA的時(shí)候就是假如給出一個(gè)百科,讓機(jī)器每天讀新聞,當(dāng)它知道這個(gè)新聞是有關(guān)哈工大的之后,就把報(bào)道哈工大的這個(gè)新的新聞中的新知識(shí)抽取出來(lái)放在哈工大的網(wǎng)頁(yè)上,這個(gè)測(cè)試就是類(lèi)似這樣的一個(gè)實(shí)驗(yàn)。
我們?cè)?013年的時(shí)候就做到了最好的效果。我們的系統(tǒng)可以找到vital(最重要而且相關(guān))的信息,就是說(shuō)機(jī)器找到的新聞確實(shí)是非常相關(guān)的而且有必要記錄的。比如,微軟買(mǎi)了某個(gè)公司,這個(gè)跟微軟是非常相關(guān),但是,某個(gè)人買(mǎi)了微軟的某個(gè)產(chǎn)品,也是跟微軟相關(guān)的,但是普通人買(mǎi)其實(shí)沒(méi)那么重要,但如果是哈工大買(mǎi)微軟的某個(gè)產(chǎn)品那就很重要了,這也是vital和useful的差別。
所以,大家可以看到微軟在剛才講的,會(huì)看、會(huì)聽(tīng)、會(huì)讀、有知識(shí)這四個(gè)前沿領(lǐng)域都做了很多的研究、開(kāi)發(fā)。
接下來(lái)跟大家做一個(gè)數(shù)學(xué)題——“There are 20 horses and chickens at Old Macdonald's farm. Together there are 58 legs. How many horses and how many chickens?”。這個(gè)問(wèn)題很簡(jiǎn)單,大家小學(xué)的時(shí)候就會(huì)做了。但要讓機(jī)器來(lái)解這個(gè)問(wèn)題就沒(méi)有那么簡(jiǎn)單了。為什么呢?
因?yàn)橛?jì)算機(jī)不知道馬有幾只腳,雞有幾只腳。即使知道,它還要知道Macdonald's farm和解決問(wèn)題一點(diǎn)關(guān)系都沒(méi)有。另外,解決這個(gè)問(wèn)題還要有數(shù)學(xué)知識(shí),考的就是加減乘除。
我們可以看出,計(jì)算機(jī)要有語(yǔ)言理解能力才可能和人溝通。計(jì)算機(jī)要怎么解題呢?首先必須要了解語(yǔ)言,不管是英文還是中文。再就是要有知識(shí),即使能理解所有的東西,它還要知道腳和雞的關(guān)系,雞和馬的關(guān)系,以及農(nóng)場(chǎng)這個(gè)信息跟解題一點(diǎn)關(guān)系都沒(méi)有等等。第三,是知道這些東西之后,還要能計(jì)算。如果所有內(nèi)容都知道了,但是不知道怎么算,那也不行。對(duì)于一個(gè)物理題,要有物理的計(jì)算能力,對(duì)于統(tǒng)計(jì)題,要有統(tǒng)計(jì)的計(jì)算能力。
所以,我們現(xiàn)在還是有很多問(wèn)題沒(méi)有解決的。比如,機(jī)器怎么能夠知道所有的知識(shí)呢?今天要解這個(gè)題,我們把雞和馬幾只腳的知識(shí)放進(jìn)去。明天改成蛇,就要把蛇沒(méi)有腳加進(jìn)去。如果再改成螃蟹,就要把螃蟹有八只腳加進(jìn)去等等。這樣的工作量就會(huì)十分巨大,每講一個(gè)東西都要加進(jìn)去新的信息,這是不可能的。所以這時(shí)候就有一個(gè)問(wèn)題了,如何很快速地累積知識(shí)?
總結(jié)一下我們剛剛講的這個(gè)問(wèn)題。
首先,要有自然語(yǔ)言的能力,要有知識(shí),機(jī)器要學(xué)習(xí)。要考慮如何讓機(jī)器可以很快地有一個(gè)學(xué)習(xí)的算法來(lái)了解語(yǔ)言中的信息。
其次,人和機(jī)器要結(jié)合在一起。微軟在講到AI時(shí)都會(huì)強(qiáng)調(diào)一個(gè)概念——Artificial Intelligence(人工智能)+ Human Intelligence(人類(lèi)智能)= Super Intelligence(超級(jí)智能)。在此我要強(qiáng)調(diào)的一點(diǎn)就是,人在這樣一個(gè)成功的環(huán)路里是不可或缺的。
第三,機(jī)器要有知識(shí)。機(jī)器解這個(gè)數(shù)學(xué)題的時(shí)候需要哪些能力呢?上圖的左邊是一篇文章,它講到了個(gè)人助理。機(jī)器要了解這件事,首先要知道什么是個(gè)人助理。然后,機(jī)器需要有一個(gè)表達(dá)的方法,這就是知識(shí)了。在知識(shí)方面,比如文章里講到微軟,那么機(jī)器要知道微軟是什么,微軟跟它的產(chǎn)品的關(guān)系是什么。
所以,機(jī)器跟人之間的溝通或者是機(jī)器要去了解這個(gè)世界的時(shí)候,它有一個(gè)語(yǔ)義的鴻溝。我們還有個(gè)技術(shù)叫實(shí)體鏈接,比如文章里有“微軟的Cortana”,這個(gè)短語(yǔ)里包括了兩個(gè)實(shí)體,一個(gè)是微軟,一個(gè)是Cortana。以前在做自然語(yǔ)言處理的時(shí)候,我們說(shuō)這是一個(gè)名詞詞組,不需要了解里面講的是微軟還是什么,它就是個(gè)專(zhuān)有名詞,Cortana也是一個(gè)專(zhuān)有名詞。但人理解的時(shí)候,我們不是只知道它是什么詞性的,我們知道微軟是代表一個(gè)公司,Cortana是微軟公司的一個(gè)產(chǎn)品。
所以說(shuō)真正要進(jìn)入到AI時(shí)代,機(jī)器必須要有語(yǔ)義的理解,而且要知道為什么用這個(gè)東西來(lái)代表某個(gè)事情。我們微軟知識(shí)計(jì)算組的任務(wù)就是,我們?cè)趺茨軌驗(yàn)檫@個(gè)世界服務(wù),通過(guò)什么手段讓機(jī)器可以自動(dòng)理解知識(shí),通過(guò)對(duì)數(shù)據(jù)的挖掘來(lái)增進(jìn)我們的知識(shí)。我們希望機(jī)器以后能幫人們干更多的活。
自然語(yǔ)言中有一些問(wèn)題對(duì)計(jì)算機(jī)來(lái)說(shuō)很麻煩,比如,當(dāng)我通過(guò)語(yǔ)音讓智能手機(jī)給潘副院長(zhǎng)打電話,但通訊錄里只寫(xiě)了潘天佑博士,那么機(jī)器就無(wú)法執(zhí)行這個(gè)操作。再比如重名問(wèn)題,再比如當(dāng)說(shuō)到我來(lái)自中國(guó)的時(shí)候,機(jī)器要知道這個(gè)中國(guó)指的就是中華人民共和國(guó)等等類(lèi)似的問(wèn)題。事實(shí)上機(jī)器要理解語(yǔ)言,要有知識(shí),這個(gè)方面還是非常寬闊的。
第一,理解知識(shí)。我們必須要知道怎么建這個(gè)包含巨大知識(shí)的數(shù)據(jù)庫(kù),機(jī)器怎么才能知道這么多不同的東西。今天有iPhone 8,明天就有iPhone 9了,機(jī)器的知識(shí)要一直不斷增加,這對(duì)人類(lèi)來(lái)說(shuō)沒(méi)有問(wèn)題。當(dāng)別人說(shuō)iPhone 8要出來(lái)了,你就會(huì)想什么時(shí)候出更新一代的iPhone,你會(huì)自己推理。
第二,機(jī)器必須要有一定的推理能力。這個(gè)推理的能力也包括一部分知識(shí),不是只知道事實(shí)。比如,地上有水,那就一定下過(guò)雨嗎?不一定。但是,天下雨地上一定有水。所以要考慮怎么把這類(lèi)知識(shí)放到機(jī)器里面去理解這個(gè)內(nèi)容。
我們從哪些地方取得這些知識(shí)呢?就是從非結(jié)構(gòu)性的數(shù)據(jù)中,比如新聞、文件,還有從結(jié)構(gòu)性的數(shù)據(jù)中,如個(gè)人數(shù)據(jù)庫(kù)、公司、學(xué)校里的一些內(nèi)容,像每天選課的課表都是結(jié)構(gòu)化的數(shù)據(jù),這些都可以綜合起來(lái)使用。除此之外當(dāng)然還可以讓人直接給機(jī)器添加知識(shí)。
第三,算法。有了知識(shí)和理解能力后,我們要做一些算法,把這些數(shù)據(jù)結(jié)合、清理、連接起來(lái),提供服務(wù)給上層的應(yīng)用。
經(jīng)過(guò)來(lái)源之后,我們會(huì)做挖掘的工作,做處理。然后把獲得的內(nèi)容存在知識(shí)庫(kù)里,然后知識(shí)庫(kù)就能應(yīng)用到不同的場(chǎng)景中了。
我們還有什么挑戰(zhàn)呢?
第一個(gè),機(jī)器什么時(shí)候可以真正的理解?所謂的理解不是說(shuō)只把它變成一個(gè)語(yǔ)法樹(shù),而是真正能夠知道我們講的是什么東西。
第二個(gè),如何解決問(wèn)題?理解語(yǔ)言沒(méi)問(wèn)題,但你要怎么解決問(wèn)題呢,解決問(wèn)題的知識(shí)去哪里獲得?我們不能靠百科網(wǎng)頁(yè),因?yàn)檫@些百科網(wǎng)頁(yè)不能解決所有的事情。所以,我們要怎么獲取這樣的知識(shí)?
第三個(gè),怎么讓機(jī)器有永久學(xué)習(xí)的能力?人每天看一些書(shū)本,聽(tīng)一些演講,看一些視頻,可以自己教育自己,機(jī)器可不可以做到這些?
最后總結(jié)一下,我們要機(jī)器能看、能聽(tīng)、能說(shuō)、能寫(xiě)、能學(xué)習(xí)、有知識(shí),就需要自然語(yǔ)言的處理能力。并且,我們不只是可以做中文、英文,我們要做各種不同的語(yǔ)言。在這個(gè)領(lǐng)域,未來(lái)的工作機(jī)會(huì)有太多太多。希望大家在生活和學(xué)習(xí)中多思考,用自己的創(chuàng)新想法解決人工智能的核心問(wèn)題。
謝謝!
(審核編輯: 林靜)
分享