谷歌DeepMind發(fā)布最新研究:人類認(rèn)知心理學(xué)開啟人工智能的“黑盒子”
點(diǎn)擊:1548
A+ A-
所屬頻道:新聞中心
深度神經(jīng)網(wǎng)絡(luò)已經(jīng)掌握了解決各種問題的方法——從識別、推理圖像中的物體,到成為“圍棋上帝”。隨著這些任務(wù)變得越來越復(fù)雜,神經(jīng)網(wǎng)絡(luò)摸索出來的解決方法也變得越來越繁瑣。
因?yàn)檫@個(gè)系統(tǒng)太復(fù)雜了,即使是設(shè)計(jì)該系統(tǒng)的工程師可能也無法分析出它發(fā)出某一指令的原因。當(dāng)然,你也不能強(qiáng)求這個(gè)神經(jīng)網(wǎng)絡(luò)能夠給出它下達(dá)每一個(gè)指令的原因:目前為止還沒有一套能夠讓 AI 自己解釋自己行為的系統(tǒng)。
實(shí)際上,這就是人工智能領(lǐng)域著名的“黑盒子”問題,隨著神經(jīng)網(wǎng)絡(luò)在現(xiàn)實(shí)世界中的應(yīng)用越來越廣泛,對這一問題的研究也開始變得無比重要。對此,《麻省理工科技評論》曾以“人工智能核心地帶的黑暗秘密”為題刊發(fā)專題文章,來深入探討神經(jīng)網(wǎng)絡(luò)的不可解釋性問題。
圖丨《麻省理工科技評論》關(guān)于人工智能的“黑盒子”問題的封面文章
作為人工智能研究領(lǐng)域的先鋒,DeepMind對“黑盒子”問題也在持續(xù)關(guān)注——目前,該團(tuán)隊(duì)正著手開發(fā)更多的工具,用于解釋人工智能系統(tǒng)。6 月 26 日,在最新發(fā)布的一篇論文中,DeepMind提出了一種基于認(rèn)知心理學(xué)來研究深度神經(jīng)網(wǎng)絡(luò)的新方法。
那么,什么是認(rèn)知心理學(xué)?一般而言,該學(xué)科通過評估行為來推測認(rèn)知機(jī)制,并涵蓋了大量與認(rèn)知機(jī)制相關(guān)的細(xì)節(jié),同時(shí)還設(shè)計(jì)了很多實(shí)驗(yàn)來證明這些機(jī)制。隨著神經(jīng)網(wǎng)絡(luò)在解決某些具體問題上的能力已經(jīng)達(dá)到或超越人類水平,認(rèn)知心理學(xué)的研究方法將與人工智能的黑盒子問題愈發(fā)相關(guān)。
為了證明這一點(diǎn),DeepMind設(shè)計(jì)了一個(gè)實(shí)驗(yàn)來解釋人類認(rèn)知,從而幫助人類進(jìn)一步了解深度神經(jīng)網(wǎng)絡(luò)是如何解決圖像分類問題。
實(shí)驗(yàn)結(jié)果顯示,認(rèn)知心理學(xué)家觀察到的人類行為,在深度網(wǎng)絡(luò)中也有類似的體現(xiàn)??傮w上說,實(shí)驗(yàn)的成功也證明,認(rèn)知心理學(xué)完全可以用來幫助人們更好地理解深度學(xué)習(xí)系統(tǒng)。
在 DeepMind 的案例研究中,甚至考慮到了孩子們是如何辨識物體的,這是認(rèn)知心理學(xué)的一大研究領(lǐng)域。
通常而言,孩子們從單個(gè)例子中猜測詞語意思的能力,被稱為“單次語義學(xué)習(xí)”(one-shot word learning)——這種認(rèn)知能力看起來非常自然,會讓人們覺得,這一過程其實(shí)沒什么太復(fù)雜的機(jī)制。
然而,美國著名哲學(xué)家威拉德·奧曼·奎因多年前設(shè)計(jì)的一個(gè)經(jīng)典思想實(shí)驗(yàn),卻向人們展示了這一過程到底有多復(fù)雜:
一個(gè)語言學(xué)家要去一個(gè)地方,但那里的語言和這個(gè)語言學(xué)家所使用的完全不一樣。于是,這位語言學(xué)家想找一位當(dāng)?shù)厝藖韺W(xué)習(xí)一些本地語言中的詞匯。這時(shí),正巧有一只兔子從他們身邊跑過,當(dāng)?shù)厝嗣摽诙觥癵avagai”,于是語言學(xué)家就開始推測這個(gè)詞的意思。
圖丨“gavagai”到底指的是什么?
當(dāng)然,這個(gè)詞可能表示很多意思,可以是“兔子”、“白色的東西”,甚至指兔子身上的某一部位。
那么,面對這么多的可能性,人類如何去選擇哪個(gè)正確的意思?
時(shí)至今日,我們在使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行單次語義學(xué)習(xí)時(shí)也會遇到了同樣的問題,而 DeepMind 團(tuán)隊(duì)所開發(fā)的名為“匹配網(wǎng)絡(luò)”(Matching Network)的新型神經(jīng)網(wǎng)絡(luò)模型或許可以解決這些問題。
實(shí)際上,匹配網(wǎng)絡(luò)憑借著在關(guān)注度和記憶方面的進(jìn)步,完全可以做到僅憑一個(gè)案例就對ImageNet圖像識別數(shù)據(jù)庫中的海量數(shù)據(jù)進(jìn)行分類篩選,而且表現(xiàn)絕對是無可爭辯的。
圖丨“匹配網(wǎng)絡(luò)”的結(jié)構(gòu)
為了闡明這一點(diǎn),研究團(tuán)隊(duì)參照了認(rèn)知心理學(xué)家的研究結(jié)果——他們發(fā)現(xiàn),孩子們往往是通過歸納出偏好來消除許多錯誤推論,從而得出正確推論。這些典型的偏好包括:
整體偏好(whole object bias):孩子們會更傾向于認(rèn)為一個(gè)詞指代的是整個(gè)物體,而不是它的組成部分(兔子未被關(guān)注的部分);
類別偏好(taxonomic bias):將一類物體歸于類別中的某一種物體(所有動物都可能被當(dāng)做“兔子”);
形狀偏好(shape bias):孩子們往往會根據(jù)事物的形狀,而不是顏色或條紋來描述一個(gè)物體。(所有白色的東西都可能被歸類為“兔子”)。
在上面三種偏好中,DeepMind的研究團(tuán)隊(duì)選擇了“形狀偏好”作為檢測神經(jīng)網(wǎng)絡(luò)的切入點(diǎn),這是因?yàn)椤靶螤钇谩痹谌祟惼醚芯恐姓紦?jù)了很大的比重。
圖丨從左至右:原物體、形狀匹配物體、顏色匹配物體
更為關(guān)鍵的是,在接下來的試驗(yàn)中,DeepMind 研究團(tuán)隊(duì)向深度神經(jīng)網(wǎng)絡(luò)展示三個(gè)物體的圖像——原物體、形狀匹配物體(形狀相似但顏色不同的參照物體)以及顏色匹配物體(顏色相似但形狀不同的參照物體)。同時(shí),研究團(tuán)隊(duì)記錄了原物體和形狀匹配物體被歸為一類的次數(shù),以及原物體和顏色匹配物體被歸到一類的次數(shù)。
在對上述歸類次數(shù)進(jìn)行比對后,研究人員發(fā)現(xiàn),正如人類一樣,該網(wǎng)絡(luò)對形狀的感知有著超過對顏色和材質(zhì)的偏好——也就是說,神經(jīng)網(wǎng)絡(luò)也有著“形狀偏好”。
圖 | DeepMind在匹配網(wǎng)絡(luò)中進(jìn)行的認(rèn)知心理學(xué)實(shí)驗(yàn)。A為形狀匹配物體,B為顏色匹配物體。由于匹配網(wǎng)絡(luò)對形狀的偏好,會傾向于將原物體于A相匹配。
然而,除了觀察到深度網(wǎng)絡(luò)的形狀偏好外,還有一些值得注意的結(jié)果:
首先,形狀偏好在對網(wǎng)絡(luò)訓(xùn)練的早期就開始出現(xiàn)。這很容易令人聯(lián)想到了人類思維方式對于形狀的偏好。心理學(xué)家表示,兒童所展示的形狀偏好比青少年要少,而成年人的形狀偏好最為明顯;
其次,取決于不同的組合和訓(xùn)練模式,深度網(wǎng)絡(luò)對形狀偏好的程度也不一樣。所以當(dāng)研究團(tuán)隊(duì)對深度學(xué)習(xí)系統(tǒng)進(jìn)行測試時(shí),必須使用大量的訓(xùn)練模型來得到可靠的結(jié)果,就像心理學(xué)家對不同對象的測試一樣;
最后,即使形狀偏好程度不同,每個(gè)網(wǎng)絡(luò)在同種單次語義學(xué)習(xí)測試上的表現(xiàn)是一樣的。這說明不同的網(wǎng)絡(luò)可以針對同一個(gè)復(fù)雜問題找到同樣有效的解決辦法。
總之,DeepMind團(tuán)隊(duì)認(rèn)為,此次實(shí)驗(yàn)的重大成功就在于證明了認(rèn)知心理學(xué)在解釋和推測神經(jīng)網(wǎng)絡(luò)行為方面的潛力。而由于人類在認(rèn)知心理學(xué)研究領(lǐng)域具備豐富的知識儲備,這將為解決人工智能“黑盒子”問題提供全新的思路,讓人類更深刻的理解深度神經(jīng)網(wǎng)絡(luò)的行為。
(審核編輯: 林靜)