機(jī)器學(xué)習(xí)專家、著名的計算機(jī)科學(xué)和統(tǒng)計學(xué)家 Michael I. Jordan 近日在《哈佛數(shù)據(jù)科學(xué)評論》上發(fā)表文章,評論當(dāng)前的人工智能炒作,認(rèn)為現(xiàn)在被稱為 AI 的許多領(lǐng)域,實際上是機(jī)器學(xué)習(xí),而真正的 AI 革命尚未到來。
人工智能(AI)已經(jīng)成為當(dāng)今時代的口號。
技術(shù)專家、學(xué)者、記者、風(fēng)險投資家都在說這個詞。跟其他許多從技術(shù)或?qū)W術(shù)領(lǐng)域流入普通大眾的詞語一樣,“AI”這個詞的使用也存在嚴(yán)重的誤解。
然而,跟其他領(lǐng)域中公眾不理解科學(xué)家在做的事情不一樣,對于“AI”,科學(xué)家們經(jīng)常和公眾一樣困惑。
某種程度上,我們這個時代正在看到一種與我們?nèi)祟惖闹悄芟嗥车墓杌悄艿某霈F(xiàn),這既讓所有人感到興奮,讓我們著迷,同時也讓我們感到恐懼。不幸的是,它分散了我們的注意力。
Michael I. Jordan
我們急需發(fā)展構(gòu)建推理和決策系統(tǒng)的原則
我們可以從另一個角度來講述這個時代。有這樣一個故事,其中涉及人類、計算機(jī)、數(shù)據(jù)和生死抉擇,但重點不僅僅是硅基智能這類的幻想。
14年前,我的妻子懷孕時,我們做了超聲波檢查。醫(yī)生是一位遺傳學(xué)家,她指出胎兒心臟周圍有一些白點?!斑@些都是唐氏綜合癥的標(biāo)志,”她說,“現(xiàn)在你的風(fēng)險已經(jīng)上升到20分之一了。”她告訴我們,可以通過羊膜穿刺術(shù)了解胎兒是否真的有唐氏綜合癥基因畸變,但羊膜穿刺術(shù)存在風(fēng)險——在穿刺術(shù)過程中胎兒死亡的幾率大約是300分之一。
作為一名統(tǒng)計學(xué)家,我決定找出這些數(shù)字的來源。在我的研究中,我發(fā)現(xiàn)十年前英國有人做過一項統(tǒng)計分析,這些反映鈣沉積的白點確實被認(rèn)為是唐氏綜合癥的預(yù)測因子。我還注意到,我們做檢查時使用的成像機(jī)每平方英寸的像素比英國研究中使用的成像機(jī)多幾百個像素。我回去告訴遺傳學(xué)家,我相信那些白點很可能是假陽性,也就是字面上的白噪音。
她說:“啊,這就解釋了為什么我們幾年前開始發(fā)現(xiàn)唐氏綜合癥的診斷有上升趨勢。那恰好是新機(jī)器運(yùn)來的時候?!?/span>
我們沒有做羊膜穿刺術(shù),幾個月后妻子生下一個健康的女孩。但這件事一直讓我放不下,尤其是我知道由于一次粗略的計算,那天可能有成千上萬的人得到同樣診斷,然后許多人選擇做羊膜穿刺術(shù),造成許多嬰兒不必要的死亡。
這件事揭示的問題不是我個人的醫(yī)療問題;它關(guān)乎一個醫(yī)療系統(tǒng),在不同的地點和時間測量變量和結(jié)果,進(jìn)行統(tǒng)計分析,并在其他情況下使用結(jié)果。
這個問題不僅與數(shù)據(jù)分析本身有關(guān),而且與數(shù)據(jù)庫研究人員所稱的“溯源”(provenance)有關(guān)——數(shù)據(jù)來自哪里,從數(shù)據(jù)中得出了什么推論,這些推論與當(dāng)前的情況有多大關(guān)系?雖然專業(yè)人士可能在遇到個案時能逐步解決這些問題,但問題是設(shè)計一個行星級規(guī)模的醫(yī)療系統(tǒng),該系統(tǒng)要能在不需要如此詳細(xì)的人類監(jiān)督的情況下做到這一點。
我也是一名計算機(jī)科學(xué)家,我突然想到,在我所受的教育中,根本找不到構(gòu)建這種行星級規(guī)模的推理和決策系統(tǒng)所需要的原則,這些原則融合了計算機(jī)科學(xué)和統(tǒng)計學(xué),并考慮到人類的效用。在我看來,發(fā)展這些原則至少與構(gòu)建玩游戲之類眼花繚亂的AI系統(tǒng)同樣重要,這些原則不僅在醫(yī)學(xué)領(lǐng)域,而且在商業(yè)、交通和教育等領(lǐng)域都需要。
一個新的工程學(xué)分支:將人類和計算機(jī)結(jié)合起來
無論我們是否很快就能理解“智能”,我們都面臨著一項重大挑戰(zhàn),那就是如何將計算機(jī)和人類結(jié)合起來,從而增強(qiáng)人類的生活。
盡管一些人認(rèn)為這一挑戰(zhàn)只是AI創(chuàng)造的一種輔助,但另一種觀點認(rèn)為,這是一個新的工程學(xué)分支。就像過去幾十年的土木工程和化學(xué)工程一樣,這門新學(xué)科的目標(biāo)是圍繞一些關(guān)鍵思想,為人們帶來新的資源和能力,并確保安全。土木工程和化學(xué)工程建立在物理和化學(xué)的基礎(chǔ)上,而這門新的工程學(xué)科將建立在上個世紀(jì)賦予了實質(zhì)的思想之上,如信息、算法、數(shù)據(jù)、不確定性、計算、推理和優(yōu)化。此外,由于新學(xué)科的大部分重點將放在來自人類和關(guān)于人類的數(shù)據(jù)上,因此,它的發(fā)展將需要社會科學(xué)和人文學(xué)科的觀點。
雖然各種構(gòu)建塊已經(jīng)就位,但是將它們組合在一起的原則還沒有到位,因此目前將這些塊組合在一起的方式是臨時的。因此,就像人類在土木工程出現(xiàn)之前建造建筑物和橋梁一樣,人類也在繼續(xù)建造涉及機(jī)器、人類和環(huán)境的社會規(guī)模的推理和決策系統(tǒng)。正如早期的建筑和橋梁有時會以無法預(yù)見的方式倒塌,并帶來悲劇性的后果一樣,我們早期的許多社會規(guī)模的推理和決策系統(tǒng)已經(jīng)暴露出嚴(yán)重的概念缺陷。
不幸的是,我們并不擅長預(yù)測下一個可能出現(xiàn)的嚴(yán)重缺陷是什么。我們?nèi)鄙俚氖且粋€分析和設(shè)計原則的工程學(xué)科。
目前大多數(shù)AI,實際上是機(jī)器學(xué)習(xí)
目前關(guān)于這些問題的公開討論中,經(jīng)常使用“AI”這個術(shù)語作為一個智能的通用詞,這使得人們很難推斷出新興技術(shù)的范圍和后果。因此,我們有必要深入了解AI在最近和曾經(jīng)被用來指代什么。
如今大多數(shù)被稱為AI的東西,尤其是在公共領(lǐng)域,實際上是機(jī)器學(xué)習(xí)(ML),這個術(shù)語在過去幾十年里一直在使用。ML是一個算法領(lǐng)域,融合了統(tǒng)計學(xué)、計算機(jī)科學(xué)和許多其他學(xué)科的思想(見下文),設(shè)計處理數(shù)據(jù)、做出預(yù)測和幫助做出決策的算法。
就對現(xiàn)實世界的影響而言,ML是真實存在的,而不僅是最近才火起來的。事實上,在20世紀(jì)90年代初期,ML就已展現(xiàn)出將為產(chǎn)業(yè)界帶來巨大改變的苗頭。到了世紀(jì)之交,亞馬遜等具有前瞻性的公司就已經(jīng)在他們的業(yè)務(wù)中使用機(jī)器學(xué)習(xí)、解決關(guān)鍵任務(wù)、后端欺詐檢測和供應(yīng)鏈預(yù)測中存在的問題,以及建立面向消費(fèi)者的創(chuàng)新服務(wù),如推薦系統(tǒng)。
在隨后的20年里,隨著數(shù)據(jù)集和計算資源的迅速增長,很明顯,ML很快將不僅為亞馬遜提供動力,而且將為任何一家可以將決策與大規(guī)模數(shù)據(jù)關(guān)聯(lián)在一起的公司提供動力。新的商業(yè)模式將會出現(xiàn)。
“數(shù)據(jù)科學(xué)”一詞用來指代這種現(xiàn)象,反映了ML算法專家與數(shù)據(jù)庫和分布式系統(tǒng)專家合作構(gòu)建可擴(kuò)展、強(qiáng)大的ML系統(tǒng)的需要,也反映了這樣的系統(tǒng)將產(chǎn)生更大范圍的社會影響。過去幾年,這種思想和技術(shù)趨勢的融合被重新命名為“人工智能”。這種品牌重塑的做法值得仔細(xì)審查。
模仿人類的AI和智能增強(qiáng)
從歷史上看,“人工智能”一詞是在20世紀(jì)50年代末創(chuàng)造的,指的是在軟件和硬件上實現(xiàn)具有人類智能水平的實體這樣一個令人興奮的愿望。我將用“模仿人類的AI”(human-imitative AI)來指代這一愿望,強(qiáng)調(diào)人工智能實體似乎應(yīng)該成為我們?nèi)祟惖囊粏T,即使不是在身體上成為,那么至少在精神上要這樣(無論這可能意味著什么)。
這在很大程度上是一項學(xué)術(shù)事業(yè)。雖然相關(guān)的學(xué)術(shù)領(lǐng)域,如運(yùn)籌學(xué)、統(tǒng)計學(xué)、模式識別、信息論和控制理論已經(jīng)存在,并且經(jīng)常從人類或動物的行為中獲得靈感,但這些領(lǐng)域可以說是專注于低水平的信號和決策。
比如,松鼠能夠感知它所居住的森林的三維結(jié)構(gòu),并能在樹枝間跳躍,這種能力對這些領(lǐng)域具有啟發(fā)意義。AI旨在關(guān)注一些不同的東西:人類進(jìn)行推理和思考的高級或認(rèn)知能力。然而,60年后,高層次的推理和思想仍然難以捉摸?,F(xiàn)在被稱為AI的發(fā)展主要出現(xiàn)在與低水平模式識別和運(yùn)動控制相關(guān)的工程領(lǐng)域,以及統(tǒng)計學(xué)領(lǐng)域,該學(xué)科的重點是在數(shù)據(jù)中發(fā)現(xiàn)模式,并做出有充分根據(jù)的預(yù)測、測試假設(shè),以及決策。
事實上,現(xiàn)在被認(rèn)為是所謂“AI革命”核心的著名的反向傳播算法,是David Rumelhart在20世紀(jì)80年代初重新發(fā)現(xiàn)的,而它早在20世紀(jì)60年代和60年代的控制理論領(lǐng)域就已出現(xiàn)。其早期應(yīng)用之一是優(yōu)化阿波羅飛船飛向月球時的推力。
自上世紀(jì)60年代以來,AI已經(jīng)取得了很大的進(jìn)步,但可以說,這種進(jìn)步并非源于對模仿人類的AI的追求。相反,就像阿波羅飛船的例子一樣,這些想法往往隱藏在幕后,研究人員的工作專注于特定的工程挑戰(zhàn)。雖然普通大眾看不到,但在文檔檢索、文本分類、欺詐檢測、推薦系統(tǒng)、個性化搜索、社會網(wǎng)絡(luò)分析、規(guī)劃、診斷和A / B測試等領(lǐng)域的研究和系統(tǒng)構(gòu)建取得了重大進(jìn)展,這些進(jìn)步推動了谷歌、Netflix、 Facebook和亞馬遜等公司的成功。
人們可以簡單地把這一切稱為AI,事實上,這似乎已經(jīng)發(fā)生。對于那些發(fā)現(xiàn)自己突然被稱為AI研究人員的優(yōu)化或統(tǒng)計學(xué)研究人員來說,這樣的標(biāo)簽可能會讓他們感到意外。但撇開標(biāo)簽不談,更大的問題是,使用這個單一的、定義不清的首字母縮略詞,阻礙了他們對正在發(fā)揮作用的智能和商業(yè)問題范圍的清晰理解。
在過去的20年里,工業(yè)和學(xué)術(shù)領(lǐng)域都取得了重大進(jìn)展——作為模仿人類的AI的補(bǔ)充,通常被稱為“智能增強(qiáng)”(Intelligence Augmentation, IA)。在這里,計算和數(shù)據(jù)被用來創(chuàng)建增強(qiáng)人類智力和創(chuàng)造力的服務(wù)。搜索引擎可以被視為IA的一個例子,因為它可以增強(qiáng)人類的記憶和事實知識;自然語言翻譯也是IA的一個例子,它可以增強(qiáng)人類的溝通能力?;谟嬎銠C(jī)的聲音和圖像生成為藝術(shù)家提供了增強(qiáng)調(diào)色和創(chuàng)造的能力。雖然這類服務(wù)將來可能包含高層次的推理和思考,但目前還沒有;它們主要執(zhí)行各種字符串匹配和數(shù)值操作,以捕獲人類可以使用的模式。
讓我們廣泛構(gòu)思一個“智能基礎(chǔ)設(shè)施”的學(xué)科,構(gòu)建基于計算,數(shù)據(jù)和物理實體的網(wǎng)絡(luò),使人類環(huán)境更加有趣和安全。目前這種基礎(chǔ)設(shè)施已經(jīng)開始在運(yùn)輸,醫(yī)藥,商業(yè)和金融等領(lǐng)域出現(xiàn),對個人和社會的影響正越來越深。
可以想象,我們生活在一個覆蓋全社會的醫(yī)療系統(tǒng)中,這個系統(tǒng)能夠建立人與醫(yī)生、醫(yī)療設(shè)備之間的數(shù)據(jù)流和分析,幫助醫(yī)生做出更準(zhǔn)確地診斷,并提供護(hù)理服務(wù)。系統(tǒng)可以整合來自體細(xì)胞、DNA、血液測試,環(huán)境,群體遺傳學(xué)以及關(guān)于藥物和治療的大量科學(xué)文獻(xiàn)的信息。它不僅關(guān)注單個患者和醫(yī)生,而且關(guān)注所有人類之間的關(guān)系,有助于維持關(guān)于醫(yī)療信息的相關(guān)性、來源和可靠性的概念,就像今天的銀行系統(tǒng)關(guān)注金融和支付領(lǐng)域的挑戰(zhàn)一樣。盡管人們可以預(yù)見這樣的系統(tǒng)中會出現(xiàn)許多問題,比如隱私問題、責(zé)任問題,安全問題等等。但我們應(yīng)該將這些問題視作勇于面對的挑戰(zhàn),而不是前進(jìn)的阻礙。
目前的AI成果解決不了核心問題
現(xiàn)在我們面臨一個關(guān)鍵問題:目前在傳統(tǒng)的、基于人類模仿的AI真的是解決這些挑戰(zhàn)的最佳方式(甚至是唯一方式)嗎?
事實上,機(jī)器學(xué)習(xí)近年來取得成功的一些成功案例都是在模仿人類的AI領(lǐng)域,如計算機(jī)視覺、語音識別、游戲和機(jī)器人技術(shù)。也許我們應(yīng)該繼續(xù)等待,等待這些領(lǐng)域的更多技術(shù)進(jìn)步。這里有兩件事情需要注意。
首先,目前模仿人類的AI取得的成功還很有限,我們的最終愿望還遠(yuǎn)未實現(xiàn)。同時,在這個領(lǐng)域已經(jīng)取得的有限進(jìn)展,產(chǎn)生了巨大的快感,也滋生了不少恐懼,導(dǎo)致AI的過度繁榮和媒體的過度關(guān)注,這一點在其他工程領(lǐng)域是不存在的。
更重要的是第二點,在這些領(lǐng)域取得的成功并不足以解決重要的IA和II問題。比如自動駕駛汽車。要實現(xiàn)自動駕駛,需要解決一系列工程上的問題,這些問題可能與人的能力(或人力資源缺乏)關(guān)系不大。整體交通運(yùn)輸系統(tǒng)(II系統(tǒng))可能更接近當(dāng)前的空中交通管制系統(tǒng),而不是目前普遍關(guān)注的人類駕駛員。這種系統(tǒng)比現(xiàn)有的空中交通管制系統(tǒng)復(fù)雜得多,特別是可以使用大量數(shù)據(jù)和自適應(yīng)統(tǒng)計建模,為精細(xì)化決策提供信息。應(yīng)對這些挑戰(zhàn)需要關(guān)注最前沿,僅僅關(guān)注模仿人類的AI是不夠的。
至于必要性,有人說模仿人類的AI愿景涵蓋了IA和II的目標(biāo),因為它不僅能夠解決AI的經(jīng)典問題(比如圖靈測試),同時也是解決IA和II問題的最佳選擇。不過這種說法幾乎在歷史上找不到先例。以前聽說過要用AI木匠或AI瓦工來搞土木工程嗎?化學(xué)工程是否應(yīng)該建一個AI化學(xué)家的框架?更有爭議的是:如果我們的目標(biāo)是建立化工廠,是否應(yīng)該首先打造一群AI化學(xué)家,然后讓TA們?nèi)パ芯吭趺唇ǎ?/span>
有一種說法是,人類智能是我們所了解的唯一一種智能,因此我們應(yīng)該將模仿人類智能作為第一步。但是,人類實際上并不擅長某種推理,人類有自己的失誤、偏見和局限。而且,至關(guān)重要的是,人類并沒能進(jìn)化足以執(zhí)行現(xiàn)代II系統(tǒng)必須面對的大規(guī)模決策,也沒有應(yīng)對II環(huán)境中出現(xiàn)的各種不確定性的能力。
有人可能會說,人工智能系統(tǒng)不僅會模仿人類智能,還會糾正人工智能,而且這種能力可以擴(kuò)展到任意規(guī)模的問題。當(dāng)然,現(xiàn)在說的處于科幻小說的范疇,這種推測性的論點,雖然放在科幻小說中會很吸引人,但不應(yīng)該成為我們面對關(guān)鍵的IA和II問題時采取的主要戰(zhàn)略,這類問題已經(jīng)開始出現(xiàn)了。我們需要根據(jù)自身的優(yōu)勢解決IA和II問題,而不僅僅靠模仿人類的AI。
當(dāng)然,經(jīng)典的人工模擬AI問題仍然很有意義。然而,目前的重點是通過收集數(shù)據(jù)進(jìn)行AI研究,部署深度學(xué)習(xí)基礎(chǔ)設(shè)施,以及模仿某些特定人類技能的系統(tǒng)的演示。這些研究中幾乎沒有涉及新的解釋性原則,往往會將研究的注意力偏離經(jīng)典AI領(lǐng)域的幾個主要開放問題。
這些問題包括需要將意義和推理引入自然語言處理的系統(tǒng),以應(yīng)對推斷和表示因果關(guān)系的需要。開發(fā)計算易處理的不確定性表示,以及開發(fā)制定和追求長期目標(biāo)的系統(tǒng)。這些都是模仿人類的AI的經(jīng)典目標(biāo),但在當(dāng)前人工智能革命的熱潮中,人們很容易忘記這些尚未解決的問題。
IA同樣是非常重要的問題,因為在可預(yù)見的未來,計算機(jī)仍無法與人類在抽象推理真實情況的能力相比。我們需要經(jīng)過深思熟慮的人機(jī)的交互來解決最緊迫的問題。我們希望計算機(jī)能夠催生出人類創(chuàng)造力的新水平,而不是取代人類的創(chuàng)造力。
目前的AI視野過于狹隘,談AI革命為時尚早
最早提出“人工智能”這個名詞的是約翰·麥卡錫(時任達(dá)特茅斯大學(xué)教授,后來去了麻省理工學(xué)院),當(dāng)時他提出這個名詞,應(yīng)該是為了區(qū)分他剛剛起步的研究項目和諾伯特·維納的項目(當(dāng)時是MIT的老教授)。維納提出了“控制論”一詞來指代他自己對智能系統(tǒng)的展望,這一概念與運(yùn)營研究、統(tǒng)計學(xué)、模式識別、信息理論和控制理論密切相關(guān)。而麥卡錫則強(qiáng)調(diào)了與邏輯的聯(lián)系。有趣的是,今天占據(jù)主導(dǎo)地位的更多是維納的關(guān)于“智能”的內(nèi)容體系,但外表卻用的是麥卡錫提出來的“人工智能”一詞。
除了歷史上的觀點差異之外,我們還要認(rèn)識到,目前關(guān)于人工智能的公共對話,多數(shù)僅限于產(chǎn)業(yè)界和學(xué)術(shù)界的很小一部分,這種狹隘視野會影響我們面對人工智能所帶來的全部挑戰(zhàn)和機(jī)遇。
這里說的廣闊視野,和實現(xiàn)科幻小說中的場景關(guān)系不大,更多與人類對技術(shù)的必要性的理解和塑造有關(guān),因為它在日常生活中變得越來越有影響力。在這種理解和塑造中,需要來自各行各業(yè)的各種各樣的聲音,而不僅僅是技術(shù)上對話。僅僅關(guān)注模仿人類的AI,可能會讓我們無法獲知,或不愿去獲知更廣泛的信息。
學(xué)術(shù)界也要發(fā)揮重要作用,不僅僅是提供一些最具創(chuàng)新性的技術(shù)理念,而且會與計算、統(tǒng)計學(xué)等學(xué)科的研究人員共同作出貢獻(xiàn),這些貢獻(xiàn)和觀點非常重要,尤其需要社會科學(xué)、認(rèn)知科學(xué)和人文科學(xué)的觀點。
另一方面,雖然科學(xué)對人類的前進(jìn)必不可少,但我們也不應(yīng)該夸大我們的努力和成果。社會的目標(biāo)是建立新的成果。應(yīng)該構(gòu)建這些工件以按照聲明的方式工作。我們不希望造出一提供醫(yī)療、交通選擇和商業(yè)機(jī)會的系統(tǒng),然后發(fā)現(xiàn)這些系統(tǒng)無法真正發(fā)揮作用,發(fā)現(xiàn)它們會產(chǎn)生錯誤,影響到我們的快樂和生活。所以,正如我所強(qiáng)調(diào)的那樣,目前在數(shù)據(jù)和學(xué)習(xí)為關(guān)注重點的領(lǐng)域還沒能出現(xiàn)一個“工程學(xué)科”。盡管這些領(lǐng)域的發(fā)展前景令人興奮,但目前還不能被視為“工程學(xué)科”。
我們應(yīng)該接受這樣一個事實,即我們正在見證一個新的工程學(xué)科的誕生?!肮こ獭边@個詞具有獨特的內(nèi)涵,容易讓人想到冷漠、情感的機(jī)器,以及失去對人類的控制,但我們可以打造自己想要的工程學(xué)科。在當(dāng)今時代,我們迎來了一個真正的機(jī)會,來構(gòu)思?xì)v史上前所未有的新東西:以人為本的新興工程學(xué)科。我在這里不打算這個新興學(xué)科取名,但如果縮略詞“AI”繼續(xù)作為學(xué)科名字使用,那么我們需要意識到這個詞的真正意義和局限性。我們需要拓寬視野,平息炒作,并對未來的嚴(yán)峻挑戰(zhàn)有一個清醒的認(rèn)識。
(審核編輯: 劉傳龍)
分享