沒(méi)有任何行業(yè)能忽視AI 它將如何開啟生活新可能?
點(diǎn)擊:1181
A+ A-
所屬頻道:新聞中心
60年前的夏天,4名電腦科學(xué)教授一起啟動(dòng)了一個(gè)目標(biāo)為創(chuàng)造"人工智能”的夏季課題。這是這個(gè)名詞第一次出現(xiàn)在世界上。此課題的目標(biāo)是:探索如何讓機(jī)器運(yùn)用語(yǔ)言和抽象思維。
當(dāng)時(shí)的項(xiàng)目提議是:“我們認(rèn)為,一組精挑細(xì)選的科學(xué)家在一起工作一整個(gè)夏天就可以實(shí)現(xiàn)重大突破?!边@在現(xiàn)在看來(lái)簡(jiǎn)直是樂(lè)觀的傲慢。我們直到現(xiàn)在都沒(méi)有可以媲美人類語(yǔ)言或者可以實(shí)現(xiàn)抽象思維的軟件。
但是,最近的幾年里,人工智能軟件已經(jīng)實(shí)現(xiàn)了曾經(jīng)被認(rèn)為是不可能的功能。例如識(shí)別圖像和語(yǔ)音,或者像谷歌最近給他們的電子郵件服務(wù)添加的功能:通過(guò)人工智能對(duì)語(yǔ)言的理解來(lái)寫出短郵件回復(fù)。
《麻省理工科技評(píng)論》主編Jason Pontin
5月23日在舊金山舉辦的為期2天的《麻省理工科技評(píng)論》Emtech Digital峰會(huì)上,來(lái)自各行業(yè)的精英們探討了這項(xiàng)科技是如何開啟人類生活及工作的新可能。
GE軟件研發(fā)副總裁Colin Parris:將人工智能引入工業(yè)互聯(lián)網(wǎng)
GE的“數(shù)字雙胞胎模型”(Digital Twin)靈感來(lái)源于長(zhǎng)期應(yīng)用于工業(yè)生產(chǎn)的產(chǎn)品和設(shè)備,拿航空制造業(yè)來(lái)說(shuō),引擎發(fā)動(dòng)機(jī)在此行業(yè)中生產(chǎn)了將近40年。工業(yè)中的設(shè)備和產(chǎn)品技術(shù)投入巨大,效率的提高是工業(yè)生產(chǎn)發(fā)展的核心課題,而模型的提出是為了解決如何使得我們更加高效地使用和制造這些東西。
2005到2010年,工業(yè)增長(zhǎng)率達(dá)到4%,而2010到2015卻只有1%,這是生產(chǎn)力的退步么?GE Software就此提出構(gòu)想,我們能否從生產(chǎn)設(shè)備出發(fā),合理規(guī)劃生產(chǎn)環(huán)節(jié),將生產(chǎn)效率提高。
“數(shù)字雙胞胎模型”的設(shè)計(jì)理念源自于商業(yè)應(yīng)中用的“數(shù)字信息轉(zhuǎn)化模型”(Digital Transformation),其中最出名的就是這三家公司的產(chǎn)品:蘋果,亞馬遜以及谷歌。它們有兩個(gè)共同點(diǎn),一個(gè)是它們對(duì)于數(shù)字信息轉(zhuǎn)化的方案大同小異,而且公司市值的增速也都相當(dāng)驚人,蘋果公司在2004年的市值才80億,而現(xiàn)在已經(jīng)高達(dá)2340億。
讓我們說(shuō)回?cái)?shù)字模型,拿亞馬遜來(lái)說(shuō),他們首先建立“單位模型(Model of One)”來(lái)統(tǒng)計(jì)用戶的全面信息。這些信息來(lái)源于每一個(gè)用戶,并且有一系列數(shù)據(jù)標(biāo)簽,包括年齡、性別和收入。用戶信息在你逛亞馬遜網(wǎng)站的時(shí)候就已經(jīng)悄無(wú)聲息地收集了,例如你查看的商品、付款方式、送貨地址以及你購(gòu)物車?yán)锏臇|西。而初代模型其實(shí)就反應(yīng)了我們的購(gòu)物心理,即喜歡買什么以及怎樣購(gòu)買。亞馬遜然后將初代模型進(jìn)行數(shù)據(jù)分類以及數(shù)據(jù)分析,得到能應(yīng)用于商業(yè)的輸出信息。
而將用戶的購(gòu)買興趣和購(gòu)買力進(jìn)行分類在這里是十分關(guān)鍵的,例如我如果被分在“型男區(qū)”,而此區(qū)的用戶大部分都買了“男人裝”,那網(wǎng)站就會(huì)向我推薦。除此之外,亞馬遜還將各個(gè)用戶的信息編纂起來(lái),并向他們定向推薦商品和個(gè)性化服務(wù),例如我已經(jīng)在亞馬遜上訂購(gòu)了年末的滑雪雙飛旅程,網(wǎng)站會(huì)以此為基礎(chǔ)向我推薦一些滑雪的裝備例如滑雪頭盔之類的。我購(gòu)買完商品之后又會(huì)向網(wǎng)站提供反饋,點(diǎn)贊或者差評(píng)之類。我買得越多,他們提供的信息就越來(lái)越完備,這是一個(gè)正反饋的流程。
這樣的機(jī)制就是“單位信息處理(P&L of One)”。用不了多久,依靠此模型,亞馬遜就會(huì)知道我會(huì)花多少錢購(gòu)物,以及怎樣讓我多花錢。從初代模型到用戶信息模型,商業(yè)價(jià)值就產(chǎn)生了。除此之外,一個(gè)收集信息的平臺(tái)也將推出,用來(lái)更方便地收集信息,例如亞馬遜的購(gòu)物網(wǎng)站、蘋果的iTunes以及谷歌的搜索引擎。
那么“數(shù)字雙胞胎模型”的機(jī)制也十分類似,只是將上述商業(yè)模型直接搬到了工業(yè)上來(lái),持續(xù)對(duì)生產(chǎn)設(shè)備的各個(gè)部件進(jìn)行監(jiān)控和分析,并期望得到特定的商業(yè)價(jià)值。我們同樣需要收集數(shù)據(jù),例如收集引擎的生產(chǎn)數(shù)據(jù)、維修數(shù)據(jù)以及運(yùn)轉(zhuǎn)數(shù)據(jù),然后構(gòu)建“單位模型”以及“單位信息處理”,而相應(yīng)的輸出數(shù)據(jù)則從購(gòu)物推薦、個(gè)性化服務(wù)以及評(píng)價(jià)系統(tǒng)變成“效率評(píng)估”、“性能評(píng)估”以及“產(chǎn)品商業(yè)評(píng)估”。
具體來(lái)說(shuō),就是將具有物理實(shí)體的機(jī)器所有信息收集起來(lái),數(shù)據(jù)化,建立一個(gè)數(shù)字模型,就像它們的“雙胞胎”一樣,然后運(yùn)用這個(gè)模型來(lái)預(yù)測(cè)機(jī)器會(huì)遭遇的問(wèn)題或者來(lái)調(diào)試機(jī)器參數(shù),使得它的效率更高。舉個(gè)例子,GE90飛機(jī)引擎的問(wèn)題預(yù)測(cè),如圖所示是經(jīng)常途徑炎熱地區(qū)的飛機(jī)的引擎,其中的扇片上有防熱涂層(TB Coating)。這樣的涂層一旦損壞,就會(huì)影響發(fā)動(dòng)機(jī)的性能,嚴(yán)重的話會(huì)造成人員傷亡。航空公司對(duì)此也是十分慎重,也發(fā)現(xiàn)了一些規(guī)律,往往200天這樣的引擎就會(huì)出現(xiàn)問(wèn)題,所以200天期限一到,就要進(jìn)行引擎的檢修。
這樣的經(jīng)驗(yàn)可能會(huì)靈驗(yàn)幾次,但往往誤差很大,如果200天中有很多天氣溫并不是很高則會(huì)減緩?fù)繉訐p壞的速度,或者是濕度過(guò)大加速涂層的損壞。這樣簡(jiǎn)單粗暴地將引擎送往檢修,往往可能檢測(cè)不出損壞,而此期間飛機(jī)也不能使用,白白增加了維修成本也降低了商業(yè)價(jià)值的產(chǎn)生。如果針對(duì)此涂層建立“數(shù)字雙胞胎模型”,在每次飛行之后根據(jù)此次飛行的氣溫濕度等相關(guān)數(shù)據(jù)進(jìn)行模擬分析,到了模型中損壞快出現(xiàn)的時(shí)候提前檢修,這就使得維修顯得十分及時(shí)了。
其實(shí)“數(shù)字雙胞胎模型”能提供的服務(wù)還有很多,例如上述的“維修服務(wù)優(yōu)化”、“工作方案優(yōu)化”、“生產(chǎn)優(yōu)化”、“服務(wù)優(yōu)化”、“輔助設(shè)計(jì)優(yōu)化”以及“新服務(wù)方案設(shè)計(jì)”。只要你提供數(shù)據(jù),我們就能提供巨大的商業(yè)價(jià)值回報(bào)。
“數(shù)字雙胞胎模型”中還應(yīng)用了很多機(jī)器學(xué)習(xí)的理念,在這里我介紹其中的三個(gè)。
第一個(gè)是我們?nèi)绾握_取得我們想要的數(shù)據(jù),其中引入了計(jì)算機(jī)視覺(jué)采集技術(shù);
第二項(xiàng)技術(shù)是我們?cè)鯓訉?shù)據(jù)進(jìn)行過(guò)濾,并找到正確的我們想要的數(shù)據(jù);
最后是如何建立我們的“數(shù)字雙胞胎模型”。
問(wèn)答環(huán)節(jié):
主持人:我們都知道,雙胞胎的基因十分相似,但是他們之間還是有這樣那樣的差別,那么你們所謂的“數(shù)字雙胞胎模型”和它們現(xiàn)實(shí)中對(duì)應(yīng)的物體之間也是有差別的吧。我的問(wèn)題是,這種差別有多大,并且你們?cè)鯓討?yīng)對(duì)這樣的差別?
科倫帕里斯:我們的應(yīng)對(duì)呢,總的來(lái)說(shuō)有兩種,而差別一般分為三類。那么我們對(duì)不同的差別有不同的應(yīng)對(duì)方案。第一種差別是有人對(duì)產(chǎn)品做了改變?nèi)欢](méi)有告訴我們,這其實(shí)是我們最常遭遇的,那么我們則需要反復(fù)對(duì)比實(shí)際以及校對(duì)參數(shù)來(lái)保證模型的擬真程度。
第二種是新變量的產(chǎn)生,比如我們觀測(cè)到的一個(gè)很詭異的現(xiàn)象——地球的“高空急流”實(shí)際上會(huì)變化——而當(dāng)這樣的變化產(chǎn)生時(shí),地球上炎熱地區(qū)的氣候也會(huì)發(fā)生改變。而一旦我們觀測(cè)到這樣的新變量,數(shù)字雙胞胎模型也要自然地做出相應(yīng)的改良。
有些情況下,我們得到的數(shù)據(jù)并不完整,當(dāng)你的數(shù)據(jù)缺失大到某種程度的時(shí)候,你的模型與現(xiàn)實(shí)的差異就比較明顯了。這種情況下,我們一般采取的措施是,首先核對(duì)實(shí)際數(shù)據(jù),或者采用其他相關(guān)數(shù)據(jù)分析,比如大氣層的變化或其他我們觀測(cè)到的與氣候變化相關(guān)的數(shù)據(jù),然后開始全面地學(xué)習(xí)和分析差異性的成因和影響。因?yàn)槲覀兛创氖且徽麄€(gè)綜合的問(wèn)題,其中的各個(gè)組成部分中也會(huì)存在差異產(chǎn)生的因素,當(dāng)我們把這些因素都整合到一起,問(wèn)題就基本解決了。
主持人:那“高空急流”的改變發(fā)生過(guò)幾次呢?
科倫帕里斯:我們就觀測(cè)到過(guò)一次,你也知道研究“全球變暖問(wèn)題”是一個(gè)無(wú)法預(yù)測(cè)的事情。
Founders Fund聯(lián)合創(chuàng)始人Luke Nosek:醫(yī)生將被人工智能取代
Founders Fund是一家投資公司,專門投資高新科技公司,這些公司一定是能對(duì)人類文明做出巨大貢獻(xiàn)的,如Airbnb、Stripe、LinkedIn、SpaceX、Yelp等高科技創(chuàng)新公司。Luke Nosek也是DeepMind的董事會(huì)成員,此前在韓國(guó)取得重大成功的AlphaGo就是他們的杰作。
主持人:像電影里那樣,人們對(duì)人工智能都有或多或少的恐慌。你們認(rèn)為人工智能對(duì)于人類工作機(jī)會(huì)的影響有哪些?
Luke:我覺(jué)得,人工智能既在創(chuàng)造人類的工作機(jī)會(huì)也在減少人類的工作機(jī)會(huì)。那我就舉一個(gè)常見的例子:優(yōu)步(Uber)。優(yōu)步的出現(xiàn)就創(chuàng)造了全民司機(jī)的世界,雖然這不是傳統(tǒng)意義的人工智能,其實(shí)也是基于計(jì)算機(jī)技術(shù)的軟件應(yīng)用。而如果真正的人工智能駕駛系統(tǒng)建立完備,司機(jī)這種職業(yè)將不復(fù)存在。這就是我說(shuō)的,工作種類的變革變得越來(lái)越快,一些工種消失,一些對(duì)應(yīng)的工種就要出現(xiàn)。這也需要當(dāng)下經(jīng)濟(jì)狀況良好,有著這樣那樣的公司出現(xiàn)來(lái)承載這樣的新職業(yè),如此新的工種才能創(chuàng)造經(jīng)濟(jì)價(jià)值。
主持人:那么對(duì)于那些特殊工種而言呢?比如醫(yī)生,他們接受了長(zhǎng)期的培訓(xùn),就為了與人治病救死扶傷,現(xiàn)在如果機(jī)器能比他們更加準(zhǔn)確,那么他們也將被替換,你是這樣認(rèn)為的么?
Luke:恩,這是一個(gè)很難回答的問(wèn)題。這些人一生都在接受培訓(xùn),做一些特殊的事情。我并不這樣認(rèn)為。我覺(jué)得人工智能能在臨床醫(yī)學(xué)做的就只有處理數(shù)據(jù)的部分,因?yàn)獒t(yī)生往往不能記住繁多的病人病歷還有最近最新發(fā)表的醫(yī)學(xué)論文,而機(jī)器卻十分擅長(zhǎng)。但是機(jī)器也有做不來(lái)的地方,它們不能陪伴病人,使他們得到安慰,也不能照顧病人,而這些都是人類能做的。也就是說(shuō),我覺(jué)得機(jī)器和人類都能在其中找到自己最擅長(zhǎng)的工作部分。
主持人:我不敢對(duì)整個(gè)醫(yī)學(xué)界妄加評(píng)論,但是你貌似覺(jué)得在醫(yī)護(hù)人員中只有一部分能繼續(xù)留下來(lái),不被機(jī)器搶了飯碗,例如護(hù)士、康復(fù)師以及物理治療師。是這樣么?
Luke:我覺(jué)得最終會(huì)是這樣的。不過(guò)也許需要數(shù)十年吧。
主持人:不過(guò)最近的研究表明,人工智能的出現(xiàn)不會(huì)產(chǎn)生新的雇傭關(guān)系,也不太會(huì)改變現(xiàn)有的雇傭關(guān)系結(jié)構(gòu),而只是會(huì)在此基礎(chǔ)上加入一點(diǎn)新元素:工作之中越來(lái)越頻繁的人機(jī)交流。這樣的場(chǎng)景相信大家都在電影中看見過(guò),那么你是怎么看待這樣的景象的呢?能為我們描述一下你心中的那個(gè)場(chǎng)景么?
Luke:我還是以臨床醫(yī)學(xué)為例子,這樣的情況下,醫(yī)生就有更多的時(shí)間花在病人身上了。教育中的情況也十分類似,人工智能將一些負(fù)責(zé)一些重復(fù)性的工作,例如評(píng)分系統(tǒng),以及設(shè)計(jì)課程。而老師的角色就在于分析每一個(gè)學(xué)生的信息,然后加入情感方面的判斷,建立學(xué)生和人工智能之間的聯(lián)系,讓人工智能給學(xué)生的幫助更加恰當(dāng)。
主持人:我這幾天都在看到這樣那樣的新聞和呼聲,人們呼吁對(duì)人工智能的發(fā)展和研究設(shè)定一個(gè)標(biāo)準(zhǔn)。我個(gè)人覺(jué)得,規(guī)定人工智能的發(fā)展標(biāo)準(zhǔn)是十分困難的,因?yàn)橛行┦虑椴⒉荒茴A(yù)測(cè)。那么你作為投資者,覺(jué)得人工智能的發(fā)展需不需要受到限制呢?
Luke:我覺(jué)得是十分困難的。而且就算要設(shè)立標(biāo)準(zhǔn)這個(gè)范圍也是很廣的,你也無(wú)從下手。最關(guān)鍵的是這種新型科技的發(fā)展本來(lái)就是未知的,標(biāo)準(zhǔn)就更加難以定義了,就好比我們古代的醫(yī)學(xué),也是顯得十分粗鄙,但是還是一步一步發(fā)展過(guò)來(lái),但是那時(shí)候也沒(méi)有任何人規(guī)定手術(shù)時(shí)不能用某種剪刀吧。這是不可能的。
主持人:你覺(jué)得DeepMind的不足在哪里以及制約DeepMind發(fā)展的因素是什么?
Luke:我覺(jué)得現(xiàn)在的機(jī)器學(xué)習(xí)的表現(xiàn)是令人咋舌的,不過(guò)發(fā)展也就只是機(jī)器算法而已。如果我們想繼續(xù)發(fā)展下去,我們必須加入很多其他學(xué)科的理念和理論,例如神經(jīng)學(xué)、心理學(xué)、哲學(xué)以及等等。這樣我們才能發(fā)展處下一代的人工智能,不然好的算法也終將是算法。
觀眾互動(dòng):
觀眾:您剛剛談?wù)摰娜斯ぶ悄芎凸ぷ髦g的影響,我想展開一下。您剛剛只討論了某些高新的特殊職業(yè)例如醫(yī)生,那么對(duì)于那些底層的藍(lán)領(lǐng)工作者,比如麥當(dāng)勞的員工以及快遞員,這些人群也是十分巨大的。在人工智能替代人類工作的趨勢(shì)中,醫(yī)生能輕松轉(zhuǎn)型成為治療師之類的,而底層工作者的機(jī)會(huì)卻不這么多,您怎么看待這個(gè)問(wèn)題呢?
Luke:我覺(jué)得只要是人,就能找到工作,而能力不是存在于你的簡(jiǎn)歷或者學(xué)歷。技能可以繼續(xù)學(xué)習(xí),工作能否盡快找到就在于當(dāng)下你學(xué)習(xí)技能的快慢,以及順應(yīng)潮流。
主持人:我的想法也差不多。舉個(gè)例子,就是伊隆馬斯克找到的一個(gè)工程師并讓他參與Tesla ModelX的設(shè)計(jì),他曾經(jīng)是一個(gè)機(jī)器人專家,馬斯克找到他時(shí),他毫無(wú)自信說(shuō):“我都沒(méi)有參與工業(yè)界項(xiàng)目的經(jīng)驗(yàn),我恐難當(dāng)大任?!瘪R斯克卻說(shuō):“要的就是你這樣的人,毫無(wú)經(jīng)驗(yàn),你就不會(huì)被條條框框所限制,就能發(fā)現(xiàn)我們看不見的東西。”
觀眾:就像你們正在做的事情,就是對(duì)各行各業(yè)的高新科技進(jìn)行評(píng)估然后投資。那么一定有某家公司或者某位研發(fā)者的某個(gè)金點(diǎn)子讓你瞬間爆炸,你能告訴我們是怎樣的點(diǎn)子么?
主持人:哈哈哈,誰(shuí)能讓Luke Nosek瞬間爆炸呢?
Luke:(開始打太極)如果真的是讓我瞬間爆炸的點(diǎn)子,因?yàn)槲以谕顿Y公司,這也許是商業(yè)機(jī)密,所以也不能告訴你。
主持人:(開始救場(chǎng))那你就抽象地說(shuō)說(shuō)唄。
Luke:(什么鬼……)但是硬要說(shuō)的話,我只能很抽象地描述一下。想出這樣點(diǎn)子的公司一定是我們能看到他們有十分有創(chuàng)造力的前景,比如自動(dòng)駕駛系統(tǒng),我們就能看出它有很多閃光點(diǎn)能在未來(lái)為我們?nèi)祟愖龀龊艽筘暙I(xiàn)。
觀眾:(就是不放過(guò)你)恩,我打斷一下,這個(gè)真的確實(shí)十分抽象。
主持人:(救不了你了)哈哈哈哈~
觀眾:你就直說(shuō)一些你覺(jué)得很贊的理念或者想法唄,不一定要是某些公司的案例。
Luke:那我就說(shuō)一下吧。最讓我感到驚訝的就是人類的思維理念,而現(xiàn)在我們正處于理解人類思維以及怎樣提升人類思維的十字路口。而人類思維的潛力我相信是巨大的,也許也比我們想象中人工智能的潛力還要大。這個(gè)課題貫穿很多門學(xué)科例如教育學(xué)、心理學(xué)還有很多實(shí)際應(yīng)用中的工作,我對(duì)此十分興奮。
亞馬遜機(jī)器人首席技術(shù)官Tye Brady:我對(duì)機(jī)器人的五點(diǎn)感悟
照片上開拖拉機(jī)的是我父親,他是密西西西比的一位伐木工。大蕭條時(shí)期,剛十二歲的他不得不進(jìn)入?yún)擦秩ヅぷ鱽?lái)養(yǎng)活家人。
我本人在技術(shù)領(lǐng)域工作了25年,遇到那些經(jīng)歷過(guò)大蕭條時(shí)期的人們,我總愛問(wèn)他們一個(gè)問(wèn)題:“你覺(jué)得對(duì)你人生影響最大的一項(xiàng)技術(shù)是什么?”我父親的回答是:“拖拉機(jī)、冰箱,還有飛機(jī)。”比如照片中的那臺(tái)拖拉機(jī),有了它,不需要再用人力或牲口犁地;至于冰箱,能讓肉儲(chǔ)存更長(zhǎng)的時(shí)間,這對(duì)食物短缺的時(shí)代是至關(guān)重要的。所以,大家可以看到,這些技術(shù)對(duì)生活的影響都是非常直接的。
但至于飛機(jī),我覺(jué)得很奇怪,又問(wèn)道:“我說(shuō)的是影響你自己生活的技術(shù)!”,他沉默了一會(huì),答道:“兒子,當(dāng)我四十歲的時(shí)候,我第一次從報(bào)紙上聽說(shuō)飛機(jī)這種東西,我當(dāng)時(shí)很難相信一部機(jī)器載上人就可以像鳥一樣飛到天上?!敝钡剿H眼看見一架飛機(jī),看見它如何起飛降落?!拔译m然說(shuō)不好飛機(jī)對(duì)我的日常生活產(chǎn)生什么樣的影響,但我知道,它將改變這個(gè)世界?!?/span>
由已實(shí)現(xiàn)的非凡科技所帶來(lái)的的巨大的變革,我將這種現(xiàn)象稱為“完美的邊界“(the Boundary of Awesome)。技術(shù)是用來(lái)滿足人類需求的,包括機(jī)器人。
我個(gè)人對(duì)機(jī)器人的定義是:一種安裝了計(jì)算、傳感、驅(qū)動(dòng)系統(tǒng)的物理裝置,以在物理環(huán)境中完成一項(xiàng)或多項(xiàng)的智力行為。
高等智力行為表現(xiàn)在對(duì)未建成環(huán)境的改造,輔以快速做出高級(jí)決策的能力。這種智力行為在初期的時(shí)候是預(yù)先設(shè)定好優(yōu)先級(jí)的,后來(lái)發(fā)展到完全自動(dòng)化。
機(jī)器人非???,我很高興我自己的工作是每天和他們打交道。作為亞馬遜機(jī)器人部門的首席技術(shù)官,我的責(zé)任是發(fā)掘、改進(jìn)、應(yīng)用相關(guān)技術(shù),來(lái)使我們的員工、公司業(yè)務(wù)獲益,當(dāng)然,最重要的通過(guò)技術(shù)和新產(chǎn)品來(lái)改善用戶體驗(yàn)。
我們的總體目標(biāo)是通過(guò)應(yīng)用智能技術(shù)制造吃更好的機(jī)器人,并以此擴(kuò)展人類的能力,同時(shí)改善我們的工作、生活、娛樂(lè)環(huán)境。這個(gè)目標(biāo)貫穿我們工作的始終,尤其在低成本高效處理用戶訂單上。每當(dāng)用戶點(diǎn)擊“購(gòu)買”按鈕時(shí),神奇的事情就開始發(fā)生了,只是用戶們很難看到而已。你訂購(gòu)的商品存放在亞馬遜各地的倉(cāng)庫(kù)中,并會(huì)為用戶選擇最佳的“訂單處理中心”(Fulfillment Center)。
如果你有機(jī)會(huì)去我們的訂單處理中心參觀,你會(huì)發(fā)現(xiàn)所有的機(jī)器人、人類同時(shí)有條不紊的并行工作,互不干擾,就像在演奏一首人機(jī)交響曲,場(chǎng)面令人震撼。機(jī)器人們現(xiàn)在已經(jīng)取代了很多以前必須由人類去完成的工作,而且效率要高得多。我們的技術(shù)原理其實(shí)很簡(jiǎn)單直接:我們讓貨物過(guò)來(lái)找人,而不是派人去找貨物。通過(guò)這套系統(tǒng),我們能保證亞馬遜的物流系統(tǒng)可以以極高的效率運(yùn)行。
至于整套系統(tǒng)是怎么工作的,大家可以看下面的視頻。我想先介紹一下系統(tǒng)中的組成部分。這種橙色的機(jī)器人是“運(yùn)輸單元”,它負(fù)責(zé)搬運(yùn)倉(cāng)庫(kù)中的黃色貨架,貨架上塞滿了貨物,什么形狀的都有,而且有些是隨意擺放的。亞馬遜的倉(cāng)庫(kù)里有成千上萬(wàn)這種貨架,機(jī)器人能準(zhǔn)確識(shí)別需要搬運(yùn)的貨架,在預(yù)先設(shè)定好的最優(yōu)路線上行進(jìn),快速且不會(huì)相互干擾。
亞馬遜的訂單處理中心面積非常大,約120萬(wàn)平方英尺(約合11萬(wàn)平方米),約28個(gè)橄欖球場(chǎng)那么大。這些機(jī)器人會(huì)按訂單順序排隊(duì)來(lái)到工作人員身邊,將目標(biāo)貨物所在的那一面朝向工作人員,以便他們拿取對(duì)應(yīng)貨物。
感謝我們的員工和機(jī)器人們,他們讓亞馬遜的訂單處理能力前所未有的強(qiáng)大。在剛過(guò)去的高峰期中,我們達(dá)到了每秒處理500件貨物的水平。如果把所有亞馬遜搬運(yùn)機(jī)器人所走過(guò)的路程加在一起的話,可以突破一個(gè)“1”,當(dāng)然,單位很重要,畢竟在座的都是工程師:一個(gè)天文單位,這是地球到太陽(yáng)的平均距離,約1.5億公里!從今年起,我們的機(jī)器人該往回走了。
最后想說(shuō)一下亞馬遜機(jī)器人的團(tuán)隊(duì),他們是一群極富創(chuàng)新精神的人,敢想敢做,很多亞馬遜已部署的機(jī)器人都是由他們?cè)O(shè)計(jì)制造的。他們中的大部分人都在波士頓和西雅圖工作。我能與他們共事是我一生的榮幸!
好了,既然今天是EmTech數(shù)字峰會(huì),而且主題是人工智能,我就來(lái)分享一下自己對(duì)機(jī)器人前景的五個(gè)觀察。
首先是,機(jī)器人應(yīng)該在人類身邊,而不是遠(yuǎn)離。機(jī)器造出來(lái)就是為了滿足人類的需求,只有當(dāng)它們?cè)谏磉吺遣拍転槟惴?wù)。比如手機(jī),它也是高科技的產(chǎn)物,而且人們總是把它帶在身上,以便隨時(shí)隨地的獲得信息。人們擁有了一部隨身攜帶的電腦,改變了我們的行為習(xí)慣,這才是改變革命性的。機(jī)器人也是一樣,它們必須融入到人類的生活環(huán)境,但挑戰(zhàn)在于,怎樣快速融合?AI技術(shù)就是這一融合過(guò)程的催化劑。
其次,機(jī)器人應(yīng)該很容易使用,而且不分男女老幼。道理很簡(jiǎn)單,某個(gè)產(chǎn)品被使用得越多,就會(huì)有更多的人去改進(jìn)它,反之亦然,一個(gè)良性循環(huán)。AI技術(shù)將用于開發(fā)更方便、更自然的互動(dòng)界面,不管你是對(duì)機(jī)器人說(shuō)話,還是指點(diǎn),或是碰觸,總之,在人與機(jī)器人之間,必須有一種自然的行為方式。比如亞馬遜的Echo,我自己經(jīng)常使用,我妻子也是,我孩子也是。如果我們家的狗也會(huì)用,我想她會(huì)天天在網(wǎng)上訂購(gòu)肉骨頭,這我可不干。
第三,機(jī)器人應(yīng)該為人類創(chuàng)造一種學(xué)習(xí)環(huán)境,這點(diǎn)很重要。允許人類有很好奇心,允許人類了解機(jī)器人的能力,允許人類將他們認(rèn)為合適的工具用于合適的場(chǎng)景。創(chuàng)造一個(gè)學(xué)習(xí)環(huán)境來(lái)讓人類以最自然的方式去了解機(jī)器人的功能。AI技術(shù)將是建立這種學(xué)習(xí)環(huán)境必不可少的,人類將把AI作為了解機(jī)器人,以及賦予其更多功能的入口。
第四,機(jī)器人應(yīng)該以可預(yù)測(cè)的明確姿態(tài)去完成任務(wù)。人類應(yīng)該完全清楚機(jī)器人的下一步行動(dòng),這樣才能建立人類與機(jī)器人之間的信任關(guān)系。AI將用來(lái)建立雙方間的意向及狀態(tài)的雙向分享機(jī)制,AI要學(xué)會(huì)預(yù)測(cè)下一步行動(dòng),不管是人類的還是機(jī)器人的,這樣才能使得人類與機(jī)器人的關(guān)系透明化。
最后,機(jī)器人應(yīng)該以簡(jiǎn)化事物及增強(qiáng)人類能力為直接目標(biāo),簡(jiǎn)單的說(shuō)就是讓人類生活得更輕松。比如,亞馬遜的運(yùn)輸機(jī)器人只負(fù)責(zé)一項(xiàng)工作:搬運(yùn)貨物。把這項(xiàng)工作做到極致后,帶來(lái)的效果就是訂單處理效率的極大提升。AI在這里的作用就是分配任務(wù),讓機(jī)器人去做它們擅長(zhǎng)的事情,而讓人類集中與那些需要大量腦力的重要工作上去,然機(jī)器去延展人類的能力。
百度首席科學(xué)家吳恩達(dá):人工智能將和電力一樣具有顛覆性
主持人:作為掀起深度學(xué)習(xí)革命的先驅(qū)之一,你是在何時(shí)意識(shí)到,深度學(xué)習(xí)可能會(huì)跨過(guò)人工智能的門檻?
吳恩達(dá):我記得我在 16 歲的時(shí)候,第一次寫出自己的神經(jīng)網(wǎng)絡(luò)。但很長(zhǎng)一段時(shí)間里,我對(duì)神經(jīng)網(wǎng)絡(luò)都沒(méi)什么信心,因?yàn)樗⒉辉趺垂苡?。直?2009 年的時(shí)候,這是個(gè)轉(zhuǎn)折點(diǎn),我的同事Adam Coates給我展示了他自己寫出的圖表。那張圖表使用一個(gè)深度學(xué)習(xí)模型,并將它不斷擴(kuò)大。他發(fā)現(xiàn),模型被擴(kuò)展得越大,輸出的結(jié)果就越準(zhǔn)確,而整個(gè)系統(tǒng)不過(guò)是從一個(gè)小模型演變過(guò)來(lái)的。所以那時(shí)我想,構(gòu)建更加龐大的系統(tǒng),可能是一個(gè)能夠成功的思路。于是我找到Sebastian Thrun,他那時(shí)在Google X,我問(wèn)他能不能提供給我一些Google的機(jī)器,他說(shuō)好啊我們一起做,于是后來(lái)就有了Google Brain項(xiàng)目。
主持人:這故事的最后一部分我還真沒(méi)聽過(guò)。這段時(shí)間,百度在對(duì)話型交互界面上有了巨大的突破,從商業(yè)角度上看,為什么語(yǔ)音交互界面對(duì)百度如此重要?要在效率和靈活性方面取得進(jìn)步,會(huì)面臨哪些挑戰(zhàn)?
吳恩達(dá):事實(shí)上,很多人低估了 95% 語(yǔ)音識(shí)別率與 99% 語(yǔ)音識(shí)別率的差別,這四個(gè)百分點(diǎn)的微小差距能夠改變游戲規(guī)則:現(xiàn)在,只有少數(shù)人偶爾使用手機(jī)上的語(yǔ)音交互設(shè)備,然而如果我們達(dá)到 99% 的準(zhǔn)確率,語(yǔ)音交互系統(tǒng)就會(huì)成為人們?cè)谑褂卯a(chǎn)品時(shí)不可分割的一部分,人們會(huì)不假思索地使用。自去年以來(lái),百度用戶中使用語(yǔ)音助手的數(shù)量已經(jīng)增長(zhǎng)了三倍,我們肯定經(jīng)過(guò)了快速?gòu)澋?。隨著語(yǔ)音識(shí)別技術(shù)越來(lái)越可靠,就會(huì)接近采用曲線(adoption curve),不久就會(huì)有越來(lái)越多的人與手機(jī)、電腦對(duì)話,甚至都不用考慮。我經(jīng)常想到智能手機(jī)觸摸屏,它改變了一切,喬布斯沒(méi)有發(fā)明觸屏(可能是HTC第一個(gè)發(fā)明的觸屏電話),但是,他讓觸屏智能電話運(yùn)行得很棒,你會(huì)不假思索地使用它,這改變了一切,因?yàn)檫@是一種全新的人機(jī)交互方式。我認(rèn)為,幾年后,語(yǔ)音交互也有這樣的潛力,將來(lái)我們都會(huì)不假思索地以語(yǔ)音的方式與電腦、手機(jī)等智能設(shè)備交流。
主持人:近年來(lái)智能系統(tǒng)在商業(yè)中的應(yīng)用越來(lái)越廣泛。你認(rèn)為商業(yè)公司戰(zhàn)略應(yīng)該如何與時(shí)俱進(jìn),適應(yīng)智能系統(tǒng)的普及?
吳恩達(dá):這個(gè)問(wèn)題很大,要花很多時(shí)間談這個(gè)問(wèn)題。我認(rèn)為,人工智能是新的「電力」。一百多年前,電力的使用完全改變了一切,產(chǎn)生了許多意料之外的后果,例如,電力讓冰箱成為可能,冰箱改變了食品供應(yīng)系統(tǒng),發(fā)電機(jī)也改變了產(chǎn)業(yè)建立方式。我認(rèn)為,人工智能也會(huì)產(chǎn)業(yè)相似變革影響。目前,我們正處在這一階段,許多公司正在首席數(shù)據(jù)執(zhí)行官,以后可能還會(huì)雇傭人工智能執(zhí)行官,來(lái)管理掌控一切的人工智能。而這與當(dāng)時(shí)許多公司「電力VP」的角色十分相似,因?yàn)樵诋?dāng)時(shí),電力系統(tǒng)對(duì)人們來(lái)說(shuō)太復(fù)雜了,以致于必須要由專人管理。目前,我們也是這樣。這種策略有很多價(jià)值,如果你不十分確定怎么做,可以雇傭數(shù)據(jù)執(zhí)行官或者人工智能執(zhí)行官幫你搞定。
在接下來(lái)幾年,會(huì)發(fā)生另一種變革:人工智能會(huì)具有戰(zhàn)略決策般的重要性。舉例,另一個(gè)對(duì)產(chǎn)業(yè)影響與之類似的變革,就是互聯(lián)網(wǎng)的發(fā)明,當(dāng)時(shí)首席信息官負(fù)責(zé)處理互聯(lián)網(wǎng)之類事宜。我們意識(shí)到,互聯(lián)網(wǎng)的發(fā)明從根本上變革了我們對(duì)創(chuàng)立公司方式的看法。人工智能會(huì)帶來(lái)類似的轉(zhuǎn)變。比如,現(xiàn)在,數(shù)據(jù)是許多公司的防御門檻,技術(shù)相對(duì)容易進(jìn)行某種復(fù)制,但是數(shù)據(jù)是很難復(fù)制的,因此,你們公司的數(shù)據(jù)戰(zhàn)略是什么?有時(shí)我們推出一個(gè)產(chǎn)品,部分原因在于我們喜歡這款產(chǎn)品,部分原因就是為了收集足夠的數(shù)據(jù),獲取信息,為以后要做的事情做準(zhǔn)備。
這就是戰(zhàn)略計(jì)劃的一部分,計(jì)劃推出項(xiàng)目的先后順序,先做什么,獲取數(shù)據(jù)。我認(rèn)為,一家領(lǐng)先的公司已經(jīng)開始思考這樣的問(wèn)題。許多公司曾經(jīng)希望自己早點(diǎn)思考互聯(lián)網(wǎng)戰(zhàn)略問(wèn)題,就像很多年前一些公司希望早點(diǎn)設(shè)計(jì)出電力戰(zhàn)略一樣?,F(xiàn)在正是考慮公司的數(shù)據(jù)戰(zhàn)略的好時(shí)機(jī)。
主持人:我們現(xiàn)在的大學(xué),能夠培養(yǎng)足夠的人工智能工程師來(lái)滿足市場(chǎng)的需求嗎?
吳恩達(dá):可能僅靠大學(xué),無(wú)法提供如此多的專業(yè)人才,所以許多在線學(xué)習(xí)平臺(tái),如coursera, Udacity等等平臺(tái)能夠幫助我們解決這個(gè)問(wèn)題。
主持人:聽說(shuō),中國(guó)大城市的交通情況很讓人頭疼,我們的一位同事前段時(shí)間體驗(yàn)了百度的無(wú)人車,他的感受是,中國(guó)的道路真的是很難開,百度訓(xùn)練無(wú)人駕駛車就像中國(guó)司機(jī)一樣夸張。你認(rèn)為,在中國(guó)開發(fā)無(wú)人車,有什么在美國(guó)不會(huì)遇見的問(wèn)題嗎?
吳恩達(dá):中國(guó)交通的確讓人頭疼。有一次我們?cè)谖瀛h(huán)高速試行無(wú)人車,一輛車突然就開到我們前面。如果是我的話我早就撞上去了,但是當(dāng)時(shí),汽車猛地停了下來(lái)。我還跟坐在駕駛位的同事說(shuō),哇你技術(shù)真好,剛才太危險(xiǎn)了,人類接管了汽車,他說(shuō),我什么都沒(méi)做,車自己停下了。這可能就是你剛才提到的那種體驗(yàn)。
我想和大家分享一個(gè)洞見:為什么我對(duì)百度的自動(dòng)駕駛戰(zhàn)略表示樂(lè)觀。
例如,當(dāng)我獨(dú)自開車時(shí),旁邊的建筑工人可能會(huì)對(duì)你做出「停車」的手勢(shì),這時(shí),你必須停車,如果做出「加速通過(guò)」的手勢(shì)(類似召喚你過(guò)去的手勢(shì)——譯者),你最好開過(guò)去。對(duì)于無(wú)人車來(lái)說(shuō),它需要非常準(zhǔn)確地判斷這兩個(gè)十分相像的手勢(shì),因?yàn)樗鼈兊暮x是完全相反的。這時(shí),99.99% 的準(zhǔn)確率才能保證一切運(yùn)作正常。
根據(jù)現(xiàn)在計(jì)算機(jī)視覺(jué)技術(shù),區(qū)分這兩種手勢(shì)需要辯證能力。這就是為什么我認(rèn)為現(xiàn)在絕大多數(shù)組織思考自動(dòng)駕駛汽車存在的誤區(qū),自動(dòng)駕駛汽車不僅僅是自動(dòng)化,也需要輕微改變汽車的基礎(chǔ)結(jié)構(gòu),比如給建筑工人無(wú)線麥克風(fēng),與自動(dòng)駕駛汽車交流,搞清楚汽車傳達(dá)的信息。如此以來(lái),可能不久以后,自動(dòng)駕駛汽車就可以上路了。
主持人:作為一名父親,我很關(guān)心未來(lái)的教育和就業(yè)情況。你有什么建議給家長(zhǎng)們,讓他們幫助孩子更好地就業(yè)?
吳恩達(dá):像所有技術(shù)革命一樣,人工智能會(huì)替代許多職位,也會(huì)創(chuàng)造許多職位。我能給各位家長(zhǎng)的建議是,幫助你的孩子學(xué)習(xí)如何學(xué)習(xí)。隨著技術(shù)更新?lián)Q代越來(lái)越快,最重要的是擁有學(xué)習(xí)的能力,這樣一個(gè)人才能不斷地適應(yīng)環(huán)境的變化,始終在需要人類的崗位上發(fā)揮價(jià)值。
主持人:你談到了技術(shù)性失業(yè)這個(gè)主題,不過(guò),目前在硅谷,一個(gè)特別熱烈的討論是,工作機(jī)會(huì)的有限是不是一種永久性的結(jié)構(gòu)性有限,硅谷的解決方案是universal basic income,意思是每個(gè)人出生的時(shí)候就有收入購(gòu)買所需 ,這個(gè)概念可以追溯到經(jīng)濟(jì)學(xué)家米爾頓·弗里德曼,在你看來(lái),無(wú)論工作機(jī)會(huì)是否有限,這種統(tǒng)一基礎(chǔ)收入的解決方案是否會(huì)有意義?
吳恩達(dá):以后可能出現(xiàn)的失業(yè)潮,可能會(huì)更加迅速。之前,當(dāng)農(nóng)業(yè)漸漸被機(jī)器取代的時(shí)候,農(nóng)民們尚可繼續(xù)耕作,而他們的孩子轉(zhuǎn)而學(xué)習(xí)別的技能。未來(lái),從事司機(jī)等職業(yè)的人,可能在他們有生之年就會(huì)面臨失業(yè)。我認(rèn)為,有一種與此類似的方法可能會(huì)很有幫助,那就是,對(duì)于結(jié)構(gòu)性失業(yè)的人,我們不發(fā)放「失業(yè)補(bǔ)助」,而是發(fā)放「學(xué)習(xí)補(bǔ)助」,讓人們通過(guò)學(xué)習(xí)來(lái)賺錢。因?yàn)槲蚁嘈?,每個(gè)人都有通過(guò)自己的努力來(lái)創(chuàng)造更好的生活的權(quán)力。對(duì)于因智能系統(tǒng)的普及而失業(yè)的人來(lái)說(shuō),讓他們能夠?qū)W習(xí)其它更加需要人類的技能,能夠幫助他們繼續(xù)他們個(gè)人的發(fā)展。
主持人:你認(rèn)為對(duì)于當(dāng)前的機(jī)器學(xué)習(xí)技術(shù)來(lái)說(shuō),可能存在什么樣的局限性,可能出現(xiàn)什么樣的難題?
吳恩達(dá):目前,任何的機(jī)器學(xué)習(xí)系統(tǒng)使用的都是監(jiān)督式學(xué)習(xí),而實(shí)現(xiàn)監(jiān)督式學(xué)習(xí),我們需要大量的數(shù)據(jù)。例如,我們?cè)诎俣扔?xùn)練語(yǔ)音識(shí)別系統(tǒng)的時(shí)候,我們使用了過(guò)去整整五年的語(yǔ)音數(shù)據(jù)和相應(yīng)的文本數(shù)據(jù)。所以,對(duì)數(shù)據(jù)的龐大需求是機(jī)器學(xué)習(xí)的阿喀琉斯之踵。我希望以后能夠出現(xiàn)新的技術(shù),使得機(jī)器學(xué)習(xí)能夠從更少的樣本中學(xué)習(xí)。
觀眾問(wèn)答:
觀眾:我感覺(jué)對(duì)于人工智能在市場(chǎng)上的應(yīng)用,工業(yè)產(chǎn)業(yè)常常被忽略,那么你認(rèn)為人工智能對(duì)工業(yè)產(chǎn)業(yè)會(huì)有什么影響?
吳恩達(dá):我認(rèn)為事實(shí)上沒(méi)有什么產(chǎn)業(yè)是不會(huì)被人工智能所影響的,其中有很多是我們現(xiàn)在難以想象的產(chǎn)業(yè)。在互聯(lián)網(wǎng)剛剛興起的是,不論在百度還是谷歌,我們投放廣告的方式是,雇傭?qū)iT的人員,他們需要和廣告商討論,尋找與之匹配的、用戶訪問(wèn)量高的網(wǎng)站,然后把不同廣告放到不同的網(wǎng)頁(yè)去。后來(lái),我們開始使用數(shù)據(jù)來(lái)幫助他們進(jìn)行分析。到現(xiàn)在,我們幾乎完全依賴機(jī)器學(xué)習(xí)系統(tǒng)來(lái)自動(dòng)匹配廣告和網(wǎng)頁(yè)。但在一開始,那些工作人員是絕對(duì)不會(huì)相信機(jī)器能夠取代他們的工作的。同樣,拿服裝零售業(yè)舉例,以前,銷售人員需要分析什么款式、什么顏色更符合用戶的需求,他們需要預(yù)估一件產(chǎn)品的銷量,現(xiàn)在,很多公司已經(jīng)在使用數(shù)據(jù)來(lái)幫助它們分析了。
觀眾:目前在語(yǔ)義理解方面,我們的進(jìn)步十分有限,你覺(jué)得什么時(shí)候才會(huì)出現(xiàn)拐點(diǎn)?
吳恩達(dá):目前,我們已經(jīng)能夠使機(jī)器學(xué)習(xí)類比,這雖然只是非常基礎(chǔ)的一步,但我確實(shí)相信我們能夠一步一步地達(dá)成目標(biāo)。其中,大量的數(shù)據(jù)是必要的,我相信這也是兒童學(xué)習(xí)的方式。算法也是十分重要的。我們確實(shí)非常需要一種新的算法來(lái)解決這一問(wèn)題,但就我個(gè)人而言,我還不知道這種算法會(huì)是什么樣的。概括地講,大數(shù)據(jù)、更好的算法、以及強(qiáng)大的硬件,能夠幫助我們進(jìn)步。
特斯拉研發(fā)的負(fù)責(zé)人Sterling Anderson:特斯拉自動(dòng)駕駛將在Model 3之前推出
斯特林·安德森(Sterling Anderson)
當(dāng)Tesla在2012年推出Model S時(shí),這部車的主要賣點(diǎn)之一就是永久移動(dòng)網(wǎng)絡(luò)連接。如今,此功能將成為Tesla在自動(dòng)駕駛汽車競(jìng)賽中的一個(gè)重大優(yōu)勢(shì)。
通過(guò)網(wǎng)絡(luò)連接,Tesla可以從車主車內(nèi)所帶的探測(cè)器中下載各種數(shù)據(jù),例如車主的開車習(xí)慣以及路況。這些數(shù)據(jù)則可以被用于測(cè)試Tesla的自動(dòng)駕駛軟件的效率。Tesla公司甚至曾經(jīng)秘密的把自動(dòng)駕駛軟件下載到車主的車?yán)?,在不控制車的前提下測(cè)試軟件在真實(shí)路況上的反應(yīng)。
“我們可以從車?yán)锵螺d高分辨率的數(shù)據(jù),并且可以通過(guò)OTA(Over The Air)來(lái)升級(jí)這些車輛。這個(gè)功能使得我們?cè)谶^(guò)去的18個(gè)月里,從開發(fā)競(jìng)賽的尾巴追趕到如今擁有這些非常先進(jìn)的自動(dòng)或半自動(dòng)駕駛功能”。Tesla自動(dòng)駕駛項(xiàng)目總監(jiān)斯特林·安德森(Sterling Anderson)在舊金山《麻省理工科技評(píng)論》EmTech Digital大會(huì)上如此宣布。
“自從在18個(gè)月前推出這些硬件以來(lái),我們積累行駛了7.8億英里”,安德森說(shuō)?!拔覀兛梢栽谧约旱姆?wù)器上使用這些數(shù)據(jù)來(lái)觀察車主們是如何使用我們的車輛,以及我們?nèi)绾慰梢蕴岣咦约骸!?/span>
安德森還表示,Tesla每10個(gè)小時(shí)就可以獲得1百萬(wàn)公里的數(shù)據(jù)。Tesla的工程師們?cè)陂_發(fā)自動(dòng)駕駛軟件的初期時(shí),就會(huì)把軟件的結(jié)果和這些數(shù)據(jù)比較。任何表現(xiàn)良好的軟件可以被秘密的安裝在車輛里來(lái)做進(jìn)一步的測(cè)試。在不控制車輛的前提下,軟件對(duì)真實(shí)路況的一切反應(yīng)將被記錄下來(lái)。
“我們經(jīng)常會(huì)在已售車輛中安裝一個(gè)‘惰性’功能”,安德森說(shuō),“這將允許我們觀察一個(gè)功能在千萬(wàn)英里的實(shí)況下表現(xiàn)如何?!?/span>
當(dāng)一個(gè)新的功能被推出時(shí),安德森的團(tuán)隊(duì)也可以緊密觀察它的情況。就拿Tesla的Autopilot功能來(lái)說(shuō),安德森展示了一個(gè)圖表。圖表顯示了在Autopilot的控制下,自動(dòng)駕駛的Tesla汽車比人類駕駛更加貼近車道的中心。自從去年10月正式推出以來(lái),Tesla的自動(dòng)駕駛功能已經(jīng)積累了1億英里。
可以隨時(shí)隨地的從車?yán)锵螺d數(shù)據(jù),以及秘密的測(cè)試自動(dòng)駕駛功能是屬于Tesla的獨(dú)門絕技。谷歌曾展示過(guò)最先進(jìn)的自動(dòng)駕駛技術(shù),但是他們也只能從數(shù)量極少的原型車?yán)锵螺d數(shù)據(jù)。相比之下,Tesla的車輛不但在數(shù)量上超過(guò)谷歌,在區(qū)域的廣度上也完全超越谷歌。
其他汽車廠家,例如通用汽車,也在試圖開發(fā)自動(dòng)駕駛技術(shù)。但是他們并沒(méi)有像Tesla一樣歡迎網(wǎng)絡(luò)連接和OTA升級(jí)。
前不久,馬斯克剛剛宣布,廉價(jià)版的電動(dòng)車特斯拉Model3會(huì)在2017年晚些時(shí)候面世。其內(nèi)飾和輪轂的設(shè)計(jì)依舊沒(méi)有蓋棺論定,馬斯克在自己的推特里,也提到了車輛設(shè)計(jì)方面的不確定性,以及Model3“宇宙飛船”般的駕駛體驗(yàn)。宇宙飛船?這究竟意味著什么?難道這是關(guān)于特斯拉,乃至全世界,第一部無(wú)人駕駛汽車的高能劇透?
當(dāng)Sterling Anderson,特斯拉無(wú)人駕駛部門的負(fù)責(zé)人,被問(wèn)及Model3會(huì)不會(huì)是人類歷史上第一部無(wú)人駕駛車時(shí),他“駁斥”了這種觀點(diǎn):“這種事情,在Model3問(wèn)世之前,就應(yīng)該發(fā)生了?!?/span>
“Model 3不會(huì)因?yàn)閮r(jià)格的原因缺失任何我們所擁有的技術(shù),它會(huì)代表我們的最高水平?!盇nderson表示,特斯拉是獨(dú)一無(wú)二的公司,它會(huì)將所有已經(jīng)掌握的新技術(shù),運(yùn)用到所有正在生產(chǎn)的車型上,也就是說(shuō),所有特斯拉電動(dòng)車在出廠時(shí),都擁有當(dāng)時(shí)特斯拉最先進(jìn)的技術(shù),“ModelS和X的技術(shù)水平也會(huì)一直進(jìn)步下去?!?/span>
這預(yù)示著,也許特斯拉Model 3不會(huì)成為第一部無(wú)人駕駛車了,因?yàn)橐坏┨厮估莆樟俗専o(wú)人駕駛(自動(dòng)巡航)的技術(shù)——不僅僅針對(duì)高速公路,而是全路段——他們不會(huì)等待Model 3的問(wèn)世,而會(huì)將這項(xiàng)技術(shù)直接加載到現(xiàn)有的車型中。
Anderson說(shuō),他們的無(wú)人駕駛研發(fā)團(tuán)隊(duì)目前正在嘗試解決郊區(qū)行駛問(wèn)題,以及如何處理十字路口情況的問(wèn)題。他的說(shuō)法也符合目前特斯拉在無(wú)人駕駛方面的計(jì)劃,以及研發(fā)現(xiàn)狀的報(bào)告。
以特斯拉Model S為例,它在2012年開始發(fā)售,當(dāng)時(shí)并不具備自動(dòng)駕駛所需要的傳感器和其他硬件;到了2014年晚些時(shí)候,Model S增加了自動(dòng)緊急剎車系統(tǒng)以及相關(guān)傳感器;而2015年,Model S又增加了一項(xiàng)人工開啟自動(dòng)巡航的功能。
按這個(gè)速度下去,無(wú)人駕駛(自動(dòng)巡航)指日可待?
Facebook計(jì)劃在今年使用神經(jīng)網(wǎng)絡(luò)來(lái)提高翻譯水平
阿蘭·帕克爾(Alan Packer)
Facebook正在試圖大幅提高它自動(dòng)翻譯的精準(zhǔn)度。
他們準(zhǔn)備在年底推出一款全新的,基于人工神經(jīng)網(wǎng)絡(luò)的翻譯系統(tǒng)。人工神經(jīng)網(wǎng)絡(luò)是Facebook以及其他科技公司花重資所開發(fā)的人工智能新技術(shù)。
在麻省理工科技評(píng)論EmTec Digital峰會(huì)上,F(xiàn)acebook語(yǔ)言技術(shù)部部長(zhǎng)阿蘭·帕克爾(Alan Packer)表示,使用神經(jīng)網(wǎng)絡(luò)所得到的翻譯結(jié)果要比統(tǒng)計(jì)機(jī)器翻譯所得到的結(jié)果更加自然。目前,絕大多數(shù)翻譯軟件所使用的都是統(tǒng)計(jì)機(jī)器翻譯。
帕爾克還表示,神經(jīng)網(wǎng)絡(luò)在把俚語(yǔ)和比喻翻譯為其他語(yǔ)言中相似的說(shuō)法這方面可能更加出色。
谷歌也正在向神經(jīng)網(wǎng)絡(luò)上轉(zhuǎn)移谷歌翻譯,但是目前此項(xiàng)目還沒(méi)具體的時(shí)間表。
Facebook和谷歌兩者都有龐大的數(shù)據(jù)可以用來(lái)訓(xùn)練翻譯軟件。但是Facebook的數(shù)據(jù)可能更加口語(yǔ)化,更加貼近人們聊天的方式。
目前,F(xiàn)acebook上有大概2萬(wàn)億個(gè)狀態(tài)和回復(fù)。而且這個(gè)數(shù)字正在以每日10億的數(shù)量增加。帕克爾曾解釋過(guò)他的團(tuán)隊(duì)是如何使用這些數(shù)據(jù)來(lái)訓(xùn)練他們的軟件,去翻譯口語(yǔ)化的單詞和句子的。
就拿數(shù)月前的一個(gè)發(fā)現(xiàn)來(lái)說(shuō)。那時(shí),F(xiàn)acebook有探測(cè)到法國(guó)學(xué)生正在使用各種英語(yǔ)單詞的變種,例如“wow”的變種“uau”。Facebook的機(jī)器學(xué)習(xí)軟件成功的學(xué)會(huì)了這些,并開始正確的翻譯這些變種。帕克爾表示,F(xiàn)acebook目前可以翻譯40多種語(yǔ)言,每天提供高達(dá)20億次的翻譯。每個(gè)月都有8億名用戶在Facebook上瀏覽翻譯的語(yǔ)言。
但是有一種及其受到歡迎的語(yǔ)言帕克爾沒(méi)有任何興趣翻譯——表情符號(hào)。
“它們一般都是通用的“他說(shuō)。
Gary Marcus:一味追求大數(shù)據(jù)是機(jī)器學(xué)習(xí)的誤區(qū),我們的算法所需數(shù)據(jù)更少且速度更快
去年,微軟和谷歌的圖像識(shí)別算法都已表現(xiàn)出可通過(guò)學(xué)習(xí)打敗人類的能力。他們各自搭建了自己的軟件,進(jìn)行了標(biāo)準(zhǔn)測(cè)試,讓軟件識(shí)別1000張各式各樣的物體的圖片,結(jié)果超過(guò)了平均的人類得分。
但是,為了讓軟件足夠強(qiáng)大能夠?qū)谷祟悾@兩個(gè)公司的軟件都對(duì)120萬(wàn)張帶標(biāo)簽的圖片進(jìn)行了仔細(xì)觀察。而對(duì)一個(gè)孩子來(lái)說(shuō),只用一張樣例圖片,就能夠識(shí)別一種新的物體。
日前,創(chuàng)業(yè)公司Geometric Intelligence說(shuō),他們研發(fā)了一個(gè)可以更快學(xué)習(xí)的機(jī)器學(xué)習(xí)軟件。該公司的CEO Gary Marcus在EmTech Digital大會(huì)上表示,如果要學(xué)習(xí)一項(xiàng)新的視覺(jué)任務(wù),他們的XProp軟件所需要的樣品圖片數(shù)量與現(xiàn)在機(jī)器學(xué)習(xí)軟件的主流形式——即深度學(xué)習(xí)相比要少得多。
Marcus沒(méi)有披露XProp的工作細(xì)節(jié),但他展示了一張將XProp和某個(gè)深度學(xué)習(xí)程序在一項(xiàng)測(cè)試中的表現(xiàn)做對(duì)比的表格,該測(cè)試的內(nèi)容是軟件學(xué)習(xí)怎樣識(shí)別手寫體數(shù)字。
表格顯示,訓(xùn)練數(shù)據(jù)越多,兩個(gè)系統(tǒng)性能就會(huì)越精確。但是在相同數(shù)量訓(xùn)練樣例的情況下, XProp的性能表現(xiàn)得更好。
比如,XProp學(xué)習(xí)過(guò)每個(gè)數(shù)字的大約150張手寫圖片后,識(shí)別新的數(shù)字圖片,錯(cuò)誤率只有約 2%。而對(duì)深度學(xué)習(xí)算法來(lái)說(shuō),為達(dá)到同樣性能,則每個(gè)數(shù)字需要學(xué)習(xí)約 700 張樣圖。
這并不代表XProp一定有實(shí)際用處。識(shí)別手寫體數(shù)字差不多屬于已解決的問(wèn)題了。可用來(lái)訓(xùn)練的數(shù)據(jù)很多,而用深度學(xué)習(xí)軟件得出的最好結(jié)果錯(cuò)誤率已經(jīng)達(dá)到了 0.2%。Marcus展示的數(shù)字顯示,隨著訓(xùn)練數(shù)據(jù)的增多,XProp相比于深度學(xué)習(xí)軟件的優(yōu)勢(shì)就會(huì)下降。
但是Marcus說(shuō),在谷歌街景項(xiàng)目收集的門牌號(hào)碼照片的數(shù)據(jù)庫(kù)中,XProp的識(shí)別結(jié)果與上面那個(gè)實(shí)驗(yàn)相似,其他的圖像識(shí)別測(cè)試中也是如此,這表明,該公司的技術(shù)可能具有廣泛的可用性。
大多數(shù)機(jī)器學(xué)習(xí)研究人員都認(rèn)為會(huì)出現(xiàn)一些能夠通過(guò)學(xué)習(xí)更少的數(shù)據(jù)運(yùn)作起來(lái)的新技術(shù)。
Marcus說(shuō):“深度學(xué)習(xí)非常需要數(shù)據(jù)——而我們的學(xué)習(xí)速度則更快,我們的軟件有時(shí)可以將所需數(shù)據(jù)量減少一半,有時(shí)甚至更多。”
Marcus是紐約大學(xué)的心理學(xué)教授,曾用幾十年時(shí)間研究?jī)和膶W(xué)習(xí)方式。他目前最困惑的一個(gè)問(wèn)題是,語(yǔ)音及圖像識(shí)別等由深度學(xué)習(xí)支撐的領(lǐng)域進(jìn)展是否一定會(huì)幫助理解語(yǔ)言等更有挑戰(zhàn)性的領(lǐng)域的進(jìn)步呢?
谷歌這樣的大型計(jì)算公司通過(guò)將海量的標(biāo)簽訓(xùn)練數(shù)據(jù)集結(jié)到一起,已經(jīng)有能力打造強(qiáng)大的語(yǔ)音和圖像識(shí)別軟件。Marcus不否認(rèn)這類科技將會(huì)帶來(lái)成功的產(chǎn)品。但是,他相信,如果軟件的性能要更加接近人類快速學(xué)習(xí)新技能,以及適應(yīng)不斷變化的環(huán)境的能力,那么需要更少數(shù)據(jù)量的算法就必不可少。
“我們處在大數(shù)據(jù)的時(shí)代,而且很多人覺(jué)得只要投入更多數(shù)據(jù)就能解決問(wèn)題,”Marcus對(duì)EmTech的觀眾說(shuō),“但是面對(duì)有些問(wèn)題的時(shí)候,并沒(méi)有那么多數(shù)據(jù)可以提供?!?/span>
他說(shuō),語(yǔ)言就是其中之一。人們的言語(yǔ)有無(wú)限種可能,將所有含義的語(yǔ)句歸納出來(lái)訓(xùn)練軟件是不可能實(shí)現(xiàn)的。Marcus還提到了無(wú)人駕駛汽車的例子,機(jī)器學(xué)習(xí)算法需要大量數(shù)據(jù),在無(wú)人駕駛汽車中,這可能無(wú)法解決所有問(wèn)題。
他說(shuō),如果一輛汽車必須一遍遍地體驗(yàn)環(huán)境才能掌握技能,那么用每種可能的交通和天氣情況訓(xùn)練車輛,可能耗時(shí)太長(zhǎng)。
(審核編輯: 智匯小蟹)
分享