-
李德毅院士談人工智能:二十二次說到“記憶”這個(gè)詞
關(guān)鍵字: 人工智能圍棋AlphaGo自動(dòng)駕駛深度學(xué)習(xí)人腦認(rèn)知弱智能【AlphaGo戰(zhàn)勝李世石,靠的是窮舉的計(jì)算能力?不,是靠“深度學(xué)習(xí)”了一天就能下300萬盤棋積累下的經(jīng)驗(yàn)。李德毅老師的團(tuán)隊(duì)也正在以算法+大數(shù)據(jù)的思路,打造“主要靠經(jīng)驗(yàn)”的人工智能“老司機(jī)”。他在4月22日的全球人工智能技術(shù)大會(huì)所作的《人工智能在奔跑》演講,二十二次說到“記憶”這個(gè)詞?!?/strong>
各位同行,我很高興下午做第一個(gè)發(fā)言。我的題目有點(diǎn)大,叫人工智能在奔跑。因?yàn)槿斯ぶ悄芙?jīng)過60年的歷練已經(jīng)到了可以奔跑的時(shí)候了,我想講三個(gè)問題。先講講圍棋腦,然后再講講智能車駕駛腦,然后再講講決策腦,作為人腦最重要的部分怎么做決策。
先講講圍棋,圍棋其實(shí)是中國的文化遺產(chǎn),中國的圍棋在全世界很有名。就跟中國的乒乓球一樣有名,但乒乓球是舶來品,圍棋是我們中國人的。現(xiàn)在圍棋最好的是中日韓。圍棋是誰把誰圍住了誰就贏,所以我出了一個(gè)題目,叫做形象思維的自動(dòng)化。下象棋大家都知道主要是吃子,有大小之分。圍棋就不一樣了,圍棋的子沒有大小之分,象棋是八分八的棋盤。我想特別回顧一下歷史,在2011年9月6號,我們中國人工智能學(xué)會(huì)組織了九路圍棋,81個(gè)格子,讓北郵的圍棋程序Lingo對俞斌,讓俞斌讓兩個(gè)子給Lingo,他說不好贏。在2011年的時(shí)候包括中央電視臺(tái)也播了,俞斌是我們中國圍棋隊(duì)總教練,我們的圍棋在世界上可以說是穩(wěn)拿的,兩盤都敗給了Lingo,當(dāng)時(shí)認(rèn)為兩三年九路棋盤是有希望的。這是五年前的事情,只不過我們中國人工智能學(xué)會(huì)影響不那么大,全世界不一定都感知到了。
到了2016年3月9號,李世石下了19路圍棋,而且最后4:1輸了。為什么?難在哪里?圍棋難以鎖定下一個(gè)目標(biāo),具有更大的不確定性。我有一篇著作叫做“不確定性人工智能”。圍棋的不確定性比象棋大很多,象棋更注重邏輯思維,圍棋在某個(gè)狀態(tài)下應(yīng)對的步驟比象棋多很多,既有邏輯思維也更注重形象思維,更大局觀。
我們看看在《自然》雜志上,20個(gè)作者寫了AlphaGo的程序,他們采取的辦法。這篇文章里提到一個(gè)特定的圍棋棋局,有很多的計(jì)算量和推理量。我們中國人有一句話叫做千古無同局,所以歷來把它認(rèn)為是給人工智能一個(gè)挑戰(zhàn)的很好的里程碑。那么我們仔細(xì)分析一下,AlphaGo為什么贏?這是我今天要報(bào)告的重點(diǎn)。它突破了傳統(tǒng)的程序,構(gòu)建了兩道模仿人類思維的深度卷積神經(jīng)網(wǎng)絡(luò)。第一個(gè)網(wǎng)絡(luò)主要擔(dān)當(dāng)棋局態(tài)勢的評估,第二個(gè)網(wǎng)絡(luò)是如何落子,這是人機(jī)大戰(zhàn),如果你知道每一步怎么下的,你會(huì)得到一個(gè)結(jié)論,那就是沒有看到有天外來客下出不食人間煙火的套路。這句話告訴大家AlphaGo的學(xué)習(xí)能力很強(qiáng),因?yàn)樗俏覀儑迨纸趟摹?
所以在全世界一片振動(dòng)之后,我提出四個(gè)問題請大家思考一下。
第一個(gè)問題,如果讓AlphaGo或李世石再下一次復(fù)盤,讓李世石原來怎么下還怎么下,請問AlphaGo能不能復(fù)盤,能下出跟原來一樣的嗎?它是以不確定性為強(qiáng)的,能不能重復(fù)?這是第一個(gè)問題。
第二個(gè)問題,在比賽之前以及比賽之后,這個(gè)程序變了沒有?還是原來的程序嗎?我們手機(jī)壞了實(shí)在不行重新啟動(dòng),還是原來的。AlphaGo的程序還是原來的嗎?它跟李世石下了五盤棋學(xué)到了什么東西。
第三個(gè)問題,跟李世石下棋之前,AlphaGo跟別人下過,如果用相同的版本對比的話結(jié)局如何?還有沒有意義?能不能提高AlphaGo的水平。
第四個(gè)問題,讓AlphaGo從此以后不再跟高棋手下棋,AlphaGo的程序水平會(huì)不會(huì)降低?
我覺得這幾個(gè)問題可以讓我們?nèi)斯ぶ悄芄ぷ髡呱晕⒍嘞胍幌?。其?shí)在我們眼里李世石只是充當(dāng)了一次人工智能發(fā)展成果的測試員而已,他對我們來說只是我們測程序的一次科學(xué)實(shí)驗(yàn)而已,是一個(gè)人與一群人的對決,包括棋類高手又包括人工智能高手。你們看deepmind的作者,他們不但是人工智能高手,也是圍棋高手,是兩個(gè)領(lǐng)域的能人,這個(gè)不容易的。所以我們經(jīng)常講什么叫人機(jī)大戰(zhàn),人機(jī)大戰(zhàn)實(shí)際上是人在前面機(jī)器在后面,或機(jī)器在前面人在后面的一場對決而已。因此從統(tǒng)計(jì)學(xué)上來看人機(jī)大戰(zhàn)總的結(jié)局應(yīng)該是5:5。
下面講AlphaGo程序還有很多的不足,比如說它下棋的時(shí)候還要有一個(gè)助理員拿棋子,它的手還沒做出來,它沒有眼睛,沒有感受和行為能力。這個(gè)機(jī)器人一定要有它的感知能力、有行為能力,而它只有思考能力是不夠的。再一個(gè)AlphaGo程序目前還沒有情緒、沒有情感,不能現(xiàn)場分析對手的心理狀態(tài),跟誰下都是一回事,不能夠現(xiàn)場和對手展開心理戰(zhàn),缺少交互認(rèn)知的能力。我想兩條AlphaGo程序的作者也一定會(huì)同意的。
AlphaGo對戰(zhàn)李世石
AlphaGo的成功用了深度卷積神經(jīng)網(wǎng)絡(luò),但是這個(gè)卷積神經(jīng)網(wǎng)絡(luò)有四個(gè)毛病。
第一,有太多的學(xué)習(xí)參數(shù),就是今天上午各位講的權(quán)重系數(shù),這些系數(shù)的確定具有隨意性。包括有多少個(gè)卷積和,怎么卷,怎么下載,這里面隨意性太大。所以我們發(fā)現(xiàn)他們發(fā)表的文章我們做的時(shí)候恢復(fù)不了,文章主要的東西沒寫進(jìn)去。
第二,你在學(xué)習(xí)的過程當(dāng)中不能進(jìn)行你的數(shù)據(jù)樣本很大,就能保證算法是正確的,這個(gè)事情很糟糕。
第三,現(xiàn)在用的卷積神經(jīng)網(wǎng)絡(luò)更多的還是前面的,這是跟人類學(xué)習(xí)不一樣的。
第四,現(xiàn)在用的對樣本的學(xué)習(xí)是沒有累積性的,我們?nèi)耸怯欣鄯e性的。
因此這四個(gè)缺陷是我們?nèi)斯ぶ悄芤朕k法努力克服的。我個(gè)人認(rèn)為深度學(xué)習(xí)不管是卷積神經(jīng)網(wǎng)絡(luò)還是其他的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法,都不能是人工智能的終結(jié)者。尤其重要的是我們看到的人都是個(gè)性的,而AlphaGo程序目前還沒有定位為個(gè)性的,我們需要的張三李四,世界上并不存在一個(gè)人類,人類是我們?nèi)说目偡Q而已。
下面第二個(gè)議題,駕駛腦。因?yàn)閲鍖?shí)際上在我看來應(yīng)該是個(gè)圍住和不圍住的問題,在統(tǒng)計(jì)學(xué)里面是拓?fù)鋵W(xué)的問題,充其量AlphaGo是拓?fù)鋵W(xué)動(dòng)力學(xué)的問題,如果把這個(gè)問題引入到其他領(lǐng)域要很復(fù)雜。比如說開車需要駕駛認(rèn)知,汽車發(fā)明130多年了,走的正好是跟圍棋相反的道路。先走的是行為能力,不管什么時(shí)候這個(gè)汽車都要能跑,這個(gè)很重要,這是汽車工業(yè)的驕傲。我們做了幾百輛車還覺得太少,你能跑惡劣環(huán)境嗎?所以在汽車上配置感知零部件,實(shí)現(xiàn)自動(dòng)駕駛,是在車輛動(dòng)力學(xué)和人工智能成立的基礎(chǔ)上?,F(xiàn)在我們做自動(dòng)駕駛,我們覺得自動(dòng)還不行,當(dāng)你買了這個(gè)自動(dòng)駕駛車回來之后,我會(huì)告訴你,你會(huì)不滿意的,因?yàn)樗鼤r(shí)不時(shí)就說對不起,你請你轉(zhuǎn)入人工駕駛。這次長安的車很多都要人工干預(yù),這里面缺少了一個(gè)問題,光感知是不夠的,一定要有認(rèn)知腦。因此和圍棋腦相反,我們現(xiàn)在走的是現(xiàn)有行為能力,感知能力,目前汽車還需要有認(rèn)知能力,那就變成了機(jī)器人。我們現(xiàn)在希望做一個(gè)機(jī)器人,是汽車上比較集中的目標(biāo)。說得再挑戰(zhàn)一點(diǎn),我們希望做一個(gè)飆車機(jī)器人,假如飆車機(jī)器人跑的比人類快,那就更加全面了,就不單是腦子的問題,還有感知和認(rèn)知的問題了。
現(xiàn)在智能駕駛系統(tǒng)很煩惱,因?yàn)槭请x線輔助駕駛。我寫了一個(gè)報(bào)告,叫最后的繁榮和轉(zhuǎn)型之路。因?yàn)槟阕隽四敲炊嗟闹锌卦O(shè)備,顯示設(shè)備,將來汽車要自己會(huì)自駕駛了,這個(gè)行業(yè),這個(gè)工業(yè)怎么辦?轉(zhuǎn)向自動(dòng)駕駛。但是我剛才講了目前的自動(dòng)駕駛是局部時(shí)段,局部區(qū)域,能滿足駕駛的范圍很小。自駕駛說得更多一點(diǎn)是無人駕駛,或者自助駕駛。我們昨天科技部進(jìn)行了重要的答辯,用了以人為本的人機(jī)系統(tǒng)共享,不是單純的由人駕駛,也不是單純的由馬駕駛,而是共同的協(xié)調(diào)駕駛。
既然需要一個(gè)駕駛腦,我們就要考慮人腦有哪些功能,需要駕駛腦來承擔(dān)。我們認(rèn)為記憶一點(diǎn)不亞于計(jì)算,尤其是長期記憶、短期記憶,或者瞬間記憶,這個(gè)形態(tài)是不一樣的,數(shù)據(jù)量也是不同的?,F(xiàn)在所有廠家做的圖像識(shí)別,基本上還是在瞬間記憶階段。我們這個(gè)課題組不一樣,我們把它做到行政化后面去了,這就是我們的特長。
把人腦中動(dòng)機(jī)、學(xué)習(xí)和思維、性格、記憶,都用機(jī)器來實(shí)現(xiàn),就可以做一個(gè)機(jī)器的駕駛腦。情緒注意力不集中就不要進(jìn)來了,我們希望個(gè)性化還是要進(jìn)來的。這樣的情況下我們有了思想,既能有感知信息,把感知信息合并到一起大概三大類。第一塊是路網(wǎng)文件,精確到10厘米左右。第二個(gè)是雷達(dá)通道,航天雷達(dá)、超聲雷達(dá),都叫雷道通道,也是個(gè)千里眼。再一個(gè)就是攝像頭。這三個(gè)通道就好像人的感知器官一樣,很重要,但是哪一路都有不完善的地方。它們都在完成定位、路權(quán)檢測和導(dǎo)航的能力。定位就是我在什么地方,路權(quán)檢測就是周圍有什么,導(dǎo)航就是下一步怎么走。定位里面最重要的就是同步定位和映射,這個(gè)要做得好智能駕駛就好了,現(xiàn)在最難的就是這塊。周圍有什么我們用我們的行政化的方法,此時(shí)此刻我周圍多大的空間是我可以使用的。下一步怎么做就是方向盤了。
我們的課題組不僅做前面的視覺的感知深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),我們把這些叫做先視后覺。尤其要感興趣的是視而不覺,邊視邊覺和先覺后視。我多次講駕駛腦對路邊的美女是不用看的,我們強(qiáng)調(diào)要記住當(dāng)前的感知,已有的認(rèn)知對當(dāng)前的感知起重要的作用。因此我們在駕駛腦里面有視圖儀表,通過長期的記憶,工作記憶和瞬間記憶,來記憶不同時(shí)間了解交通的信息,最后形成一個(gè)動(dòng)作的執(zhí)行,這就是我們說的感知、認(rèn)知、行動(dòng),再感知、再認(rèn)知,再行動(dòng)。
自動(dòng)駕駛的未來圖景
其實(shí)跟下圍棋相比,駕駛活動(dòng)更多的是技巧,是記憶或經(jīng)驗(yàn)。而不是知識(shí)、推理和計(jì)算。駕駛腦的差異反映個(gè)人智力和運(yùn)動(dòng)能力的差異,一個(gè)孩子從小就看得出他有沒有跳芭蕾舞的天賦,其實(shí)開車有是大同小異的。為什么兩口子開到最后發(fā)現(xiàn)一個(gè)人更會(huì)開,他的小腦比另外一個(gè)人要發(fā)達(dá)一點(diǎn)。
-
本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯:鐘曉雯
-
美國政府“逃過一劫” 評論 125最新聞 Hot
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團(tuán)是絕望之舉,中國工廠效率質(zhì)量都是第一”
-
“中國有能力讓夢想照進(jìn)現(xiàn)實(shí),將贏得史詩般競爭”
-
被災(zāi)民暴罵到當(dāng)場破防,馬克龍發(fā)飆:你該慶幸你在法國!
-
美高校敦促國際學(xué)生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調(diào)”
-
澳大利亞來了,中國就得走人?澳總理這么回應(yīng)
-
美媒感慨:基建狂魔發(fā)力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報(bào)復(fù)來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-
還在扯皮中國,“涉華條款全刪了”
-
中國“光伏OPEC”發(fā)文嚴(yán)厲質(zhì)問央企,怎么回事?
-
“最后一道貿(mào)易障礙,中國解除了!”
-