他的論文連同行都看不懂,卻可能通向真正的人工智能

2019-02-15

 

作為世界上最有影響力的神經(jīng)科學(xué)家,卡爾·弗里斯頓(Karl Friston)為腦功能成像研究做出的貢獻(xiàn)恐怕已經(jīng)達(dá)到了諾獎(jiǎng)級(jí)別——全球 90% 關(guān)于腦功能成像的論文都在使用他發(fā)明的數(shù)據(jù)處理方法,h-index 幾乎是愛因斯坦的兩倍。同時(shí),他也是一位跨界天才,提出了一個(gè)連數(shù)學(xué)家、物理學(xué)家、生物學(xué)家都不能徹底理解的深?yuàn)W理論,這一理論不但囊括宇宙萬物,還可能帶我們找到真正的人工智能。

每周一中午,卡爾·弗里斯頓(Karl Friston)都會(huì)來到皇后廣場(Queen Square),去有夏洛特皇后雕像的花園里點(diǎn)起一根煙。這個(gè)稍稍有點(diǎn)駝背,有著一頭銀灰色頭發(fā)的科學(xué)家是倫敦大學(xué)學(xué)院(University College London)著名的功能成像實(shí)驗(yàn)室(Functional Imaging Laboratory,F(xiàn)IL)的學(xué)術(shù)負(fù)責(zé)人。抽完煙后,弗里斯頓走進(jìn)廣場西側(cè)一棟磚砌石灰石建筑,徑直走到四樓會(huì)議室。

他跟等在那里的人們打了個(gè)招呼——這也許是他當(dāng)天說的第一句話,因?yàn)樵谥形缰?,弗里斯頓不喜歡和任何人講話。他也很少和別人單獨(dú)會(huì)面。相反,他喜歡舉辦這種公開會(huì)議,學(xué)生、博士后和其他希望得到他指導(dǎo)的公眾(近幾年這個(gè)比例出奇的高)坐在一起,聽他講專業(yè)知識(shí)。曾跟隨弗里斯頓學(xué)習(xí)一年、現(xiàn)任麥吉爾大學(xué)(McGill University)精神病學(xué)住院醫(yī)師戴維·本里莫(David Benrimoh)說:“卡爾認(rèn)為,如果誰有了某個(gè)想法、遇到了問題或者在做項(xiàng)目,最好的解決辦法就是整個(gè)團(tuán)隊(duì)都聽聽 TA 的匯報(bào),讓每個(gè)人都有提問、討論的機(jī)會(huì)。這樣一來,一個(gè)人的學(xué)習(xí)就變成了大家的共同學(xué)習(xí)。這種方式挺獨(dú)特的,符合他的一貫風(fēng)格。”

每周一開會(huì)的時(shí)候,大家先輪流描述自己的問題,弗里斯頓邊聽邊踱步,他把眼鏡架在鼻尖上,所以每每要看發(fā)言者的時(shí)候總會(huì)低下頭去打量他們。接下來的幾個(gè)小時(shí)他會(huì)依次回答這些問題。即使是最混亂不清的問題,他也會(huì)帶著禮貌迅速給出回答。這種問答環(huán)節(jié)——我稱其為“向卡爾提問”組會(huì)——是集耐力、記憶、知識(shí)廣度和創(chuàng)造性思維于一體的卓越成就。

01
? ? ? ?

在學(xué)術(shù)生涯前半期,弗里斯頓設(shè)計(jì)了許多重要工具,極大推動(dòng)了對(duì)人類大腦的研究,他因此一躍成為學(xué)術(shù)界的“英雄”。1990 年,他發(fā)明了統(tǒng)計(jì)參數(shù)映射(statistical parametric mapping),用一位神經(jīng)科學(xué)家的話說,這種計(jì)算工具能夠?qū)⒋竽X影像“壓縮”成一致的形狀,研究人員可以借此對(duì)顱內(nèi)活動(dòng)進(jìn)行逐一比對(duì)。在統(tǒng)計(jì)參數(shù)映射的基礎(chǔ)上,發(fā)展出了基于體素的形態(tài)學(xué)分析(voxel--based morphometry)。在一項(xiàng)著名研究中,應(yīng)用上述成像技術(shù),研究者發(fā)現(xiàn)倫敦出租車司機(jī)大腦海馬體的后側(cè)會(huì)隨著“道路知識(shí)”的積累而變大。

2011 年?Science?上發(fā)表的一項(xiàng)研究,使用了弗里斯頓發(fā)明的第三代腦成像分析軟件——動(dòng)態(tài)因果模型(dynamic causal modeling)來判斷嚴(yán)重腦損傷的患者是具有輕微意識(shí),還是已經(jīng)成了植物人。

弗里斯頓 2006 年入選英國皇家學(xué)會(huì)(the Royal Society of Fellows),學(xué)會(huì)評(píng)價(jià)其對(duì)腦科學(xué)具有 “革命性”的影響,并表示超過 90% 已發(fā)表的腦成像領(lǐng)域論文使用了他的方法。2016 年,弗里斯頓成為了世界上被引用次數(shù)最高的神經(jīng)科學(xué)家,他的 h-index(衡量科學(xué)家論文影響力的參數(shù))幾乎是阿爾伯特·愛因斯坦的兩倍。2017 年,在過去二十多年中成功預(yù)測了 46 位諾獎(jiǎng)得主的科睿唯安(Clarivate Analytics),將弗里斯頓列為可能獲得諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng)的三人之一。

然而值得一提的是,如今拜訪弗里斯頓的“朝圣者”,很少再談?wù)撃X成像問題。這些訪客迫切想弄明白的事情,大多都和腦成像無關(guān)。

過去的十來年中,弗里斯頓花了大量的時(shí)間精力來研究自己稱為“自由能量原理”(free energy principle)的想法(他把自己的神經(jīng)成像研究叫做“工作”,就好比一個(gè)爵士音樂家說自己在圖書館值班,只是糊口的一種途徑)。有了這一理論,弗里斯頓堅(jiān)信自己確定了所有生命,甚至所有智慧體的組織原理。他解釋說:“有哪些行為是一個(gè)活生生的人一定會(huì)表現(xiàn)出來的呢?”

但壞消息迎頭而來:自由能量原理實(shí)在是太令人費(fèi)解了。幾乎所有談到這個(gè)理論的人,包括在其基礎(chǔ)上開展工作的科研人員,都說自己還沒完全搞懂。

但這些人又會(huì)急匆匆地補(bǔ)充,自由能量原理的核心其實(shí)十分簡單,它解決了一個(gè)再基礎(chǔ)不過的難題。熱力學(xué)第二定律告訴我們,宇宙會(huì)朝熵增的方向發(fā)展,走向消亡,但生物體卻不會(huì)。弗里斯頓認(rèn)為,從單細(xì)胞生物到擁有數(shù)十億神經(jīng)元的人類大腦,所有具備組織形式的生命都由同樣的命令驅(qū)動(dòng),這種普遍存在的命令可以簡化為數(shù)學(xué)函數(shù)。弗里斯頓認(rèn)為,生命只要存在,就會(huì)不斷減少個(gè)體期望與感官感受之間的差距。或者用他本人的話來說,就是讓自由能量最小化。

想要了解上述原理的潛在意義,你只需看看周一上午會(huì)有哪些人堵在 FIL 門口就行了。有些人希望用自由能量原理統(tǒng)一心智理論,建立一個(gè)新的生物學(xué)基礎(chǔ),解釋已知的生命現(xiàn)象;有些人希望借助自由能量原理,從大腦功能性研究的角度來夯實(shí)精神病學(xué)研究的基礎(chǔ);還有一些人希望通過此原理突破人工智能研究的重重阻礙。他們不約而同地出現(xiàn)在這里,是因?yàn)樗麄兿嘈拍苌羁填I(lǐng)會(huì)卡爾·弗里斯頓自由能量原理的人,也許只有他本人。

02
? ? ? ?

弗里斯頓不僅在他自己的領(lǐng)域內(nèi)極具影響力,在全學(xué)科范圍內(nèi)也是一位多產(chǎn)的學(xué)者。如今 59 歲的他,仍不分晝夜地工作,2000 年至今發(fā)表了 1000 余篇學(xué)術(shù)論文。僅 2017 年一年,他作為通訊作者或共同作者出版的成果就多達(dá) 85 篇,平均每四天就有一篇論文被發(fā)表。

弗里斯頓小心翼翼地維護(hù)著自己的內(nèi)心世界,避免外界因素前來打擾,其中之一就是“擔(dān)憂他人”。與私下聊天相比,他更喜歡上臺(tái)演講,和他人保持舒適的距離。他從不用手機(jī)、喜歡穿深藍(lán)色的西裝,店鋪清倉時(shí)會(huì)一次買兩套;他覺得自己每次去皇后廣場的路上常常遇到“讓人頭大”的打攪,所以經(jīng)??桃膺h(yuǎn)離人群,即使在國際會(huì)議上也是如此——他不喜歡大力鼓吹自己的想法。

與此同時(shí),弗里斯頓卻能敏銳、透徹地領(lǐng)悟到自己作為一名學(xué)者的驅(qū)動(dòng)力。他認(rèn)為認(rèn)真思索花費(fèi)數(shù)周才能破解的難題,能給自己帶來一種難以言說的舒緩和釋放,這和溜出去抽煙一樣讓人愉悅。他認(rèn)為自己從童年起,就對(duì)尋找方法來整合、統(tǒng)一并簡化這個(gè)充斥著“干擾噪音”的世界感到癡迷

弗里斯頓回憶,自由能量原理的誕生要追溯到八歲一個(gè)炎熱的夏天。有一天他在花園玩,翻過一根舊木頭時(shí),他發(fā)現(xiàn)了幾只木虱,他認(rèn)為這種小蟲子在極力尋找新的黑暗處避難。但盯著它們看了半個(gè)小時(shí)后,他發(fā)現(xiàn)這些小蟲子并沒有像他想的那樣在尋找暗處。

他意識(shí)到木虱的運(yùn)動(dòng)其實(shí)毫無目的,至少不像人類坐上車之后有個(gè)明確的目的地。這些木虱只是隨意爬,太陽越大,爬得越快。

弗里斯頓把這次經(jīng)歷稱為他的“第一次科學(xué)思考”,他說,那一刻“所有關(guān)于生存及其目的的人格化解釋,瞬間從腦海中剝離。你必須全盤接受自己的觀察結(jié)果,沒有其它的解釋?!?/p>

弗里斯頓的父親是一名土木工程師,需要在英格蘭全境內(nèi)的橋梁上工作,因此一家人會(huì)隨著他各地搬家。到十歲的時(shí)候,弗里斯頓已經(jīng)換了六所學(xué)校。老師們無法因材施教,所以他常常獨(dú)自破解各種問題。10 歲時(shí)他發(fā)明了一種能自動(dòng)修正的機(jī)器人,可以通過自我校正系統(tǒng)攜帶一杯水通過不平坦的地面而不撒出來。但是學(xué)校卻找了個(gè)心理學(xué)家詢問他是如何設(shè)計(jì)出來的。一貫給予他鼓勵(lì)的母親安慰道:“你非常聰明,卡爾,不要理會(huì)別人對(duì)你的評(píng)頭論足?!钡?dāng)時(shí)不相信。

到了十幾歲,弗里斯頓又經(jīng)歷了一次“木虱時(shí)刻”。他看完電視回到臥室的時(shí)候,恰巧注意到窗外盛開的櫻花樹,一個(gè)令他一生難忘的想法在腦海中閃出:“肯定有一種從零開始理解萬物的方法。如果我從一個(gè)點(diǎn)開始考慮,可以推導(dǎo)出整個(gè)宇宙嗎?”他躺在床上想了很久,但第一次嘗試“很明顯以失敗告終”。

03
? ? ??

中學(xué)快畢業(yè)時(shí),弗里斯頓和同學(xué)參與了一項(xiàng)計(jì)算機(jī)職業(yè)咨詢實(shí)驗(yàn)。他們要回答一系列問題,機(jī)器會(huì)就此預(yù)測出最適合他們的職業(yè)。弗里斯頓描述了自己對(duì)電子設(shè)計(jì)和在自然中獨(dú)處的喜愛,機(jī)器卻建議他當(dāng)電視天線安裝工。這顯然不對(duì)勁,所以他還是去了學(xué)校的職業(yè)咨詢處,說他想在數(shù)學(xué)和物理學(xué)的背景下研究大腦。顧問老師建議他當(dāng)一名醫(yī)生,這就意味著,弗里斯頓必須學(xué)習(xí)醫(yī)學(xué)。

他先在劍橋大學(xué)學(xué)習(xí)物理學(xué)和心理學(xué),隨后接受了醫(yī)學(xué)教育。完成學(xué)業(yè)后,弗里斯頓搬到牛津,在成立于維多利亞時(shí)代的利特摩爾醫(yī)院(Littlemore Hospital)作了兩年實(shí)習(xí)醫(yī)生。分配給弗里斯頓的任務(wù)是照顧 32 名慢性精神分裂癥患者。正是這些患者讓他開始思考:大腦中的連接為何能被輕易破壞?弗里斯頓帶著一絲眷戀回憶到,“那兒真是個(gè)理想的研究地點(diǎn),有著濃厚的精神病理學(xué)氛圍?!?/p>

他每周組織兩次 90 分鐘的治療會(huì),會(huì)上患者們會(huì)一起探討他們的“小問題”,這和今天的“向卡爾提問”組會(huì)十分類似。30 多年過去了,這些形形色色的患者仍能激發(fā)卡爾的深思。比如患者 Hillary,看上去神似《唐頓莊園》中那個(gè)淳樸的廚娘,但現(xiàn)實(shí)中,她在被送來醫(yī)院之前,用菜刀砍死了自己的鄰居,因?yàn)樗按_信鄰居是一只邪惡的人形烏鴉”。

20 世紀(jì) 90 年代早期,弗里斯頓在離開利特摩爾醫(yī)院之后,曾嘗試用當(dāng)時(shí)比較新穎的正電子放射斷層掃描成像技術(shù)(PET)來研究精神分裂癥患者大腦內(nèi)部的病變。在此期間他發(fā)明了統(tǒng)計(jì)參數(shù)映射。發(fā)明之時(shí)他就堅(jiān)持,該技術(shù)是自由共享的,不搞專利化和商業(yè)化,因此今天這項(xiàng)技才能被廣泛使用。當(dāng)時(shí),弗里斯頓還會(huì)飛往世界各地,比如美國馬里蘭州(Maryland)貝塞斯達(dá)(Bethesda)國立衛(wèi)生研究院(the National Institutes of Health),把軟件交給科研人員。弗里斯頓描述:“我常常會(huì)帶著一堆生物特征測量數(shù)據(jù)磁帶坐上飛機(jī),到了目的地再把內(nèi)容下載下來,接著花上一天調(diào)試軟件,教會(huì)別人如何操作,最后再飛回家休息。當(dāng)時(shí)開源軟件就是這么傳播的。”

1994 年,弗里斯頓搬到皇后廣場,F(xiàn)IL 給他安排的辦公室讓弗里斯頓和蓋茨比計(jì)算神經(jīng)科學(xué)組(Gatsby Computational Neuroscience Unit)做了很多年的鄰居。當(dāng)時(shí)蓋茨比科學(xué)組由它的創(chuàng)始人、認(rèn)知心理學(xué)家、計(jì)算機(jī)科學(xué)家杰弗里·辛頓(Geoffrey Hinton)負(fù)責(zé),他們正在研究生命體系和機(jī)器系統(tǒng)中的認(rèn)知學(xué)習(xí)理論。這時(shí) FIL 在神經(jīng)影像學(xué)領(lǐng)域正處于領(lǐng)先地位。蓋茨比科學(xué)組為有志于將數(shù)學(xué)模型應(yīng)用在神經(jīng)系統(tǒng)中的學(xué)者們提供了訓(xùn)練的平臺(tái)。

辛頓對(duì)那些艱深的統(tǒng)計(jì)模型有種“孩童般的熱情”。和很多人一樣,弗里斯頓很快就被辛頓所吸引,二人成了朋友。

在辛頓的影響下,弗里斯頓逐漸相信,研究大腦的最好方法,就是將它想象成一臺(tái)貝葉斯概率機(jī)(Bayesian probability machine)。19世紀(jì)赫曼·馮·亥姆霍茲(Hermann von Helmholtz)在其工作中就曾提出過這一觀點(diǎn),認(rèn)為大腦以概率的方式計(jì)算和感知世界,根據(jù)接收到的信息調(diào)整想法、進(jìn)行預(yù)判。在最流行的現(xiàn)代貝葉斯模型中,大腦像個(gè)“推理引擎”,目的是最大限度減少“預(yù)測誤差”。

2001 年辛頓離開倫敦,前往多倫多大學(xué)。在那里他逐漸成為人工智能領(lǐng)域舉足輕重的科學(xué)家之一,為現(xiàn)今深度學(xué)習(xí)算法(deep learning)的研究奠定了堅(jiān)實(shí)的基礎(chǔ)。

辛頓離開之前,弗里斯頓最后一次拜訪了這位蓋茨比科學(xué)組的朋友。辛頓向他描述了自己設(shè)計(jì)的一種新技術(shù),通過整合多個(gè)概率模型的輸入,使計(jì)算機(jī)程序能更有效地模擬人類進(jìn)行決策, 該技術(shù)目前在機(jī)器學(xué)習(xí)中被稱為“專家乘積系統(tǒng)(product of experts)”。

這次見面讓弗里斯頓深受啟發(fā),出于“智力互惠”的考慮,弗里斯頓將他的筆記拿給了辛頓。在這些筆記中他曾嘗試將某些看似“不相關(guān)的大腦解剖學(xué)、生理學(xué)和心理物理結(jié)果”聯(lián)系起來。2005 年,弗里斯頓將筆記整理成論文發(fā)表出來,這是他第一篇研究自由能量原理的論文,之后他又發(fā)表了數(shù)十篇。

04
? ? ??

即使是弗里斯頓本人,也很糾結(jié)自由能量原理該從何講起。他經(jīng)常讓大家自行搜索維基百科。但對(duì)我來說,從弗里斯頓辦公室的一張?zhí)鹤又v起可能會(huì)容易一點(diǎn)。

弗里斯頓辦公室一角。圖片來源:Wired;攝影:Kate Peters

這張印有俄羅斯數(shù)學(xué)家安德烈·安德烈耶維奇·馬爾科夫(Andrei Andreyevich Markov)的羊毛掛毯,是弗里斯頓的兒子送給他的惡作劇禮物,隱藏著一個(gè)有關(guān)自由能量原理核心理論的笑話。馬爾科夫毯(Markov blanket)就是用這位數(shù)學(xué)家的名字來命名的。在機(jī)器學(xué)習(xí)中,馬爾科夫毯能起到分離的作用,將分層系統(tǒng)中的某組變量與其他變量區(qū)分開來。心理學(xué)家克里斯多?!し鹄梗–hristopher Frith,h-index 跟弗里斯頓一樣高)曾將馬爾科夫毯形容為“認(rèn)知版本的‘細(xì)胞膜’,保護(hù)毯內(nèi)狀態(tài)不受外部影響?!?/p>

在弗里斯頓看來,宇宙是一個(gè)馬爾科夫毯的嵌套結(jié)構(gòu)。我們都有各自的馬爾科夫毯,把我們和外界的影響分隔開。每個(gè)人身體內(nèi)部也存在各式各樣的馬爾科夫毯,有分隔器官的、分隔細(xì)胞的,還有分隔細(xì)胞器的。在馬爾科夫毯的保護(hù)下,生物體內(nèi)的物質(zhì)經(jīng)歷一段時(shí)間后,仍能保持其特性。沒有了馬爾科夫毯, 我們只能化作一團(tuán)熱氣消失在蒼穹下。

自由能量理論的概念本身來自物理學(xué),這意味著如果不引入數(shù)學(xué)公式,就很難把它解釋清楚。從某種意義上說,自由能量之所以強(qiáng)大,是因?yàn)樗粌H僅是一個(gè)文字化的概念,更是一個(gè)可測量的量,從而能夠被模型化,其過程與弗里斯頓引起世界轟動(dòng)的腦成像建模十分相似。但如果將這個(gè)數(shù)學(xué)上的概念翻譯成文字,得到的結(jié)果大概是這樣的:自由能量是期望狀態(tài)與測量狀態(tài)之差。換句話說,當(dāng)你把自由能量最小化,也就意味著意外最小化。

弗里斯頓認(rèn)為,無論是原生動(dòng)物還是職業(yè)籃球隊(duì),任何能夠抵抗無序和分解趨勢的生物系統(tǒng),都遵循自由能量原理。

單細(xì)胞生物和大腦一樣,都存在減小意外的特定機(jī)制。兩者唯一的區(qū)別在于,隨著自組織生物系統(tǒng)的發(fā)展,人擁有了非常復(fù)雜的腦結(jié)構(gòu),吸收了數(shù)十億感受器傳來的信息,并將這些信息有效地組織成精確的世界模型。弗里斯頓說:“從某種意義上講,大腦十分奇特,它所形成的假設(shè),能夠解釋從感受器傳來的無窮無盡的世界模式?!?strong>在對(duì)接下來幾波感受進(jìn)行預(yù)測的過程中,大腦不斷地根據(jù)感受器得到的信息做出推斷,并努力將錯(cuò)誤預(yù)測信號(hào)最小化。

你可能已經(jīng)注意到,目前為止這聽起來很像辛頓上世紀(jì) 90 年代講給弗里斯頓的貝葉斯理論——大腦是一個(gè)“推理引擎”。事實(shí)上,弗里斯頓認(rèn)為貝葉斯模型是自由能量原理的基礎(chǔ),“自由能量”大體等同于“預(yù)測誤差”。弗里斯頓認(rèn)為貝葉斯模型的局限性在于,它只解釋了信念與感知之間的相互作用,但是它不能解釋信念與身體或動(dòng)作之間的關(guān)系。比如它并不能讓你離開椅子。

這對(duì)于弗里斯頓來說還不夠,他使用“主動(dòng)推理”一詞來描述有機(jī)體在世界中活動(dòng)時(shí)最大限度地減少意外的方式。弗里斯頓認(rèn)為,當(dāng)大腦做出的預(yù)判不能很快被感受器證實(shí)時(shí),大腦可以通過以下兩種方式之一來使自由能量最小化:修改預(yù)判——接受意外,允許錯(cuò)誤,更新世界模型;或者主動(dòng)讓預(yù)判成真。比如我的大腦預(yù)判我將會(huì)用左手食指觸摸自己的鼻子,但是本體感受器反饋的信息是左臂還垂在身體一側(cè),那我就可以抬起手臂,把手指壓在鼻子上,將大腦的錯(cuò)誤預(yù)判信號(hào)最小化。

這也就是這個(gè)理論為何能解釋我們所做的一切:感知、行動(dòng)、計(jì)劃、解決問題。坐車去辦事,就是用行動(dòng)將假設(shè)變?yōu)楝F(xiàn)實(shí),從而最小化自由能量。

那如果預(yù)判不能自我實(shí)現(xiàn)又會(huì)怎樣呢?一個(gè)系統(tǒng)被意外淹沒后會(huì)是什么樣呢?事實(shí)證明,自由能量原理不僅僅是統(tǒng)一行為,認(rèn)知和計(jì)劃的理論,也是一種精神疾病理論。假若大腦對(duì)感官涌入的證據(jù)不夠重視或者太過重視時(shí),就會(huì)出問題。例如,精神分裂癥患者可能無法更新他們的世界模型來解釋獲得的視覺信息。原本看到的應(yīng)該是友好的鄰居,病人看到的沒準(zhǔn)是一只巨型的邪惡烏鴉。弗里斯頓解釋:“你想想看,精神病,甚至大多數(shù)神經(jīng)系統(tǒng)疾病,只不過是破碎的信念或者錯(cuò)誤的推斷,也就是幻覺和妄想?!?/p>

過去幾年,弗里斯頓和其他一些科學(xué)家利用自由能量原理來解釋焦慮、抑郁和精神病,以及自閉癥、帕金森病等癥狀。多虧了弗里斯頓的神經(jīng)成像方法,科學(xué)家們已經(jīng)知道了不同的疾病中大腦哪些區(qū)域容易出現(xiàn)功能障礙,哪些信號(hào)會(huì)受到干擾。但僅此一點(diǎn)還不夠。弗里斯頓說:“我們還不了解大腦中具體哪些連接(神經(jīng)突觸)出了問題,得有個(gè)涉及內(nèi)心認(rèn)知的微積分才行?!?/p>

也就是說:自由能量原理為大腦的運(yùn)轉(zhuǎn)和失靈提供了一個(gè)統(tǒng)一的解釋,因此我們有理由相信,它可能引領(lǐng)我們走上一條從頭開始理解心智的道路。

05
? ? ??

過去幾年,以圖像、人臉以及語音識(shí)別為典型代表的機(jī)器學(xué)習(xí)算法在計(jì)算機(jī)領(lǐng)域取得了飛速發(fā)展。但它需要大量的前期數(shù)據(jù)及人的監(jiān)督,而且普適性很差。除了圖像或語言識(shí)別,機(jī)器學(xué)習(xí)還存在一種叫做強(qiáng)化學(xué)習(xí)(reinforcement learning)的算法,在贏得圍棋、國際象棋、打磚塊(Atari’s Breakout)等各種游戲的過程中表現(xiàn)出色。強(qiáng)化學(xué)習(xí)不需要人類對(duì)海量訓(xùn)練數(shù)據(jù)進(jìn)行標(biāo)注,只需要指導(dǎo)神經(jīng)網(wǎng)絡(luò)尋求某種獎(jiǎng)勵(lì)——通常是游戲的勝利。神經(jīng)網(wǎng)絡(luò)在一遍又一遍玩游戲的過程中學(xué)習(xí),不斷優(yōu)化動(dòng)作直至打通最后一關(guān),就好比狗狗為了得到獎(jiǎng)勵(lì)而學(xué)習(xí)執(zhí)行特定任務(wù)。

問題在于,強(qiáng)化學(xué)習(xí)也有很大的局限性。現(xiàn)實(shí)情況中大多數(shù)目標(biāo)都不是單一的、狹義的;而且大多數(shù)情形都不像游戲那樣,由穩(wěn)定的規(guī)則約束。人工智能背后宏偉的目標(biāo)在于,讓機(jī)器以人類的方式思考,但是目前強(qiáng)化學(xué)習(xí)做不到。

對(duì)于弗里斯頓和他的支持者來說,以上失敗有因可循。畢竟自由能量原理認(rèn)為,人類思考的根本動(dòng)力不是尋求某種任意的外在獎(jiǎng)勵(lì),而是最小化預(yù)測誤差。顯然,人工智能也該如此模仿。好消息是,自由能量原理背后那些很難翻譯成文字的貝葉斯公式,已經(jīng)用機(jī)器學(xué)習(xí)語言編寫出來了。

2017 年末,倫敦國王學(xué)院(King’s College London)神經(jīng)系統(tǒng)科學(xué)家、工程師羅莎琳·莫蘭(Rosalyn Moran)領(lǐng)導(dǎo)的一個(gè)團(tuán)隊(duì),讓兩名 AI 玩家在 3D 射擊游戲《毀滅戰(zhàn)士》(Doom)中對(duì)決,以比較自由能量(主動(dòng)推理)驅(qū)動(dòng)與獎(jiǎng)勵(lì)最大化驅(qū)動(dòng)的差別。

由獎(jiǎng)勵(lì)最大化驅(qū)動(dòng)的 AI,目標(biāo)是在游戲中殺死一只怪獸;主動(dòng)推理驅(qū)動(dòng) AI 的目標(biāo)是意外最小化。后者開始時(shí)進(jìn)程緩慢,但后來它表現(xiàn)得像是掌握了游戲的模式一樣,比如它好像意識(shí)到,自己向左移,怪物就會(huì)向右移。

一段時(shí)間后人們發(fā)現(xiàn),即使在游戲環(huán)境中,獎(jiǎng)勵(lì)最大化 AI 表現(xiàn)明顯“沒那么穩(wěn)定”;主動(dòng)推理 AI 則會(huì)更好地適應(yīng)環(huán)境。莫蘭描述:“因?yàn)橛辛颂剿?,它比?qiáng)化學(xué)習(xí) AI 的表現(xiàn)要好?!痹诹硪粓瞿M中,主動(dòng)推理 AI 與真人玩家對(duì)決時(shí)它的表現(xiàn)與上面的情況相似:一開始也沒急于求成,先積極探索環(huán)境,而后快速達(dá)到了真人玩家的水平。

莫蘭告訴我,主流的深度學(xué)習(xí)理論正在逐漸接受自由能量原理。弗里斯頓有學(xué)生去了 DeepMind 和 Google Brain 工作,還有一名還創(chuàng)建了華為的人工智能理論實(shí)驗(yàn)室(Huawei’s Artificial Intelligence Theory lab)。但它還沒像強(qiáng)化學(xué)習(xí)方法那樣普遍,現(xiàn)在計(jì)算機(jī)專業(yè)的本科生都在鉆研強(qiáng)化學(xué)習(xí),“但他們還沒接觸過自由能量原理?!?/p>

我第一次問弗里斯頓自由能量原理和人工智能有什么聯(lián)系的時(shí)候,他預(yù)測在 5~10 年內(nèi),大多數(shù)機(jī)器學(xué)習(xí)算法將會(huì)把自由能量原理整合進(jìn)去。問到第二次,他告訴我:“想想它為什么叫主動(dòng)推理(active inference),”邊笑邊等著我回味他的文字游戲,露出潔白的牙齒?!耙?yàn)楹喎Q是AI呀。所以主動(dòng)推理是新的 AI 嗎?當(dāng)然啦,簡稱一樣啊?!?/p>

06
? ? ??

2010 年,哥倫比亞大學(xué)(Columbia University)的精神病學(xué)家彼得·弗利德(Peter Freed)找來 15 名研究大腦的同行,一起討論弗里斯頓的一篇論文。弗利德后來在文章里回憶:“我們中懂?dāng)?shù)學(xué)的人還挺多:三名統(tǒng)計(jì)學(xué)家,兩名物理學(xué)家,一名物理化學(xué)家,一名核物理學(xué)家,還有一大群神經(jīng)影像學(xué)家,但還是沒能理解那篇論文。后來我又找了一位普林斯頓大學(xué)的物理學(xué)家、一位斯坦福大學(xué)的神經(jīng)生理學(xué)家一位,以及一位冷泉港的神經(jīng)生物學(xué)家,還是沒有結(jié)果。每次都一樣:論文里有太多公式、假設(shè)、運(yùn)動(dòng)部件了,理論也很全局化,我們連問題都不知道從何問起,所以大家都放棄了?!?/p>

很多人被弗里斯頓晦澀難懂的理論弄得很惱火,但同時(shí)也有許多人認(rèn)為他的理論如同達(dá)爾文的自然選擇學(xué)說一般,開啟了新世界的大門,每一部分都蘊(yùn)含了深?yuàn)W的道理。加拿大哲學(xué)家麥克斯韋·拉姆斯特德(Maxwell Ramstead)在 2014 年首次閱讀弗里斯頓的論文之前,就已經(jīng)在尋找方法,將不同層次的復(fù)雜生命系統(tǒng)關(guān)聯(lián)起來——從細(xì)胞到大腦,從個(gè)體到社會(huì)。2016 年他見到了弗里斯頓,后者告訴他,適用于細(xì)胞分化的數(shù)學(xué)方法,也可以應(yīng)用于文化動(dòng)力學(xué)。拉姆斯特德說:“這是一次改變?nèi)松恼勗?,我都激?dòng)得要流鼻血了?!?/p>

拉姆斯特德表示,在弗里斯頓提出自己的理論之前,“我們都在這個(gè)多學(xué)科空間里尋覓,卻沒有連通各領(lǐng)域的通用貨幣。自由能量原理的出現(xiàn)帶來了這種貨幣。

2017 年,拉姆斯特德、弗里斯頓與墨爾本大學(xué)(the University of Melbourne)的保羅·巴德科克(Paul Badcock)合作發(fā)表了一篇論文,文中用馬爾科夫毯解釋了所有生命形式。單個(gè)細(xì)胞是為了生存而將自由能量最小化的馬爾科夫毯系統(tǒng),部落、宗教和物種也是如此。

這樣看來,自由能量原理似乎已經(jīng)發(fā)展到了能夠包含萬物的程度(弗里斯頓告訴我,癌癥和腫瘤可能就是細(xì)胞接收到錯(cuò)誤的訊息時(shí)產(chǎn)生的錯(cuò)誤推理)。但人們還有疑問:有什么是這個(gè)涵蓋萬物的理論解釋不了的呢?

我與弗里斯頓聊起這個(gè)話題的時(shí)候,他本人的語氣則更為謹(jǐn)慎,他只表示主動(dòng)推理及其推論前景廣闊,還幾次承認(rèn)自己的理論可能“毫無價(jià)值”。在 FIL 小組會(huì)議上,他告訴大家,這個(gè)理論不是要求生物為了生存而最小化自由能量,而僅僅是對(duì)生物自我組織的一種解釋。

弗里斯頓認(rèn)為,自己有兩個(gè)主要工作目標(biāo)。當(dāng)然在自由能量原理的基礎(chǔ)上,能發(fā)展出真正的人工智能再好不過,但這并不是他的首要目標(biāo)。相反,他最大的愿望是推進(jìn)精神分裂癥研究,幫助修復(fù)千千萬萬精神疾病患者的大腦。他的第二個(gè)目標(biāo)則“自私得多”——這需要回溯到他十幾歲在臥室看櫻花的那個(gè)晚上,“我能找到一種最簡單的、解釋萬物的理論嗎?”

他說:“這個(gè)目標(biāo)有點(diǎn)任性。不是出于對(duì)臨床患者的同情,而是一種私欲,只想盡可能對(duì)萬物有個(gè)全面、嚴(yán)格、簡單的理解罷了。我經(jīng)常想起人們和我開玩笑說很難和我交流,這些玩笑有時(shí)出于惡意,有時(shí)出于打趣。但不管怎樣我都會(huì)想,我的理論又不是寫給你的,這是寫給我自己的。

本文來自微信公眾號(hào)“科研圈”

寶寶起名

本站所有相關(guān)知識(shí)僅供大家參考、學(xué)習(xí)之用,部分來源于互聯(lián)網(wǎng),其版權(quán)均歸原作者及網(wǎng)站所有,如無意侵犯您的權(quán)利,請與小編聯(lián)系,我們將會(huì)在第一時(shí)間核實(shí)并給予反饋。
相關(guān)期刊推薦
種子世界

種子世界

農(nóng)作物 - 省級(jí)期刊

經(jīng)營管理者

經(jīng)營管理者

合作期刊 - 省級(jí)期刊

科學(xué)導(dǎo)報(bào)

科學(xué)導(dǎo)報(bào)

合作期刊 - 國家級(jí)期刊

當(dāng)代旅游

當(dāng)代旅游

合作期刊 - 省級(jí)期刊

新東方英語

新東方英語

合作期刊 - 國家級(jí)期刊

中國儲(chǔ)運(yùn)

中國儲(chǔ)運(yùn)

企業(yè)經(jīng)濟(jì) - 國家級(jí)期刊

時(shí)代教育

時(shí)代教育

合作期刊 - 省級(jí)期刊

設(shè)備管理與維修

設(shè)備管理與維修

合作期刊 - 國家級(jí)期刊

節(jié)能

節(jié)能

動(dòng)力工程 - 省級(jí)期刊

建筑與預(yù)算

建筑與預(yù)算

合作期刊 - 省級(jí)期刊