AGI將高速地處理信息且高度智能,不斷自我改進(jìn)的系統(tǒng)將急劇提升機(jī)器智能程度。但是AGI的未來難以預(yù)測,沒人知道這一切是好是壞。
2010年奇點(diǎn)峰會(huì),DeepMind創(chuàng)始人DemisHassabis在會(huì)上發(fā)表了關(guān)于AGI的演講,演講題目是:建立AGI的系統(tǒng)神經(jīng)學(xué)方法。
AGI指通用人工智能,它是一種假設(shè)的計(jì)算機(jī)程序,可以和人類一樣執(zhí)行智能任務(wù),甚至有希望超越人類。AGI將能夠完成離散的任務(wù),比如識(shí)別照片或翻譯。此外,它將會(huì)加減運(yùn)算、下棋、說法語,還能理解物理論文、撰寫小說、設(shè)計(jì)投資策略、與陌生人談話。它將能夠監(jiān)測核反應(yīng)、管理電網(wǎng)和交通流量,它可以輕易地做任何事情。相比之下,目前最先進(jìn)的AI在AGI面前看起來就簡單得像個(gè)便攜式計(jì)算器。
上述任務(wù)目前只能由人類完成。但是人類智力受到腦容量所限,更受人類渺小脆弱的身體限制。既然AGI在計(jì)算機(jī)上運(yùn)行,它就不會(huì)受到這些機(jī)體條件限制,其智能水平只受處理器數(shù)量的影響。AGI可能會(huì)先從監(jiān)測核反應(yīng)開始。但很快,它在一秒內(nèi)消化的物理論文數(shù)量比一個(gè)人在千年內(nèi)消化的還要多,并可以據(jù)此發(fā)現(xiàn)新能源。人類智慧,再加上計(jì)算機(jī)的速度和可擴(kuò)展性,將解決目前看來無解的問題。Hassabis預(yù)計(jì)AGI將掌握各種學(xué)科,包括癌癥研究、氣候變化、能源、基因組學(xué)、宏觀經(jīng)濟(jì)、金融系統(tǒng)等等。
AGI將高速地處理信息且高度智能,不斷自我改進(jìn)的系統(tǒng)將急劇提升機(jī)器智能程度。但是AGI的未來難以預(yù)測,沒人知道這一切是好是壞。
Hassabis解釋說,到目前為止,科學(xué)家們一直從兩個(gè)途徑發(fā)展AGI。第一個(gè)途徑是符號(hào)AI。研究人員試圖描述編寫一套完整的規(guī)則,使之能像人類一樣思考。這種方法在上世紀(jì)八九十年代很流行,但沒有達(dá)到預(yù)期的結(jié)果。Hassabis認(rèn)為,人類大腦神經(jīng)結(jié)構(gòu)太過微妙,編程模仿是做不到的。第二個(gè)途徑是以數(shù)字形式復(fù)制大腦的生物網(wǎng)絡(luò)。這聽起來似乎可行,畢竟大腦是人類智力的中心。但操作起來并不現(xiàn)實(shí),因?yàn)檫@么做就好比繪制宇宙中每一顆恒星的地圖。最根本的問題在于,這種途徑是在錯(cuò)位研究大腦功能。打個(gè)比方,這就像試圖通過打開計(jì)算機(jī)并檢查晶體管的交互來理解MicrosoftExcel是如何工作的。
Hassabis提出了中間立場:AGI應(yīng)該從大腦處理信息的廣泛方法中汲取靈感,而不是在特定情況下應(yīng)用生物系統(tǒng)或特定規(guī)則。換句話說,它應(yīng)該專注于理解大腦的軟件運(yùn)作,而不是大腦的硬件構(gòu)成。功能性磁共振成像等新技術(shù)使人們能夠在大腦活動(dòng)的同時(shí)觀察大腦內(nèi)部,因此理解“大腦的軟件運(yùn)作”漸漸成為可能。最新研究表明,大腦通過在睡眠中重演經(jīng)驗(yàn)來學(xué)習(xí),從而得出一般原則。AI研究者應(yīng)該模仿這種系統(tǒng)。
當(dāng)年Hassabis參加奇點(diǎn)峰會(huì)最重要的目的是募資,DeepMind最終獲得200萬英鎊投資,其中著名風(fēng)險(xiǎn)投資人彼得·泰爾投資了140萬英鎊。谷歌在2014年1月以6億美元收購該公司時(shí),Thiel和其他早期投資者的投資回報(bào)率高達(dá)5000%。
對許多創(chuàng)始人來說,這已經(jīng)算是一個(gè)完美的結(jié)局。但對Hassabis來說,被谷歌收購只是他追求AGI過程的一個(gè)步驟而已。2013年,他花費(fèi)大量時(shí)間進(jìn)行協(xié)議條款談判,目的在于保持DeepMind的獨(dú)立性。它可以獲得被谷歌收購的好處,比如獲得現(xiàn)金流和計(jì)算能力,但是創(chuàng)始人仍然保有對公司的控制權(quán)。
Hassabis認(rèn)為DeepMind具備多種優(yōu)勢:擁有創(chuàng)企的動(dòng)力、頂尖大學(xué)的優(yōu)異人才、大公司的財(cái)力支持??芍^萬事俱備,因此AGI的時(shí)代會(huì)加速到來,從而為人類造福。
天才游戲少年
DemisHassabis1976年出生于倫敦,他4歲開始下國際象棋,13歲時(shí)成為了世界上同年齡段中位列第二的棋手。8歲在老式電腦上自學(xué)編程。1992年提前兩年完成高中課程。他在BullfrogProductions找到一份電子游戲編程的工作,編寫的虛擬游戲ThemePark大賣1500萬張拷貝。
十幾歲的時(shí)候,Hassabis同時(shí)參加國際象棋、拼字游戲、撲克和西洋雙陸棋的比賽。1995年,在劍橋大學(xué)學(xué)習(xí)計(jì)算機(jī)科學(xué)時(shí),又參加了學(xué)生圍棋錦標(biāo)賽且成績出色。下棋激發(fā)了Hassabis對人工智能的興趣。當(dāng)他下棋時(shí)也在思考,計(jì)算機(jī)是否也可以像人類一樣通過經(jīng)驗(yàn)積累不斷學(xué)習(xí)。游戲提供了脫離現(xiàn)實(shí)的完美學(xué)習(xí)環(huán)境。游戲世界純粹又包容,玩游戲不會(huì)受到干擾而且可以迅速掌握。
先搞定智能,其它問題就能迎刃而解
1997年5月,IBM超級(jí)計(jì)算機(jī)DeepBlue擊敗了國際象棋世界冠軍GarryKasparov。這是計(jì)算機(jī)首次擊敗一位大師級(jí)棋手。這場比賽受到廣泛關(guān)注,也引起了人們對計(jì)算機(jī)不斷增長的力量和潛在威脅的擔(dān)憂。當(dāng)時(shí)Hassabis產(chǎn)生了一個(gè)想法,他要把戰(zhàn)略游戲和AI結(jié)合起來,有一天,他會(huì)建立一個(gè)計(jì)算機(jī)程序,打敗最高段位的人類圍棋手。
Hassabis有條不紊地規(guī)劃職業(yè)生涯。1998年,他創(chuàng)辦了自己的游戲工作室Elixir,專注開發(fā)一款復(fù)雜的模擬政治游戲Republic:TheRevolution。還在學(xué)校時(shí),Hassabis就有這樣的想法:通過超級(jí)計(jì)算機(jī)來模擬復(fù)雜的世界動(dòng)態(tài),以解決最棘手的社會(huì)問題。當(dāng)時(shí),他試著在游戲中實(shí)踐自己的想法。不過現(xiàn)實(shí)很骨感,Elixir最終發(fā)布了精簡版的游戲但是反響平平。其它游戲也沒有成功。2005年4月,Hassabis關(guān)閉了Elixir。有人認(rèn)為Hassabis創(chuàng)立Elixir只是為了獲得管理經(jīng)驗(yàn)?,F(xiàn)在,在正式踏上AGI之路以前,他只缺少一個(gè)關(guān)鍵的知識(shí)領(lǐng)域——了解人類的大腦。
2005年,Hassabis在倫敦大學(xué)學(xué)院開始攻讀神經(jīng)科學(xué)博士學(xué)位。他發(fā)表的關(guān)于記憶和想象力的研究很有影響力。一篇被引用上千次的論文顯示,患有健忘癥的人也很難想象新的體驗(yàn),這表明記憶和創(chuàng)造大腦圖像之間存在聯(lián)系。Hassabis所作的研究都是朝著AGI邁進(jìn)。他大部分研究都回歸一個(gè)問題:人腦是如何獲得并保留概念和知識(shí)的?
2010年11月15日,Hassabis正式成立DeepMind。從那時(shí)起,公司的宗旨就一直沒有變過:先搞定智能,其它問題就能迎刃而解。也就是說,把大腦如何完成任務(wù)的理解轉(zhuǎn)化為計(jì)算機(jī)軟件,軟件可以使用相同的方法進(jìn)行自我學(xué)習(xí)。
Hassabis并沒有假裝科學(xué)已經(jīng)完全理解了人類的思想。AGI的藍(lán)圖不能簡單地從數(shù)百項(xiàng)神經(jīng)科學(xué)研究中得出。我們對大腦的功能仍然知之甚少。2018年,Hassabis自己的博士研究結(jié)果甚至受到了澳大利亞研究團(tuán)隊(duì)的質(zhì)疑。所以DeepMind的起步工作還是很艱難。
Suleyman和ShaneLegg加入了公司聯(lián)合創(chuàng)始人的行列。公司位于倫敦,許多新員工來自歐洲,有效避開了和谷歌、Facebook等硅谷巨頭爭奪人才。也許DeepMind成功秘訣之一就在于留住了最優(yōu)秀的員工。
公司花大力氣發(fā)展的一種機(jī)器學(xué)習(xí)技術(shù)——強(qiáng)化學(xué)習(xí),源于Hassabis所擅長了兩個(gè)領(lǐng)域:游戲和神經(jīng)科學(xué)。建立這樣一個(gè)程序是為了收集有關(guān)其環(huán)境的信息,然后通過重復(fù)經(jīng)驗(yàn)來從中學(xué)習(xí),就像Hassabis所說的“睡眠期間大腦活動(dòng)”一樣。
在此之前,強(qiáng)化學(xué)習(xí)在計(jì)算機(jī)領(lǐng)域還是一片空白。程序顯示了一個(gè)虛擬環(huán)境,除了游戲規(guī)則,它什么也不知道。程序包含至少一個(gè)稱為神經(jīng)網(wǎng)絡(luò)的組件。由計(jì)算結(jié)構(gòu)層組成,可篩選信息,目的是識(shí)別特定特征或策略。每一層都在不同的抽象層次上檢查環(huán)境。起初,這些網(wǎng)絡(luò)的成功率很低。當(dāng)他們嘗試不同的策略時(shí),變得越來越老練,當(dāng)成功時(shí),也會(huì)得到獎(jiǎng)勵(lì)。程序不會(huì)再次范同樣的錯(cuò)誤。AI神奇的地方就在于它重復(fù)任務(wù)的速度。
DeepMind的AI項(xiàng)目在2016年獲得重大勝利,當(dāng)年,AlphaGo在首爾舉行的五局三勝比賽中擊敗圍棋世界冠軍,震驚世人。2.8億人見證了AlphaGo的勝利,有專家曾預(yù)測人機(jī)對戰(zhàn)機(jī)器取勝還需要十年時(shí)間。次年,升級(jí)版AlphaGo擊敗了中國圍棋冠軍。
人類智慧將被人工智能超越嗎?
就像1997年的DeepBlue一樣,AlphaGo改變了人們對人類成就的看法。人類冠軍無疑擁有地球上最聰明的頭腦,可是他們已經(jīng)被AI超越。近20年后,Hassabis實(shí)現(xiàn)了自己當(dāng)年的野心,他說這場比賽讓他熱淚盈眶。
當(dāng)年DeepBlue殺伐決斷,通過快速計(jì)算贏得了勝利,但是AlphaGo的風(fēng)格看起來卻很有藝術(shù)氣質(zhì),幾乎是人類的風(fēng)格。它的優(yōu)雅、復(fù)雜以及卓越的計(jì)算能力,似乎表明,在治療疾病和管理城市等領(lǐng)域,DeepMind將比競爭對手走得更遠(yuǎn)。
DeepMind控制權(quán)之爭
Hassabis一直說,DeepMind將使世界變得更好。但AGI存在不確定性。如果它真的出現(xiàn),我們不知道它是善是惡,也不知道它是否會(huì)服從于人類控制。即便它聽從人類控制,那這個(gè)人類舵手又會(huì)是誰呢?
從一開始,Hassabis就試圖保護(hù)DeepMind的獨(dú)立性。他一直堅(jiān)持讓DeepMind留在倫敦。Hassabis不愿交出自己一手帶大的公司。因此DeepMind制定了一項(xiàng)協(xié)議,阻止谷歌單方面控制該公司的知識(shí)產(chǎn)權(quán)。據(jù)知情人士透露,在收購前一年,雙方簽署了《道德與安全審查協(xié)議》。該協(xié)議將DeepMind的核心AGI技術(shù)的控制權(quán)交給了一個(gè)名為EthicsBoard的委員會(huì)。EthicsBoard為DeepMind提供了堅(jiān)實(shí)的法律支持,以保持對其最有價(jià)值、也可能是最危險(xiǎn)的技術(shù)的控制。小組成員的名字尚未公布,但據(jù)消息人士透露,DeepMind的三位創(chuàng)始人都是EthicsBoard成員。
此外DeepMind在市場公關(guān)方面表現(xiàn)極好。AlphaGo就是典型的例子。自谷歌被收購以來,DeepMind多次創(chuàng)造了舉世矚目的奇跡。比如,一個(gè)軟件可以在眼睛掃描中發(fā)現(xiàn)黃斑病變。另一個(gè)程序使用與AlphaGo類似的架構(gòu)從無到有地學(xué)會(huì)了下棋,僅僅花費(fèi)九個(gè)小時(shí)。2018年12月,一個(gè)名為AlphaFold的程序被證明可以從復(fù)合物列表中預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),其準(zhǔn)確率高于同行競爭對手,這有助于治療帕金森病和阿爾茨海默癥等疾病。
谷歌數(shù)據(jù)中心預(yù)計(jì)包含250萬臺(tái)服務(wù)器,DeepMind開發(fā)了一套算法,以優(yōu)化谷歌數(shù)據(jù)中心冷卻方案,DeepMind深以為傲,因?yàn)楣雀枰虼私档土?0%的能源成本。谷歌母公司Alphabet為這類服務(wù)付給DeepMind豐厚的報(bào)酬。2017年,DeepMind向Alphabet收取了5400萬英鎊。但與DeepMind的日常管理費(fèi)用相比,這一數(shù)字顯得微不足道。那一年僅在DeepMind員工身上就花了2億英鎊??傮w而言,公司在2017年支出2.82億英鎊。
谷歌收購DeepMind五年后,控制權(quán)之爭不可避免??紤]到Hassabis對事業(yè)的執(zhí)著,他不太可能離開公司。他對金錢感興趣只是因?yàn)殄X能幫助他完成事業(yè)追求。到目前為止,谷歌對DeepMind的干預(yù)還不大。但最近發(fā)生的一件事卻引發(fā)了對公司未來獨(dú)立性的擔(dān)憂。
2016年2月,DeepMind成立了新醫(yī)療保健部門DeepMindHealth,由公司聯(lián)合創(chuàng)始人之一的MustafaSuleyman領(lǐng)導(dǎo)。公司希望創(chuàng)建Streams項(xiàng)目,當(dāng)病人的健康狀況惡化時(shí),可以向醫(yī)生發(fā)出警告。DeepMind將獲得基于績效的費(fèi)用。由于這項(xiàng)工作需要獲得有關(guān)病人的敏感信息,Suleyman建立了一個(gè)獨(dú)立的審查小組(IRP)。
2018年11月8日,谷歌宣布成立自己的醫(yī)療保健部門GoogleHealth。五天后,公司宣布將把DeepMindHealth并入母公司相關(guān)部門。Suleyman曾在2016年寫道:“在任何階段,患者數(shù)據(jù)都不會(huì)與谷歌賬戶、產(chǎn)品或服務(wù)相關(guān)聯(lián)?!钡某兄Z似乎已經(jīng)落空。不過DeepMind還是說:“在這個(gè)階段,我們的合同都沒有轉(zhuǎn)到谷歌,只有得到合作伙伴的同意,才會(huì)轉(zhuǎn)去谷歌?!焙喜⒓づ薉eepMindHealth的員工。據(jù)消息人士說,一旦合并完成,就會(huì)有更多員工計(jì)劃離職。據(jù)多名知情人士透露,有員工于2017年12月辭職,原因是擔(dān)心合并后該獨(dú)立審查小組更多的是為了裝門面,而不會(huì)對病人隱私數(shù)據(jù)使用情況進(jìn)行真正的監(jiān)督。
這一事件表明,DeepMind的非核心業(yè)務(wù)容易受到谷歌的左右。DeepMind在一份聲明中對此次合并給出了正面評(píng)價(jià)。但是我們不禁要問,谷歌是否會(huì)將同樣的邏輯應(yīng)用于DeepMind在AGI方面的工作。
強(qiáng)化學(xué)習(xí)
總體上來說DeepMind進(jìn)步明顯。它的軟件可以模擬甚至超越人類學(xué)習(xí)執(zhí)行任務(wù)。比如打磚塊游戲。沒有人類指導(dǎo),DeepMind的程序不僅學(xué)會(huì)了玩這個(gè)游戲,而且還學(xué)會(huì)了如何把球打進(jìn)磚塊后面的空間,利用球回彈來打更多的磚塊。Hassabis說,這證明了強(qiáng)化學(xué)習(xí)的力量和DeepMind計(jì)算程序的非凡能力。
這個(gè)游戲演示令人印象深刻,但有個(gè)問題。如果虛擬球拍移動(dòng)得更高一些,程序就會(huì)失敗。AI項(xiàng)目所掌握的技能非常有限,即使對環(huán)境的微小變化也無法做出反應(yīng),除非接受數(shù)千輪強(qiáng)化學(xué)習(xí)?,F(xiàn)實(shí)世界的變化太多了。對于智能診斷來說,沒有兩個(gè)身體器官是完全相同的。對于智能機(jī)械,沒有兩個(gè)引擎可以用相同的方式調(diào)整。因此,將虛擬空間中完善的程序投放到現(xiàn)實(shí)世界困難重重。
另外一個(gè)問題是,虛擬環(huán)境中的成功取決于獎(jiǎng)勵(lì)機(jī)制:一個(gè)允許軟件衡量其進(jìn)程的信號(hào)。程序了解到物體從墻上回彈會(huì)加分。AlphaGo很多編程工作都是在構(gòu)建與復(fù)雜游戲兼容的獎(jiǎng)勵(lì)函數(shù)。不幸的是,現(xiàn)實(shí)世界并不提供這種簡單的獎(jiǎng)勵(lì)。政治因素使問題更加復(fù)雜化。要協(xié)調(diào)氣候健康的獎(jiǎng)勵(lì)信號(hào)(單位體積二氧化碳粒子數(shù))與石油公司的獎(jiǎng)勵(lì)信號(hào)(股價(jià)),牽涉到許多動(dòng)機(jī)矛盾的各方。獎(jiǎng)勵(lì)信號(hào)往往非常微弱。而人腦在執(zhí)行任務(wù)的過程中不會(huì)去想有沒有獎(jiǎng)勵(lì)的問題。
DeepMind通過大量計(jì)算機(jī)電力找到了解決方法。公司最近專注于策略電腦游戲星際爭霸II,游戲早期所做的決定對后來會(huì)產(chǎn)生影響,這更接近于現(xiàn)實(shí)世界任務(wù)所特有的那種復(fù)雜而延遲的反饋。今年1月,DeepMind軟件擊敗了一些頂級(jí)人類玩家,給人留下了深刻印象。它的程序也已經(jīng)開始學(xué)習(xí)經(jīng)由人類反饋的獎(jiǎng)勵(lì)功能。不過,把人類指令置于計(jì)算循環(huán)中,比起純粹的計(jì)算機(jī)處理,其計(jì)算規(guī)模和速度都會(huì)受到影響。
公司研究人員匿名表示,他們也對DeepMind能否通過這些方法達(dá)到AGI表示懷疑,專注于在模擬環(huán)境中實(shí)現(xiàn)高性能,這使得獎(jiǎng)勵(lì)信號(hào)問題很難解決。然而,這種方法又是DeepMind的核心。
Hassabis的人生一直在和游戲打交道。就像公司的軟件一樣,Hassabis只能從以往的經(jīng)驗(yàn)中學(xué)習(xí)。在發(fā)明了一些有用的醫(yī)療技術(shù),并超越了世界上最偉大的棋類游戲玩家之后,對AGI的追求最終還是可能會(huì)失敗。公司取得的成績斐然,卻不是Hassabis最終想要的。他仍然可以開創(chuàng)AGI的時(shí)代,就在谷歌的眼皮底下,但卻超出了它的控制范圍。如果這樣做,Hassabis將贏得最艱難的比賽。
聲明:本文為轉(zhuǎn)載類文章,如涉及版權(quán)問題,請及時(shí)聯(lián)系我們刪除(QQ: 2737591964),不便之處,敬請諒解!