王曉
AlphaGo與人工智能威脅論
去年3月,AlphaGo以4:1戰(zhàn)勝李世乭,一度引發(fā)了世界范圍內對于“人機大戰(zhàn)”的狂熱關注;今年1月,一個名為“MASTER”的神秘棋手60盤連勝狂掃各路棋壇高手,后被證實是AlphaGo的升級版;5月,AlphaGo以3:0戰(zhàn)勝世界排名第一的天才棋手柯潔,“世界第一圍棋高手”正式易主成為一臺計算機。許多科學界與企業(yè)界的精英人士公開表示,這是AI發(fā)展的里程碑事件,紛紛寄期望于AI來解決目前企業(yè)甚至社會管理中的眾多疑難問題。與此同時,包括埃隆·馬斯克、斯蒂芬·霍金等人在內的許多科技界人士開始公開宣稱擔心AI崛起并威脅人類,與眾多人工智能專家聯(lián)名簽署了一封禁止開發(fā)人工智能武器的公開信。
實際上,自從二戰(zhàn)美國政府在參與研發(fā)原子彈的科學家們事先毫不知情的情況下,悍然在廣島和長崎投放了兩顆原子彈之后,科學家們對于技術的發(fā)展可能會威脅世界安全甚至人類生存的反思從未停止。當時,由于機器過去的性能表現(xiàn)已經能夠被用于調整機器的未來行為(維納在其劃時代的巨著《控制論》中將其稱為“反饋”),已經出現(xiàn)了人們口中所說的“會學習”的機器,自動化也開始從軍事領域向工商企業(yè)中滲透。自動炮火指揮儀與自動巡航導彈的出現(xiàn),甚至引發(fā)了科學家們對于“按鈕”戰(zhàn)爭[1]的思考:如果一臺會學習的機器學會了編寫讓“自己按下‘按鈕’”的程序,它們是否會不惜一切——甚至是己方全軍覆沒的代價,來按下“按鈕”以實現(xiàn)預定義的“勝利”目標?如果是這樣,勝利還有意義嗎?
“意義”也是區(qū)別人類與機器之不同的重要一點。在AlphaGo戰(zhàn)勝柯潔之后,圈內便開始流行這樣一句話:“柯潔輸了會流淚,但AlphaGo贏了卻不會笑?!睂τ跈C器來說,它們只是完成了預定義的一個目標,而實現(xiàn)這一目標的意義卻無從判斷。這也是馬斯克等人擔心AI技術會產生的威脅的原因之一,技術本身無所謂對錯,但使用技術的人卻有好壞之分。
人工智能與智能機器的前塵往事:遺失的控制論歷史
人工智能這一術語,往往被認為是在1956年達特茅斯學院的一次會議上提出來的,當時約翰·麥卡錫對人工智能的定義是:“制造智能機器的科學與工程?!保╰he science and engineering of making intelligent machines)由此就不得不提及另外一個概念“智能機器”。在維納于1948年出版了他劃時代的巨著《控制論》之后,關于機器是否能夠獲得生命以及機器能否獲得智能的問題,即引發(fā)了大量、熱烈的討論與思考。假設機器能夠獲得智能,那么接下來的問題便是:機器的智能是否有可能超越人類的智能?當時,戰(zhàn)爭的陰霾仍然籠罩在幸存下來的人們身上。這也引發(fā)了20世紀60年代科學家們關于智能機器是否會威脅人類生存的討論。
持否定態(tài)度的人們認為,機器不能擁有任何程度的創(chuàng)造力,除非有事先輸入,否則它無法產生任何輸出。當然,維納嚴厲地批評了擁有這類思想的人們,并指出:“機器能夠并肯定會超越它們的設計者的某些局限性,并且當機器實現(xiàn)時,它們可能既是高效的又是危險的?!盵2]使用奴隸和奴隸主來比喻機器和人的關系,維納說到,我們不可能既要求一個奴隸非常聰明,又要求他完全服從他的主人。因此,維納的觀點是認同機器智能會超越人類智能并有可能威脅人類安全的。
在提出上文觀點的同時,維納同時指出:“原則上,我們并不能制造出我們永遠都不了解其行為因素的機器?!盵3]60年后的今天,深度學習成為了當下最火的一種人工智能技術,它證明,即便我們不能夠解釋技術背后的機理,也能得出我們想要的結果。一方面,這一事實極大地鼓舞了許多希望借助該技術解決某些難點問題的人們;另一方面,無論是投資理財、醫(yī)療救護還是軍事行動,人類都不希望僅僅依靠一個“黑匣子”來做出決策。
實際上,維納的《控制論》包含三個核心的思想:控制、反饋與人機交互。控制是指系統(tǒng)能夠與環(huán)境交互進而塑造環(huán)境的能力;反饋描述了一種“使用機器過去的性能表現(xiàn)調整未來行為的一種屬性”;[4]人機交互,使得人與機器共同組成了一個整體,一個“伺服系統(tǒng)”。在當時大眾看來,控制和反饋,也許有些抽象、理論化和難以理解,但是第三個思想,“人機交互”,卻激發(fā)了豐富的想象:機器能否活過來?機器能否獲得智能?既然機器能夠擴展人的體能,那它是否也會擴展人類的智能?既然能用人的思想來理解機器(擬人化的機器),那能不能用機器的思想來理解人呢(機械化的人體)?這些所有的問題,衍生了包括人工智能、機器人、機械大腦、VR等等在內的整個控制論學科群。當學術界在對控制論的研究范疇、應用范疇等問題進行討論時,美國政府和企業(yè)界已經極大地推動了控制論在軍事和工業(yè)生產中的應用。前者催生了大陸級別的高空放射炮塔SAGE,后者引發(fā)了“自動化工廠不招人”的嚴峻就業(yè)問題。
第二次世界大戰(zhàn)帶來了一個明顯的啟示:擁有領先生產能力的國家將會首先獲得戰(zhàn)爭的勝利。但是這對于美蘇冷戰(zhàn)期間對太空和深海等極端環(huán)境的探索卻毫無用處。因此,新的思考出現(xiàn)了,“可否借助自動化改變人類的身體,使其更好的探索極端環(huán)境,拓展國家疆土?”[5]由此,控制論的新產物出現(xiàn)了——賽博格。隨后十多年間,美國空軍、海軍和陸軍相繼展開賽博格的相關研究,卻并沒有取得可實際應用的進展。如果不能改造人類身體,那么可否在地面建立虛擬極端環(huán)境,“訓練”身體以逐漸適應環(huán)境?在這一想法的引導下,美國軍方的第一款VR設備VCASS(全稱為Visually Coupled Airborne Systems Simulator,視覺耦合機載系統(tǒng)模擬器)面世了。硬件設備的發(fā)展開始推動人們探索機器內部的世界——賽博空間。隨著計算機技術的發(fā)展,許多人開始敏銳地意識到,盡管單個機器的內部空間擴展了個人的思想和意識,但人與人、人與機器、機器與機器之間的通信才是催生更大的智能的動力所在。在線社區(qū)、搜索引擎、互聯(lián)網、物聯(lián)網等概念相繼誕生。借助機器進行的人類通信也引發(fā)了對新問題的思考,如何保證個人隱私不被濫用,如何安全地進行在線交易,如何利用現(xiàn)實以及虛擬世界中的通信設備在戰(zhàn)爭之前就通過輿論戰(zhàn)來控制民意,從而不動一兵一卒就能取得戰(zhàn)爭的勝利,等等,進一步促進了當下科學界對于大數據、社會計算、國務管理的研究。因此可以說,維納的《控制論》是當今整個智能科技蓬勃發(fā)展的精神之源、力量之泉。
機器擴展人類
從廣義的角度來說,許多機器都是人類體能的擴展。汽車、飛機、輪船、潛艇甚至宇宙飛船,拓展了人類腿腳的可到達范圍;斧頭、螺絲刀、電鋸甚至筆,擴展了人類手的應用范圍;傳聲筒、軍隊號角以及電話,擴展了人類語言的傳播范圍;臺式機、筆記本以及各種智能設備,不僅開始擴展我們大腦計算的能力,這些設備所收集的無所不在的感知數據也成為了計算機處理的“原料”,進一步增強了機器的智能。一定程度上,我們所制造的工具,已經成為了我們身體器官的延展。
除了直接使用工具來擴展人類能力之外,60年代也出現(xiàn)了一些使用機械來直接擴展人類軀體的探討。這是因為,美蘇的軍備競賽促進了人類勢力在外太空的擴張,但同時,人類的身軀卻無法適應真空極端環(huán)境,因此有些軍事科學家提出了改造人的身體以適應極端環(huán)境的想法。雖然這一想法并未完全實現(xiàn),但10年之后,科學家們開始意識到,既然難以改造人類身體以適應極端環(huán)境,那么是否可以在地面建立模擬極端環(huán)境,讓人類逐步適應呢?而這一想法則進一步推動了虛擬現(xiàn)實(Virtual-Reality, VR)的發(fā)展。
機械化擴展人類物理軀體的想法,在20世紀70年代達到了一個高潮。隨著美國在越南戰(zhàn)場節(jié)節(jié)失利,一方面,美國陸軍開始新型機械“馱獸”的研發(fā),以幫助美軍在越南的森林、沼澤和稻田中應對新的意想不到的戰(zhàn)術問題;另一方面,在越戰(zhàn)中經受物理與精神傷害的士兵被送回國內后,亟須重新“鍛造”,從而有能力開始新的生活。
盡管大多數的科學研究專注于機械化進步對于人類體能的擴展,但科幻小說已經開始設想機器快速進化并戰(zhàn)勝人類的情景。庫爾特·馮內古特發(fā)表于1952年的《自動鋼琴》(Player Piano),描述了在機器人替代部分腦力勞動后,人類幡然醒悟進行起義,但最終失敗的故事。1955年,弗蘭克·萊利的《賽博和福爾摩斯大法官》(The Cyber and Justice Holmes)則探討了未來的法院系統(tǒng),智能高效的機器取代了人類法官。這甚至引起了獲得諾貝爾文學獎的伯特蘭·羅素的反思:人類的存在是否必要?(Are Human Beings Necessary?)在這樣的歷史背景下,自然而然地出現(xiàn)了一些新的反思:當機器接管之后,人類會滅亡嗎?英國星際航行協(xié)會前主席、曾被授予卡林加獎的亞瑟·克拉克對于這個問題進行了深入的探討,他指出,生物進化,已經讓位于一個更為快速的過程,技術進化。“直白而殘酷地說,機器將會接管一切”。[6]當然,關于機器與人類關系的討論,一直充斥在整個機器發(fā)展的歷程之中。
機器對于人類能力的擴展,當然不僅僅限于人類的體能,同時可適用于人類的智能。特別是隨著計算機存儲和計算能力的提升,這一機器對于人類智能的擴展愈加明顯。最早意識到這一問題的人是約瑟夫·卡爾·羅·利克萊德(J. C. R. Licklider),他曾經擔任過早期半自動地面防空系統(tǒng)(SAGE)的咨詢顧問。在這個大型系統(tǒng)中看到的機器與機器連接和交互所產生的自動且精準的控制后,他產生了通過計算機構建“思維中心網絡”的想法。20世紀50年代末,利克萊德就已經看到,對于SAGE以及當時的許多自動化系統(tǒng),很大程度上,都是人類在幫助機器,而不是真正的人機共生。他在1960年發(fā)表的一篇文章中指出了人機關系發(fā)展的新方向:“讓人感到希望的是,不久之后,人類的大腦就能和計算的機器緊密地耦合在一起了?!盵7]
20世紀60年代初,在寫給“星際計算機網絡的成員和分支機構”的一文中,利克萊德正式提出了構建一個由計算機連接而成的網絡的設想,也就是他所說的由一個個“思維中心”組成的網絡。但這一網絡,幾乎花了整整20年才成長為后來大家所熟知的“互聯(lián)網”。
人類增強機器
從某些方面看來,機器要比人類優(yōu)秀得多,因為機器人會比人類更快、更精確地完成任務,而且不會生病、不會罷工、不會酗酒,極大程度上它會成為定制化的優(yōu)秀員工。但從生物進化的觀點,我們是風雅的、有情懷、有直覺且具有創(chuàng)造力的;相比之下,機器是死板的、冷冰冰的、數學公式化的而且重復乏味?!拔覀儭保欢ǔ潭壬蟻碚f,是美學家;而機器,則是沒有生命且程序化的,不管它們在存儲和計算能力上高出人類多少倍。
最早的時候,機器被寫在卡片上的指令驅動進行工作,那時,雖然很多人擔心機器會造成“失業(yè)”的現(xiàn)象,但本質上人們對于什么是機器做的事情、什么是人類做的事情,都是很清楚的。近年來,隨著人工智能等技術的發(fā)展,關于兩者之間的功能分界線,變得越來越模糊不清了。許多關于機器能否獲得智能的討論,都提到了“圖靈測試”的概念。這一術語最早出現(xiàn)于英國數學家、邏輯學家、現(xiàn)代計算機之父阿蘭·圖靈一篇名為《可計算的機器及其智能》(Computational Machinery and Intelligence)的文章,文章開篇即提出了這樣一個問題:“機器能夠思考嗎?”由于難以對“思考”進行定義,圖靈提出了“模仿游戲”的概念,并聲稱它在某種程度上與智能等價。自此之后,通過“模仿游戲”[8]便成為了衡量機器是否是智能的一個標準。
了解圖靈測試的人們都知道,圖靈實際上是把機器理解人類語言(文本)的能力,即人-機文本通信,作為了衡量機器智能的標準。近年來,隨著機器逐漸有了聽覺、視覺以及觸覺,許多學者專家都開始爭論,聽懂人類的講話、識別物體的能力或者操縱物理世界中事物的能力,也應該作為評價機器是否智能的一部分,這又分別促進了語音識別、圖形圖像學以及微觸覺傳感技術的發(fā)展。不知有多少人還記得,2016年2月23日波士頓動力公司(Boston Dynamics)在YouTube上發(fā)布的一段視頻中,Atlas推開玻璃門揚長而去的背影,是多么的逆天。
近20年來,機器不斷向人發(fā)起挑戰(zhàn)的另外一個領域,是下棋。從最開始的跳棋,[9]到后來的象棋和最近的圍棋,賺足了世人的眼球。本質上,這三種棋類游戲,都是完全信息、確定性并且零和博弈的。這就導致,只要機器有足夠的存儲能力和計算能力,終究有一天,總會戰(zhàn)勝人類。相比較之下,人類的世界要復雜得多,尤其是商業(yè)和社會行為,充滿了多樣、復雜且不確定性,即便是擁有宇宙最強武器“銀河水滴”而且使用腦電波進行交流的三體文明來到地球,也無法在短時間內遏制或毀滅人類,更不要說目前水平的人工智能了。[10]
AlphaGo在與樊輝、李世乭、柯潔等人進行對戰(zhàn)之前,已經得到了數量眾多的計算機工程師、圍棋高手、軟件測試員經年累月的幫助、練習和“指導”,一定程度上可以說,不是一臺機器戰(zhàn)勝了一個世界頂級圍棋選手,而是一臺機器背后的許許多多的男人和女人一起,戰(zhàn)勝了一個擁有血肉之軀的凡人。在這種場景下,還是機器擴展了人類嗎?不是的,是人類增強了機器。
最近,這一趨勢隨著目前社交媒體與社會網絡的興起變得愈加明顯了。目前公認的人工智能發(fā)展的一大瓶頸,是常識問題。很多情況下,這是由人類語言本身所具有的歧義性所導致的。因此,理解人們說話時的上下文語境就成為了衡量機器智能的標準之一。理解上下文語境又包括兩個步驟:一是語音識別,二是語義理解。機器在第一步上已經做得非常好了,這一領域國內最具代表性的應用是“訊飛聽見”;然而,機器在第二步卻依然尚未取得明顯的進步。目前的許多個人的人工助理,Siri、Contana或者小冰,只能識別簡單的句子或“命令”。但是,隨著越來越多的人機交互接口提供語音輸入與輸出的功能,機器在與人類進行交互的同時,也在學習人類的語言。大規(guī)模人類語音輸入的出現(xiàn),開始為機器的語義理解提供大量新的、真實的甚至實時的訓練素材。
本質上,許多時候機器難以理解常識問題的關鍵在于,它并不能完全理解我們所生活的世界。就像陪伴了“80后”整個兒童年代的一首歌中唱的:
打雷要下雨,雷歐,(什么?)下雨要打傘,雷歐,(這我也知道?。┨炖浯┟抟\,雷歐,雷誒歐,天熱扇扇子。智慧就是,(說?。。┻@么簡單。
歌中描述的都是對于人類很常見的情景,也是人類在面臨這些狀況時自然而然就知道怎么做的情景。但是,如果機器并不怕下雨,也不怕冷,更不怕熱,那么它如何在面臨這種環(huán)境時表現(xiàn)出人類所謂的“智能”?
另一方面,無所不在的社會網絡與便攜式智能設備相遇后,也碰撞出了新的火花——人肉搜索、“眾包”以及多種通過超大規(guī)模人類在碎片化時間內的勞動,開始創(chuàng)造出巨大的社會和經濟效益。人類開始主動地將知識貢獻出來,幫助人工智能技術以及智慧機器,獲取常識、演化成長。反過來,成長并連通的機器,也在為人類提供更加智能的服務,如基于位置、喜好、個人經歷的個性化推薦服務等,開始組建成為大型的社會機器。正如Tim Berners-Lee與Mark Fischetti于1999年出版的一本書中所言:“借助計算機,我們能夠在網絡上創(chuàng)造出抽象的社會機器:由人類進行創(chuàng)造性工作而機器完成管理任務的過程??”[11]
社會機器的降臨
網絡時代最為著名的定律有兩個,一是描述硬件設備演化發(fā)展的摩爾定律;二是描述軟件網絡演化發(fā)展的梅特卡夫定律。前者揭示了互聯(lián)網時代信息技術進步的速度;后者闡明了互聯(lián)網時代社會與經濟價值發(fā)展的速度。梅特卡夫定律能夠明確告訴我們的一點就是,網絡上的個體數量越多,網絡的價值也就越大。顯然,“眾包”就是這樣一個例子,一個網絡中的每個人所做的是非常小的一部分工作,共同努力就能創(chuàng)造出巨大的內容輸出。這類情況最著名的一個例子是Wikipedia,目前已有超過200種語言版本,僅它的英文版網站就有超過500萬篇文章,總文章數超過3800萬篇,通過網站部署的350多種網絡Bots來進行異常發(fā)現(xiàn)、維護和管理。
除此之外,還有另外一種利用人類共同合作來獲益的方法。《科學》雜志信息科學領域唯一的編委James Hendler將其稱為“人類計算”。[12]借助人類的輸入,保障機器(及其內在的人工智能算法與技術)能夠獲得優(yōu)良的“輸入原料”,進而使得機器產生更好的“輸出”,從而幫助人類完成某些任務。值得一提的是,中國科學院自動化研究所的王飛躍研究員在2001年時已經觀察到了這一現(xiàn)象,并將其命名為“人肉搜索”(Human Flesh Search)。也是計算機科學中為數不多的由我國學者提出的原創(chuàng)性概念。今天,這種模式已經被廣泛用于大型自然災害發(fā)生之后的尋人和救援等工作中。顯然,以無所不在的網絡,以社會計算[13]和動態(tài)網群組織(CMOs)[14]為基礎,融合人類與機器優(yōu)勢協(xié)同執(zhí)行任務的社會機器已然初現(xiàn)形態(tài)。
另外一種常見的社會機器的形態(tài),被稱為“目的性游戲”(Games with a purpose, GWAP)。最早的一款游戲,被稱作ESP,這一游戲的思想是對圖片“打標簽”,但并不是像某些主流的圖像分享網站如Flicker或Instagram那樣的做法,讓人們上傳自己的照片。很多情況下,人們在自己的社交媒體平臺上上傳照片并打上“我的男朋友”或“最好的姐妹”等標簽,其實對于除了擁有者之外的人來講,并沒有任何用處。這也是機器所缺乏的常識的一種。而ESP,通過設計一種競技游戲的機制來讓人們主動對圖像打上“有用的”標簽,并進行排行。這樣就利用人類的工作將幾百萬張圖片進行了高質量的標注,而智能機器或人工智能算法也能利用這些高質量的標注進行進一步的訓練和學習。
近年來,這樣的設計也被用于城市道路狀況監(jiān)督、環(huán)境監(jiān)測以及舉報不法行為等,這些設計,顯然只用到了很少的AI技術,但卻正在為更強大的AI技術提供輸入。AI,已經開始依賴于人們使用社會機器時產生的大量時間和空間數據,創(chuàng)造出更多、更大的突破。
AI = 智能的自動化
美國AAAI協(xié)會的前主席Nils Nilsson曾與John McCarthy對AI做出了這樣一種解釋:AI = Automation of Intelligence
該見解不僅與維納的控制論思想一脈相承,也解釋了從工程角度,人工智能的實質就是知識自動化。
去年,一部名為《西部世界》的美劇,席卷全球,為當下正熱的人工智能又澆了一鍋熱油,也引發(fā)了全世界范圍內對于未來的人機關系的探討。劇中,所有的機器人接待員最終獲得生命及智能,根據內置的機制與設定的“目標”,能夠在面臨不同境地時做出符合目標的決策。當然,《西部世界》目前只是文學上對機器智能的夢想,但生命和智能的確一直是人類最美好、最重要的兩類追求。讓機器獲得智能,一定程度上就是讓機器根據輸入的知識,借助智能算法,如當下流行的長短期記憶網絡(LSTM)、深度神經網絡(DNN)、卷積神經網絡(CNN)、深度信念網絡(DBN)等,來解決知識型工作中遇到的問題。歸根結底,是讓機器圍繞特定的目標/任務,結合數據處理、知識提取、算法分析、模型構建等形成決策制定流程,實現(xiàn)知識自動化。
經過約 200 年的發(fā)展,人類社會基本完成了工業(yè)化建設,并從工業(yè)時代迅速向知識時代轉移,智能產業(yè)隨之崛起。就像工業(yè)時代必須依靠工業(yè)自動化一樣,知識自動化將是發(fā)展知識時代智能產業(yè)的基礎與關鍵。近年來,隨著網絡化的虛擬空間成為與現(xiàn)實化的物理空間平行的一個實實在在的新空間,數據成為這一空間中最為重要的“礦藏”資源。未來產業(yè)一定是圍繞數據的處理、知識的加工、智能的自動化建設而成,就像圍繞地下礦藏的挖掘、加工和制造形成的大型現(xiàn)代企業(yè)一樣。在新的產業(yè)中,成百上千的算法被集成到一起,形成“數據清洗廠”、“信息加工廠”、“知識生成廠”,甚至“決策制定廠”,使得它們面對具體問題時具有深度知識的敏捷性,針對具體問題時具有深度分析的聚焦能力,同時具有自適應精準實時地向目標收斂的能力,實現(xiàn)智能的自動化。[15]
然而,無論人類還是機器,都無法單獨實現(xiàn)這點。機器,需要借助人類對于環(huán)境、對于其他個體、對于世界所擁有的常識知識;而人類,則需要機器更大的存儲和更快的計算能力,進行決策。就像是深藍戰(zhàn)勝卡斯帕羅夫之后,人與計算機在國際象棋游戲中產生的合作。1997年,計算機登上世界象棋冠軍的寶座,導致卡斯帕羅夫開始探索由個體人類與個體計算機組成的“半人馬”[16]國際象棋比賽模式。“半人馬”展示了一種人類能夠基于自己的象棋知識進行決策,并借助計算機進行計算的混合力量,十多年來,它的表現(xiàn)逐漸超越了世界上最優(yōu)秀的人類個體玩家與計算機個體玩家。然而,到了2012年左右,隨著計算機在存儲和計算能力上得到了極大的提升,“半人馬”開始輸給越來越強大的專門下象棋的計算機了。就在最近,出現(xiàn)了更高形式的“自由體”[17]國際象棋玩家,2016年時,它已經能夠打敗世界上最好的象棋機器了??雌饋?,機器(包括硬件的和軟件的)和人類協(xié)同合作組成的團隊,創(chuàng)造了任何單獨一方都無法打敗的極其強大的“社會機器”。
(作者單位:中國科學院自動化研究所)