人民網
人民網>>棋牌

與AlphaGo對戰 李世石能捍衛人類最后的榮譽嗎?

鄧菲菲
2016年02月02日08:28 | 來源:信息時報
小字號
原標題:李世石能捍衛人類最后的榮譽嗎?

最近一周,“AlphaGo”這個詞幾乎席卷了棋界,這個由谷歌DeepMind實驗室研發的圍棋軟件在不讓子的情況下5︰0擊敗歐洲冠軍樊麾二段,引起了棋界和科技界的大地震。

“Alpha”是希臘語的第一個字母,有“領頭”的意思,“Go”則是圍棋的英文,這個橫空出世的人工智能確實做到了它的“前輩”們所不能:首次打敗圍棋職業棋手。在攻克“打敗職業棋手”這個難關之后,“AlphaGo”已經雄心勃勃地劍指下個目標:韓國天王李世石九段。

今年3月8日,李世石將與AlphaGo激戰五番棋,谷歌為此開出了100萬美元(約合人民幣657.5萬元)的巨額獎金。但正如李世石自己所說的那樣,不應將注意力放在錢上,比賽的意義更大,因為這位過去十年戰績最好的棋手將代表人類與人工智能決一死戰。

AlphaGo——

不犯錯的可怕對手

電腦與人腦相比最大的優勢在於它的計算速度和計算量,1997年“深藍”擊敗卡斯帕羅夫正是依靠超強的計算能力:當時“深藍”輸入了一百多年來優秀棋手的對局兩百多萬局,它可搜尋和估計隨后的12步棋,而一名人類國際象棋好手大約可估計隨后的10步棋,計算上的優勢使得深藍以2勝1負3平的戰績勝出。

與象棋相比,圍棋的變化要多出不止一個等級。象棋的變化可能性為10的48次方,而圍棋的變化可能性大約是10的170次方,這是一個普通人很難具象化的龐大數字。國內計算機圍棋領域的佼佼者、北京郵電大學的劉知青教授在接受弈林採訪時就曾經以一個形象的例子類比:“如果象棋的變化是一個原子,那麼圍棋的變化就比整個太陽系還要大。”

為了攻克這一難關,“AlphaGo”的研發團隊將傳統的高級搜索樹與深度神經網絡結合在一起,然后用了海量的人類高手對局來訓練“AlphaGo”。用DeepMind項目總監希爾弗的話來說,AlphaGo已經學習了相當於人類1000年的學習量。而刊登這一報道的《自然》雜志說的更直白:“人類在長時間的比賽后往往會犯錯(也就是我們常說的‘昏招’),但機器不會。”對於這一點,與“AlphaGo”過招過的樊麾最有感觸:五番棋的第二局原本樊麾形勢極好,但由於一個隨手被對方抓住,后面竟然就沒了機會。自己的弱點被完全掌握,對方卻完全不犯錯,這正是對手的可怕之處。

李世石:請人類支持我

AlphaGo的橫空出世在棋界和科技界都引發了強烈的地震,與科技界為它能給人工智能技術帶來質的飛躍而欣喜不同,棋界更多是為人類最后陣地眼看將被攻克而感嘆。即將在3月8日與AlphaGo展開對決的李世石,也因此被視為守衛人類最后堡壘的勇者。

李世石坦言,自己毫不猶豫地就接受了谷歌的邀約,不是因為高額獎金的誘惑,而是看重比賽的意義:“這是人與電腦(在圍棋領域)首次實質性的對決,中韓日這麼多職業棋手中能選中我,我感到非常高興又光榮,我也不知道能否代表人類,但谷歌選中了我,我就接受了,所以應該算是代表人類了吧。相信棋界的人都會支持我,不懂圍棋的人也會關注並助威,拜托大家了。”

作為人類的代表,李世石也給自己定下了嚴苛的標准:“如果我輸了的話,豈不是顯得人類太綿軟無力了?輸兩盤都不行,我要4︰1或者5︰0拿下!”而對於一旦落敗的后果,李世石也可以預見:“大家還沒完全的心理准備 ,肯定會刮起巨大風暴。棋界可能會動搖,也可能反而得到發展,我也說不好。不過我個人而言,如果輸了的話打擊肯定很大,夢百合決賽也沒受到這麼大的打擊,兩者根本無法相提並論。”李世石坦言,其實他覺得人類輸給電腦的時代終究是會來臨的:“快則兩三年,慢則五到十年,不過那時人類就算輸給電腦也會受沖擊小些吧。即使這次我贏了,大家也要有心理准備,哪怕五年后人類輸了……”

頂尖棋手終有一天會被電腦擊敗,棋界對於這一點是有共識的,只是目前情感上還無法接受這一刻來得這麼快。一旦那一天真的來臨,棋界要做的就是對人工智能加以充分利用,而不是沉浸於消極情緒中無法自拔。正如柯潔所說的那樣:“太陽還是會照常升起的,我們肯定不會因為被計算機擊敗就不下棋了。如果機器下贏了我,我還想贏回來。”

柯潔:可怕的是AlphaGo還能進化

目前中國圍棋等級分第一、已經三奪世界冠軍的柯潔坦言,光看棋譜的話,根本看不出來AlphaGo不是人類,換言之,它已經通過了“圖靈測試”(注:由計算機科學之父圖靈於1950年設計,如果電腦能在5分鐘內回答由人類測試者提出的一系列問題,且其超過30%的回答讓測試者誤認為是人類所答,則電腦通過測試,AlphaGo所做到的遠遠超過及格線。)

“這五盤棋我也很仔細地看了,但我沒看名字,不知道誰執黑誰執白,完全看不出誰是電腦,感覺(電腦)就像是一個真正的人類下的棋一樣。該棄的地方也會棄,該退出的地方也會退出,非常均衡的一個棋風。之前的ZEN(AlphaGo之前最好的人機對弈軟件)那樣的程序經常會莫名其妙地抽風,突然跑到一個無關緊要的地方下棋,這個不會,”柯潔說,“但可怕的是這還不是完全體,它是可以學習進化的。”

(責編:胡雪蓉、楊磊)

分享讓更多人看到

返回頂部