人民網
人民網>>棋牌>>人民圍棋

2019世界智能圍棋公開賽 專訪“不退不讓”的星陣圍棋

2019年08月16日16:26 | 來源:人民網-體育頻道
小字號

隨著2019中國圍棋大會開幕臨近,我們亦將迎來2019“中信建投証券杯”世界智能圍棋公開賽。而此次世界智能圍棋公開賽或將是歷屆規模和水平最高的一屆圍棋AI比賽,比賽場地定於山東省日照市科技文化中心,時間定在8月21-24日,這四天將有來自多個國家和地區的14支圍棋AI隊伍展開緊張角逐,屆時相信“神仙”打架定會“弈”彩紛呈!

星陣圍棋素以“不退讓圍棋”而聞名,曾獲得過2018日本AI龍星戰、2018世界智能圍棋公開賽、2019“博思杯”世界人工智能圍棋大賽三次冠軍。在本屆絕大多數參賽隊伍所給出的賽前預測中,“星陣圍棋”均為奪冠熱門。有人預測,本屆世界智能圍棋公開賽的最大看點或將是“星陣圍棋”“絕藝”代表的中國AI對抗日韓AI的激烈爭霸場面。星陣的主創人金涬博士詳盡地回答了我們的8個問題:

1、可以簡單的介紹一下自己的參賽隊嗎?

深客科技是一家專注人工智能的高科技企業,為探索人工智能前沿技術,我們開發了圍棋AI程序“星陣圍棋”。星陣於 2018 年 4 月戰勝世界冠軍柯潔九段,2018 年 5 月讓先對陣頂尖職業棋手 41 局獲得 40 勝 1 負,隨后相繼三次獲得世界人工智能圍棋大賽冠軍。2019 年 4 月,星陣讓二子對陣四位世界女子頂尖棋手,獲得全勝。星陣曾代表中國人工智能參加第四屆東方經濟論壇,並在 2018 世界人工智能大會上接受劉鶴副總理視察。

2、可以介紹一下你們在參賽圍棋AI上的技術原理和自身優勢嗎?

“星陣圍棋”在AlphaGo的基礎上做了一些技術創新。星陣的主要貢獻涉及到機器學習的兩個重要領域,多任務學習和遷移學習。

與AlphaGo隻使用策略網絡(Policy Network)和價值網絡(Value Network)不同,星陣同時學習了四個主任務,另外兩個是領地網絡(Area Network)和子差網絡(Score Network)。領地網絡基於任意給定盤面,分別估算棋盤上每個交叉點最終歸屬黑棋或白棋的概率。子差網絡基於任意給定盤面,估算最終黑方子數與白方子數的差值。在領地網絡和子差網絡的幫助下,星陣對局面的判斷更加全面、立體,這也讓星陣學會了像人一樣“點目”,而不僅僅是依靠勝率來下棋。在勝率接近的情況下,星陣會選擇子差更優的下法,將領先的優勢繼續擴大,或者試圖縮小落后的目數,咬住局面尋找機會。這一技術特點也形成了星陣“不退讓圍棋”的棋風。

另外,目前圍棋AI大多使用19路棋盤,中國規則黑貼3.75子,此規則下的訓練樣本相對充足。星陣通過引入遷移學習技術,將中國規則黑貼3.75子的模型,用較小的代價,遷移到其他規則下。遷移學習為星陣帶來了極大的算法靈活性,於是星陣可以進行任意路數的對局,也可以進行任意貼目的對局,可以進行讓子棋的對弈,完美適應中國規則數子法和韓日規則數目法。可以說,遷移學習使得星陣在圍棋上實現了“舉一反三”的智能。

3、你們在開發自己的圍棋AI過程中用了多長時間?期間遇到過的挑戰有哪些?

深客科技是一家小創業團隊,剛剛成立一年多。與谷歌、騰訊等資金和計算資源充足的大團隊不同,我們的研發經費和服務器都是自籌資金。眾所周知,圍棋AI是需要大量計算資源投入的項目,我們的主要挑戰是利用十分有限的計算資源,來達到甚至超過其他團隊使用數倍甚至數十倍資源達到的水平。

我們採用多任務學習來解決這個問題,通過多任務學習,充分利用每一個訓練樣本所包含的信息,這樣能大大減少對訓練樣本的需求量,進而減少對計算資源的需求量。

4、據悉本屆世界智能圍棋公開賽的參賽隊實力都很強,是歷屆比賽中最強的一屆,你是如何評價這次的對手的?

各個圍棋AI的水平一直都在快速提升。此次參賽的隊伍無論是從實力還是數量都是歷史之最,其中“絕藝”時隔一年多再次參賽應該是最受關注的,我們也很期待跟他們在比賽中再次交手。另外還有顧彼思問鼎圍棋(GLOBIS-AQZ),從他們賽前發布會的情況來看,應該也會是實力強勁的對手。其他的參賽隊有一些是老對手,如裡拉零(Leela Zero),但也有很多新面孔,相信他們都具有不俗的實力。

5、你們的圍棋AI在技術風格上有哪些特色?

“星陣圍棋”使用少量硬件資源完成訓練,實現更具通用性、更人性化的高水平圍棋智能軟件。對局進程中,星陣會像人類一樣用點目的方式進行形勢判斷,無論優勢劣勢,始終追求最優下法,以“不退讓圍棋”聞名。星陣還可以進行任意路數和任意貼目的對局,完美適應各種圍棋規則。

6、談一談你們的AI對貼目合理性的判斷?

合理的貼目是圍棋公平性的保証,在圍棋AI出現以前,人類一直在探索合理的貼目。圍棋AI出現以后,成為了人類更強大的工具,幫助人類研究更合理的貼目。星陣認為目前中國規則黑貼3.75子,白棋的優勢很大。星陣認為如果使用中國規則數子法,貼2.75子黑棋稍稍有利,但或許比貼3.75子更加平衡。另外,日本規則數目法貼6.5時,星陣仍然認為白棋有利。

7、你對未來圍棋AI水平上限的預期是怎樣的?

AlphaGo Zero算法可以自我學習,不斷迭代提升水平,被証明是一種優秀的強化學習算法。但使用單一算法,水平提升終有上限。AlphaGo論文中棋力曲線圖顯示,前72小時的棋力是快速上升的,之后的提升速度逐漸變緩,40天左右遇到瓶頸后停止了訓練。但是事實上圍棋的問題足夠復雜,留給研究者的空間足夠廣闊,圍棋AI仍然有很大的上升空間。我相信要突破水平上升的瓶頸,唯有通過不斷的算法創新。目前星陣的水平仍然在較快的提升,我們也在不斷通過各種嘗試,進一步提升水平,但距離真正的圍棋上帝還非常遙遠。也正因為如此,圍棋AI在未來很長時間,仍然是非常理想的算法試驗田。

8、你們是否在探索嘗試AI在非圍棋領域的應用?是否有明確的方向和新的突破?

深客科技希望將圍棋作為算法的試驗田,進而嘗試將算法移植到能源、生活服務等多種應用場景中。目前深客正積極與合作伙伴一起,展開多個應用項目的研發與實施。包括將人工智能技術精確控制數據中心制冷系統,達到節電減低PUE的目標﹔以及將AI技術用於儲能電站,基於大數據預測電池的工作狀態及壽命。目前這些領域的嘗試都已經有了一些積極的進展和突破。

(中國圍棋協會)

(責編:管若寒、胡雪蓉)

分享讓更多人看到

返回頂部