首頁
黨政
- 黨網 · 時政
- 人事
- 反腐
- 理論
- 黨史
- 黨建
要聞
- 經濟 · 科技
- 社會 · 法治
- 文旅 · 體育
- 健康 · 生活
- 國際
- 軍事
- 港澳
- 台灣
- 教育
- 房產
- 科普
觀點
互動
可視化
- 視頻
- 圖片
- 圖解
地方
- 京
- 津
- 冀
- 晉
- 蒙
- 遼
- 吉
- 黑
- 滬
- 蘇
- 浙
- 皖
- 閩
- 贛
- 魯
- 豫
- 鄂
- 湘
- 粵
- 桂
- 瓊
- 渝
- 川
- 黔
- 滇
- 藏
- 陝
- 甘
- 青
- 寧
- 新
- 鵬
- 雄安
舉報專區
多語言
- |
合作網站
登錄

退出

2019世界智能圍棋公開賽專訪“不退不讓”的星陣圍棋

2019年08月16日16:26 | 來源：人民網-體育頻道

小字號

隨著2019中國圍棋大會開幕臨近，我們亦將迎來2019“中信建投証券杯”世界智能圍棋公開賽。而此次世界智能圍棋公開賽或將是歷屆規模和水平最高的一屆圍棋AI比賽，比賽場地定於山東省日照市科技文化中心，時間定在8月21-24日，這四天將有來自多個國家和地區的14支圍棋AI隊伍展開緊張角逐，屆時相信“神仙”打架定會“弈”彩紛呈！

星陣圍棋素以“不退讓圍棋”而聞名，曾獲得過2018日本AI龍星戰、2018世界智能圍棋公開賽、2019“博思杯”世界人工智能圍棋大賽三次冠軍。在本屆絕大多數參賽隊伍所給出的賽前預測中，“星陣圍棋”均為奪冠熱門。有人預測，本屆世界智能圍棋公開賽的最大看點或將是“星陣圍棋”“絕藝”代表的中國AI對抗日韓AI的激烈爭霸場面。星陣的主創人金涬博士詳盡地回答了我們的8個問題：

1、可以簡單的介紹一下自己的參賽隊嗎？

深客科技是一家專注人工智能的高科技企業，為探索人工智能前沿技術，我們開發了圍棋AI程序“星陣圍棋”。星陣於 2018 年 4 月戰勝世界冠軍柯潔九段，2018 年 5 月讓先對陣頂尖職業棋手 41 局獲得 40 勝 1 負，隨后相繼三次獲得世界人工智能圍棋大賽冠軍。2019 年 4 月，星陣讓二子對陣四位世界女子頂尖棋手，獲得全勝。星陣曾代表中國人工智能參加第四屆東方經濟論壇，並在 2018 世界人工智能大會上接受劉鶴副總理視察。

2、可以介紹一下你們在參賽圍棋AI上的技術原理和自身優勢嗎？

“星陣圍棋”在AlphaGo的基礎上做了一些技術創新。星陣的主要貢獻涉及到機器學習的兩個重要領域，多任務學習和遷移學習。

與AlphaGo隻使用策略網絡（Policy Network）和價值網絡（Value Network）不同，星陣同時學習了四個主任務，另外兩個是領地網絡（Area Network）和子差網絡（Score Network）。領地網絡基於任意給定盤面，分別估算棋盤上每個交叉點最終歸屬黑棋或白棋的概率。子差網絡基於任意給定盤面，估算最終黑方子數與白方子數的差值。在領地網絡和子差網絡的幫助下，星陣對局面的判斷更加全面、立體，這也讓星陣學會了像人一樣“點目”，而不僅僅是依靠勝率來下棋。在勝率接近的情況下，星陣會選擇子差更優的下法，將領先的優勢繼續擴大，或者試圖縮小落后的目數，咬住局面尋找機會。這一技術特點也形成了星陣“不退讓圍棋”的棋風。

另外，目前圍棋AI大多使用19路棋盤，中國規則黑貼3.75子，此規則下的訓練樣本相對充足。星陣通過引入遷移學習技術，將中國規則黑貼3.75子的模型，用較小的代價，遷移到其他規則下。遷移學習為星陣帶來了極大的算法靈活性，於是星陣可以進行任意路數的對局，也可以進行任意貼目的對局，可以進行讓子棋的對弈，完美適應中國規則數子法和韓日規則數目法。可以說，遷移學習使得星陣在圍棋上實現了“舉一反三”的智能。

3、你們在開發自己的圍棋AI過程中用了多長時間？期間遇到過的挑戰有哪些？

深客科技是一家小創業團隊，剛剛成立一年多。與谷歌、騰訊等資金和計算資源充足的大團隊不同，我們的研發經費和服務器都是自籌資金。眾所周知，圍棋AI是需要大量計算資源投入的項目，我們的主要挑戰是利用十分有限的計算資源，來達到甚至超過其他團隊使用數倍甚至數十倍資源達到的水平。

我們採用多任務學習來解決這個問題，通過多任務學習，充分利用每一個訓練樣本所包含的信息，這樣能大大減少對訓練樣本的需求量，進而減少對計算資源的需求量。

4、據悉本屆世界智能圍棋公開賽的參賽隊實力都很強，是歷屆比賽中最強的一屆，你是如何評價這次的對手的？

各個圍棋AI的水平一直都在快速提升。此次參賽的隊伍無論是從實力還是數量都是歷史之最，其中“絕藝”時隔一年多再次參賽應該是最受關注的，我們也很期待跟他們在比賽中再次交手。另外還有顧彼思問鼎圍棋（GLOBIS-AQZ），從他們賽前發布會的情況來看，應該也會是實力強勁的對手。其他的參賽隊有一些是老對手，如裡拉零（Leela Zero），但也有很多新面孔，相信他們都具有不俗的實力。

5、你們的圍棋AI在技術風格上有哪些特色？

“星陣圍棋”使用少量硬件資源完成訓練，實現更具通用性、更人性化的高水平圍棋智能軟件。對局進程中，星陣會像人類一樣用點目的方式進行形勢判斷，無論優勢劣勢，始終追求最優下法，以“不退讓圍棋”聞名。星陣還可以進行任意路數和任意貼目的對局，完美適應各種圍棋規則。

6、談一談你們的AI對貼目合理性的判斷？

合理的貼目是圍棋公平性的保証，在圍棋AI出現以前，人類一直在探索合理的貼目。圍棋AI出現以后，成為了人類更強大的工具，幫助人類研究更合理的貼目。星陣認為目前中國規則黑貼3.75子，白棋的優勢很大。星陣認為如果使用中國規則數子法，貼2.75子黑棋稍稍有利，但或許比貼3.75子更加平衡。另外，日本規則數目法貼6.5時，星陣仍然認為白棋有利。

7、你對未來圍棋AI水平上限的預期是怎樣的？

AlphaGo Zero算法可以自我學習，不斷迭代提升水平，被証明是一種優秀的強化學習算法。但使用單一算法，水平提升終有上限。AlphaGo論文中棋力曲線圖顯示，前72小時的棋力是快速上升的，之后的提升速度逐漸變緩，40天左右遇到瓶頸后停止了訓練。但是事實上圍棋的問題足夠復雜，留給研究者的空間足夠廣闊，圍棋AI仍然有很大的上升空間。我相信要突破水平上升的瓶頸，唯有通過不斷的算法創新。目前星陣的水平仍然在較快的提升，我們也在不斷通過各種嘗試，進一步提升水平，但距離真正的圍棋上帝還非常遙遠。也正因為如此，圍棋AI在未來很長時間，仍然是非常理想的算法試驗田。

8、你們是否在探索嘗試AI在非圍棋領域的應用？是否有明確的方向和新的突破？

深客科技希望將圍棋作為算法的試驗田，進而嘗試將算法移植到能源、生活服務等多種應用場景中。目前深客正積極與合作伙伴一起，展開多個應用項目的研發與實施。包括將人工智能技術精確控制數據中心制冷系統，達到節電減低PUE的目標﹔以及將AI技術用於儲能電站，基於大數據預測電池的工作狀態及壽命。目前這些領域的嘗試都已經有了一些積極的進展和突破。

（中國圍棋協會）

(責編：管若寒、胡雪蓉)

分享讓更多人看到

人民日報報系

旗下網站

2019世界智能圍棋公開賽專訪“不退不讓”的星陣圍棋

相關新聞

客戶端下載

熱門排行

人民日報報系

旗下網站

2019世界智能圍棋公開賽 專訪“不退不讓”的星陣圍棋

相關新聞

客戶端下載

熱門排行

2019世界智能圍棋公開賽專訪“不退不讓”的星陣圍棋