網站首頁 健康小知識 母嬰教育 起名 運動知識 職場理財 情感生活 綠色生活 遊戲數碼 美容 特色美食 愛好

繼象棋之後,人機大戰為何選中圍棋?

欄目: 互聯網 / 發佈於: / 人氣:2.04W

關於人機大戰,早在1997年,一台叫做“深藍”的超級計算機在國際象棋上下贏了國際象棋冠軍卡斯帕羅夫。“深藍”是一台超級計算機,雖然跟人工智能程序Alpha Go好像不是同一回事,但是其實人工智能程序也需要以計算機作為載體才能工作,就像大腦也需要有身體才行。因此,把它們放在一起比較並不奇怪。而隨着超級計算機技術的不斷髮展,即使是今天最普通的集成顯卡的性能也超過了700GFLOPS。“深藍”已經從逐漸跟不上腳步到被甩開了一大截。值得一提的是,世界上最快的超級計算機是我們國家的天河2號,其性能達到了33.86PFLOPS,是“深藍”計算機的30萬倍。

繼象棋之後,人機大戰為何選中圍棋?

那麼,跟“深藍”計算機相比,谷歌Alpha Go的性能又怎麼樣呢?此前谷歌曾經在《自然》雜誌上發表過關於這個人工智能系統的文章,其中稱,Alpha Go人工智能的計算機裝有48個CPU和8個GPU。我們似乎無法將兩者放在一起直接比較,因為Alpha Go是在雲計算平台上運行的,我們可以通過競爭對手的計算機數據來進行大概的比較,比如阿里雲。

2015年12月,阿里雲對外開放高性能計算服務。這些計算機的單機浮點運算能力是11TFLOPS。如果谷歌的計算機性能與阿里雲接近的話,那麼Alpha Go所驅動的硬件的性能至少是深藍的1000倍。

説起圍棋和人工智能,我們可能多少都瞭解一些,不過二者是怎麼聯繫到一塊的呢?

繼象棋之後,人機大戰為何選中圍棋? 第2張

那是因為機器戰勝人類,一個關鍵就是圍棋。擁有悠久歷史的圍棋高度反映了人類的智慧,圍棋棋盤縱橫19道,361個交叉點,涉及到的可能出現的局面數量最大可達3^361,大致的體量是10^170,而已經觀測到的宇宙中,原子的數量才10^80,國際象棋最大隻有2^155種局面,這是什麼概念?看似簡單的縱橫19道,361個交叉點,形成了浩瀚的宇宙。所以有人説,圍棋是體現人類智慧的最好遊戲,之前還有人預測,人工智能(AI)需要再花十幾年才能戰勝人類,所以若拋去商業元素,這場比賽的意義可能在於見證歷史,足以説明當前人工智能的技術研究已經達到新高度。

AI下圍棋,究竟有多難?

難點1:圍棋對弈的基礎是死活的確認,確定棋盤上一塊棋的死活是最基本的,但要搞清楚一塊棋是死是活是非常困難的,而且,這種似死似活的狀態又是在不斷變化的。研究局部死活搜索是AI圍棋發展的一個難點。

繼象棋之後,人機大戰為何選中圍棋? 第3張

難點2:棋形體現着人類形象思維獨有的特性,棋手對棋形的感覺完全依賴於自身的經驗,而這種感覺恰恰是勝負的關鍵,也是棋手水平高低的標誌。人類棋手不願意浪費自己的棋子去無謂地攻擊對方活的棋形或無謂地試圖挽救自己死的棋形,要賦AI這種對棋形的感覺,則是人工智能面臨的重要課題。

難點3:此外,還需要研究特殊的算法來解決快速識別問題,著名的電腦圍棋程序設計者布恩説過: “有了快速的模式識別方法,就不難教程序利用手筋來吃棋。”所以説,模式識別算法是圍棋博弈程序的重要組成部分,高效的模式識別算法反映着博弈程序的水平,當電腦的模式識別技術發展到能與人腦匹敵時,電腦圍棋的棋力離專業九段就不遠了。

簡單來説,一方面,圍棋規則非常複雜,每一步的調整,都會產生更多的可能,這對機器的計算能力要求很高。另一方面,即使機器中存儲了足夠多的已有圍棋大戰數據,由於圍棋規則的複雜程度和棋手的無法預測的落子,對機器的應變能力或深度學習能力有更高的要求。

4.下圍棋這麼複雜,AI靠什麼取勝?

上面説的那麼難,難道AI就沒機會取勝了?NO NO NO~

繼象棋之後,人機大戰為何選中圍棋? 第4張

為了擊敗人類,研究者們拿出了大殺器——這就是人工智能領域新一代的機器學習(machine learning)形式——深度學習(deep learning)和強化學習(reinforcement learning)。

深度學習的概念換句話説,就是讓計算機像人腦一樣去學習和思考。和傳統的機器學習不同,深度學習是把計算機科學和人類的神經學結合起來,讓計算機自主學習。比如,不是由人告訴計算機這是一隻貓,然後讓它來進行識別和印證。而是給計算機提供大量的圖片數據,讓它自己學習和分析,然後自主形成“貓”的概念,就像人類大腦的視覺皮層那樣反應。有了具備深度學習能力的人工智能系統,以後駕車出行時,汽車就能主動提醒你周圍的路況,還能應用於語音和臉部識別、醫療診斷等領域。

強化學習一詞來自於行為心理學,這一理論把行為學習看成是反覆試驗的過程,從而把動態環境狀態映射成相應的動作。它類似於傳統經驗中的“吃一塹長一智”,強化學習可以做出策略選擇,廣泛應用於下棋、走迷宮這一類別中。這種依賴於大數據和強大計算能力的被稱為“深度學習”的無監督或半監督機器學習,使計算機可以在無需人力參與的情況下,完成原本只有經過高度專業化訓練的專業人士才能完成的任務,甚至超過專家。

另外,為了達到更高的運算能力,谷歌還把Alpha Go接入到了一個有1202個CPU組成的網絡中。這使得這個人工智能系統的計算能力在原來的基礎上增加了24倍。經過推算,Alpha Go的性能大約是深藍計算機的2.5萬倍左右。按這個節奏計算,假如人類一年能玩1000局,AI一天就可能玩100萬局。所以Alpha Go只要經過了足夠的訓練,還是有可能擊敗人類選手。畢竟,人類在長時間的下棋比賽後,由於生理和心理限制可能會疲累,進而犯錯,但機器不會。

不過谷歌董事長施密特表示,即使機器真的贏了,人類仍是贏家。即使AlphaGo機器最終贏了李世石,對於人工智能是否會“碾壓”人類,依然存疑,我們不必過於焦慮,人工智能可能還有很長的路要走。

歷史上的人機大戰

①深藍戰勝卡斯帕羅夫

1997年,美國IBM公司的“深藍”超級計算機深藍以二勝一負三平的戰績戰勝了當時世界排名第一的國際象棋大師卡斯帕羅夫,成為贏家。

②浪潮天梭挑戰人類象棋大師

2006年的浪潮天梭超級計算機,挑戰人類象棋大師一役,在最終的巔峯對決中,許銀川與浪潮天梭兩戰皆和。浪潮天梭向世人證明了自己超強的運算能力。

繼象棋之後,人機大戰為何選中圍棋? 第5張

③全才學霸沃森挑戰人類

2011年,“深藍”的同門師弟“watson”(沃森)在美國老牌智力問答節目《危險邊緣》中挑戰兩位人類冠軍,並獲得成功。

④Alpha Go以5:0完勝歐洲冠軍樊麾

2016年1月,美國谷歌公司旗下的人工智能(AI)開發商“DeepMind”(位於英國)研發的圍棋電腦軟件“AlphaGo”(阿爾法圍棋)打敗了職業棋手樊麾,開創全球先河。

進入21世紀後,科學研究從大數據、人工智能到虛擬現實,從發現了類地球行星、引力波到無人駕駛、量子計算,這是一個創新不斷、驚喜不斷的時代,而我們有幸參與其中,這也許比單純討論比賽輸贏更有趣