AlphaGo如何擊敗人類?
谷歌的人工智能AlphaGo與韓國棋手李世石的較量終于有了結果,最終是谷歌的AlphaGo戰勝李世石,連續取得三場勝利。接下來兩場將淪為李世石的“榮譽之戰”。
根據之前的約定,谷歌獲勝后將獲得“自己的”100萬獎金,這些獎金將捐贈給聯合國兒童基金會(UNICEF)、STEM教育以及圍棋慈善機構(Go Charity)。值得一提的是,李世石雖然以0:3宣告失敗,但仍需要和AlphaGo下完剩余兩場。剩余2場比賽將分別在13日(周日)、15日 (周二)的北京時間中午12點進行。
在本場比賽前,AlphaGo已經在本周三和周四戰勝了李世石。由于本次人機對決采用五局三勝制,因此本場比賽成為AlphaGo的“賽點”,李世石能否為人類挽回尊嚴成本次對決看點。
AlphaGo如何擊敗人類?
1.超強的計算能力
以往人類挑戰者往往需要多次挑戰找到前任圍棋冠軍的弱點然后將他擊敗。然而AlphaGo擁有強大計算能力及分析能力可以比人類更快的找到李世石的思維模式,或許也是因為如此因此第二盤棋中AlphaGo的攻勢明顯比第一盤要強,反之受了第一盤的打擊后李世石的比第一盤要保守許多。
這是一般人無法達到的,但成功者在每一次嘗試前一定會計算各種后果的可能性,從而盡可能做好承擔所有后果的準備,不打無準備之仗。
2.不為情緒影響
從另一種意義上來說,AlphaGo和李世石下的不是一種棋。 人類的運算能力不能窮盡排列組合,下棋的方式實際上是自身經驗+古老傳承經驗+局勢判斷+心理因素的組合。而計算機下棋,是窮舉+剪枝+局勢估值,絲毫不受情緒影響,占進攻上風也好,被困死也罷,對于AlphaGo的計算沒有絲毫影響。
人類或許窮以一生都無法做到這樣的程度,畢竟人類沒有長著一顆鋼鐵心。但古往今來的成功者在巔峰時期都能做到一點——不被情緒影響根本判斷。
3.超強的學習能力
2015年10月,AlphaGo以5:0戰勝歐洲圍棋冠軍樊麾,這是人工智能程序首次在不讓子的情況下戰勝人類圍棋選手。5個月之后,AlphaGo迎戰世界冠軍李世石,并且直接拿下兩盤。短短5月不到的時間,直接晉級到圍棋九段。
不過好在這種能力是人類賦予的,DemisHassabis和他的伙伴們創造了AlphaGo,學習的經驗和案例來自專業的人類棋手們。
圍棋作為人類最復雜的棋類比賽,縱橫十九路,變化多,有千古不同局一說,開發的電腦軟件也只能達到專業初段的水平。而象棋子力少,各種棋子有固定的走子方法,象棋開發的電腦軟件已可占勝人類的頂極棋手。
還有人計算過兩者的難度差距,圍棋的復雜度為10^{172} 而國際象棋則只有10^{46},簡直是天壤之別!
之前IBM的深藍雖然能以國際象棋擊敗世界棋王卡斯帕洛夫,這是由于相對來說國際象棋目標明確,只要殺死國王即可(跟象棋、將棋系出同源),因此演算法并不困難,但圍棋不一定須要智殺對方棋子,每一步有數百種以上的走法,只靠模式識別,窮舉法,暴力搜索這種還是比較難以擊敗職業九段,AlphaGo實力雄厚是共識,但至于說對弈圍棋職業九段,我感覺現在還差點火候。
最后,我們不妨前瞻一下,如果這次AlphaGo沒有打敗李世石,那還要多久呢?
當年深藍從進入大師級別到比賽擊敗世界冠軍花了四年時間,AlphaGo應該會比深藍更快提升自己,因為深藍需要新版本的硬件,和針對Kasparov的人工調節優化,而AlphaGo是基于谷歌的硬件計算平臺,和相對通用的深度學習算法,裝備升級了兩三代都不止,IBM的深藍以及更深的藍,跟它都不在同一級別上。