前段時間,人工程序AlphaGo戰(zhàn)勝圍棋高手柯潔,自此AlphaGo幾乎成為了圍棋界的“泰斗”。昨天日本的人工智能DeepZenGo參加第三屆夢百合杯世界圍棋公開賽32強(qiáng)賽中,中國棋手王昊洋六段擊敗了日本圍棋程序DeepZenGo,讓柯潔驚呼“你是人類的希望”!賽后DeepZenGo發(fā)明人加藤英樹坦言,是程序有漏洞導(dǎo)致判斷錯死活。就這點(diǎn)看起來,人工智能之間還有有很大的差距的。
這盤棋DeepZenGo執(zhí)黑,序盤階段都很正常,到了黑57一路“跳”,事后看是本局的敗因。局后加藤英樹說,DeepZenGo以為跳了之后是把白棋吃掉了,直到二十多手之后才判斷出左邊是自己死了。隨后,看錯死活的DeepZenGo又走出一串人類無法理解的棋。下到后來,代替DeepZenGo落子的加藤英樹連連搖頭,表情黯然。
至207消劫轉(zhuǎn)換,白棋小勝局面已定。奕至252手,加藤英樹向裁判說了一聲“pass(認(rèn)輸)”,裁判開始數(shù)子。數(shù)子結(jié)果,黑棋184子,王昊洋白棋勝1/4子。
之前柯潔對戰(zhàn)AlphaGo時就一直在尋找bug(漏洞),期望可以借此戰(zhàn)勝AlphaGo,可惜最終未能成功。
擊敗AI,最開心的自然是王昊洋,他說:“以前在弈城網(wǎng)上和它下過兩盤,都輸了。”加藤英樹則表示,DeepZenGo的表現(xiàn)沒有達(dá)到他的預(yù)期。
而這已不是DeepZenGo第一次在比賽中崩潰。今年3月的2017世界圍棋最強(qiáng)棋士戰(zhàn)首輪比賽,中國棋手羋昱廷對DeepZenGo的人機(jī)比賽中,終局階段DeepZenGo判斷不清輸贏,忽然開始胡亂落子,以致DeepZenGo團(tuán)隊不得不終止比賽認(rèn)輸。這樣看來,日本程序趕超AlphaGo的道路還很漫長。
在開始之初DeepZenGo參賽受到了很多反對的聲音,衛(wèi)冕冠軍柯潔更是直言不愿意、不接受。但無論兩輪比賽的對戰(zhàn)質(zhì)量還是賽事的受關(guān)注程度都有提升,這也顯示了AI本身的價值。
AI進(jìn)入社會沒有錯,現(xiàn)階段的介入可以讓人類慢慢適應(yīng)有AI的社會,因?yàn)樵趯恚?a target="_blank" href="http://www.comcomcom.net/archives/tag/ai" title="View all posts in AI">AI必將會在人類的生活中得到很多的應(yīng)用,現(xiàn)階段的AI在不斷的接觸人類的過程中也在升級,AI的程序員們在不斷的讓AI可以更加的智能,可以更快的步入到人類的生活。
]]>即便是在海拔5200米的珠峰大本營,與人類下棋的柯潔依然無敵。
6月14日,2017“拉薩交通產(chǎn)業(yè)集團(tuán)”圍棋汽車?yán)惵湎箩∧唬?a target="_blank" href="http://www.comcomcom.net/archives/tag/%e6%9f%af%e6%b4%81" title="View all posts in 柯潔">柯潔與柁嘉熹的決賽在珠峰大本營進(jìn)行,最終柯潔毫無懸念地奪冠冠軍,并拿到了組委會頒發(fā)的200萬元獎金。
從成都到珠峰大本營的318國道上,這位前不久剛剛因與AlphaGo對弈而哭紅鼻子的19歲男孩已逐漸走出陰影,他甚至在向澎湃新聞記者講如何推廣圍棋時,開起了“狗”的玩笑。
而在旅途中看到別人家的狗時,他總會上前去抱抱,“抱走吧,給它改名阿爾法?!?/p>
普通游客和“網(wǎng)癮少年”
從與AlphaGo大戰(zhàn)三盤哭紅了眼,到LG杯虐慘韓國棋手,19歲的柯潔一刻也沒有休息過。從6月2日到6月15日,他又坐上了賽車,來了一把“圍棋拉力賽”。
在這位19歲的世界冠軍看來,頻繁密集的賽程早已是他生活的一部分,“有點(diǎn)習(xí)慣了吧。”柯潔在接受澎湃新聞記者采訪時說。
在這為期近半個月的時間里,柯潔不僅要與古力、羋昱廷、陳耀燁、周睿羊、柁嘉熹這5位世界冠軍爭奪冠軍,還要與女車手搭檔一路沿著318國道從成都前往最終目的地珠峰大本營。
“這次我并沒有把它當(dāng)一個比賽來看,我在比賽之余我能夠欣賞到川藏線上的美景,希望自己在勝負(fù)之外也可以享受比賽,放松自己?!?/p>
除了和對手對弈時一如既往的認(rèn)真,柯潔一路上也的確很放松,AlphaGo留給他的淚水也正隨著川藏線上炙熱的陽光逐漸消散。
在不下棋的時候,19歲的少年像個游客一樣到處拍照,聽著講解員對當(dāng)?shù)匚幕慕榻B;有時又像個明星似的與認(rèn)出他的游客合照,大多時候他都會禮貌地答應(yīng)粉絲們的各種要求。
不知是本身喜歡狗,還是因?yàn)榕c阿爾法狗對弈的原因,柯潔在沿途還與狗結(jié)下了不少情緣。在看到別人家的狗時,他總會上前去抱抱,“抱走吧,給它改名阿爾法?!?/p>
當(dāng)然,愛上網(wǎng)、愛游戲的“網(wǎng)癮少年”也時刻手機(jī)不離手,他自我調(diào)侃地在微博上曬出自己川藏之行的照片,甚至在第二天有比賽的情況下,前一晚還在發(fā)自拍。
不用吸氧就把比賽贏了
對于上高原下圍棋,柯潔在剛出發(fā)時還是顯得有些擔(dān)憂,“如果真的高反很嚴(yán)重的話,那也沒有辦法?!?/p>
沒想到的是,作為地球上第三大物種(AI、柯潔、人類)的柯潔還沒怎么下棋,僅憑沒有高原反應(yīng)這一點(diǎn)就贏了其他人。
從小組賽到?jīng)Q賽,古力、陳耀燁、柁嘉熹等棋手紛紛遭遇了不同程度的高原反應(yīng)。決賽中,柁嘉熹甚至還拿著氧氣瓶不停地吸氧。
和人類下棋一樣,柯潔對于征服“世界屋脊”青藏高原同樣信心十足,幾乎沒有什么高反的他就像在平原一樣自如。
當(dāng)車輛開到了離珠穆朗瑪峰不遠(yuǎn)的觀景臺上時,柯潔像個孩子一樣開心走地下車,擺出多種姿勢在這海拔5000米以上的山峰之巔合影留念。
本次比賽的決賽分為上下半場,上半場在布達(dá)拉宮進(jìn)行,而下半場封盤則移師世界最高峰珠穆朗瑪峰下的珠峰大本營,而結(jié)果也是毫無懸念。
柯潔盯著比賽棋盤。
作為最接近AI的人類,柯潔從小組賽到?jīng)Q賽一路全勝。有位圍棋領(lǐng)域?qū)<腋嬖V澎湃新聞記者,其實(shí)在上半場前99手時柯潔基本就已經(jīng)贏了。
“其實(shí)我挺幸運(yùn)的,來這之后并沒有什么高原反應(yīng)。”在奪冠之后,柯潔向澎湃新聞記者謙虛地表示,“在高原上不僅是比拼棋的技藝,還要在體能和身體素質(zhì)上跟上?!?/p>
柯潔和搭檔女車手。
19歲,自帶“老干部”氣質(zhì)
在這次比賽中,柯潔的女賽車手搭檔是1990年出生的胡蝶,胡蝶說,柯潔讓她很意外。
“他們年齡都比我們小,這些我們出發(fā)前都已經(jīng)知道了,有心理準(zhǔn)備?!焙嬖V澎湃新聞記者,她們這些年長一些的女車手本想著盡“姐姐”的義務(wù)去照顧這些棋手。
可與胡蝶想象中不同的是,這些圍棋國手們雖然年齡很小,但他們舉止得體、渾身上下還散發(fā)著“老干部”的氣質(zhì),“接觸之后發(fā)現(xiàn),他們一個都比一個老成。”
“可能是他們受中國傳統(tǒng)文化的影響,像圍棋這種國粹讓他們從小就去耳濡目染地接觸那些歲數(shù)比較大的人的東西?!?/p>
1990年出生的胡蝶告訴澎湃新聞記者,柯潔在從四川到西藏一路上聽的都是“老一輩藝術(shù)家”的歌曲,“齊秦、張學(xué)友、王杰等等,真的都是特別老的歌,我現(xiàn)在都不聽這些?!?/p>
“家住中國棋院旁,過著老北京南城人一樣悠然自得的生活……我想問到底誰比誰大7歲?。俊迸c柯潔相處了一段時間的胡蝶,也曾在微博上發(fā)出這樣的感慨。
令這位同樣是90后的賽車手驚訝的是,不只是柯潔一個人這么少年老成,這些年輕的棋手們基本都有懷舊情懷,“雖然都是孩子吧,但都是一個比一個成熟。”
這些年,他看了國足三場比賽
當(dāng)然,無論是柯潔還是其他5位圍棋世界冠軍也有著活潑和接地氣的一面,正如胡蝶所說,“他們的屬性其實(shí)還有待挖掘。”
胡蝶向澎湃新聞記者回憶,一開始她覺得柯潔挺高冷,可后來熟了之后發(fā)現(xiàn)他其實(shí)是個“話癆”,“一路上只要他不困的時候,就都在說話,而且他困得時候還挺少的。”
胡蝶還發(fā)現(xiàn),除了與柯潔外,其他幾個棋手性格其實(shí)也都挺開朗,“像柁老(柁嘉熹)、周睿羊他們其實(shí)都挺外向的,只是剛開始大家不熟,他們也有些慢熱?!?/p>
圍棋拉力賽比賽的過程中正值NBA總決賽,周睿羊、羋昱廷等棋手都會拿著iPad在吃飯時去看一眼比賽戰(zhàn)況,他們甚至還為騎士隊第四場的精彩逆轉(zhuǎn)激動地拍手叫好。
柯潔看上去對籃球并不太感興趣,他也在采訪中表示自己并沒有看NBA總決賽。當(dāng)其他人圍在一起看球時,這位“網(wǎng)癮少年”就坐在一旁玩手機(jī),而真正令他感興趣的運(yùn)動其實(shí)是足球。
與眾多國內(nèi)球迷一樣,足球讓柯潔也是又愛又恨,他曾表示看國足讓他很鬧心,“我希望他們成績好啊,但這幾年我就看了兩場球,一場和香港,一場和泰國,然后我就不敢看了,太糟心。”
不過,在最后一場圍棋比賽開始的前一天晚上,球迷柯潔還是看了國足對陣敘利亞的比賽,不過對于這場比賽的看法,柯潔并不愿意多說。
柯潔在珠峰大本營下棋。
一路上,他把女車手教會了
作為圍棋界人氣最高的棋手,柯潔在一路上也積極推廣著圍棋。他曾與昌都市領(lǐng)導(dǎo)對弈并聊起AlphaGo,也當(dāng)起了“柯老師”教其他人下棋。
胡蝶向澎湃新聞記者透露,柯潔一路上還要教她們這些女賽車手,“他開始只是教我下,他棋癮特別大、也特別能說,教我一些圍棋的規(guī)則。”
其他棋手發(fā)現(xiàn)胡蝶開始學(xué)下棋后,也都開始教自己的搭檔下棋,賽車手們漸漸地也喜歡上了這項腦力運(yùn)動,“他們開始讓我下九路棋,這個還挺好玩的,大家癮都挺大的。”
不過,在全世界范圍,圍棋仍然是一項小眾的運(yùn)動項目,如何將這項代表人類最高智慧的運(yùn)動進(jìn)行普及也是柯潔和中國棋院不斷思索的問題。
“大家一直都有一個錯覺,覺得圍棋很難。”柯潔向澎湃新聞記者解釋道,其實(shí)這項運(yùn)動一點(diǎn)也不難,“我在路上教我搭檔下棋,半個小時到1個小時的樣子她就學(xué)會了?!?/p>
在柯潔看來,類似圍棋拉力賽這樣的活動對圍棋有著很好的宣傳和普及作用,“我覺得這樣的賽事應(yīng)該越多越好,為圍棋、賽車都能注入新鮮的血液?!?/p>
“其實(shí)圍棋很簡單,只是大家誤區(qū)太深了。只有到我這個級別了,圍棋才會覺得難。當(dāng)我被AlphaGo虐的時候,我就覺得棋很難了?!笨聺嵭χ蚺炫刃侣動浾哒f道。
澎湃新聞記者和柯潔合影。
]]>“以前柯潔和人類棋手下,始終顯得很從容,但今天臉上充血,顯得很緊張。”韓國圍棋九段金庭賢說。
Google 黑板報整理了一段 22 秒的短視頻,柯潔揪了自己 4 次頭發(fā),剩下時間單手抵住下巴或者扶額。解說嘉賓常昊表示柯潔揪頭發(fā)是緊張的表現(xiàn)。
其它一些比如皺眉、咬手指、側(cè)身坐、身子前傾等小動作和神情,頻繁被攝像機(jī)鏡頭捕捉到。
“他(柯潔)以往在國內(nèi)比賽,相對來說,他用的時間是比對手少。今天跟 AlphaGo 之間,他幾乎多用了一個小時。”常昊說。
似乎所有人,都在期待柯潔有多緊張。
柯潔所處的對局室里只有寥寥數(shù)人,除了幾家攝影媒體,還有 3 名工作人員、代替 AlphaGo 落子的黃士杰博士以及柯潔自己。整場比賽,黃士杰博士幾乎面無表情地坐著,幾乎勻速地執(zhí)行 AlphaGo 計算出的最佳落子。
比賽進(jìn)行到 4 小時 25 分鐘時,柯潔輸?shù)袅吮荣悺?/p>
一年多前,AlphaGo 首戰(zhàn)戰(zhàn)勝李世乭,柯潔說“就算 AlphaGo 戰(zhàn)勝了李世乭,但它贏不了我?!?/p>
輸了比賽后,柯潔自陳 AlphaGo 越來越像圍棋上帝,“我還是想和人類下棋,因?yàn)榈轿磥?,我們與 AlphaGo 的差距可能越來越大?!?/p>
這個畫面似曾相識。
2016 年 1 月,AlphaGo 戰(zhàn)勝歐洲冠軍樊麾。
“AlphaGo 目前還沒到與我談?wù)搫儇?fù)的程度,對決結(jié)果將會是 5:0 或者 4:1。”李世乭在自己 AlphaGo 比賽的賽前記者招待會上報出出師表。他并不認(rèn)為樊麾輸給 AlphaGo 對自己起到什么威脅,在他看來,樊麾是業(yè)余棋手里的頂尖高手。
兩個月后李世乭 1:4 輸?shù)舯荣?。這位時年 33 歲的韓國圍棋世界冠軍如此評價 AlphaGo, “它(AlphaGo)可以始終保持心理平靜和精神專注,就這方面而言,我覺得人類比不過它,盡管我還不大愿意承認(rèn),AlphaGo 在棋藝上勝過人類?!?/p>
同樣的情況你也可以在國際象棋棋王卡斯帕羅夫 1997 年對戰(zhàn) IBM 深藍(lán)時看到。
他沒有考慮過自己會輸給深藍(lán),之前還說過“國際象棋這游戲就是為我而設(shè)的。”
卡斯帕羅夫在 1999 年達(dá)到 2851 國際棋聯(lián)國際等級分、2005 年退役。之后 8 年一直沒人能超過他,直到 2013 年才由挪威人卡爾森打破記錄。
但現(xiàn)在更多讓人們記住、知道卡斯帕羅夫的事情,還是他在 1997 年輸給國際象棋人工智能“更深的藍(lán)”。
1997 年 5 月 11 日,國際象棋人工智能只用 19 步就戰(zhàn)勝了卡斯帕羅夫。棋王這張雙手捧頭的照片成了他最廣為流傳的照片之一。
這次柯潔輸?shù)暮苌伲?AlphaGo 用的處理器功耗也只有去年的 1/10。下圍棋,人被計算機(jī)超過,已經(jīng)沒有任何懸念。
博彩網(wǎng)站預(yù)測給出 AlphaGo 獲勝賠率 1.05、柯潔獲勝賠率 8。也就是說買 100 元柯潔獲勝,將能獲得 800 元;買 100 元 AlphaGo 勝,能拿回 105元,只賺 5 塊錢。
這和去年李世乭比賽前大不相同,當(dāng)時還有很多人覺得人類能贏,包括人工智能專家。
“一年前我期待李世乭 3:2 或者 4:1 戰(zhàn)勝 AlphaGo,我當(dāng)時沒預(yù)料它那么強(qiáng)大。今年的結(jié)果毫無疑問,AlphaGO 三場全勝?!痹鴰ш犞谱魈搴蛧H象棋程序的喬納森·謝弗爾教授告訴《好奇心日報》。
如果說圍棋是“人類智慧皇冠上的明珠”,那么這一次和 AlphaGo 對局的中國棋手柯潔九段無疑是最有資格守衛(wèi)這份珍寶的人之一。
柯潔 1997 年出生,自幼學(xué)棋。2008 年取得初段段位,2014 年獲得第二屆百靈杯世界圍棋公開賽冠軍,成為中國大陸第 16 位圍棋世界冠軍,年僅 17 歲升九段。截至目前,柯潔共在以個人資格出賽的國際圍棋比賽中取得 4 次冠軍。
2016 年 3 月敗于 AlphaGo 的韓國棋手李世乭九段比柯潔年長許多。李世乭 1983 年出生,至今在以個人資格出賽的國際圍棋比賽中獲得 18 次冠軍。
國際上有一個非常簡單粗暴的辦法評價圍棋選手的實(shí)力:定級分。法國計算機(jī)專家,也是圍棋人工智能程序 CrazyStone 的作者 Rémi Coulom 利用選手的歷史成績結(jié)合 Elo 算法,建立了一個給這些選手打分的網(wǎng)站 Go Ratings。因?yàn)槭澜缟喜]有一個統(tǒng)一的圍棋國際組織,這個網(wǎng)站的分?jǐn)?shù)在很多時候被引用作為圍棋選手世界排名。
從 1991 年到 2006 年,韓國名將棋手李昌鎬連續(xù) 16 年在 Go Ratings 排名第一,李世乭則從 2007 年到 2011 年連續(xù)五年排名第一,柯潔從 2015 年開始成為世界榜首。
但柯潔本人認(rèn)為,Go Ratings 的評分并不科學(xué),認(rèn)為它沒有公信力。
目前,在 Go Ratings 的排名上,柯潔、韓國棋手樸廷桓、中國棋手羋昱廷、韓國棋手申真谞、中國棋手連笑分列前五名。李世乭排名第 6。
在去年李世乭敗給 AlphaGo 后,柯潔曾發(fā)微博稱,自己能戰(zhàn)勝 AlphaGo。他也曾多次在國際大賽賽前,公開表示自己對比賽的信心。歷史上,國際個人大賽中,柯潔和李世乭共有 8 次對弈,大比分為 8 比 2,柯潔占有明顯優(yōu)勢。
2016 年 12 月 29 日至 2017 年 1 月 4 日,一個神秘的賬號 Master 出現(xiàn)在中國大陸的圍棋在線平臺奕城圍棋網(wǎng)和野狐圍棋上。奕城圍棋和野狐圍棋是最熱門的圍棋對弈平臺,包括柯潔、井山裕太、樸廷桓、羋昱廷、連笑、古力等等眾多日韓三國眾多的圍棋冠軍和高手都注冊有賬號。
但 Master 在快棋比賽中展現(xiàn)出了針對人類的絕對優(yōu)勢。Master 和全世界 60 位世界冠軍、國內(nèi)冠軍,包括中國著名圍棋大師聶衛(wèi)平在內(nèi)對局 60 場,規(guī)則定為每 30 秒下一步的快棋。這 60 場比賽無一例外全部獲勝。
Master 背后就是 AlphaGo。
在和李世乭和柯潔的比賽中,AlphaGo 的算法表現(xiàn)出了非常穩(wěn)定的性能,能夠以很穩(wěn)定的節(jié)奏,平均幾分鐘一步下完整盤,而作為人類的柯潔和李世乭都多次陷入“長考”,花費(fèi)很長時間思考落子的位置。和限時數(shù)小時的正式比賽相比,快棋對于 AlphaGo 這樣的機(jī)器來說優(yōu)勢顯著。
當(dāng)年深藍(lán)戰(zhàn)勝卡斯帕羅夫也是這樣。1994年卡斯帕羅夫就在快棋比賽里輸給過一次人工智能,但兩年后他在不限時的正式比賽里贏了深藍(lán)。
真正被認(rèn)為人類戰(zhàn)敗,是 1997 年,升級版深藍(lán)戰(zhàn)勝卡斯帕羅夫。
換句話說,在正式比賽里打敗柯潔,AlphaGo 才能說戰(zhàn)勝最厲害的人類圍棋棋手。
看上去是沒有。
賽前深夜,柯潔在微博上發(fā)了一篇題為《最后的對決》的短文。他在文中寫道:“無論輸贏,這都將是我與人工智能最后的三盤對局。因?yàn)楝F(xiàn)在的 AI 進(jìn)步之快遠(yuǎn)超我們的想象?!?/p>
柯潔在去年李世乭與 AlphaGo 對陣中曾經(jīng)發(fā)過這樣一條微博:“就算阿法狗戰(zhàn)勝了李世石,但它贏不了我?!蹦菞l微博被轉(zhuǎn)發(fā)了三萬次。
但是在今年賽前,柯潔寫道:“我相信未來是屬于人工智能的。”
去年年末與 Master 對戰(zhàn)之后,柯潔深夜寫道:“人類數(shù)千年的實(shí)戰(zhàn)演練進(jìn)化,計算機(jī)卻告訴我們?nèi)祟惾际清e的。我覺得,甚至沒有一個人沾到圍棋真理的邊。”
但他也繼續(xù)說棋手會結(jié)合計算機(jī),邁進(jìn)全新的領(lǐng)域,達(dá)到全新的境界,就像“新的風(fēng)暴繼續(xù)來襲”。
從比賽形式上看,柯潔和 AlphaGo 的三番棋對決和去年李世乭的比賽沒什么差別——AlphaGo 調(diào)用云端的運(yùn)算資源,一位工作人員和人類旗手對坐,負(fù)責(zé)擺出棋子。
不同的是這次比賽增加了團(tuán)體賽,柯潔還會在 5 月 25 日和 5 月 27 日與 AlphaGo 再下兩盤。在 5 月 26 日,數(shù)名中國頂尖職業(yè)圍棋選手還會組成團(tuán)隊和 AlphaGo 進(jìn)行兩盤團(tuán)體和配對比賽。
實(shí)際上這一次 Alpha Go AlphaGo 背后的計算能力只有此前對戰(zhàn)李世乭那會兒的 1/10。去年戰(zhàn)勝李世乭時,AlphaGo 的程序需要依靠全世界 Google 很多機(jī)房提供計算能力。
而今天的 AlphaGo 的算力需求更小,它不再是分布式運(yùn)算,整個程序僅運(yùn)行在一個單一的云服務(wù)器 TPU 上。這是 Google 去年在開發(fā)者大會上發(fā)布的用于人工智能計算的單處理器計算機(jī),全稱是 Tensor processing unit。
從計算機(jī)消耗的能耗來看,去年李世乭相當(dāng)于面對 10 臺計算機(jī)打比賽。而今年柯潔的比賽是貨真價實(shí)的一比一對抗,AlphaGo 的程序性能提升了至少 10 倍。
這次的團(tuán)隊賽還分為兩種:一種是人類組隊對陣機(jī)器,第二種是,人和人工智能算法合作,對陣人類。
意義很明確:如果人工智能算法能夠打敗單個人類,那么用人類的集體智慧和寫作文對應(yīng)人工智能是否能贏?人+機(jī)器這樣的組合,能不能產(chǎn)生更好的結(jié)果?
這樣的比賽之前也有過。2005 年,Playchess.com 舉行了一場“自由式”象棋大賽,參賽者可以任意和其他人或者電腦組隊。通常情況下,象棋網(wǎng)站都會運(yùn)用“反作弊”算法來防止參賽者用電腦程序作弊。
重賞之下,好幾位特級大師都攜多臺電腦參加了比賽。一開始,結(jié)果不出預(yù)料。人和電腦組隊,要遠(yuǎn)遠(yuǎn)勝過最強(qiáng)的電腦?!熬蓬^蛇”(Hydra)和“深藍(lán)”一樣,是一臺專業(yè)象棋超級電腦,而面對棋力較強(qiáng)的人類選手和一臺較弱的筆記本電腦的組合,它卻敗下陣來。人類的戰(zhàn)略引導(dǎo)加上電腦精確的戰(zhàn)術(shù)計算。
但更有意思的是,最后的贏家并不是“人+高配置電腦”的組合,而是兩位美國業(yè)余選手和三臺電腦的組合。
他們的技巧是通過干預(yù)和“教導(dǎo)”,讓電腦們更深入地搜索可能的局面。這一策略不僅勝過了特級大師們對象棋的精深理解,也勝過了其它參賽者的超強(qiáng)計算能力。
“棋力較弱的人類+機(jī)器+優(yōu)化的步驟”比強(qiáng)力的電腦本身技高一籌,也優(yōu)于“棋力較強(qiáng)的人類+機(jī)器+較差的步驟”。
李世乭在去年 6 月的夏季達(dá)沃斯論壇上說,賽前自己存在判斷失誤,低估了對手的水平:
“當(dāng)時我看了它和樊麾的比賽,之后我覺得 AlphaGo 應(yīng)該不是我的對手,比較確信我會贏。但是沒想到,深度學(xué)習(xí)在六個月期間有這么大的進(jìn)步。”
他說人類和機(jī)器對弈的時候,人是處在不利地位的。AlphaGo 始終如一,沒有情緒波動,甚至也不會意識到下到第幾局、整個場面是什么情況。
“我再也不想和 AlphaGo 比賽了?!崩钍纴h說。
AlphaGo 是一款圍棋人工智能,Google 人工智能團(tuán)隊 DeepMind 創(chuàng)造了它。
DeepMind CEO 哈薩比斯今年 5 月 19 日接受 BBC 四臺采訪時表示,AlphaGo 是面向圍棋這一“狹窄領(lǐng)域”的人工智能,簡單說,雖然它能打敗世界冠軍,但 AlphaGo 也只能下棋。
說起這個,“窮舉”、“蒙特卡羅樹算法”、“深度學(xué)習(xí)”等等一大堆術(shù)語經(jīng)常出現(xiàn),但沒有這些基礎(chǔ)也能看懂。
所謂 “深度學(xué)習(xí)”,是 AlphaGo 圍棋訓(xùn)練的第一步,將人類棋譜輸入計算機(jī),學(xué)習(xí)人類的落子習(xí)慣。這種“識別”與人臉識別、圖像分類等搜索技術(shù)類似。
第一步:把棋盤分拆成小塊,輸入數(shù)據(jù)。AlphaGo 會把輸入系統(tǒng)的人類棋譜的每一步進(jìn)行分拆,棋盤上每個落子以及隨后的應(yīng)對落子算作一個樣本,AlphaGo 從這些人類棋局中分解出了三千多萬個樣本。
這些樣本集合在一起,能夠識別出每個特定的落子之后,哪一種應(yīng)對方法的概率最高,這個最高的概率其實(shí)就是人類棋手最喜歡的應(yīng)對方法。
雖然說圍棋“千古無同局”,但是局部來看還是有很多相似的模式反復(fù)出現(xiàn),AlphaGo 就學(xué)會了這些最受歡迎的下法。
第二步:亂下棋,不過比純粹亂下要好一點(diǎn)。
AlphaGo 的思考結(jié)合了蒙特卡羅樹搜索。
假設(shè)一個從來都沒下過圍棋的人,用了分身術(shù)分成兩個人開始在棋盤上亂下,最終這盤棋也會分出個勝負(fù)。
第二盤,上一盤贏的那個分身不再完全是亂下了,開始使用贏的那一盤中的一些對應(yīng),第三盤棋,第二盤贏的那個分身開始使用第一盤和第二盤中的對應(yīng)。當(dāng)?shù)?N 盤棋下完之后,這個始終贏棋的分身就會獲得最有可能獲勝的落子方法。
以上這 N 盤棋就是一步使用蒙特卡羅樹搜索的思考過程,思考結(jié)束后的下一個落子,就是被是推演過次數(shù)最多,獲勝概率最高的那一步。
AlphaGo 團(tuán)隊還改進(jìn)了以上這種傳統(tǒng)的蒙特卡羅樹搜索算法。
上面我們說過的深度神經(jīng)網(wǎng)絡(luò)得出了一套人類棋手概率最高的下法,假設(shè)蒙特卡羅樹搜索故事中那個完全不會下棋的人學(xué)習(xí)了這套下法,那么之后的“亂下”思考過程的起點(diǎn)就會提高很多。這樣一來,蒙特卡羅樹算法的計算量就減少很多,提高了效率。
第三步:AlphaGo 自己和自己下棋,來學(xué)習(xí)棋局。圍棋畢竟變化太多,AlphaGo 需要更多的棋局來學(xué)習(xí),于是通過自我對弈產(chǎn)生新的棋局。
AlphaGo 自己和自己下棋,棋力的來源就是第一步通過學(xué)習(xí)人類棋局得到的落子方法。AlphaGo 左右互搏,自我對弈幾萬盤,就能總結(jié)出贏棋概率更高的新下法,接下來再用新下法自我對弈幾萬盤,以此類推,最終得到了一套棋力比最初只學(xué)習(xí)人類下法厲害很多的新策略。
那用這新的策略和蒙特卡羅樹搜索結(jié)合是不是更厲害呢?答案卻是否。
因?yàn)槭褂酶怕蕘碛?xùn)練的這種策略會讓下法高度集中,變化太少,而蒙特卡羅樹搜索需要更多的變化才更有效。
第四步:局面評估。
這也是 AlphaGo 最厲害的地方是,它可以像人類一樣在比賽過程中估計局面的優(yōu)劣,這樣才有第四局它判斷獲勝幾率太小,選擇中盤認(rèn)輸。
當(dāng)一盤棋開始的時候,AlphaGo 先用第一步訓(xùn)練的下法下若干步,然后亂下一步,接著用第三步自我對弈訓(xùn)練產(chǎn)生的更厲害的下法下完整盤棋,然后對結(jié)果做一個評估,評估出“亂下”的那步棋造成的局面是好是壞。
AlphaGo 可以在一步的思考中亂下很多次,總有一次能匹配到真實(shí)對下棋的狀況。而對這一步亂下以及后續(xù)結(jié)果的評估,就是對當(dāng)前局面的判斷。
上一次戰(zhàn)勝李世乭的 AlphaGo,根據(jù) Deepmind 的說法,是一部運(yùn)行在云端,由全世界的 Google 機(jī)房協(xié)作運(yùn)算的人工智能。5 月 23 日 AlphaGo 戰(zhàn)勝柯潔之后,Deepmind 老大哈撒比斯說明,這一次 AlphaGo 是全新的版本,不再使用分布式計算的方案,調(diào)用的計算能力只有李世乭版本的十分之一。
具體來說,這一次的 AlphaGo 只用了一個 Google TPU 的計算能力。
Google TPU 是 Google 去年首次發(fā)布的用于人工智能運(yùn)算的專用硬件,全稱 Tensor Processing Unit,中文可以翻譯成張量處理單元,是一個飯盒大小的專用硬件。在人工智能研究里,包括 Google 在內(nèi)都在大量使用通用處理器 CPU 和圖形處理器 GPU 進(jìn)行運(yùn)算。比如曾經(jīng)公布過的一個版本的 AlphaGo,使用了 1920 個 CPU 和 280 個 GPU,取得了 Go Ratings 網(wǎng)站的 3168 等級分,世界第一柯潔的等級分為 3625。
TPU 這種專用硬件的效率比 CPU 加 GPU 快很多。
上周的 Google I/O 大會上,Google 宣布了 TPU 2.0,它具有四個專用芯片,每秒可處理 180 萬億次浮點(diǎn)運(yùn)算。64 個 TPU 可以拼在一起組成 TPU Pod,可提供大約 11500 萬億次浮點(diǎn)運(yùn)算能力。Google 同時公布了一個數(shù)字,說 Google 的大型翻譯模型如果在 32 塊性能最好的 GPU 上訓(xùn)練需要一整天,而 8 塊 TPU 就可以在 6 個小時內(nèi)完成同樣的任務(wù)。
2017 年底,Google 就會把 TPU 計算服務(wù)變成云服務(wù),全世界的人工智能研究者都可以租用這種云服務(wù),幫助加速人工智能研究。和亞馬遜等公司提供的,基于 CPU 和 GPU 的人工智能云服務(wù)相比,Google 的 TPU 更有效率優(yōu)勢,從成本上來講,也更便宜。
DeepMind 是一家成立于 2010 年、總部位于英國倫敦的初創(chuàng)公司,主要研究人工智能。2014 年 Google 以 4 億英鎊(約合 6.6 億美元)的價格打敗 Facebook,買下 DeepMind。這筆交易金額可以排進(jìn) 2014 年全球初創(chuàng)公司收購金額前十。
公司創(chuàng)始人哈薩比斯曾有過數(shù)次創(chuàng)業(yè)經(jīng)歷,最后為了創(chuàng)造一個通用的、真正能思考的人工智能,創(chuàng)辦 DeepMind。
DeepMind 的研究圍繞人工智能展開。2016 年 7 月前后,Google 用 DeepMind AlphaGo 的深度神經(jīng)網(wǎng)絡(luò),預(yù)測 Google 內(nèi)部 120 個數(shù)據(jù)中心和連帶冷卻風(fēng)扇的各個時段用電量,然后分配能源,達(dá)到控制冷卻系統(tǒng)和計算機(jī)服務(wù)器的耗電量的目的。
現(xiàn)在 DeepMind 的辦公室還在距離倫敦國王十字車站約 2 公里的一處辦公樓里,那里已經(jīng)聚集 400 多位計算機(jī)和神經(jīng)科學(xué)家。他們還計劃繼續(xù)擴(kuò)充到 1000 人。
2014 年收購英國 DeepMind 公司不是個例,Google 在最近 5 年間投資收購了不少人工智能公司,例如 api.ai、Timeful、Kaggle 等等。
從 2013 年開始到現(xiàn)在,Google 已經(jīng)收購了 16 家人工智能公司了??梢哉f是各大科技公司里收購最多、布局最早的。
主要是來自策略的轉(zhuǎn)變。Google CEO 桑達(dá)·皮蔡在 2016 年 5 月宣布將公司從“移動為先”的策略轉(zhuǎn)變成“人工智能為先”(AI First)。根據(jù) Google 員工的說法,他們已經(jīng)在公司的每一個產(chǎn)品上都應(yīng)用了機(jī)器學(xué)習(xí)的算法。
Google 買下的公司主要用于拓展現(xiàn)有業(yè)務(wù)。比如 2013 年 Google 收購了聚焦于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的初創(chuàng)企業(yè) DNNresearch,用于幫助提升圖像搜索功能。
它也收購了像 Deepmind 這樣本身發(fā)展成熟的團(tuán)隊,收購后依然保持獨(dú)立運(yùn)營。今年,Google 主要收購了一家做視覺搜索的初創(chuàng)公司 Moodstock,以及語音識別開放平臺 Api.ai。
去年 2 月,AlphaGo 在圍棋上打敗李世乭的消息,讓不少人開始關(guān)注人工智能。
而也是在這次比賽之后,Google 制定“人工智能為先”的策略,今年 5 月舉行的開發(fā)者大會上皮蔡再次強(qiáng)調(diào)這一點(diǎn),現(xiàn)場還做了不少人工智能都能做什么的演示,例如這樣的用語音控制的調(diào)酒機(jī):
更多的比賽只有營銷價值。圍棋就是終極比賽,是人腦在公平游戲里的最后防線。
這是因?yàn)閲迤灞P一共有 361 個落子點(diǎn),圍棋每一步的可能性都是天文數(shù)字,靠計算機(jī)窮舉原理上就是不可能的。其它游戲的限制少很多,人工智能更有機(jī)會依靠窮舉法取得比賽勝利。
對于把下棋當(dāng)作人工智能測試平臺的研究者來說,1997 年 IBM 超級計算機(jī)“深藍(lán)”(Deep Blue)在戰(zhàn)勝國際象棋世界冠軍加里·卡斯帕羅夫(Garry Kasparov)之后,圍棋就一直是最大的挑戰(zhàn)。
之前有報道稱 AlphaGo 要和人類選手比賽《星際爭霸 2》,你能想象人類和計算機(jī)比操控單位的速度么?
在醫(yī)療領(lǐng)域,DeepMind 已經(jīng)有所建樹,他們跟倫敦皇家免費(fèi)醫(yī)院(Royal Free London)簽訂一紙為期五年的付費(fèi)合約,處理后者 170 萬條患者記錄。
DeepMind 的第一項醫(yī)療研究是幫助醫(yī)生診斷眼部疾病,2016 年 7 月,他們宣布了與英國國民健康服務(wù)(National Health Service)的最新合作項目,與倫敦摩菲眼科醫(yī)院一起,讓人工智能幫助醫(yī)生診斷,預(yù)防眼部疾病。
這個長達(dá)五年的研究項目將利用摩菲眼科醫(yī)院超過百萬的患者數(shù)據(jù)庫,讓人工智能學(xué)會“看”眼部掃描。簡單來說就是讓人工智能把這些掃描結(jié)果全部“看”一遍,從而訓(xùn)練出能夠發(fā)現(xiàn)病變征兆的模型。
DeepMind 還被運(yùn)用在了 Google 的數(shù)據(jù)中心:幫 Google 省電費(fèi)。它那套深度神經(jīng)網(wǎng)絡(luò)被用來預(yù)測 Google 內(nèi)部 120 個數(shù)據(jù)中心和連帶冷卻風(fēng)扇的各個時段用電量,然后分配能源。據(jù)稱,現(xiàn)在整套算法能將 Google 的能源利用提高 15%。
DeepMind 還和哈佛一起研究了讀唇語的軟件,他們研發(fā)的這個唇語閱讀軟件 LipNet 準(zhǔn)確率高達(dá) 93.4%。這個準(zhǔn)確率遠(yuǎn)高于此前研發(fā)出來的其他唇語設(shè)備。
去年 11 月,DeepMind 宣布將與暴雪娛樂合作,讓人工智能學(xué)會玩《星際爭霸 II》游戲,因?yàn)榕c棋類比起來,《星際爭霸》更能模擬真實(shí)世界的混亂狀況。
對于 DeepMind 來說,無論是讓人工智能學(xué)會圍棋還是打游戲,目的都是研發(fā)“通用型人工智能”,DeepMind 創(chuàng)始人哈薩比斯去年在劍橋大學(xué)的一場演講中表示:“我們的首要使命便是解決人工智能問題;一旦這個問題解決了,理論上任何問題都可以被解決。這就是我們的兩大使命了。”
今年 3 月,省電這件事被 DeepMind 用到了公司之外,他們與英國國家電網(wǎng)公司討論,計劃用人工智能技術(shù)幫助英國節(jié)省 10%的用電量。
這個看上去有點(diǎn)明顯的問題,可以套用在很多東西上。人工智能是不是真的懂 365 種語言?人工智能是不是真的會寫詩?
哲學(xué)家 John R. Searle 在 1980 年(一段人工智能很熱的時期)提出過一個關(guān)于人工智能的思維游戲,叫“中文屋子”。
游戲假設(shè)人工智能的研究已經(jīng)可以成功造出一臺表現(xiàn)起來懂中文的電腦。它能輸入中文,然后在電腦程序的指導(dǎo)下輸出一個個中文字符。這臺電腦執(zhí)行起任務(wù)來叫人如此信服,能輕松通過圖靈測試:讓一個講中文的人以為電腦程序也是一個懂中文的人,對所有中文提問它都能給出合適的回答,因而會有人相信他們正在和一個懂中文的人聊天。
所以本質(zhì)上說,即使人工智能靠模仿騙過人類,但它對問題仍然沒有任何理解,因此不具備真正的智能。
計算機(jī)科學(xué)之父艾倫·圖靈在 1950 年首次提出了這個關(guān)于機(jī)器人是否可以思考的著名實(shí)驗(yàn):人類測試員在不知情的情況下面對計算機(jī),用文字和其交談,如果計算機(jī)成功欺騙了測試人員假裝成一個真實(shí)的人類,那么該計算機(jī)便被證實(shí)“會思考”。
后來英國皇家學(xué)會將圖靈的標(biāo)準(zhǔn)具體化:在一系列時長為 5 分鐘的鍵盤對話中,只要計算機(jī)被誤認(rèn)為是人類的比例超過 30%,那么這臺計算機(jī)就被認(rèn)為通過了圖靈測試。
一年一度的 Loebner Prize 比賽便以此標(biāo)準(zhǔn),這個大賽也早就出現(xiàn)了“通過測試”的機(jī)器人,比如 2011 年的 Cleverbot 程序達(dá)到 59% 的通過率。
2014 年還出現(xiàn)過這樣的新聞標(biāo)題《俄羅斯團(tuán)隊開發(fā)人工智能機(jī)器人,首次通過圖靈測試。》這臺名為 Eugene Goostman 的計算機(jī)被描述為“把自己偽裝成十三歲的男孩,騙過了超過 30% 的評測人員?!?/p>
Eugene Goostman 的批評者認(rèn)為,這個所謂機(jī)器人就是單純地為了通過這個 5 分鐘測試而設(shè)計的,編寫者還頗有心機(jī)地把它設(shè)定成一個 13 歲的非英語母語的小孩,以便在很多問題無法回答或者出現(xiàn)錯誤的時候,讓裁判誤以為這是因?yàn)樗挲g小而產(chǎn)生的語無倫次。也就是說,Goostman 既不是“第一個通過測試”的程序,也不是一臺人工智能機(jī)器人。
話說,想讓計算機(jī)蒙混過關(guān)并不復(fù)雜,這里還有 10 個伎倆,有興趣的話可以看看。
今天大小科技公司都在談人工智能,而神經(jīng)網(wǎng)絡(luò)計算則是說明自己技術(shù)前沿的最佳例證。當(dāng)它的原理被市場部們幾經(jīng)簡化之后,已經(jīng)變成“像人腦神經(jīng)網(wǎng)絡(luò)一樣工作”。
但是 1980 年就已經(jīng)出現(xiàn)的神經(jīng)網(wǎng)絡(luò)計算和人腦只有極為模糊的聯(lián)系。一個大問題是科學(xué)家目前根本不知道人腦里那張由無數(shù)神經(jīng)元突觸組成的網(wǎng)絡(luò)究竟是怎么“計算”的。
正如伯克利大學(xué)人工智能與機(jī)器學(xué)習(xí)專家邁克爾·喬丹(Michael I. Jordan)所說的:“我們完全不知道大腦是怎樣存儲信息和運(yùn)作的,這里頭的規(guī)則是什么?是什么算法?因此我們現(xiàn)在還不能說用大腦的理論去指導(dǎo)人工智能系統(tǒng)?!?/p>
Google(Alphabet)董事長施密特也說:“我們不認(rèn)為讓計算機(jī)模仿大腦可以去做人工智能,我覺得這個太復(fù)雜,大腦的神經(jīng)元太多了,計算機(jī)只是借助了人類大腦的一些概念?!?/p>
自我繁殖,并且在這個過程里進(jìn)化,是生命的重要一步。但這還沒實(shí)現(xiàn)。
現(xiàn)代計算機(jī)創(chuàng)始人之一約翰·馮·諾伊曼(John von Neumann)在 1940 年代就提出了機(jī)器人生產(chǎn)機(jī)器人的概念。馮·諾伊曼認(rèn)為,任何能夠自我繁殖的系統(tǒng),都應(yīng)該同時具有兩個基本功能:第一,它必須能夠構(gòu)建某一個元素,并且用這些元素組裝和自己一樣的下一代;第二,它必須能夠把對自身的描述傳遞給下一代。
曾經(jīng)有人依據(jù)這個理論提出了一個名叫 Auxons 的項目,給這個機(jī)器人安裝高溫熔爐,讓它在沙漠里獲取原料和能量。不過這個項目最終連概念圖都沒有實(shí)現(xiàn)。
這也是影視作品中的經(jīng)典設(shè)定,比如《超驗(yàn)駭客》里,德普飾演的科學(xué)家把自己的意識“上傳”到云端,繼而成為了不死的虛擬人。英劇《黑鏡》也有人死后把意識存放在云端“天堂”從而永生的故事。
但現(xiàn)在還沒有任何人有辦法移植記憶,原因在于沒人知道大腦究竟怎么存儲記憶。事實(shí)上,就連記憶存在大腦的什么地方都是未解之謎,更別提什么保存記憶了。
或者讓我們更(笨拙地)哲學(xué)一點(diǎn),到底什么才算是“記憶”?你記得的那些,還是你認(rèn)為你記得的那些?
客服。美國的第四大通信運(yùn)營商 Sprint 從去年 1 月份大刀闊斧地裁撤了 2500 名電話接線客服人員,取而代之的是能自動為客戶提供咨詢服務(wù)的 app 工具。
處理保險理賠。日本富國生命保險相互公司從今年 1 月開始,用“IBM Watson Explorer” 取代原本公司的 34 名理賠人員,他們過去的工作主要是查閱投保人的就醫(yī)記錄等文件來確定理賠錢數(shù),定損并且處理相關(guān)手續(xù),人工智能可以提高 30% 的工作效率。
資產(chǎn)管理,選股票。管理 5.1 萬億美元資產(chǎn)的全球最大投資管理公司貝萊德也在更多建立自動化流程,用人工智能來選購股票,并裁減了 30 多名分析師和基金經(jīng)理——占所在部門總?cè)藬?shù)的 7% 左右。
撰寫新聞稿。全球最大的新聞通訊社——美聯(lián)社平臺上大多涉及數(shù)字的財經(jīng)報道是與人工智能合作完成的。騰訊也推出過寫財經(jīng)和體育新聞的機(jī)器人。
用人工智能修復(fù)渣畫質(zhì)的照片。人工智能領(lǐng)域的專家 Roland Meertens 通過自己訓(xùn)練的算法將 1998 年 由 Game Boy 外置攝像頭所拍攝的渣畫質(zhì)照片修復(fù)成了彩色并且像素更高的圖片。
處理和篩選照片。Google Photos 會給你的照片自動歸類、添加濾鏡、制作相冊。
畫畫。Google 甚至用人工智能畫了抽象畫,賣出了一萬美元的價格。
翻譯。Google Translate 已經(jīng)全面引入圖像識別,把鏡頭對準(zhǔn)不認(rèn)識的文字,它會自動翻譯成目標(biāo)語言。Google 表示他們的神經(jīng)機(jī)器翻譯系統(tǒng)(GNMT) 能降低 80% 的翻譯錯誤率,并且十分接近人類譯員的翻譯水平。
駕車。特斯拉、各大車廠推出的輔助駕駛系統(tǒng),實(shí)際上相當(dāng)于一個機(jī)器人在幫你開車。Google 的完全自動駕駛也做到了全程無人。
創(chuàng)作劇本。一個叫 Benjamin 的人工智能寫了一段科幻短片,還被拍了出來參加倫敦科幻電影節(jié)的 48 小時短片制作挑戰(zhàn)賽。
日本國立情報研究所(NII)于 2011 年發(fā)起了“東大機(jī)器人計劃”(Todai Robot Project)。自 2013 年以來,團(tuán)隊每年都讓機(jī)器人在真實(shí)的考場接受演練。
在去年的中心考試(日本大學(xué)招生的統(tǒng)一考試)中,Todai 機(jī)器人排名在前 20%, 達(dá)到了超過 60% 的大學(xué)的入學(xué)標(biāo)準(zhǔn)。團(tuán)隊的目標(biāo)是,2020 年以前能讓 Todai 機(jī)器人考進(jìn)東京大學(xué)。
Todai Robot 的考試技能依靠于 AI 的檢索和優(yōu)化能力。
有趣的是,機(jī)器不會理解題目的真實(shí)內(nèi)涵。
問題是,很多人類考生也好不到哪里去。大部分學(xué)生都還停留在死記硬背的水平,像 AI 一樣不能理解、不會或者根本不仔細(xì)閱讀。
實(shí)際工作中,只會照著公司做好的流程處理問題的人并不少見。比如有的電話客服人員就只會跟著公司預(yù)先設(shè)置的 QA 回答。
同樣并不理解自己學(xué)習(xí)的技能,計算機(jī)快無數(shù)倍,還完全不會違規(guī)。人被搶走工作也是理所應(yīng)當(dāng)?shù)牧恕?/p>
美國最大的經(jīng)濟(jì)研究機(jī)構(gòu)——全國經(jīng)濟(jì)研究所(NBER,全美超過一半的諾獎經(jīng)濟(jì)學(xué)得主都曾是該機(jī)構(gòu)的成員)發(fā)布過一份報告,全面分析了 1990 到 2007 年的勞動力市場情況主要針對藍(lán)領(lǐng)工作。
他們發(fā)現(xiàn),每增加一個機(jī)器人,意味著要干掉 3 - 5.6 個本地崗位。同時薪資水平也受到影響,在 1000 名工人中每增加 1 個機(jī)器人,所有人的平均薪資將降低 0.25 - 0.5 個百分點(diǎn)。這也意味著當(dāng) 1000 人運(yùn)作的生產(chǎn)線上出現(xiàn) 20 個機(jī)器人時,留下來的工人的平均收入就會降低 5 - 10%。
這份報告針對的是自動化機(jī)器人,和 AlphaGo 這種人工智能相比還很初級。
麥肯錫根據(jù)情境模型預(yù)測認(rèn)為今天人類 50% 的工作活動將在 2055 年被自動化,因?yàn)楦鞣N影響因素和經(jīng)濟(jì)狀況的不確定性,這個時間可能會早 20 年,也可能會晚 20 年。
調(diào)查涵蓋了美國 800 多種工作崗位的 2000 多種工作,認(rèn)為當(dāng)這些工作崗位涉及收集數(shù)據(jù)、處理數(shù)據(jù)、以及可預(yù)測環(huán)境下的體力勞動這些活動最有可能被機(jī)器取代,這些崗位需要為員工提供的工資約為 2.7 萬億美元,它們在制造業(yè)、住宿和食品服務(wù)、零售領(lǐng)域最為普遍。
花旗銀行全球視角及解決方案部門曾發(fā)布一份報告稱,歐美銀行預(yù)計在 2015-2025 這十年間將會裁員 30%,數(shù)量最多將達(dá)到 170 萬人,約相當(dāng)于 6 個冰島的人口,這其中,最重要的影響因素就是 Fintech(金融科技),互聯(lián)網(wǎng)技術(shù)將越來越多地取代銀行的中介作用,消費(fèi)者直接和機(jī)器互動的時間會越來越多。
投資機(jī)構(gòu) ArkInvest 預(yù)測,接下來 20 年美國會有 7600 萬個工作崗位因?yàn)?AI 而消失,這個數(shù)字是奧巴馬執(zhí)政 8 年創(chuàng)造的工作崗位數(shù)量的 10 倍。英格蘭銀行估計,48% 的人類工作都將會被機(jī)器人和算法取代。
加拿大阿爾伯塔大學(xué)的教授喬納森·謝弗在早先接受《好奇心日報》采訪時表示:因?yàn)橐?guī)則是固定的,每步棋子可能性是有限的,下棋的能力有分?jǐn)?shù)可以評估,還有人類的對手可以和程序?qū)尽匝芯咳斯ぶ悄艿南蠕h們總是把棋牌游戲當(dāng)做是人工智能測試的最完美方式。
謝弗帶領(lǐng)的團(tuán)隊曾經(jīng)寫出了跳棋程序 Chinook,在 1995 年打敗人類冠軍。
跳棋:1992 年,跳棋程序 Chinook 挑戰(zhàn)跳棋高手馬里恩·廷斯利(Marion Tinsley),戰(zhàn)敗。1995 年,Chinook 再次挑戰(zhàn),6 局平手,之后廷斯利因病退賽,Chinook 最終取得了冠軍?,F(xiàn)在 Chinook 已經(jīng)不會輸(跳棋容易平局)。
國際象棋:卡斯帕羅夫 1985 年連續(xù)跟 32 臺電腦下棋并取得勝利、1996 年 4:2 戰(zhàn)勝深藍(lán),但在 1997 年,卡斯帕羅夫 2.5:3.5 敗給深藍(lán)。
圍棋:AlphaGo 在 2015 年 5:0 戰(zhàn)勝樊麾;2016 年 3 月以 3:1 戰(zhàn)勝李世乭;2017 年 5 月,暫時 1:0 領(lǐng)先柯潔。
確實(shí)如此。
可以參考國際象棋比賽里,人工智能和象棋大師卡斯帕羅夫的對弈。
卡斯帕羅夫不只是世界冠軍,他在很長一段時間被認(rèn)為是人類歷史上最厲害的棋手。
即便在卡斯帕羅夫退役后,他的定級分也等了 8 年才被目前的世界冠軍,挪威棋手芒努斯·卡爾森(Magnus Carlsen)超過——而早已變成政治運(yùn)動家的卡斯帕羅夫從 2009 年就開始幫著培訓(xùn)卡爾森。
1989:深思 vs. 卡斯帕羅夫
臺灣學(xué)生許峰雄(Feng-Hsuing Hsu),寫了一個象棋程序深思(Deep Thought),由此開始了一個慣例,即在程序前加個前綴“deep”來表示它運(yùn)行在并行處理器上。比賽中,電腦根本不是對手。
1994:Fritz, Genius 在快棋賽 vs. 卡斯帕羅夫
1994 年上半年,英特爾在慕尼黑組織了可能是史上最強(qiáng)的閃電戰(zhàn)大賽,有 17 名特級大師參加。Fritz 最后和卡斯帕羅夫并列第一。在復(fù)賽中,卡斯帕羅夫 4:1 大勝。
英國人 Richard Lang 編寫的程序 Geniu 舉行的英特爾職業(yè)國際象棋聯(lián)合會拉力賽中戰(zhàn)勝卡斯帕羅夫,并把他淘汰出局。不過那是 25 分鐘的快棋賽。
1996:深藍(lán) VS 卡斯帕羅夫
許峰雄加入 IBM,和協(xié)作程序員莫雷·坎貝爾(Murray Campbell)開發(fā)深藍(lán)。首局深藍(lán)獲勝,但之后卡斯帕羅夫兩和、三勝打敗深藍(lán)。
1997 深藍(lán) vs帕羅夫
1997 年版本的深藍(lán)運(yùn)算速度為每秒 2 億步棋,是其 1996 年版本的 2 倍。1997 年 6 月,深藍(lán)在世界超級電腦中排名第 259 位。一個說法是,深藍(lán)可搜索及估計隨后的 12 步棋,而一名人類象棋好手大約可估計隨后的 10 步棋。
最后卡斯帕羅夫以 1 勝、2 負(fù)、3 和,總比分 2.5:3.5 輸?shù)袅吮荣悺T僦?,就沒有人類象棋冠軍能在正式規(guī)則比賽中打贏人工智能。
在國際象棋領(lǐng)域,卡斯帕羅夫被深藍(lán)戰(zhàn)勝之后一樣,一個人機(jī)對戰(zhàn)的時代結(jié)束了,一個人與電腦一起探索棋力的時代開始了。
人工智能的勝利,并不意味著這門游戲的終結(jié),它幫助提升了棋手的水平,廉價、智能的國際象棋軟件也吸引到了更多的人來參與這項運(yùn)動。
卡斯帕羅夫之后,國際象棋界仍然有明星誕生,克拉姆尼克、阿南德和近年最耀眼的卡爾森,都是普通人可能聽說過的名字。
十多年來,提供計算機(jī)和大量數(shù)據(jù)分析,已經(jīng)成為國際象棋頂級賽事的常規(guī)服務(wù),頂級國際象棋選手也越來越多借助超級電腦制定競賽計劃。前國際象棋世界冠軍阿南德曾表示:“電腦對于提高(國際象棋)水平有很大幫助?!?/p>
尤其是用電腦進(jìn)行開局的準(zhǔn)備。國際象棋特級大師王皓告訴《好奇心日報》,他們平時都會依靠軟件訓(xùn)練,比賽結(jié)束之后也會用計算機(jī)分析棋局。
2014 年,23 歲的挪威人馬格努斯·卡爾森衛(wèi)冕國際象棋世界冠軍之后,《金融時報》發(fā)表了一篇題為《卡爾森:戰(zhàn)勝電腦的國象大師》的文章,這并不是說那場賽事有計算機(jī)選手參賽,而是說卡爾森的對手們都習(xí)慣用超級計算機(jī)來計算開局,卡爾森則不像他的對手們那樣依賴計算機(jī)分析??柹淖龇?,已經(jīng)成了特例。
在深藍(lán)戰(zhàn)勝人類國際象棋大師之后的十幾年后,不使用計算機(jī)的人類棋手成為了罕見的特例。但是卡爾森也曾接受過人工智能的訓(xùn)練,他也被認(rèn)為是所有人類棋手中最接近電腦的棋手。
可以想象,圍棋的未來也會是類似的方向。
去年年末與 Master 對戰(zhàn)之后,柯潔深夜寫道:“人類數(shù)千年的實(shí)戰(zhàn)演練進(jìn)化,計算機(jī)卻告訴我們?nèi)祟惾际清e的。我覺得,甚至沒有一個人沾到圍棋真理的邊。”
但他也繼續(xù)說棋手會結(jié)合計算機(jī),邁進(jìn)全新的領(lǐng)域,達(dá)到全新的境界,就像“新的風(fēng)暴繼續(xù)來襲”。
圍棋,應(yīng)該也不會例外。只是未來不會再有超越電腦的圍棋大師,只會有最接近電腦的棋手。
1950 年代的黑客馬文·明斯基被普遍認(rèn)為是人工智能之父,他在去年年初去世。這里有關(guān)于他的報道。
另一位從如何看待“思考”考慮人工智能的先驅(qū)則是計算機(jī)之父阿蘭·圖靈。1950 年,圖靈寫了一份關(guān)于機(jī)器思考的論文,叫做“機(jī)器會思考嗎?”,里面提到了一個測試機(jī)器是否有“感覺”的方法,簡單來說就是讓人透過屏幕跟機(jī)器聊天,看看能否判斷屏幕背后的是真人還是機(jī)器,這個方法后來被稱作是“圖靈測試”。
他的圖靈測試是多年來人工智能研究者的目標(biāo),2015 年,首次人工智能算法通過了圖靈測試。
話說回來,圖靈還是世界上第一個象棋計算機(jī)程序的創(chuàng)作者。不過當(dāng)時他的程序沒有計算機(jī)有足夠的計算能力去執(zhí)行,每下一步棋需要 30 分鐘。
人工智能研究在高潮和低谷之間不斷交替。
第一次低谷出現(xiàn)在 1974-1980 年,這時候人工智能研究開始遭遇批評,隨之而來研究所缺少資金支持。批評主要集中在,研究者們過于樂觀,承諾無法兌現(xiàn)。美國英國政府這期間停止向沒有明確目標(biāo)的人工智能研究項目撥款。
第二次在 1987-1993 年這一輪低谷主要在于人工智能商業(yè)化的失敗。受到日本政府研究規(guī)劃的刺激,美國政府和企業(yè)再次在人工智能領(lǐng)域投入數(shù)十億美元的研究經(jīng)費(fèi),但到了 80 年代末他們重新撤回了投資。一個征兆在于,1987 年的硬件市場需求下跌同時 XCON 等最初大獲成功的專家系統(tǒng)維護(hù)費(fèi)用居高不下。
到了 80 年代晚期,戰(zhàn)略計算促進(jìn)會決定大幅削減對人工智能的資助,認(rèn)為人工智能不是“下一個浪潮”。到 1991 年,人們發(fā)現(xiàn)十年前日本宏偉的“第五代工程”也并沒有實(shí)現(xiàn)。
據(jù)彭博社,2015 年是 AI 的里程碑年份,Google 內(nèi)部應(yīng)用 AI 的項目從 2012 年的“零星幾個”擴(kuò)展到 2700 個。
2016 年,超過 30 個公司說要做自動駕駛。由于數(shù)據(jù)和人才的關(guān)系,人工智能是一個大公司占優(yōu)的關(guān)系。但行業(yè)內(nèi)的大公司都在積極收購。根據(jù) The Information ,過去兩年時間收購人工智能公司最多的是 Google,買了 9 家公司,包括 AlphaGo。接著是蘋果買了 5 家人工智能創(chuàng)業(yè)公司,以及同樣買了 4 家人工智能公司的英特爾和 Twitter。
2012 年到 2015 年,在代表計算機(jī)智能圖像識別最前沿發(fā)展水平的 ImageNet 競賽(ILSVRC)中,參賽的人工智能算法在識別準(zhǔn)確率上突飛猛進(jìn)。 2014 年,在識別圖片中的人、動物、車輛或其他常見對象時,基于深度學(xué)習(xí)的計算機(jī)程序超過了普通人類的肉眼識別準(zhǔn)確率。
這一次浪潮背后, 是機(jī)器學(xué)習(xí)在商業(yè)產(chǎn)品上的應(yīng)用,現(xiàn)在它可以解決實(shí)際問題了。Google 工程師杰夫·迪恩(Jeff Dean)說:“我認(rèn)為在過去 5 年,最重大的突破應(yīng)該是對于深度學(xué)習(xí)的使用。這項技術(shù)目前已經(jīng)成功地被應(yīng)用到許許多多的場景中,從語音識別到圖像識別,再到語言理解。而且有意思的是,目前我們還沒有看到有什么是深度學(xué)習(xí)做不了的。希望在未來我們能看到更多更有影響力的技術(shù)?!?/p>
實(shí)際上最積極推動人工智能的公司,已經(jīng)把 AI 放進(jìn)可用的產(chǎn)品之中、解決各種日常問題了。Google 不僅要知道你搜索過什么,還能看懂你上傳的圖片內(nèi)容。亞馬遜用人工智能幫助推薦商品、調(diào)整定價。整個 Facebook 上,用戶看到什么信息也都是由人工智能決定。這些看上去突然對人工智能熱衷起來的公司,已經(jīng)投入了多年研發(fā)。
在今年的 Google I/O 開發(fā)者大會上,Google 公司的 CEO 桑達(dá)·皮蔡解釋了未來戰(zhàn)略:“我們將會在人工智能和機(jī)器學(xué)習(xí)上加大賭注?!薄耙?yàn)樯疃葘W(xué)習(xí)的優(yōu)勢,我們現(xiàn)在可以讓圖片、視頻變得更有用了。”
這樣的發(fā)言不少,很多科技公司都會聲稱自己進(jìn)入了人工智能領(lǐng)域,靠深度學(xué)習(xí)。
傳統(tǒng)程序是根據(jù)事件條件,給出結(jié)果?!皺C(jī)器學(xué)習(xí)”的定義是不用明確編寫程序,就能讓計算機(jī)學(xué)習(xí)——讓機(jī)器大量接觸數(shù)據(jù),自己從中找到規(guī)律,改進(jìn)判斷。而深度學(xué)習(xí)則是機(jī)器學(xué)習(xí)里最熱門的分支,被認(rèn)為推動了這次人工智能躍進(jìn)。
“深度學(xué)習(xí)就是一種人工智能學(xué)習(xí)技術(shù),通過把大量數(shù)據(jù)‘喂’進(jìn)系統(tǒng),嘗試自己建立模型,通過模型自己做決定,就像我們現(xiàn)在認(rèn)為的人類大腦工作的原理那樣?!庇査固卮髮W(xué)計算機(jī)科學(xué)教授、IEEE 安全技術(shù)專家,專門研究計算機(jī)網(wǎng)絡(luò)和系統(tǒng)凱文·科倫(Kevin Curran)在早先的采訪中這么對《好奇心日報》解釋深度學(xué)習(xí)是什么。
具體到 AlphaGo 身上。深度學(xué)習(xí)是通過審視記憶來做出決定的,因?yàn)?AlphaGo 已經(jīng)看過那么多的例子,接下來深度神經(jīng)網(wǎng)絡(luò)中會自動權(quán)衡重要性然后進(jìn)一步做出決定。
所以說,深度學(xué)習(xí)是通過審視記憶來做出決定的,因?yàn)?AlphaGo 已經(jīng)看過那么多的例子,接下來深度神經(jīng)網(wǎng)絡(luò)中會自動權(quán)衡重要性然后進(jìn)一步做出決定。
之前開發(fā)跳棋應(yīng)用打敗所有人類的計算機(jī)教授喬納森·謝弗用地圖來解釋深度學(xué)習(xí)的工作方式:
你可以把它想象成一個帶有點(diǎn)和連接的網(wǎng)絡(luò)吧。就像一個地圖一樣,我們假設(shè)城市是點(diǎn),然后連接是路。
我們來假設(shè)這地圖上的連接會動態(tài)變化。例如,本來從 A 到 B 點(diǎn)只需要走 10 分鐘,但現(xiàn)在看著這條路的實(shí)時路況,系統(tǒng)自動調(diào)整了時間,例如上下班高峰期 13 分鐘,其他時間 9 分鐘。這就是一個學(xué)習(xí)的例子。更進(jìn)一步說,這個網(wǎng)絡(luò)還可以建新的路,所以 A 和 B 之間的最佳路徑還可能會改變。
對應(yīng)到 AlphaGo 上,每一個“城市”就是一個知識點(diǎn),他們之間連接的“路”就是知識與知識之間的連接。想象使用一個地圖在城市中導(dǎo)航,每個城市的計算價值,是連接它的路數(shù)量的總和。同樣的,一個知識點(diǎn)的價值,也依賴于它的連接情況。
當(dāng)我們看紙質(zhì)地圖的時候,這個地圖是二維的。然后想想兩張地圖疊在一起,在地圖上不同的連接也交織著。AlphaGo 使用的是十三層的網(wǎng)絡(luò),所以也能讓不同的知識點(diǎn)有更多連接的可能。
在一場圍棋比賽中的特定時刻,有些知識點(diǎn)會使用,而另一些則不會。就像是你能去某一些城市,另外一些則禁止你入境一樣。知道這些信息,會改變“城市點(diǎn)”的連接情況,更會改變這個城市的連接價值——這也就是每一個棋步的來源。
一方面,人工智能取代人類就業(yè)的報告一個接一個。
網(wǎng)景創(chuàng)始人、著名風(fēng)險投資人Marc Andreessen認(rèn)為,“就像今天我們大多數(shù)人都從事著 100 年前不存在的工作一樣,100 年后也會是如此。”
目前來看人類的某些技能機(jī)器很難復(fù)制,比如常識、適應(yīng)性和創(chuàng)造力。麻省理工學(xué)院的經(jīng)濟(jì)學(xué)家 David Autor 說,“即使是實(shí)現(xiàn)了自動化的工作崗位,常常也需要人工的參與,比如自動化麻醉設(shè)備旁邊,就需要有醫(yī)生值守協(xié)助操作?!?/p>
再比如用機(jī)器人為新聞媒體寫稿,這并沒有導(dǎo)致記者數(shù)量的減少。人工智能寫的只是需要速度但不需要深入分析的東西,比如體育比賽結(jié)果快訊、以及不那么模板一致的公司財報快訊。它們做了許多人沒有精力做的工作,讓有經(jīng)驗(yàn)的記者去寫更有價值的報道。
但如果沒有經(jīng)歷低價值的“笨工作”的訓(xùn)練,剛走出學(xué)校的人又有多少能一下獲得經(jīng)驗(yàn)、找到一個不能被人工智能替代的高級工作呢?
未來學(xué)家馬丁·福特(Martin Ford)在今年的 TED 大會做了一場演講,為我們描述了一個人工智能主導(dǎo)社會生產(chǎn)的社會。
從積極的一面來看,人們有了更多的時間休閑,有更多時間來陪伴家人,這似乎是我們現(xiàn)在努力追求的東西,但是問題也出現(xiàn)了。
未來或許人類可以接受沒有工作,或者只領(lǐng)少許的薪水,但是這一切都會給社會造成經(jīng)濟(jì)壓力,因?yàn)槿祟悰]有有工作、或者只擁有少量收入,消費(fèi)能力就就會減弱,從現(xiàn)有的社會經(jīng)濟(jì)制度來看,社會產(chǎn)品和通貨緊縮,容易造成社會動蕩。
福特認(rèn)為,我們必須在傳統(tǒng)的工作中找到分離收入的辦法,在他看來,最好的解決方案是從保證最低收入開始,這么做很可能會變得必不可少。
但是需要在基本工資的基礎(chǔ)上增加“獎勵機(jī)制”,鼓勵那些沒有工作的人去完成教育、參加社區(qū)服務(wù),因此獲得更多的獎勵薪資。更重要的是,人們要知道如何在不需要工作的社會里還能找到生活的意義和滿足感。
而這一切都需要社會的機(jī)制、體系進(jìn)行改革和重塑,不會是件容易事。
福特的觀點(diǎn)可以看他的暢銷書《機(jī)器人時代:技術(shù)、工作與經(jīng)濟(jì)的未來》。
這三位都在最近表示過對人工智能的擔(dān)憂。
史提芬·霍金:“我們已經(jīng)擁有原始形式的人工智能,而且已經(jīng)證明非常有用。但我認(rèn)為人工智能的完全發(fā)展會導(dǎo)致人類的終結(jié)?!?/p>
埃隆·馬斯克:“我們需要萬分警惕人工智能,它們比核武器更加危險?!?/p>
比爾·蓋茨:“如果我們處理得好,人工智能具有積極意義……我同意伊隆·馬斯克和其他一些人的說法,不明白為什么有些人并不關(guān)心。”
去年 4 月,馬斯克和美國初創(chuàng)公司孵化機(jī)構(gòu) Y Combinator 成立了一個非營利組織 OpenAI,準(zhǔn)備籌集 10 億美元的資金,去對抗人工智能可能會帶來的問題。
去年 9 月,亞馬遜、Facebook、Google、IBM 和微軟五家公司在去年 9 月聯(lián)合發(fā)起人工智能聯(lián)盟 Partnership on AI,旨在努力減輕公眾對于正在學(xué)習(xí)自主思考的機(jī)器的恐慌?;谶@五個巨頭的共識,這一行業(yè)聯(lián)合組織制定了一系列用于工程開發(fā)和科學(xué)研究的基本道德標(biāo)準(zhǔn)。
科幻小說家阿西莫夫在 1942 提出了著名的“機(jī)器人三定律”:機(jī)器人不得傷害人類,或因不作為使人類受到傷害;除非違背第一法則,機(jī)器人必須服從人類的命令;在不違背第一及第二法則下,機(jī)器人必須保護(hù)自己。
但這只是阿西莫夫的設(shè)想,不是各國軍隊的共識。事實(shí)上機(jī)器可以輕而易舉地決定人類的生死。目前在全球已經(jīng)有超過 30 個國家配備了“致命性自主武器系統(tǒng)”,未來戰(zhàn)爭的一些區(qū)域可能是人工智能在自主決定是否射殺屏幕上出現(xiàn)的運(yùn)動物體。
美國國防部已經(jīng)在實(shí)驗(yàn)讓無人機(jī)自己判斷地面上誰是需要被消滅的敵人。
從軍隊角度,人工智能決定生死有諸多好處,比如它效率更高、幾乎一定比人更準(zhǔn)確,并且殺人不會有負(fù)罪感和戰(zhàn)后創(chuàng)傷。這引起巨大爭議。2013 年 5 月,由它引發(fā)的道義、倫理、人權(quán)問題首次被提到聯(lián)合國人權(quán)理事會。但這并不是一場一邊倒的爭論,阿西莫夫的三定律不一定是我們將會面對的未來。
用 MIT 斯隆商學(xué)院研究員?Michael Schrage 的話說,“如果庫布里克再拍《奇愛博士》,他會拍這些自動化的武器?!?/p>
來源 好奇心日報
烏鎮(zhèn)圍棋峰會第二天,DeepMind聯(lián)合創(chuàng)始人及CEO哈薩比斯、DeepMind首席程序員席爾瓦和歐洲圍棋冠軍樊麾接受采訪。哈薩比斯稱:”AlphaGo后面的支撐技術(shù)很多,在其他領(lǐng)域使用還在早期階段。在其他領(lǐng)域的使用,只是AlphaGo一部分技術(shù)。以后會推廣AlphaGo技術(shù),也會在中國推廣?!惫_比斯認(rèn)為人類應(yīng)該正確使用人工智能,造福全人類,不要用來研發(fā)武器,而要應(yīng)用于科學(xué)、制藥等領(lǐng)域,應(yīng)該全人類共享而不是少數(shù)幾家公司獨(dú)享。
席爾瓦稱:“這次比賽的目的是探索圍棋疆界,讓頂尖人類棋手和頂尖人工智能強(qiáng)強(qiáng)聯(lián)合,類似于讓兩位偉大藝術(shù)家共同創(chuàng)造一個藝術(shù)品,配對賽和團(tuán)隊賽就是這個目的。同時,AlphaGo使用的高效算法是通用型的,也可以應(yīng)用到各個領(lǐng)域。”
樊麾則盛贊AlphaGo像是來自未來200年之后的棋手穿越到今天在給我們展示如何下棋。
]]>在昨日AlphaGo戰(zhàn)勝柯潔后,Deepmind首席程序員席爾瓦表示,戰(zhàn)勝柯潔的AlphaGo Master比一年前戰(zhàn)勝李世石的AlphaGo Lee強(qiáng)三個子。
對此,柯潔再次在微博上感慨對手的強(qiáng)大,“我到底是在和一個怎樣可怕的對手下棋”。
柯潔微博全文如下:
早就聽說新版alphago的強(qiáng)大....
但...讓...讓三個?我的天
這個差距有多大呢?簡單的解釋一下就是一人一手輪流下的圍棋,對手連續(xù)讓你下三步...又像武林高手對決讓你先捅三刀一樣...
我到底是在和一個怎樣可怕的對手下棋...
]]>5月23日下午消息,柯潔與谷歌人工智能AlphaGo的第一場比賽剛剛結(jié)束,AlphaGo以四分之一子領(lǐng)先贏得首場勝利。
雙方第一場比賽耗時4小時17分37秒,其中柯潔用時2小時46分43秒,AlphaGo用時1小時30分54秒。
與以往AlphaGo大優(yōu)局面獲勝不同,柯潔在今天的比賽表現(xiàn)很好,最后官子階段,AlphaGo都未取得非常明顯的優(yōu)勢。
柯潔執(zhí)黑先行,在比賽前半段時間,柯潔表現(xiàn)的較為輕松,40分鐘時還展露出微笑。但在比賽進(jìn)行到3小時的時候,柯潔的表情開始變得凝重,并頻繁的揪頭發(fā)、托腮。
本場比賽的解說員、中國圍棋協(xié)會秘書長華以剛分析稱,柯潔每次一開始揪頭發(fā),就說明棋局出現(xiàn)了一些問題。
相較于去年李世石與AlphaGo的比賽,本次比賽在時間分配上有所變化。當(dāng)時李世石與AlphaGo比賽是每方2小時,1分鐘讀秒5次,而這次是每方用時3小時,1分鐘讀秒5次。
從比賽過程來看,時間增長是對柯潔有利。AlphaGo落子速度非常快,有些棋子甚至做到了“秒下”,所以時間對于AlphaGo來說并不重要。
在第一場比賽中,柯潔的下法已經(jīng)針對AlphaGo做出一些調(diào)整,很多落子的方法都沒有按照傳統(tǒng)的套路。
在華以剛看來,這也是AlphaGo給圍棋界帶來的創(chuàng)新和改變,讓棋手的思路變得更加開闊,更加追求圍棋本質(zhì)。
烏鎮(zhèn)圍棋峰會為期五天,從5月23日開始,柯潔還將與AlphaGo在25日、27日展開另外兩場比賽。
此外,圍棋峰會還安排了配對賽和團(tuán)體賽。配對賽中,古力和連笑將分別與AlphaGo組隊進(jìn)行對抗。而團(tuán)體賽中,五位中國頂尖職業(yè)棋手將組團(tuán)對戰(zhàn)AlphaGo。
]]>5月23日消息,中國烏鎮(zhèn)圍棋峰會今天正式拉開帷幕。圍棋世界冠軍柯潔九段及參加團(tuán)隊賽配對賽的七位頂尖選手和Alphabet執(zhí)行董事長施密特、Deepmind創(chuàng)始人哈薩比斯以及谷歌大中華區(qū)總裁石博盟都出席了開幕式。
國家體育總局棋牌運(yùn)動管理中心主任羅超毅表示:“中國棋手在去年第一次人機(jī)大戰(zhàn)后,一直在學(xué)習(xí)alphago的棋法,并表示感謝alphago為圍棋帶來的新思路?!?/p>
Alphabet執(zhí)行董事長施密特稱:“人性終將制勝,科學(xué)家通過駕馭AI可以探索光靠電腦或人腦做不到的事情。這也是人機(jī)智能共同協(xié)作時代的開啟?!?/p>
Deepmind創(chuàng)始人哈薩比斯表示:”本次比賽的宗旨是探索新的圍棋打法。alphago再過一萬年也不可能窮盡所有圍棋的定式。這次比賽其實(shí)不是人機(jī)大戰(zhàn),而是人類使用電腦作為工具探索新的東西,就像哈勃望遠(yuǎn)鏡讓人類發(fā)現(xiàn)新的領(lǐng)域一樣。人工智能可以幫助專家以更快的速度解決問題。本次比賽的目的也不是alphago還是棋手贏,最終還是人類贏。祝柯潔好運(yùn)。 ?“
不管怎樣,一場世界頂尖棋手和世界頂尖人工智能的對決即將重新書寫人類的歷史,讓我們共同關(guān)注接下來的每一場比賽,見證科技改變世界的力量。
柯潔九段昨日在廈門大學(xué)速勝李欽誠九段,助國旅聯(lián)合廈門隊以2比2主將勝蘇泊爾杭州隊。賽后柯潔接受了采訪,表示下周面對AlphaGo時要拼搏,奮戰(zhàn)到死。5月23、25、27日,烏鎮(zhèn)圍棋峰會上,世界排名第一的柯潔將與人工智能AlphaGo進(jìn)行三場對決。
問:有了上一次的對局結(jié)果,很多人對“人機(jī)大戰(zhàn)”的結(jié)果比較悲觀。
柯潔:很多人內(nèi)心都認(rèn)為我會輸,我覺得也會非常艱難,不過讓我服的話,只有在棋盤上狠狠摁倒我。至少我也要給對手施加壓力。包括Master60盤棋,真是非常厲害,很多招法都超越我們甚至好幾千年。幾乎每位棋手都是安樂死,前百手就不行了,沒什么抵抗。半目勝負(fù)也是AlphaGo大幅退讓后的結(jié)果,所以輸多輸少沒什么意義。我也學(xué)習(xí)AlphaGo的先進(jìn)思想,以前它很多招法看上去還覺得像人類,現(xiàn)在的招法給人感覺就是很“仙”。
問:古力認(rèn)為“人機(jī)大戰(zhàn)”人的勝率為10%,你自己覺得呢?
柯潔:聽上去還比較客觀,有的人更極端。我只是覺得概率沒什么意義,輸了就是百分之百輸,贏了就是百分之百贏。我就盡力去拼搏,讓大家覺得比賽很有意思。
問:人工智能招法是否值得借鑒?
柯潔:AlphaGo肯定是有自己邏輯的,包括很多沒必要的交換,其實(shí)是要減少變化。我也在理解它的招法,有些招法試了試,發(fā)現(xiàn)效果還可以。它的招法都是建立在大量對局的基礎(chǔ)上。比如快棋中,人類不知不覺就輸了,因?yàn)榕袛嗖磺宄笮?,而AlphaGo則判斷很清楚,每一步都比你走得大。
問:之前你在網(wǎng)上與化名Master的AlphaGo對弈,感覺如何?
柯潔:與Master下第一盤時殺得很激烈,感覺對手非常厲害。第二盤我執(zhí)黑,幾乎百手就不行了。下第三盤時,得知是美國公司研發(fā)的AI,就想肯定是AlphaGo。第一盤不知對手是誰,心態(tài)還好,后面因?yàn)橹缹κ植皇侨?,心態(tài)就壞了。當(dāng)時也吃不下飯,后來就住院了。
問:人類棋手對AlphaGo的差距是否能縮小?
柯潔:人不可能追得上電腦。開個玩笑,除非有黑客停止電腦的自我學(xué)習(xí)能力,否則AlphaGo一會功夫就自我對局成千上萬盤。
]]>