回到頂部

讓孩子做AlphaGo的朋友還是對(duì)手？

疾風(fēng)齒輪

2011

2017-10-21 01:10 轉(zhuǎn)載 · 圖片7

(轉(zhuǎn)載者評(píng)：作為一名技術(shù)出身的爸爸，我比較認(rèn)可2040-2050年人工智能會(huì)達(dá)到當(dāng)前人類智力水平的主流說法，之后迅速進(jìn)入超越人類智力的境地。這一輩子真沒少開眼，30年后機(jī)器人與真人混雜相處，之后超級(jí)智能的世界會(huì)是啥樣子難以想象。人類在AI面前，將如同白癡一般無法預(yù)測(cè)對(duì)方動(dòng)向。如此，活在當(dāng)下，讓孩子具有尋找快樂的能力，也許比眾多知識(shí)和技能更重要。)

2017-10-20 水木少兒編程

就在昨天（2017.10.19）

AlphaGo再次登上世界頂級(jí)科學(xué)雜志《自然》

它不依靠任何外部經(jīng)驗(yàn)，從零開始，自學(xué)圍棋

它只學(xué)了三天時(shí)間，就碾壓了AlphaGo的前期版本

它的名字叫做AlphaGo Zero

即使剔除所有艱深的專業(yè)詞匯和技術(shù)要點(diǎn)

AlphGo Zero還是深深的震撼了大家

尤其是我們這些家有學(xué)童的娃爸娃媽

很簡(jiǎn)單

這家伙太會(huì)學(xué)習(xí)了

而且越來越會(huì)學(xué)習(xí)

未來世界

是我們的孩子和這些AI超級(jí)學(xué)霸共處的世界

孩子的未來之路該怎么走呢？

三更起五更睡、懸梁刺股，跟AI死磕硬杠？

模仿AI的學(xué)習(xí)方式，努力成為一個(gè)人肉AI？

只管享受AI世界的便利，安心淪為“無用階層”？

在選擇之前

我們不妨先看看人家AI學(xué)霸是怎么學(xué)習(xí)的

我們?cè)谟邢薜目破瘴恼轮袑ふ抑虢z馬跡

似乎找到了一些線索

但坦白說，又不是很肯定

因此，以下內(nèi)容

不是人類老師面對(duì)機(jī)器學(xué)生的總結(jié)和評(píng)價(jià)

而是人類學(xué)渣面對(duì)機(jī)器學(xué)霸的癡心和仰望

AlphaGo Zero簡(jiǎn)介

從資料中可以看出， AlphaGo Zero并非AlphaGo Master（戰(zhàn)勝柯潔的AlphaGo版本）的簡(jiǎn)單升級(jí)。它是全新的、甚至是革命性的。

其革命性具體表現(xiàn)為四點(diǎn)：

? 真正從零開始學(xué)習(xí)，不需要任何外部經(jīng)驗(yàn)做基礎(chǔ)

? 自己發(fā)現(xiàn)并掌握了全新的圍棋定式

? 將策略網(wǎng)絡(luò)和值網(wǎng)絡(luò)合并，降低計(jì)算復(fù)雜度的同時(shí)全面提高計(jì)算效率

? 使用全新的深度殘差網(wǎng)絡(luò)機(jī)制全面超越原有的多層神經(jīng)網(wǎng)絡(luò)機(jī)制

（好吧，必須承認(rèn)：關(guān)于四點(diǎn)細(xì)節(jié)，我只是科普文章的搬運(yùn)工……）

科普搬運(yùn)完畢

我們正式開始以學(xué)渣的身份揣摩這名學(xué)霸的學(xué)習(xí)經(jīng)驗(yàn)

（Google實(shí)驗(yàn)室里的AlphaGo電腦聽到這里，估計(jì)會(huì)用風(fēng)扇“噗呲”“噗呲”的笑兩聲）

白板理論（Tabula rasa）

白板理論（Tabula rasa）是一種著名的哲學(xué)觀點(diǎn)，它催生的學(xué)習(xí)理念認(rèn)為沒有被事先涂畫過的白板一樣的學(xué)習(xí)者反而更容易通過訓(xùn)練和成長(zhǎng)獲得新知識(shí)與高智力。

白板理論明顯是違背自然規(guī)律的。自然界不但有傳幫帶的老傳統(tǒng)，甚至將最重要的知識(shí)寫在了生物的基因里。我們?nèi)祟惥褪嵌讶怂粯佣殉隽爽F(xiàn)在的高度。

AlphaGo前期版本在學(xué)習(xí)前也理所當(dāng)然的被事先灌輸了海量的人類圍棋棋局，然后在這些信息基礎(chǔ)之上再去機(jī)器學(xué)習(xí)?；揪褪窍劝袮lphaGo搬到巨人肩膀上的節(jié)奏。

AlphaGo Zero則完全沒有被灌輸任何知識(shí)，一切從零開始，第一次實(shí)現(xiàn)并驗(yàn)證了絕對(duì)意義上的白板教育。

事實(shí)證明：人類在很多領(lǐng)域積累的浩瀚無邊的知識(shí)，在AI學(xué)霸眼里，可能只是一張模糊無用的便簽紙。

無監(jiān)督學(xué)習(xí)（Unsupervised Learning）

AlphaGo 早期版本奉行監(jiān)督學(xué)習(xí)（Supervised Learning），就是所謂的“玉不琢不成器”。有事沒事的讓師傅點(diǎn)撥指導(dǎo)一下。拿分辨貓狗的AI來說，準(zhǔn)備幾千張照片，手把手教機(jī)器哪張照片是貓，哪張照片是狗，機(jī)器再分辨貓狗的細(xì)節(jié)（從毛發(fā)到眼睛到耳朵）。然后舉一反三的去判斷一張它從沒見過的照片是貓是狗。

AlphaGo Zero 的無監(jiān)督學(xué)習(xí)（Unsupervised Learning）則是“清水出芙蓉、天然去雕飾”。完全讓機(jī)器去自己摸索和發(fā)現(xiàn)規(guī)律。人的已有經(jīng)驗(yàn)或許能幫助機(jī)器掌握智能，但搞不好人的經(jīng)驗(yàn)是有缺陷的，會(huì)把AI帶到溝里。干脆讓機(jī)器自己發(fā)現(xiàn)新的，更好的規(guī)律。

事實(shí)證明，人類在很多領(lǐng)域傳承千年的寶貴經(jīng)驗(yàn)，在AI學(xué)霸眼里，可能就是劉姥姥去大觀園后廚指導(dǎo)燒茄子。