(轉(zhuǎn)載者評(píng):作為一名技術(shù)出身的爸爸,我比較認(rèn)可2040-2050年人工智能會(huì)達(dá)到當(dāng)前人類智力水平的主流說法,之后迅速進(jìn)入超越人類智力的境地。這一輩子真沒少開眼,30年后機(jī)器人與真人混雜相處,之后超級(jí)智能的世界會(huì)是啥樣子難以想象。人類在AI面前,將如同白癡一般無法預(yù)測(cè)對(duì)方動(dòng)向。如此,活在當(dāng)下,讓孩子具有尋找快樂的能力,也許比眾多知識(shí)和技能更重要。)
2017-10-20 水木少兒編程
就在昨天(2017.10.19)
AlphaGo再次登上世界頂級(jí)科學(xué)雜志《自然》
它不依靠任何外部經(jīng)驗(yàn),從零開始,自學(xué)圍棋
它只學(xué)了三天時(shí)間,就碾壓了AlphaGo的前期版本
它的名字叫做AlphaGo Zero
即使剔除所有艱深的專業(yè)詞匯和技術(shù)要點(diǎn)
AlphGo Zero還是深深的震撼了大家
尤其是我們這些家有學(xué)童的娃爸娃媽
很簡(jiǎn)單
這家伙太會(huì)學(xué)習(xí)了
而且越來越會(huì)學(xué)習(xí)
未來世界
是我們的孩子和這些AI超級(jí)學(xué)霸共處的世界
孩子的未來之路該怎么走呢?
三更起五更睡、懸梁刺股,跟AI死磕硬杠?
模仿AI的學(xué)習(xí)方式,努力成為一個(gè)人肉AI?
只管享受AI世界的便利,安心淪為“無用階層”?
在選擇之前
我們不妨先看看人家AI學(xué)霸是怎么學(xué)習(xí)的
我們?cè)谟邢薜目破瘴恼轮袑ふ抑虢z馬跡
似乎找到了一些線索
但坦白說,又不是很肯定
因此,以下內(nèi)容
不是人類老師面對(duì)機(jī)器學(xué)生的總結(jié)和評(píng)價(jià)
而是人類學(xué)渣面對(duì)機(jī)器學(xué)霸的癡心和仰望
AlphaGo Zero簡(jiǎn)介
從資料中可以看出, AlphaGo Zero并非AlphaGo Master(戰(zhàn)勝柯潔的AlphaGo版本)的簡(jiǎn)單升級(jí)。它是全新的、甚至是革命性的。
其革命性具體表現(xiàn)為四點(diǎn):
? 真正從零開始學(xué)習(xí),不需要任何外部經(jīng)驗(yàn)做基礎(chǔ)
? 自己發(fā)現(xiàn)并掌握了全新的圍棋定式
? 將策略網(wǎng)絡(luò)和值網(wǎng)絡(luò)合并,降低計(jì)算復(fù)雜度的同時(shí)全面提高計(jì)算效率
? 使用全新的深度殘差網(wǎng)絡(luò)機(jī)制全面超越原有的多層神經(jīng)網(wǎng)絡(luò)機(jī)制
(好吧,必須承認(rèn):關(guān)于四點(diǎn)細(xì)節(jié),我只是科普文章的搬運(yùn)工……)
科普搬運(yùn)完畢
我們正式開始以學(xué)渣的身份揣摩這名學(xué)霸的學(xué)習(xí)經(jīng)驗(yàn)
(Google實(shí)驗(yàn)室里的AlphaGo電腦聽到這里,估計(jì)會(huì)用風(fēng)扇“噗呲”“噗呲”的笑兩聲)
白板理論(Tabula rasa)
白板理論(Tabula rasa)是一種著名的哲學(xué)觀點(diǎn),它催生的學(xué)習(xí)理念認(rèn)為沒有被事先涂畫過的白板一樣的學(xué)習(xí)者反而更容易通過訓(xùn)練和成長(zhǎng)獲得新知識(shí)與高智力。
白板理論明顯是違背自然規(guī)律的。自然界不但有傳幫帶的老傳統(tǒng),甚至將最重要的知識(shí)寫在了生物的基因里。我們?nèi)祟惥褪嵌讶怂粯佣殉隽爽F(xiàn)在的高度。
AlphaGo前期版本在學(xué)習(xí)前也理所當(dāng)然的被事先灌輸了海量的人類圍棋棋局,然后在這些信息基礎(chǔ)之上再去機(jī)器學(xué)習(xí)?;揪褪窍劝袮lphaGo搬到巨人肩膀上的節(jié)奏。
AlphaGo Zero則完全沒有被灌輸任何知識(shí),一切從零開始,第一次實(shí)現(xiàn)并驗(yàn)證了絕對(duì)意義上的白板教育。
事實(shí)證明:人類在很多領(lǐng)域積累的浩瀚無邊的知識(shí),在AI學(xué)霸眼里,可能只是一張模糊無用的便簽紙。
無監(jiān)督學(xué)習(xí)(Unsupervised Learning)
AlphaGo 早期版本奉行監(jiān)督學(xué)習(xí)(Supervised Learning),就是所謂的“玉不琢不成器”。有事沒事的讓師傅點(diǎn)撥指導(dǎo)一下。拿分辨貓狗的AI來說,準(zhǔn)備幾千張照片,手把手教機(jī)器哪張照片是貓,哪張照片是狗,機(jī)器再分辨貓狗的細(xì)節(jié)(從毛發(fā)到眼睛到耳朵)。然后舉一反三的去判斷一張它從沒見過的照片是貓是狗。
AlphaGo Zero 的無監(jiān)督學(xué)習(xí)(Unsupervised Learning)則是“清水出芙蓉、天然去雕飾”。完全讓機(jī)器去自己摸索和發(fā)現(xiàn)規(guī)律。人的已有經(jīng)驗(yàn)或許能幫助機(jī)器掌握智能,但搞不好人的經(jīng)驗(yàn)是有缺陷的,會(huì)把AI帶到溝里。干脆讓機(jī)器自己發(fā)現(xiàn)新的,更好的規(guī)律。
事實(shí)證明,人類在很多領(lǐng)域傳承千年的寶貴經(jīng)驗(yàn),在AI學(xué)霸眼里,可能就是劉姥姥去大觀園后廚指導(dǎo)燒茄子。
強(qiáng)化學(xué)習(xí)(Reinforcement Learning)
AlphaGo Zero 還有一項(xiàng)法寶,就是采用強(qiáng)化學(xué)習(xí)(Reinforcement Learning)的學(xué)習(xí)方式。
學(xué)習(xí)過程中時(shí)刻評(píng)估自己,效果好了就自我獎(jiǎng)勵(lì),效果不好就自我懲罰??梢哉f時(shí)刻都是在實(shí)踐、反思、修正和再實(shí)踐的道路上高速跑圈。
這個(gè)本領(lǐng)人類也會(huì)啊。但絕大多數(shù)人是拿腿跑圈兒,極少數(shù)人類歷史上的頂級(jí)學(xué)霸,也頂多算是“肉的bike”。人家AI學(xué)霸是4個(gè)電的TPU(Tensor Processing Unit)。
可以說,人類引以為豪的專注、勤奮、進(jìn)取和自我驅(qū)動(dòng),在AI學(xué)霸眼里,已經(jīng)可笑到讓我想不出任何貼切的比喻來形容了。
不早教、不輔導(dǎo)、不上學(xué)而思……散養(yǎng)、自驅(qū)、聰明又努力……(這樣的學(xué)霸真心有點(diǎn)惹人厭)
一天,學(xué)霸從床底下翻出一盒黑白小石頭子兒
那就玩玩吧
于是,開始了它從無知到無敵的驚人學(xué)習(xí)
3天后,AlphaGo Zero以100:0狂虐了AlphaGo Lee(戰(zhàn)勝李世石的版本)
20天后,AlphaGo Zero超越AlphaGo Master(戰(zhàn)勝柯潔的版本)
40天后,AlphaGo Zero已經(jīng)在這個(gè)星球獨(dú)孤求敗而不得
它一個(gè)人
幾天時(shí)間
走完了整個(gè)人類圍棋史
更可怕的
人類圍棋所有的開局、收官、定式它都摸索了出來
而它自創(chuàng)的新的定式,人類卻聞所未聞
AI就像一種更高維度的生物
它們能掙脫時(shí)間軸的束縛
短短幾天,就跨越人類千年
面對(duì)這樣的學(xué)霸
怎么硬杠?
怎么模仿?
出路或許只有一個(gè)
掌握AI的運(yùn)行規(guī)則
學(xué)會(huì)與AI交流的方式
跟AI學(xué)霸做朋友
甚至
干脆就做一名未來AI的設(shè)計(jì)者?
未來的主題只有一個(gè)
學(xué)習(xí)
學(xué)習(xí)將不再是為了生活
學(xué)習(xí)本身就是生活
未來已來
學(xué)習(xí)
從現(xiàn)在就開始
(Duang~Duang~Duang~霸氣硬廣時(shí)間到,現(xiàn)在 劃!重!點(diǎn)?。?/p>
為了孩子的未來,請(qǐng)即刻點(diǎn)擊
《水木少兒編程免費(fèi)啟蒙計(jì)劃》