來源:知識分子
撰文 | 張崢(亞馬遜云計算上海人工智能研究院院長)
“盡管中國古代對人類科技發(fā)展做出了很多重要貢獻(xiàn),但為什么科學(xué)和工業(yè)革命沒有在近代的中國發(fā)生?” 這就是著名的李約瑟之問。從李約瑟在上世紀(jì)三十年代提出這個問題,時間已經(jīng)過去了近一百年,雖然李約瑟問題還經(jīng)常被提起,但困擾我們的是一個新版本:為什么當(dāng)代中國不能從0到1,只能從1做到無窮大?換句話說,為什么步入資訊通達(dá)的二十一世紀(jì),中國始終缺乏原始創(chuàng)新?
前一陣朋友圈里讀到吳國盛老師的一篇文章,指出”一個國家的綜合科技實力,由基礎(chǔ)研究、應(yīng)用研究、面向市場的開發(fā)研究三方面組成,如果其中一個是短板,那么科技實力是偏頗的?!?nbsp;
針對中國缺乏原創(chuàng)這個現(xiàn)象,吳老師認(rèn)為我們對基礎(chǔ)研究和基礎(chǔ)學(xué)科缺乏正確的認(rèn)識,我們的文化缺少對科學(xué)、真理和創(chuàng)造的支持,更多從功利角度、實用角度來看待科學(xué)。
吳老師的這個觀點(diǎn),可以在知識分子上刊登的另一篇熊衛(wèi)民老師的文章里得到一部份佐證。熊文分析了中國科學(xué)家為什么選擇了中國特色的“人工合成生命”系列研究,從而錯失分子生物學(xué)革命的各種原因。(見文章“中國為何會錯失分子生物學(xué)革命?”)他指出,從1958年到1977年近二十年間,除了冷戰(zhàn)階段和國際同行脫軌的國際原因之外,中國反對“為科學(xué)而科學(xué)”,強(qiáng)調(diào)理論聯(lián)系實際,經(jīng)常性的批判基礎(chǔ)研究,由非科學(xué)家主導(dǎo)研究。
從無線電、計算機(jī)、互聯(lián)網(wǎng)的發(fā)明,
我們能學(xué)到什么?
吳老師文章里舉了三個例子,無線電、計算機(jī)和互聯(lián)網(wǎng)。我們不妨對這它們的起源和發(fā)展軌跡做些分析。
無線電發(fā)明極簡史 麥克斯韋方程組被稱為人類歷史上最偉大的公式。這位英國物理學(xué)家在十九世紀(jì)六十年代把人類對電磁現(xiàn)象的認(rèn)識歸結(jié)為漂亮的四個微分方程,并預(yù)見到電磁波的存在。二十年后,德國物理學(xué)家赫茲設(shè)計了一套簡單的電磁波發(fā)生器和一個檢測器,于1887年,成功地用實驗驗證了電磁波的存在,電磁波從理論上的可能性變成可見、可測量、可量化的實驗現(xiàn)象。有意思的是,對這一個巨大的突破,赫茲本人固執(zhí)地認(rèn)為一點(diǎn)實用價值都沒有。
1894年,也就是赫茲去世的那年,愛科學(xué)愛折騰的意大利年輕富二代馬可尼,偶然讀到了電氣雜志上赫茲的實驗介紹和論文,馬上想到無線電可以用來編碼傳遞信息。和他同時競爭的英國同行一開始認(rèn)為無線電和可見光一樣,傳播路徑上必須沒有遮擋。偏偏非科班出身、基礎(chǔ)并不扎實的馬可尼無知無畏,在家里動手裝了一個簡陋的裝置,用無線電波打響了樓下的電鈴。他不停改進(jìn)設(shè)備,在發(fā)射和接收端裝上天線。1895年秋天,他將實驗轉(zhuǎn)移到室外,通信距離增大到2.8千米,不但打響電鈴,而且還在紙帶上記錄莫爾斯電碼。
無線電商用化的障礙在于,有線通信已經(jīng)非常成熟,最早的海底話纜已于1891年英法海峽敷設(shè)。當(dāng)時一個最有希望的應(yīng)用是海上救援,尤其在夜晚和迷霧中。馬可尼沒能說服忙于鋪設(shè)電纜的意大利政府,不得已前往英國集資成立公司。在一連串近乎賭博的瘋狂實驗之后,于1901年成功驗證了跨大西洋的傳輸,距離3500公里。1912年4月15號,泰坦尼克號撞上冰山,相距近六十海里的Carpathia號花了近17分鐘接受和解析出求救信號,最終七百多人獲救。馬可尼的設(shè)備,立了大功。
計算機(jī)發(fā)明極簡史 要說計算機(jī)如何成為一門科學(xué),離不開英國科學(xué)家圖靈和圖靈機(jī)。那么,圖靈機(jī)又怎么來的?事實上,圖靈機(jī)的發(fā)明是一個意外。1900年,被譽(yù)為歐洲數(shù)學(xué)界的教皇的大數(shù)學(xué)家希爾伯特,在巴黎國際數(shù)學(xué)大會上的演講中提出了23個有待解決的數(shù)學(xué)難題,為20世界的數(shù)學(xué)發(fā)展制訂了計劃。圖靈對其中的第十個問題的更一般化的形式感興趣:能不能按照一串機(jī)械化的步驟——我們現(xiàn)在通稱為“算法”——來判斷一個數(shù)學(xué)陳述是正確的?這就是希爾伯特的“可判定性”問題的泛化版。
圖靈意識到,為了解決這個問題,他首先得構(gòu)造出一個抽象的機(jī)器來執(zhí)行這些步驟,這個抽象的機(jī)器就是圖靈機(jī),簡單到只有一條無限長的紙帶和一個讀頭,讀頭能讀寫紙帶上的字符并且移動。這個圖靈機(jī)所做的就是執(zhí)行證明數(shù)學(xué)陳述的步驟。然后圖靈進(jìn)行了一個巧妙的轉(zhuǎn)換,把可判定問題轉(zhuǎn)換成圖靈機(jī)能不能停,隨后構(gòu)造了一個巧妙的悖論,證明有可能停不下來,也就是說不可判定的情況是存在的。
在這個過程中,圖靈隨手給出了一個通用機(jī)的版本,這個機(jī)器可以把做證明用的那臺圖靈機(jī)的算法作為輸入,因此可以變身成任何算法的執(zhí)行者。這個抽象的計算機(jī),完全是圖靈為了證明可判定性問題的副產(chǎn)品,卻不意間奠定了計算機(jī)的基礎(chǔ)。
然而,要不是需要破譯德軍密碼,圖靈機(jī)的思想不可能那么快落地,計算機(jī)在曼哈頓計劃后期也被投入使用。戰(zhàn)后不久,計算和存儲分離的馮諾伊曼結(jié)構(gòu)成型,至今仍是主流框架,但是軟硬件一直在不斷迭代發(fā)展,在云里從超級計算機(jī)到服務(wù)器集群,在云下從工作站到個人計算機(jī)到今天的智能手機(jī)、智能手表。同時,計算機(jī)作為一門新興學(xué)科分出諸多大類(人工智能、算法和理論、體系結(jié)構(gòu)、操作系統(tǒng)、數(shù)據(jù)庫、軟件工程、計算機(jī)語言、人機(jī)界面、計算機(jī)安全……),每大類又有諸多子類,層層疊疊。比如單看人工智能之下自然語言處理這一“小”支,要是細(xì)分到底層子任務(wù),就有幾十個,每年三四個頂會,每個會議都有上千篇文章。
互聯(lián)網(wǎng)發(fā)明極簡史 戰(zhàn)后,計算機(jī)被投入商用和科學(xué)計算,但都是獨(dú)立使用,互不相連。事實上,要是單考慮效率,最好的方案是把計算資源堆積在一起,傾力打造一個超極計算機(jī)。把超級計算機(jī)用網(wǎng)絡(luò)連起來,有兩個動因。第一是“怕”,在冷戰(zhàn)的大背景下,一個指揮中心萬一被一顆核彈擊中,整個系統(tǒng)就癱瘓了;第二是方便分散在各處的研究者合作。這些原因催生了一開始只有四個大計算節(jié)點(diǎn)的ARPANet,也催生了兩個新領(lǐng)域:計算機(jī)網(wǎng)絡(luò)和分布式系統(tǒng)。90年代左右由美國美國國家科學(xué)基金會(NSF)資助的NSFNet取代ARPANet成為主干網(wǎng),伯克利大學(xué)開發(fā)的TCP/IP作為標(biāo)準(zhǔn)協(xié)議,形成網(wǎng)絡(luò)效應(yīng),接入眾多局域網(wǎng),互聯(lián)網(wǎng)的“基建”——因特網(wǎng)(Internet)隨之逐步成熟、穩(wěn)定。
但真正讓互聯(lián)網(wǎng)火爆起來的卻源自一個古老的應(yīng)用:文檔管理。把文件存放在一層層的文件夾里很簡單也最基本,但論文可能互相引用,對研究者不方便。在一篇文章里埋下鏈接,讓用戶一鍵跳轉(zhuǎn)到另一篇相文檔,就是超文本。超文本有很長的發(fā)展時間,但相對小眾,蒂姆·伯納斯-李1980年在日內(nèi)瓦的歐洲核子研究組織(CERN)擔(dān)任獨(dú)立承包人,也建了一個超文本原型,已方便研究人員分享及更新訊息。
蒂姆·伯納斯-李之所以被稱為“互聯(lián)網(wǎng)之父”,在于他在1991年提出、實現(xiàn)并規(guī)范化了一個回頭看幾乎理所當(dāng)然的想法:把超文本網(wǎng)絡(luò)化:點(diǎn)擊鏈接可以跳轉(zhuǎn)到存放在另一臺機(jī)器上的文檔。這種被網(wǎng)絡(luò)化的文件,就是我們現(xiàn)在熟知的網(wǎng)頁,格式稱作HTML。到1995年,微軟發(fā)布了一個Windows95,這是一個里程碑,因為它支持了TCP/IP,廣大的PC用戶可以上網(wǎng)了。就這樣,因特網(wǎng)+HTML+廣大PC用戶,萬維網(wǎng)終于爆發(fā)式增長,大量的網(wǎng)絡(luò)應(yīng)用又推動了服務(wù)器產(chǎn)業(yè),也發(fā)展出搜索引擎、云服務(wù)、社交網(wǎng)絡(luò)等等現(xiàn)象級的新產(chǎn)業(yè)。
從“紙上談兵”的萬能圖靈機(jī),赫茲的相距最多不過幾米的震蕩器和天線,發(fā)展到上致星鏈、下致腦機(jī)接口、萬物互聯(lián)無往不在,真正是走過了千山萬水,包括了有無數(shù)個原創(chuàng),中國在其中的缺席,十分刺眼和醒目。
原始創(chuàng)新是怎樣發(fā)生的?
面對和歐美原創(chuàng)的巨大差距,這些年有不少人提出要重提上世紀(jì)八十年代恢復(fù)高考之后的一句流行的口號,“學(xué)好數(shù)理化,走遍天下都不怕”。這是一個簡化也是比喻,但背后藏著一個重要的假設(shè),指數(shù)理化這些傳統(tǒng)科學(xué)才是基礎(chǔ)科學(xué)。其實,這是對前沿科學(xué)不了解的一種體現(xiàn)。
原創(chuàng)之源一定出自基礎(chǔ)科學(xué)嗎? 這似乎理所當(dāng)然——就像熊老師的文章里分析的,錯失分子生物學(xué)這個新基礎(chǔ)研究,讓中國科學(xué)家丟了二十多年。但有意思的是,例外也不少。馬可尼于1909年獲得諾獎,而無線電訊號能超遠(yuǎn)距離傳播是因為電離層反射的這個原理,卻一直要等到1924年,他之所以敢于走向市場并領(lǐng)先英國的競爭對手,是因為他用簡陋的設(shè)備打響了樓下的電鈴;大語言模型的很多基本工作原理,到現(xiàn)在都還在研究之中,但是大思路并沒有問題,也足以引爆市場。在這些糧草未到而車馬先行的案例中,基礎(chǔ)科學(xué)更像是事后諸葛,其作用在于提供更深入的認(rèn)識,發(fā)現(xiàn)可能的優(yōu)化點(diǎn),推動下一輪的進(jìn)步,而每一個進(jìn)步,都有原創(chuàng)的可能。
科學(xué)技術(shù)發(fā)展到現(xiàn)在,已經(jīng)從一棵樹,成為根脈纏繞、野蠻生長的一片林,而且很多樹還在不停的生長;越往上越年輕,越前沿,越不穩(wěn)定,也是產(chǎn)生新知識最活躍的地方。這個盤根錯節(jié)、互相勾連的復(fù)雜網(wǎng)絡(luò),在它的每一個結(jié)點(diǎn)的內(nèi)部也分支龐雜,互相勾連和依賴。
面對這個復(fù)雜網(wǎng)絡(luò),“基礎(chǔ)”二字如果沒有指明上下文,不但模糊,甚至無意義。因此,把“0到1”這一截看成基礎(chǔ)科學(xué)的獨(dú)有之地,望文生義,過于簡單。我經(jīng)常碰到中國同學(xué)數(shù)學(xué)基本功很扎實,可是計算機(jī)科學(xué)里的基礎(chǔ)卻掌握得卻不全面,導(dǎo)致做起研究來磕磕絆絆。
從0到1的原創(chuàng),需要基礎(chǔ)科學(xué)研究的素質(zhì),但不見得必須發(fā)端于基礎(chǔ)科學(xué)。
總體而言,原創(chuàng)需要想象力和行動力的結(jié)合,從理論上的“虛用”一步步走向“實用”。一個常見的爭議點(diǎn)是,發(fā)生原創(chuàng)必須摒棄功利心嗎?原創(chuàng)的必要條件是要有用。“有用”很多時候是實用,帶動市場來換取更多的資源,卻也可以是“虛用”,比如圖靈機(jī)就是一個概念機(jī),赫茲的實驗也只驗證了電磁波存在的驗證。如果我們討論原創(chuàng)的動力,言必回避功利心沒有必要,因為有無功利心并不重要:把對世界的認(rèn)識推進(jìn)一大步,或者大力釋放了生產(chǎn)力,都是值得我們認(rèn)可和尊重的好工作。馬可尼就是一個功利心特別重的一個冒險家,愛迪生也是,馬斯克更是。即便愛因斯坦,可能很多人不知道他名下有不少專利,其中包括一個無疾而終的冰箱設(shè)計。
此外,我們還應(yīng)該看到運(yùn)氣和時機(jī)的重要性,比如海上救援之于無線電,二戰(zhàn)之于計算機(jī),網(wǎng)絡(luò)和超文本之于互聯(lián)網(wǎng),數(shù)據(jù)和算力之于基于深度學(xué)習(xí)的人工智能……我相信這也適用于其他領(lǐng)域,比如新冠病毒之于mRNA技術(shù)。
總的來說,我認(rèn)為原創(chuàng)從來不會在一個沒有用的上下文中發(fā)生;新知識的獲取、新學(xué)科的誕生并不見得因為天天在追問宇宙奧秘是什么,也不見得因為數(shù)學(xué)大廈里又添了一條新公式??吹接杏茫吹奖仨氁?,都是原創(chuàng)的源泉;圖靈并沒有想要去發(fā)明圖靈機(jī),圖靈機(jī)只是他去解一個數(shù)學(xué)問題時不得不需要“順手”發(fā)明的一個工具。
培養(yǎng)下一代的原創(chuàng)能力,
需要什么樣的教育?
回到我們一開始的問題,中國為什么沒有原創(chuàng),為什么沒法做到從0到1呢?如果自頂向下的推動,我們首先就會遭遇一個“燈下黑”的問題:如果我們承認(rèn)中國鮮有原創(chuàng)成果,那就找不到有原創(chuàng)經(jīng)驗和經(jīng)歷的專家來咨詢。
或許我們可以思考一下從教育的角度來說,需要培養(yǎng)一些什么素質(zhì):
批評性思維。這是中國教育的老問題了。一個只獎勵標(biāo)準(zhǔn)答案、不鼓勵學(xué)生去挑戰(zhàn)現(xiàn)成答案的教育環(huán)境,只可能抹殺而不是催生批評性思維。和這相關(guān)的是對權(quán)威的盲目崇拜。即便對諾獎得主,正常的評價應(yīng)該就是“as good as their last work”,學(xué)術(shù)上絕對平等,沒什么不能被挑戰(zhàn)。
愛提問題不見得就是具有批判性思維,因為問題的形式無非就那幾種:為什么?憑什么?是又如何?等等。最要緊的是提出好問題,有好奇心也可以問出很無厘頭的問題,瞎問甚至不如不問。
這需要我們掌握:
第一性原理。也就是說要有穿透力,關(guān)心最基本的條件和假設(shè),不要被表面的酷炫、不必要的細(xì)節(jié)迷惑。每一行都有自己的第一性原理,只有在參透了相關(guān)的基礎(chǔ)科學(xué)才能把握住,把握好了才能問出好問題。馬斯克傳里提到他在SapceX的研制中要求液態(tài)燃料的溫度壓到最低,使得燃料倉體積最小,給火箭減重,這就是堅持第一性原理的體現(xiàn),在他看來,只要物理規(guī)則沒被打破,沒有不能打破的現(xiàn)有規(guī)矩。
想象力和行動力的結(jié)合。堅持在第一性原理指導(dǎo)下的批評性思維,能讓我們看清、挖深,但不見得一定會往前走一步,因為那需要,想象力和行動力的結(jié)合。有想象力沒有行動力,只能做鍵盤俠,有行動力沒有想象力,只能等別人立了標(biāo)桿之后“趕超”。在開源已經(jīng)是常態(tài)的現(xiàn)在,甚至可以說是習(xí)慣性地“敢抄”。中國在人工智能領(lǐng)域的文章都占了40%,但無論阿爾法圍棋還是大模型,沒有貢獻(xiàn)出步子大一點(diǎn)的突破,等別人文章或者代碼放出來了才發(fā)急追趕。
要培養(yǎng)這些素養(yǎng)并不容易。原創(chuàng)能力的培養(yǎng),分布在不同學(xué)科之中。
比如說,行動力在工科和商科,想象力、創(chuàng)造力在設(shè)計和藝術(shù),批判性思維在哲學(xué)和歷史,而第一性原理又和具體的專業(yè)方向緊相關(guān),等等。很難想象專門成立一個科目,叫原創(chuàng)學(xué)科,但不管如何,單一的某個??坪茈y涵蓋應(yīng)該是不爭的事實。
如果我們?nèi)タ茨切╊I(lǐng)導(dǎo)原創(chuàng)的領(lǐng)袖人物,會發(fā)覺他們基本是靠自己的努力,自覺去采集來自不同學(xué)科的營養(yǎng),馬斯克大學(xué)后兩年轉(zhuǎn)去賓州大學(xué)念物理,就是因為他認(rèn)識到不懂物理的工程師不是好工程師。
我們在這里討論如何培養(yǎng)原創(chuàng)力,和如何設(shè)計面向未來的通識教育課程本質(zhì)上是同一個問題。今年上半年,我受邀回母校復(fù)旦參加了一次相關(guān)會議上,且把我的觀點(diǎn)作為本文的結(jié)語,并期待更多的討論:
通識教育不是簡單的讓學(xué)生懂科學(xué)、懂人文和懂藝術(shù)。不同的專業(yè)訓(xùn)練會培養(yǎng)不同的“專業(yè)通識”。比如,科學(xué)家們相信紛繁復(fù)雜的現(xiàn)象背后存在著簡潔明快、具有強(qiáng)預(yù)測力的模型;工程師認(rèn)為魔鬼在于細(xì)節(jié),他們對復(fù)雜性有著深刻的理解,在工作中致力于打造完美平衡細(xì)節(jié)和性能的產(chǎn)品;藝術(shù)和人文類從業(yè)者最關(guān)注敘事結(jié)構(gòu),敘事能力和敘事自由;金融類人才關(guān)心投入和產(chǎn)出,對人的非理性的理解甚至超過心理學(xué)家…… 每一種專業(yè)通識是各自領(lǐng)域的神器,從而深刻影響一個人的世界觀和方法論。
目前的教育系統(tǒng)存在兩個問題,第一,因為教育資源的嚴(yán)重不均衡,很多孩子被擋在高等教育之外,沒有機(jī)會接觸到專業(yè)通識,第二,幸運(yùn)的孩子們層層選拔進(jìn)入大學(xué)后,又必然進(jìn)入各個專業(yè),多年歷練下卻只擁有單一的視角。
因此,專業(yè)通識既不相通,也不通用,更不能下沉作為普惠教育的一部分,這樣的教育顯然不再適應(yīng)未來的發(fā)展。
本文肯定不能全面回答題目所拋出的問題,權(quán)作拋磚引玉,希望更多的同道中人共同討論中國從零到一的原始創(chuàng)新難題。