3月30日,2019中國(深圳)IT領袖峰會在深圳市五洲賓館舉行,CEG Ventures 創始管理合伙人王維嘉通過解釋“暗知識”概念,分析為什么人類無法理解AlphaGo的神奇。
以下為王維嘉現場分享:
大家好,我是IT領袖峰會最早的發起人之一,在過去的幾年中,主要在硅谷投資人工智能,與此同時我也在思考最基本層面的東西。圖靈獎前兩天發給了三位科學家,他們在人工智能里面是聯結主義的代表,聯結主義就是我們所說的神經網絡。神經網絡學派在美國一直被打壓,最后他們就跑到了加拿大。
這三個人都在加拿大,一個在谷歌,一個在Facebook,還有一個留在加拿大教書,叫Yoshua Bengio,這是我最佩服的三位中的一位。因為大公司去挖他們其中任何一位,給出的都是幾千萬美金的身價。但他說如果都去公司了,誰在學校做研究,誰培養下一代,所以他堅持在學校里教書。
今天我就講一下聯結學派的認識論的基礎。聯結學派到底是什么?從AlphaGo下圍棋開始,大家知道柯潔在后臺痛哭流涕,這引起了人類的兩種反應:一種是否認,另外一種是迷茫。
為什么AlphaGo對我們有這么大的震撼?有了AlphaGo以后,它從頭開始,不用學習人類任何的棋譜,并戰勝了前面所有的AlphaGo的類型,而且到今天為止天下無敵。這告訴我們一件事情,就是訓練數據不一定有用,在某些場合甚至是有害的,比如在圍棋里面是有害的,人類的知識是在束縛AlphaGo的知識。這種不可理解性給我們人類帶來了巨大的震撼。去年年底DeepMind在科學雜志上發表了一篇文章,只要你告訴我蛋白質的DNA,我就可以算出蛋白質的三維結構來。我們所有的生命都是由細胞組成的,細胞的基本組成就是蛋白質。
為什么AlphaGo可以發現蛋白質三維結構?沒有人說得清楚,不光聶衛平不懂,連谷歌設計AlphaGo的工程師也說不清楚為什么每一步棋這么走。于是在AI領域有一個重要的問題叫做不可解釋性。這提出了一個很尖銳的問題,怎么可能有一種知識是我們人類不能理解的呢?我認為存在著第三類知識,就是人類不可理解的知識,下面就跟大家回顧一下我們人類認識世界的歷史。
過去2000年來,人類認識歷史、認識世界大概分成兩派,一派是理性主義,一派是經驗主義。他們分別是這么認為的:理性主義說人的概念是天生的,有時間、空間。知識是來自推理,萬事都是有因果的。經驗主義認為不對,我們生下來所有的知識都是后天得來的。但是不一定是因果,僅僅是相關,你只不過看到一件事發生在另外一件事的前面,不代表它就是它的原因,很可能是隱蔽的原因你根本不知道,或者復雜到你根本找不出來,所以只能說它們是相關的。
理性主義和經驗主義的爭論,為什么這么多年沒有結果?原因在于人們當時根本不理解大腦是怎么工作的,甚至認為心是思考的器官。今天我們可以站在人類科學最新的基礎上回過頭來看他們錯在哪里。
我們每個人的大腦大概有860-1000億神經元,每一根神經元大概有五六千個軸突和樹突,和相鄰的神經元連接。神經元是怎么工作的呢?一個神經元和另一個神經元之間有連接,它們之間有一個很小的縫隙,這個縫隙之間有化學的分子通過。比如我們大家聽過血清素、多巴胺這樣的分子,它通過之后就會在相鄰的神經元細胞上產生電位,這個電位就激活了下一個神經元細胞。所以神經元細胞的工作原理,我們今天已經揭示清楚了。
有三位科學家為神經元的發現做出了重大的貢獻:
第一位科學家是德國科學家巴甫洛夫,我們大家都非常熟悉的條件反射就是由他提出的。
第二個偉大的科學家是西班牙的卡哈爾,他從顯微鏡下看到了神經元的連接。
最大的突破是由加拿大的科學家赫布發現的,他在1949年提出了一個天才的猜想:如果兩個神經元同時受刺激,它們兩個神經元會連接起來。比如說狗的嗅覺聞到了香味,同時刺激了口水,與此同時耳朵聽到了鈴聲,這時候鈴聲和口水細胞就建立了聯系。那下一次哪怕鼻子聞不到香味,只要聽到鈴聲就可以把口水細胞激活。這聽上去非常簡單的原理,就是我們今天人類所有學習的基本原理。1949年以后,大量的科學實驗反復證明了他這個猜想,所以今天我們叫做“赫布學習定律”。
我們今天看到的不論是AlphaGo也好,還是自動駕駛也好,還是人臉識別也好,它最基本的單位就是電子路模仿神經元。今天所有基于神經網絡的神經元的基本工作原理就是這么簡單。1957年,Rosenblatt做了第一個神經元。我斯坦福的導師在1960年做了第一個自適應線性神經元,我在跟他做博士研究的時候就做神經網絡的研究,但是老人家從1959年一直到今天從來沒有改變他的方向,這個冷板凳一直坐到今天,終于坐出來了。但是有多少人這個冷板凳一生都坐不出來,這就是科學家對知識的追求。
機器學習的工作原理,具體來講就是把它的輸出和目標值相比變成一個目標的誤差,這個誤差我畫成曲線的,像山一樣的,目的是讓誤差最小化。我如果要從山腰上走到山底下,怎么走呢?有一個最笨的方法,叫做大霧里頭下山法。比如你去爬山,周圍都是大霧,你只能看到眼前5米,你怎么下山,怎么走到最低的地方?很簡單,轉360度,找到一個最陡的方向往前走5米,再轉360度再找到一個最陡的方向往前走5米,只要你這樣走,只要函數是連續的,只要沒有斷崖,只要沒有大溝,你一定可以用這個最笨的方法走到山谷去。這就是最陡梯度下降法,今天所有的神經網絡算法都是基于最陡梯度下降法。
我們現在就可以總結一下神經網絡的本質是什么。每個神經元的工作原理非常簡單,一個乘法器、一個加法器,然后用一個連線,但是要有很多神經元。我剛才手里抱著的盒子,整個盒子里只有一個神經元,今天的機器,一個芯片上可以有多個神經元,因為今天跟1959年相比計算速度增長了10億倍都不止。
重要的是,這樣一個復雜的系統沒有解析器,它是一個高階的方程。大家記住它的本質,它是一頭牛,吃進去的是數據,提取出來的是相關性。神經網絡的本質就是在數據里面提取相關性,這就是我們人類學習的重要基礎。比如我教小孩認識英文字母O,這個學習過程是什么呢?就是你眼睛看到一個橢圓的形狀,耳朵聽到O這樣的發言,當形狀和發音建立起聯系的時候,你就認識了這個字母,學習就是這樣建立相關性的過程。它有點像精油的萃取。
現在我們就可以回頭來討論為什么我們無法理解AlphaGo的神奇,我們人類過去2000年的文明都是可以通過文字來傳承的,一旦有文字,人類的文明就可以積累了。所以人類最早的文明甲骨文,公式程序都是這樣的。一直到70年前人類才發現還有第二種知識叫默知識,就是只可意會,不可言傳的知識。有沒有人是把手冊背下來,上去就能騎車的?沒有一個,而且世界上找不出一個教人騎自行車的手冊。人類有大量這樣的技能,比如舞蹈、繪畫、音樂等等都是這樣需要反復實踐,但是說不出來的。為什么?就因為這些東西在你的大腦里建立了聯系,你是無法用符號把它描述清楚的。
我們做企業的可能閱人無數,我們通常面試的人多了以后,這個人進來坐下來5分鐘,我們心里基本上就大概有數,這個人是否靠譜。為什么,你說不清楚。同樣,企業家作決定,所有重大的決定都是一層一層推到老板那里,老板怎么拍板?老板往往是信息最少的,但是你必須用你的經驗和數據拍板。索羅斯說我所有的決定都是用胃作出來的,如果我胃疼,這個決定就不是好的決定,因為大量的直覺是無法描述的。在默知識之前,大家是否認直覺的,認為直覺是神秘主義,但事實上它非常有道理。一旦我們了解了神經元的工作原理就知道是非常有道理的。
哈耶克是奧地利著名的經濟學家,他對計劃經濟是批判的,他說供需知識是默知識。喬布斯從來不做市場調查,他的市場調查就是早上出門前對著鏡子看自己。為什么?在iPhone出來之前,你做市場調查,問iPhone需要什么功能,這是調查不出來的。我在硅谷待了30年,在喬布斯之前有很多風險投資公司血本無歸。哈耶克說因為這些供需知識是說不清道不明的,所以它無法記錄,因為無法記錄,所以無法集中。因為計劃經濟的前提就是要把供需的數據集中在中央計劃委員會的大計算機里面。
說完了明知識和默知識,我們現在終于可以來討論什么叫暗知識。
明知識就是可以表達的知識,默知識就是不可表達但可感受的。如果我把這個畫成一個象限,很自然地就會發現有沒有一種既不可感受,又不可表達的知識?正好機器學習就填補了這個空白。
去過死海的人一躺下馬上就能感受到浮力定律,浮力定律是可以表達的。但是量子力學離我們很遠,所以就很難理解。這就是為什么到今天相對論和量子力學是最難理解的。默知識就是只可意會、不可言傳的知識。人類的感官是有限的,我們聽不到超聲波,看不到紅外線,有大量的東西是人類感受不到的,但是機器就可以接收到。
這三類的知識是什么關系呢?如果用一座冰山來表示,明知識就是水面上的冰山一角,默知識就是水面下的整個冰山,暗知識就是整個海洋。
為什么人類能表達的東西這么少?原因就是人類的明知識受舌頭說話的速度限制,眼睛、耳朵能接受的信息遠遠大于舌頭。這些信息進入到我們的大腦以后,在大腦中形成的連接數目也遠遠大于我們能表達的數目,這就是我們所說的語言是非常貧乏的。這就是波蘭尼發現默知識所說的“我們能說出來的永遠比我們知道的要少?!?/p>
暗知識的概念是不是哲學概念呢,和我們的生活有關系嗎?關系太大了。上海交大的兩個教授做研究,他們給機器看了2800張人臉圖像,有好人、有罪犯。這個研究引起了全世界巨大的爭議,谷歌的科學家,美國斯坦福大學的教授都寫文章批判,他們批判的道理是人是有自由意志的,哪怕我是小偷,我在下手偷東西的那一刻也可以改變我的想法,我今天不偷了,你怎么能說長相就決定誰是罪犯呢?
以色列就有一家公司做這種研究,并且準備把它應用在以色列的海關上,看誰是恐怖分子。如果它真能以80%的概率篩選出來恐怖分子的話,要不要在海關用這樣的東西?它能保護人民的生命安全,但也有可能冤枉好人,這對人類是巨大的挑戰。
我們大家知道社會積分,假設到處都是攝像頭,你從生下來就被攝像頭抓取下來,機器自動給你打分,你的積分就這么低,為什么這么低分?答案是不知道,機器打的,沒道理,不可解釋。同樣,當人類大規模協調行動時,像諾曼底登陸這種多變量的戰斗中,敵我雙方力量的對比以及天氣,任何一個將軍都是拍腦袋,都是以經驗來做絕對的決策。但是機器可以把這么多的變量分析得非常清楚,最后可以給出一個比人更準的結論,不要在諾曼底登陸,在卡拉斯登陸,你聽不聽它的?
前一段時間馬云提出大數據可以讓新計劃經濟變為主流,劉強東也說AI可以讓共產主義在我們這一代實現。當然大家有很多爭論,馬云說大家錯誤理解了他,他說的新計劃經濟不是老的計劃經濟。但是無論如何,這樣的說法是很多人覺得有道理的。我們來看一下是不是有道理,哈耶克批判計劃經濟說因為默知識在人的腦袋里面,供需知識在腦袋里面,沒法集中。
但今天不一樣了,比如我是剁手黨,我只要在淘寶上買一定時間以后,淘寶對我的數據積累,對我的了解可能就會超過我自己。用戶的習慣是可以收集整理的,這個東西也很容易集中起來,是不是就可以導致新的計劃經濟呢?
如果我們今天要生產一個茶杯,我有辦法把全中國需要的所有茶杯都收集起來,它是不是就能夠導致計劃經濟呢?這個茶杯可以做成不同的形狀,這個茶杯可以改進質量,這個茶杯可以用不同材料來做,這個茶杯可以降低價格。也就是說即使對一個現有的需求,仍然需要企業家去做創新,不斷地改進質量,改進品種,降低成本。這點是靠誰來做的?這是計劃做不出來的,只能靠每個企業家做出決定,去冒風險。對于未知的需要,對于iPhone、自動駕駛汽車這樣的東西更不可能是計劃出來的。
如果我們把已知和未知、需求和供給畫成兩個軸的話,在已知的需求方面,大數據、AI的確能發揮作用,因為畢竟在生活中有些東西是不變的。但是在供給方面,它仍然是無法代替企業家分散創新的。
對于未知的東西,大數據、AI根本毫無能力。你把經濟看成是一個靜態需求拉動的,還是動態的供給推動的,如果你認為是供給推動的,是由創業家、企業家用冒險精神把一個新產品做出來,冒著失敗的風險把它做出來,如果經濟是這樣的結構,大數據、AI都沒有用,它永遠沒有辦法替代企業家的創業精神。
大家經常討論有一天機器會不會統治人類,變成通用的人工智能?如果機器要統治我們,有一個前提就是機器能產生自我意識。至少在今天基于神經網絡的機器很難,為什么?因為這個機器是一個確定性的機器,它里面沒有隨機。我們知道人類的意識有可能是幾十萬年過程當中演化出來的,就像生命的突然出現是一種復雜系統的涌現。機器產生意識是非常小概率的事件。
神經網絡是模仿人類大腦而產生的,為什么它在很多方面能超過我們?人類的大腦神經元是非常低效、粗糙、經常犯錯的,它的傳播速度每秒鐘只能激發200次,每秒鐘只能傳播幾十米。而在芯片里面的電子神經元每秒鐘可以激發上億次,它以光速傳播。也就是今天芯片的電子神經元的速度是人腦的幾百萬倍,而且它不出錯。最重要的一點,人工神經網絡每一個系數是可以提取出來的,也就是說它的知識是可以被共享的,而人腦的知識是不能共享的。
暗知識,就是機器認知的時代,這個時代的特點,無處不在的傳感器記錄著世界狀態。大家今天談物聯網,但是沒有提到物聯網的本質是什么,物聯網的本質就是把大量的周圍環境信息,生產、生活,包括人體自己的信息收集起來,讓機器發現其中隱蔽的相關性,這種相關性細微到人類根本無法察覺,發現出來以后就可以用于改進我們的生產生活。所以物聯網最本質的是這一點。
人類的知識,未來和機器知識相比是滄海一粟。但無論這個機器下棋多厲害,它仍然不懂符號,沒有情緒,也不會產生自我意識,所以它永遠是人類的工具。但這個工具是一次歷史級的工具,它很可能會超過蒸汽機,超過電,甚至超過互聯網。
剛才是我過去兩年所有的思考,加上我在硅谷的投資實踐,包括我的投資經驗都寫成了《暗知識》這本書,在下周會上市,謝謝大家。