《我們如何學習:大腦為何(暫時)比機器學得快》筆記

這是一本關于如何學習的書。我們每個人都有天生的學習能力,是以都能學習,但是學習了如何學習,能讓我們更聰明、更高效地學習。
迪昂這本新書的特色恰恰是學習的底層原理。他結合了腦神經科學、認知心理學和計算機科學,告訴我們有關學習的最新研究進展。他提出了四個學習原則,這些原則我們早就知道了,但是了解了底層原理,你就會更加堅定、也會更靈活地運用這些原則。
我希望每個人都成為學習專家。要了解學習,你必須了解大腦。
大腦是一台神奇的學習機器。你可能聽過一個詞叫“大腦的可塑性”(Brain Plasticity,也叫 Neuroplasticity),大腦非常……皮實。一個孩子三歲的時候頭部中彈,導緻全身癱瘓并且徹底失明,但他的語言天賦卻完全不受影響,七歲就會好幾種語言,還出版了自己的小說,還自己畫了插圖!他根本沒見過“山”是什麼樣子,但是他能想象出來。
這是什麼樣的學習能力。迪昂列舉了很多這樣的案例。一個從十一歲起雙目失明的孩子長大後成了著名數學家,而且研究的是代數幾何:你不用眼睛看能做幾何題嗎?一個被切除了大腦的整個左半球的孩子可以創作出非常厲害的繪畫。一群從小被扔進孤兒院與世隔絕的孩子,長大之後也和正常人一樣……你說作為家長還有什麼可擔心的。
可是在另一方面,有時候大腦因為一個小小的損傷,就會失去重要的學習功能。有好幾個人在創傷後發現自己不會閱讀了,對眼前的文字怎麼看都不認識,然後不管多麼努力地訓練,閱讀速度都比不上一個幼稚園小孩。
這本書的主題就是怎麼才能把大腦用好。好消息是我們的大腦都差不多,基本原理是一樣的,書中的知識适用于每一個人。
咱們先強調一個最關鍵的原理:有些知識是天生的。
這個道理在愛德華·威爾遜《創造的起源》書中提過,叫做“先備學習(prepared learning)”。科學家的最新認識是大腦不是白闆,小孩剛出生,就已經預裝了很多知識。對光線和聲音怎麼反應,關注語言,害怕危險的東西,這些事兒不用專門學,都已經寫在基因裡了,天生就會。
但是不能什麼知識都預裝。首先裝不下,人的 DNA 全部的資訊、包括把各種備援都算上,隻有750M,相當于一張老式 CD 的大小,真存不了太多東西。更重要的是,把大部分知識留到出生以後學習是更好的政策,因為你不可能事先完全知道到時候能用上哪些知識。
連最簡單的線蟲都有學習能力:它能适應環境變化,它能記住各種線索去找到營養豐富的地方,并且在路上避開有它不喜歡的氣味的地點。
人就更擅長學習了。相對于需要學習的知識而言,我們大腦的“容量”幾乎是無限的。我們有最大的學習潛能,學習對我們的影響也最大,不同的人因為學習而産生的差距也最大。能在青少年時期用十幾年的時間專門受教育,這是現代人的特權。這種系統性的教育讓你的短期記憶力比從來沒有受過教育的人高出一倍。你每多受一年教育,平均智商就能提高幾分。學習不但是你不斷适應新環境的關鍵手段,而且能把你變成不一樣的人。
但不管怎麼學,都别忘了我們也是一種生物。先天預裝知識和後天學習相配合這個機制,對我們非常重要。
迪昂這本書中有個邏輯我覺得特别有意思,也許可以叫做“反向仿生學”。
上世紀八十年代,計算機科學家有感于傳統算法做人工智能不行,轉向人腦學習,這才搞出了神經網絡算法。現在神經網絡有個更時髦的名稱叫“機器學習”,是一切 AI 基礎。計算機科學家在這個基礎上發明了各種政策和方法,其中也是不斷地在借鑒人腦,他們非常關注腦科學的進展。可以說 AI 是對大腦的仿生學。
但是教學相長,腦科學家也非常關心 AI 算法的進展,也從 AI 中悟出來了很多道理。有時候計算機科學家獨立發明一個能提高機器學習效率的新方法,結果腦科學家一看好像人腦也是這樣的……這就是反向仿生學。
這個道理是大腦也是一個神經網絡。有時候你和一個跟自己相似的東西對照,更能看清自己是怎麼回事兒。大腦的一些基本學習原理跟 AI 相同,進階的原理比 AI 高得多,這一章咱們先說相同點。
1、模型
所謂學習,迪昂說,本質上就是訓練我們大腦内部的模型。
模型是真實世界在你頭腦裡的一個縮影。這個縮影不可能完全再現真實世界,但它應該包含真實世界最關鍵的特征,它能用于解釋、甚至預測真實世界。大腦和 AI 都是神經元的網絡,是以模型無非都是神經元的連接配接結構和連接配接強度,可以用一系列參數表示。
學習就是訓練模型,就是通過和真實世界互動,用資料的回報來調整那些參數。
2、分層
神經網絡模型是分層的。比如學語言,不管是小孩學說話還是 AI 學語音識别,最底層都是識别音節,是簡單的聲音。往上一層是字詞,再往上是文法,幫你連成句子,再往上一層是意思……每一層有每一層的規律。
在機器學習領域,分層是一個重大進步,分層的神經網絡就叫“深度學習”網絡。
3、監督學習
怎麼訓練模型的參數呢?最簡單的方法就是随時提供有效的回報。
比如你練習射擊。你打了一槍,一看靶子,發現你瞄得太往上了,子彈偏離了靶心 5 厘米。這就是兩個關鍵的回報資訊,一個是偏離的程度,一個是偏離的方向。那麼下一槍你就根據這兩個資訊調整,稍微往下瞄一點。如果第二槍的結果是向下偏離靶心 2 厘米,那你就以更小的幅度再往上調整一點。
在機器學習領域,這叫做“有監督式學習(Supervised Learning)”。神經網絡每做一個動作都會收到這麼好的回報:既知道差了多少也知道差的方向是什麼,然後下一步就明确知道該怎麼對參數進行微調。當然學習射擊比較容易因為隻有幾個參數,複雜的學習需要調整的參數就太多了,要有極多的訓練資料,但是原理是一樣的。
回報,是學習的關鍵。
4、“任意的震動”
機器學習中,有時候你通過一系列回報很快就找到了一個最優解,但是你不能确定它是不是全局的最優解。你隻搜尋了一個局部,也許别處還有更好的東西你沒發現。計算機科學家的辦法是故意給學習加入一些随機的變化,就好像生物演化中的基因突變一樣,也許就能收獲驚喜。
大腦學習也應該這樣。你得博覽群書開卷有益積極探索,時不時跳躍到别的地方看看。
5、無監督學習
有老師手把手地教,每一步都給回報當然好,那要是沒有老師怎麼辦呢?也許更好。當初 DeepMind 公司出的 AlphaGo 和 AlphaZero,都不是跟圍棋教練學的下棋,它們使用的是“無監督學習(unsupervised learning)”算法。
無監督學習隻有一個外部回報,那就是最終這盤棋你是赢了還是輸了。中間哪一步你走的對不對,沒有人告訴你。
那這棋怎麼學呢?你必須自己給自己提供回報。無監督學習算法會分出兩個角色來,一個是批評者(critic),一個是行動者(actor)。批評者的任務是根據以往的對局經驗,随時評估目前局面的勝率大小。比如你的地盤很大,它就能感覺到你取勝的機率大。行動者則是根據批評者的評估意見試探下一步走法:如果批評者說走這裡勝率會降低,行動者就換個地方……
我們大腦有時候也是這樣學習的。小孩學走路,大人并沒有告訴他每一步腿邁的對不對 —— 他自己摔倒過幾次就有經驗了,知道走成什麼姿勢容易摔倒,然後就會避免走那個姿勢。
6、抓住本質
機器學習的模型是不是參數越多越好呢?不是。參數太多會讓你陷入“過度拟合”。就好像上數學課,你學解題學的是套路的一般性,而不是那些例題裡特殊的細節。你既要善于學習,也要善于忽略,才能抓住本質。
7、内在知識
機器學習中有一個很厲害的算方法叫“卷積算法”,這個算法被創造出來後,一下子就把計算機圖形識别的能力提高到了實用水準。卷積算法的關鍵是它并不是在一無所知的狀态下看圖:它已經對所有的圖形都有一定的了解,能夠識别一些最基本的圖案,比如線條、圓圈、斑點等等。新的圖形在它眼中都是已知圖案的組合。它善于運用自己的“内在知識”。
大腦的學習也是如此。你從來都不是“從零開始”學什麼東西,你總是把新知識看做舊知識的組合。我們出生之前,基因就已經告訴我們如何識别聲音和光線,是以接下來的語音和人臉識别都是在更高的層面上進行的,是以才學的那麼快那麼自然。
通過審視機器,我們也能審視自己的學習。
你的基礎知識學紮實了嗎?
你是把失敗當做回報還是把回報都當做失敗呢?
你做事的時候内心有個“批評者”嗎?
你的批評者會影響你的情緒嗎?
你喜歡新東西嗎?
人工智能到底哪點不如人?
不管你是做技術的,還是從事其他行業的,相信你已經看過太多的利弊分析了。尼斯拉斯·迪昂從“學習”這個角度說,機器學習對人腦的仿生僅限于表層。
誠然,AI 圖像識别現在很強。但圖像識别是人腦的一個非常膚淺的功能。看見一張圖檔,你找到其中的物體,把它們分類,這一切隻要幾十分之一秒,而且是無意識的。AI 能下圍棋,但本質也是靠模式識别,它無非計算速度更快、能記住的局面更多而已。模式識别能讓 AI 看起來很像是專家,但是它不是真的專家。凡是我們有意識的思維,比如邏輯推理和抽象概括這種”慢“的思維方式,AI 統統不行。
我給你舉個例子。現在有些 AI 對話程式号稱已經接近通過圖靈測試。比如它可以扮演一個心理醫生跟你聊天。你說我最近心情不好,它會問你是不是壓力太大了?你說是的,它就會接着問你是工作原因還是感情原因?聽起來很像真人……這種對話也能讓你感到安慰,其實都停留在表面。我有個讓對話深入進行的主意,你應該給它出道題:
咱們用符号 @ 代表一種四則運算,已知 1@2=3,2@9=11,那你能不能猜一猜,100@1 等于幾?
任何一個成年人都能猜到 @ 代表加号,是以 100@1=101。但是這對 AI 來說可是太難了:它涉及到猜測一個規則然後應用一個規則。
所謂“深度學習”,恰恰是淺度學習。
迪昂列舉了人腦相對于機器學習的六個優勢,都屬于我們平時自己覺得挺簡單,而對 AI 特别難的操作。
第一是抽象概念字母 A 是什麼樣的?
下面所有這些字型表現的 A ,你都能輕松認出來 ——
筆畫粗點細點、是直線還是曲線、扭曲一下或者增加點修飾,不管怎麼變,你都知道它是 A:因為你抓住了 A 的本質。
再比如說椅子,不管是三條腿還是四條腿,什麼顔色什麼材質,你都知道它是椅子,因為你抓住了椅子内在抽象的概念,你了解椅子的精髓。
AI 沒有這個能力。現在欺騙 AI 已經是一個熱門活動,在香蕉旁邊放一個小小的幹擾,AI就把它識别成了……烤面包機 [1]。
第二個優勢是人的學習速度非常快,而訓練 AI 需要海量資料
AlphaZero 确實厲害,什麼遊戲它學到最後都能比人打得好,但是請注意,它初期的學習速度可是比人慢得多。AI 全靠自己瞎摸索。而人,你隻要給他講講大概的規則,他一上來就能打的很有章法。
再比如學語言,一個法國孩子每年大概聽父母跟他講 500-1000 個小時的話,這點訓練就足夠讓他幾年之内熟練掌握法語。而如果是 AI,要粗略地掌握一門人類語言,它需要多幾十倍的訓練量才行。
第三個優勢是人很容易傳遞知識
你買個烤面包機,自己看說明書學會了怎麼用,然後給你媽媽也買了一個。她收到之後你給她打電話,三言兩語就能教會她怎麼用。AI 沒這個能力。機器學習的所有知識都展現在神經網絡裡的那些參數上,參數本身沒有意義,AI 說白了就是一個黑箱。
第四是人有時候用一個例子就能學會
比如我教你一個新詞,purget,意思是“忘記”,比如“我purget吃飯”就是“我忘了吃飯”。這就可以了!你馬上就能用這個詞造各種句子……而 AI,沒有這種把新東西加入舊知識的能力。
人腦的第五個優勢是最關鍵的,那就是人擁有一個“思想語言(language of thought)”
這是一種内在的邏輯語言,能讓我們進行推理。
迪昂喜歡的例子是這樣的。我們知道對任何一個數字,你總可以把它加1,變成下一個數字,那麼根據這一點,你就可以推導出來,世界上并沒有一個“最大的數字”:不管哪個數字+1之後都有一個更大的數字 —— 你就有了“無窮大”的概念。可能本來你不知道什麼叫無窮大,但是自己這麼一推導,你就知道了。
思想語言讓我們能用有限的詞彙去組合出無窮多的新概念。這是隻有人才有的能力,其他所有動物都不具備,AI 更不會。
第六個優勢是我們能夠把幾個技能組合起來去做一件全新的事情
我學會了加法和英語,下一步我就能檢查英文賬單。人腦會把技能遷移到新的場景。對比之下,AlphaGo 下圍棋隻會标準的 19×19棋盤,你要是臨場建議咱們下 15×15 的吧,它不會下。
你看這是不是也屬于“百姓日用而不知”的智慧。
媽媽領着女兒在公園裡玩,看到花叢中有一隻蝴蝶,媽媽說“看,蝴蝶”。就這一句話,女兒就記住了。下次再看見蝴蝶,她就知道這是蝴蝶。請問她是怎麼學會的呢?
從 AI 的視角考慮,這可太難了。當你說蝴蝶的時候,眼前有各種各樣的東西:有花、有樹葉、有泥土、有空氣、有天空,孩子是如何知道哪個是蝴蝶的呢?而且“蝴蝶”為什麼一定是個物體?它也有可能是一種顔色、一個動作或者一種性質:也許媽媽的意思是說這個花盆有旋轉對稱性!孩子怎麼就學會了“蝴蝶”呢?
還有一些更抽象的詞,比如“思考”“自由”“相信”,孩子是怎麼學會的呢?AI 做圖形識别可以,可你怎麼訓練才能讓 AI 識别“自由”?還有,“我”這個字是什麼意思,孩子是怎麼知道“我”指的是說話者本人、而不是某個特定的人的呢?
你得是一個認知科學家,拿孩子做過各種實驗,才能略知一二。
迪昂認為,人腦學習的優勢,關鍵在于兩個能力。一個是規則,一個是假設。
先說規則。稍微用一點規則,學習就能大大加快。你别看很多家長和老師抱怨孩子不遵守規則,讓他們按流程做個數學題都很難,其實每個孩子都在暗中掌握和運用規則。迪昂列舉了孩子的幾個學習規則。
第一個規則是盡量選擇最簡單、最小的假設。媽媽指着小狗跟孩子說,“dog”。站在孩子的視角,這個詞可能有兩種含義。是所有的狗都叫dog,還是這隻小狗的名字叫dog?你跟小孩說第一遍的時候,他并不知道,但是他會默默記住這兩個假設。換一個不同的場合,你指着另外一隻狗,跟小孩說 dog,小孩馬上就明白了 dog 指的是所有的狗 —— 他沒有再猜測别的可能性,比如說 dog 是不是特指公狗或者比較小的狗?他先采納最簡單的假設再說。
第二個規則是注意力。當一個人談論什麼東西的時候,他的注意力一定是在這個東西上。媽媽說蝴蝶的時候,要麼她會用手指着蝴蝶,要麼就看着蝴蝶,是以孩子知道“蝴蝶”是在說什麼。科學家怎麼知道孩子會使用這個規則呢?實驗室裡,給孩子手裡拿一個他從來沒玩過的玩具,比如一個潛水艇模型。老師對孩子說“潛水艇!”孩子就知道那個新玩具叫潛水艇。但如果不是老師沖着這個孩子說,而是頭頂上的廣播裡說了“潛水艇”,孩子就不會意識到那個玩具叫潛水艇,也就學不會這個詞。
第三個規則是在“這個”、“那個”、“the”這些冠詞之後跟着的,總是名詞。連 12 個月大的嬰兒都能運用這個規律。你每次說 the,他就知道後面跟着的一定是個東西,而不是一個動作。
第四個規則是通常情況下,兩個不同的詞不會指代同一個東西。地上有很多玩具,其中隻有一個新玩具是孩子沒見過的。你對孩子說“把那個 kekeke 拿給我!”他沒聽過“kekeke”這個詞(其實是你編造的一個詞),但是他會把那個新玩具拿給你,因為他知道其他玩具的名稱都不是“kekeke”。
有些聰明的狗能聽懂幾百個單詞,這個拿玩具的測試,連狗都能通過……而 AI 還做不到。
還有很多别的規則。現在人們也在研究讓 AI 基于規則學習的方法。在朱迪亞·珀爾的《為什麼:因果關系的新科學》的書中提到,AI 也在學習因果關系,隻是所有這些努力都還很初級。
那人腦是怎麼知道這些規則的呢?有些肯定是天生的,嬰兒一出生就已經知道一些“關于規則的規則”,也就是“元規則(meta-rules)”,甚至一些“元規則的元規則”。但更多的情況,是我們自己在大腦裡先創造規則,再去驗證規則。這就涉及到大腦的第二個關鍵能力,也就是假設和檢驗。
提出假設然後驗證假設,這是科學家的工作方法,也是我們常說的“貝葉斯方法”。
貝葉斯方法講究“觀點随着事實發生改變”,那這個觀點是從哪來的呢?是你自己假設出來的。面對一件事情,大腦會假設幾個規則,然後通過觀察去驗證哪個規則成立的可能性更大。
比如你在聚會上遇到一個人叫小王,你發現他不怎麼說話。小王是什麼情況?你提出了幾個假設:他性格比較内向,他是個啞巴,或者他不會說中國話。然後你觀察他,你跟他說了一句話他好像聽懂了,那就應該弱化“他不會中文”這個假設。
嬰兒就是這麼學習的。我們專欄多次提到過一位發展心理學家叫艾莉森·高普尼克(Alison Gopnik),她經常鼓吹嬰兒都是科學家,是貝葉斯方法專家。孩子們猜測規則,驗證規則,就掌握了規則。
迪昂認為,人腦的學習過程是下面這三步,
第一,使用思想語言創造各種假設的規則;
第二,在實踐中驗證這些假設,找到最可能的規則;
第三,用這個規則去學習。
這就是為什麼人腦學習得那麼快。你要認同他這個理論,那人腦可就太厲害了。迪昂據此有一個驚人的推斷,每個人一出生,其實已經掌握了所有的知識。
為什麼這麼說呢?因為你可以用思想語言自行推導所有的假設,你可以做各種各樣的猜測,剩下的隻不過是調整那些猜測的可信機率而已。
這就如同把頭腦健全的你穿越到一個外星球,那裡的辦事規則和地球完全不同,但是你知道一點:那裡的人辦事也是有規律的,因為沒規律我們就談不上學習了。而就憑這一點,你就等于知道了那個世界的全部。你可以假設各種各樣的規則,再一個個去驗證,把可能性低的假設排除掉。
是以學習的本質不是做加法,而是做減法。世界上并沒有什麼新東西,你已經都會了,你要做的隻是驗證……
我們說人一出生大腦中就已經儲備了一些知識,這個觀念是有點反直覺的。直到 20 年之前,也就是 2000 年左右,很多科學家還認為剛出生的大腦是空白的、神經元沒有特别的結構。今天這個觀念已經完全扭轉過來了。
為什麼反直覺呢?因為我們總覺得知識是一種軟體,總是得通過學習才能“印”在大腦中……但是你要知道,“印”并不是什麼神秘的過程:人體所有東西都是以硬體形式實作,知識無非是大腦神經元的連接配接。那既然是硬體,當然就可以遺傳設定。如果 DNA 已經儲存了身體的各種細節資訊,心髒的形狀、十個手指的長短、眼睛的顔色,為什麼就不能把大腦的結構也事先設定好呢?
事實上,最新的研究證明,嬰兒的大腦已經具備跟成年人大腦一樣的結構。
這就涉及到《我們如何學習》這本書作者斯坦尼斯拉斯·迪昂的本行了。迪昂和他的妻子和同僚們是研究嬰兒大腦的先鋒。他們是第一批使用功能性核磁共振掃描嬰兒大腦的科學家,他們還做了各種各樣的實驗,得到了讓我感到有點吃驚的結果。
迪昂等人證明,嬰兒一出生就已經自帶一些關于物體、數字、人和語言的“隐形知識(invisible knowledge)”。可科學家是怎麼知道的呢?嬰兒連話都不會說,你不能問他們更不能考他們……科學家有兩個辦法。
一個辦法是觀察眼睛。你要是看到一個怪異的東西,讓你感到很意外,你就會很注意這個東西,你會盯着它多看一會兒 —— 嬰兒也是這樣。科學家用儀器精确跟蹤嬰兒的眼睛,測量他在凝視哪個方向,和凝視時間的長短,以此來判斷嬰兒對一件事情的意外程度。
對于正常的現象,比如一個小球在地上滾動,嬰兒看幾眼就不看了,可能他也覺得很無聊。但是如果科學家給他變個小魔術,比如一個小球在螢幕上突然消失然後又突然出現,嬰兒就會長時間地盯着看,說明這讓他感到了意外!
那你說嬰兒有沒有知識?你得知道什麼是正常,才知道什麼是不正常。如果這個寶寶能看懂魔術,感到意外,就說明他知道世界原本應該如何運作。
第二個方法是用功能性核磁共振直接實時掃描大腦的活動。這個技術現在很成熟,而且對人體無害。比如嬰兒一出生,醫生當天就會測試一下他的聽力是否正常:在左右兩邊耳朵分别弄一個聲音,如果他能聽到,大腦會有明顯的相關活動。
是以科學家拿嬰兒還是有辦法的。我們這一講中要說的嬰兒都在一周歲之前,有的甚至是剛出生幾個小時就成了實驗對象……而你會看到,他們非常聰明。
咱們說幾種實驗證明的、嬰兒會的知識。
第一個知識是實體學
不是廣義相對論那種實體學,生活中也有實體學。剛出生幾個月的寶寶已經知道世界是由各種物體組成的,物體需要滿足一定的實體學:比如說物體不會自己動,你推它才會動;物體會在空間占據一定的位置,而且每次隻會占據一個地方,不會同時在兩個地方出現;物體不會突然消失,等等。
科學家的做法是用一個螢幕示範物體的運動。比如一個球在螢幕上做直線運動,嬰兒看一會兒就不看了。但如果這個球突然消失,然後在螢幕另一側突然出現,這顯然是個怪異的事情,不符合日常實體學,嬰兒就會感到意外,就會一直盯着那個球看。
這種實驗有時候搞得很進階。科學家用擋闆把一根棍子的中間擋上,隻露出兩頭,這兩頭同時上下運動,寶寶能猜出來這兩頭屬于同一根棍子。
這時候你撤掉擋闆,如果果然是一根棍子,寶寶不會感到意外。但如果擋闆後面露出來的不是一根、而是兩根棍子,也就是說兩頭并沒有連接配接在一起,寶寶就會感到意外,他就會盯着看。
第二個知識是數學
我們知道1+1=2,而不是1,寶寶也知道。一個小球跑到擋闆後面,另一個小球也跑到擋闆後面,然後你撤掉擋闆,裡面如果的确有兩個小球,寶寶會認為正常。但如果撤掉擋闆發現隻有一個小球,也就是1+1=1了,寶寶就會感到意外。
類似地,嬰兒還知道 5+5≠5,10-5≠0。剛出生幾個小時的嬰兒,甚至一些小動物,比如猴子、鴿子、烏鴉、小雞,都有數字感。科學家證明小雞剛剛從蛋殼裡孵化出來,都沒見過任何物體的情況下,就已經對數字有感覺。人們甚至發現猴子的大腦裡有專門的“數字神經元”,從 1 到 30 的每個數字,都對應一個特定的神經元:猴子看到比如說 4 個香蕉的時候,跟數字 4 對應的神經元就會活躍起來。
第三個知識是機率論
寶寶看到一個小盒子裡有 3 個紅球和 1 個綠球。你從盒子裡随機拿球,如果拿出來的是紅球,他不會感到意外;如果拿出來的是綠球,他就會多看你一會兒 —— 因為他知道拿到綠球的機率比較低!
而且嬰兒還會反向推測。你拿一個盒子,寶寶事先不知道裡面有什麼球,然後如果你一次一次拿出來的球,紅色比綠色的多很多,他能判斷出來盒子裡應該是紅球多。這表現在如果打開盒子發現裡面是綠球多,他會感到意外。
再進一步,如果寶寶知道盒子裡是紅球多,可是你每次都拿出來綠球,他就會判斷你不是随機拿球的:他認為你喜歡綠球!
有一派學者認為人腦本質上就是一台機率機器,随時都在評估各種事情的機率大小。不論如何,這個機率感證明了幾個月大的嬰兒就有邏輯思維能力。
第四個知識是生物學
嬰兒非常清楚地知道,沒有生命的東西自己不會主動做動作。你讓一個小球本來沿直線走着走着,突然自己跳了一下,寶寶會感到意外。
嬰兒對人的了解非常實用,他能看出來誰是好人還是壞人。一個實驗人員當着寶寶的面把另一個孩子扔在地上,寶寶就不喜歡這個實驗人員 —— 表現為不看他。另一個實驗人員把地上的孩子抱起來,寶寶就很願意看她。孩子還能看出來你是在正常做事情,還是在故意教他什麼東西。
嬰兒對人臉有特殊的偏好。剛出生幾個小時的寶寶,你給它一張房屋風景照和一張人臉照片,他更喜歡看人臉的照片。這是因為我們大腦中有專門用于識别人臉的結構,對人臉無感的孩子可能有自閉症。
迪昂還提到一個讓我感到有點離奇的研究。當胎兒還在媽媽肚子裡的時候,如果你用三個光點去隔着肚子透射他,而這三個光點正好是兩點在上面、一點在下面,像人臉,胎兒就會更注意這些光點;你要是倒過來讓兩點在下一點在上,不像人臉了,他就沒有那麼大的興趣。難道說孩子還沒出生的時候,就已經更喜歡看人臉了……
第五個知識是語言
剛出生的嬰兒,同樣是聽陌生人說話,他更喜歡聽人說他的母語而不是外語。這可能是因為胎兒已經能分辨語音,熟悉了母語。相對于别的聲音,寶寶對母語中的音節更敏感。日語中 R 和 L 這兩個音不分,日本寶寶也就對這兩個音的差別不敏感。嬰兒幾個月大的時候就已經能識别哪些詞是常用詞:比如像媽媽、寶寶、吃奶這些詞,他會更敏感。這說明他已經在調整自己的語言模型中的詞彙機率。
語言功能是人類的特長。有科學家曾經領養了一個黑猩猩的寶寶,讓它和自己的孩子從小享受同等待遇,同吃同住同玩同學習……結果發現黑猩猩的智力确實是硬傷。你不管怎麼教,黑猩猩最多能識别幾百個單詞 —— 而人腦天生就是一部學習語言的機器。
那你說這些知識有沒有可能是嬰兒在出生以後的幾個月慢慢學會的呢?迪昂認為還是天生的因素更大一些。首先有些能力是出生幾個小時就具備。然後就算要學,有哪個家長會特意讓幾個月大的寶寶學習實體和數學知識呢?當然嬰兒的确是一直在學習,他會自己拿東西玩,會做各種實驗,他對物體的掌控感越來越強,但是那些訓練更像是讓已經有的能力變得更敏銳,而絕不是從零開始。
然後我們還有更過硬的證據。
最明顯的證據還是功能性核磁共振掃描。成年人大腦裡相應的區域,嬰兒都有。比如說語言,我們大腦裡有專門處理語言的區域,而嬰兒大腦相關的區域對語言處理的過程跟成年人完全一樣。你對嬰兒說一句話,這個語音會先進入聽覺區,接着是詞法分析區、文法分析區,最後進入語義分析區。這個次序,各個區域從快到慢的處理速度是聽覺最快,語義分析最慢,所有這些都跟成年人一樣。
他現在還聽不懂這句話,但是他的大腦做好了聽懂語言的一切準備。
嬰兒大腦的空間感覺區域也準備好了,可以繪制地圖,知道房間中不同東西的位置。他的視覺、識别人臉的功能,都和成年人是一樣的。
那你那個 AI 要是根本沒有這些功能性區域,沒有專門的神經網絡連接配接,又怎麼能跟嬰兒比呢?是以現在 AI 也在走這個方向,有個項目叫“虛拟嬰兒計劃(Virtual Baby Project)”,就是要像人腦一樣,把所有該先天内置的功能全部内置,各個功能區的神經元都連好,完了再進行資料訓練。這才是真正的仿生人腦。
咱們借用一句佛經裡的話,每個人一出生都是“自身具足”的。你身上有學習的種子,就好像人人都有佛性一樣,你有“學習性”。
那為什麼有的小孩聰明,有的小孩不太聰明呢?大腦的藍圖确實都一樣,但是在這個共同點的基礎之上的确會有微妙的個人差異。大腦中有些差異就好像指紋一樣,連雙胞胎都不是完全一樣的。
剛出生的小孩,科學家掃描他的大腦,就能知道他有沒有閱讀障礙。閱讀障礙是先天的,是大腦的硬體問題。有閱讀障礙的孩子對文字很不敏感,認字非常困難。科學家已經知道有四個基因決定了一個人是否會有閱讀障礙,閱讀障礙的遺傳機率是 50%。
但是,後天訓練對大腦的影響,總是比先天硬體的差異大。閱讀障礙可以通過訓練改變。人腦有先天的結構,但是更有“可塑性”。
關于大腦的“可塑性”你可能已經聽過很多說法了,我感覺每次聽到新的說法都會在悲觀和樂觀之間搖擺。
沒聽說過“可塑性”這個詞的人可能會對大腦成長持悲觀态度。我們在日常生活中觀察,人到了一定年紀有些新東西就很難學了。特别是語言,小孩幾乎是不用教就會,大人怎麼學都學不會。
而你第一次聽說“可塑性”,可能會非常樂觀。一個中風患者,大腦裡一大片區域都損壞了,半身癱瘓,隻要經過一段時間的強化訓練,竟然能在旁邊再長出一套神經連接配接來控制身體。如果這都可以,我們想學點新東西又有何難?你會聽到有的激進觀點甚至不承認人的學習有所謂“敏感期”。但是你要深入了解,大腦成長的敏感期的确存在。
學什麼東西都跟練國術一樣,本質上是個生理現象。我們的大腦是肉長的,它的好與壞都是因為這個。
一切知識和技能都是以神經元連接配接的形式存在于大腦之中。人體細胞一般都是球形之類,唯有腦細胞,也就是神經元的形狀最奇特,是樹狀的,也可以說像芹菜。作為最簡單的認識,你隻需要知道神經元上的三個部位:突觸、軸突和髓鞘,
神經元身上細長而又比較粗、作為傳遞電信号的主幹道的結構叫“軸突”,軸突外面包着“髓鞘”,軸突的外端點、用于跟其他神經元連接配接的地方叫“突觸”。大腦中有幾百億個神經元,它們之間彼此連接配接,構成了一個無比複雜的網絡。每個記憶、功能、知識和技能都是由其中一個子網絡實作。我們為什麼總愛說創造性思維是“想法的連接配接”、現代化要“加入圈子”呢?因為思維就是連接配接,知識的本來結構就是連接配接。
不過學習過程更多的是強化現有的一些連接配接,而不是建立新連接配接。事實上你就算什麼都不做,大腦也在忙着建立連接配接。下面這張圖是兒童從一出生到六歲大腦神經元的連接配接情況 ——
小孩剛出生就比成年人有更多的神經元。此後連接配接越來越多,到兩歲,神經元總數達到成人的兩倍,有密密麻麻的連接配接。随着後天的學習,某些連接配接會得到加強,不用的則會被修剪掉。
最粗略地說,神經元連接配接存在,那個先驗知識就存在。連接配接的加強和修剪就是用貝葉斯方法修改機率。連接配接加強的規律是 “fire together, wire together”:兩個神經元越是經常一起被激活,它們之間的連接配接就越強。“強”表現在傳遞信号速度更快精确度更高。如果一個連接配接特别強,其中神經元的軸突會變粗,軸突外面會包上一層髓鞘,髓鞘能起到一個絕緣保護的作用,就好像用膠布包上導線,能增強裡面的電信号。
神經元是如何“錄制”資訊的呢?比如你去白宮會見了特朗普。你到了總統辦公室,跟特朗普握了手,你們聊了一陣。這種經曆不常有,是以隻發生一次就能給你鮮明的記憶。而這個記憶會存儲在大腦的不同區域之中。
你對特朗普辦公室的印象記錄在大腦負責空間想象的區域的一些神經元連接配接之中。你的視覺區域也記錄了很多。特朗普的臉會特别記錄在大腦中專門負責人臉的區域中,特朗普的聲音會記在大腦的聲音區裡。回憶當時握手的力度,會激活負責你的手的神經元的記憶。所有這些子網又都連在一起,形成對整個事件的記憶。隻要将來偶然又看到特朗普的照片,你就有可能喚醒整個事件的記憶之網。
那你可能會說,知識跟這樣的經曆記憶好像不太一樣啊?是的,我們總共有四種記憶。
大腦的四種記憶是由不同的區域主要的。
第一種是“工作記憶(working memory)”。也叫短期記憶。比如你查到一個電話号碼要臨時用一下,它純粹就是一組沒什麼意義的數字,不會喚醒你的情緒波動,這就是工作記憶。這個資訊會在你的前額葉皮質暫存一下,幾秒鐘之後就忘了。工作記憶有點像計算機的記憶體。
第二種是“情景記憶(episodic memory)”。去白宮見特朗普,包括你每天在生活中經曆的事情、到過哪裡、和誰說過話,這些都是情境記憶。情景記憶總要經過海馬體,特點是那個情景越特别、越是調動了你的更多感官、最好還能産生情緒波動,記憶就越鮮明。比如你感到興奮,大腦會分泌多巴胺,多巴胺能夠加深神經元連接配接。情景記憶隻錄制一次,如果印象不深事後不回憶,神經的連接配接就很弱,以後就忘記了。
第三種是“語義記憶(Semantic memory)”,可以叫知識記憶,是長期的記憶。晚上睡覺的時候,海馬體會把白天的一些情景記憶輸送到大腦皮質中,在那裡重新編碼,變成一個不容易忘記的知識。是以睡眠對學習非常重要。
第四種叫“程序記憶(procedural memory)”,也可以叫内隐記憶,它記住的不是什麼知識點,而是一段動作,可以說是肌肉記憶。比如練成了一段鋼琴彈奏、熟練掌握了一組花樣滑冰動作,或者能流利背誦一首唐詩,這些都是程序記憶。程序記憶的形成可以不經過海馬體,它的重點存儲區域是基底神經節。
曾經有一個特殊的病人,大腦海馬體損壞了,什麼事情都記不住。研究者天天跟他見面,每次都要重新做自我介紹。但是研究者每天都訓練這個病人對着鏡子倒着寫字 —— 他記不住這個情景,但是他倒着寫字的水準每天都在提高……以至于後來他每次都很驚訝,為什麼自己從來沒練過,上來就能寫得那麼好。
這就好比說一個人天天半夜夢遊起來練國術,他在自己完全不知道的情況下成了國術高手。
既然都是生理組織,記憶就可以被幹擾,可以被删除,甚至可以被嫁接。現在科學家已經能夠比較精确地觀察一段記憶到底會調動哪些神經元。用老鼠做實驗,先在一個地方讓老鼠形成記憶。然後科學家等着,老鼠做夢正好夢到那個地方的時候,也就是觀察相關的神經元正好激活的時候,給它注射一點多巴胺。結果是老鼠一醒過來第一件事就是去那個地方。
而所謂學習,就是你想要語義記憶和程序記憶,你想加強神經元的連接配接,你想讓知識長在大腦裡。但是不好長。
讓神經元連接配接恰好形成有用的知識和技能,那是非常精密的過程,直接注射什麼東西肯定是不行的。事實上因為神經元是肉長的,而大腦發育過程中各個區域的生長不一樣,學習必須精密配合才行。
首先營養得跟上。大腦非常消耗能量,小孩全身 50% 的能量都用在了大腦上。以色列發生過一件事情。一家生産嬰兒奶粉的公司,違規沒有在奶粉中添加維生素B1,導緻幾百個嬰兒在出生之後的第一個月裡,有 2-3 周的時間沒有得到維生素 B1。而就因為這一點,這些孩子的語言學習就錯過了敏感期,這使得他們一直到他們長大之後,文法能力都不正常!
這可不是一句“大腦可塑性”就能彌補的。是,可塑性可以彌補一部分,但畢竟是不如原裝的好。科學家用動物做實驗,阻斷了聲音信号傳遞到大腦處理聽覺區域的路線,使得動物變聾,整個聽覺區沒用了。但是接下來,聽覺區的神經元開始參與處理視覺信号!那你說這是不是對視覺更好呢?是不是上帝關上一扇門就打開一扇窗呢?并沒有:聽覺區神經元處理視覺信号的能力不如視覺區神經元,等于是幹擾了視覺。
最理想的還是該幹什麼的區域就讓它幹什麼。
人類大腦的視覺區域會在兩歲之前徹底長好,而第一個月,就是視覺最關鍵的敏感期。嬰兒剛出生的時候,光線從進入眼睛到後期處理需要 1/4 秒,幾周之後就隻需要 1/10 秒。兩個眼睛同時看東西,形成一個立體感,能判斷物體距離遠近,這個能力是在出生後幾年内建立起來的。那你說如果在此期間沒有讓人充分接觸光線,沒有好好看東西,會發生什麼?他就不會有正常的視覺。
整個聽覺的成長期到三、四歲的時候結束,但是語言識别的敏感期就在出生後的幾個月。日語裡 R 和 L 這兩個音不分,日本嬰兒出生幾個月内沒學會區分這兩個音,就一輩子也分不清了。是以日本人學英語都分不清 right 和 light,red 和 led,elect 和 erect。
再比如中文裡有四個聲調,你要出生在中國,一歲之前的敏感期能聽出來,就一輩子都能區分。你是個外國人,長大再學中文,中文的四聲激活的就不是你的語言處理區域,你最多把它們當唱歌那種音調變化,你怎麼學中文也說不好四聲。有的中國孩子出生一年後被領養到美國,長大了一句中文都不會,可是測試表明,當他聽中文的時候,四聲變化仍然能激活他的語言處理區。
是以我們不尊重這個敏感期是不行的。語言區域的可塑性永遠都不會降到 0,你要是特别努力學外語也能學得跟母語一樣好,但是那太難了。十歲以後再學外語的,通常怎麼學都會留下一點口音和怪異的文法痕迹。
如果孩子剛出生就發現是耳聾,要麼你就立即給他的大腦中植入一個助聽裝置,要麼就抓緊時間教他手語 —— 手語也可以算是一種自然語言。錯過了第一年的語言敏感期,他此生的文法能力都受影響。
社交能力也是這樣。如果嬰兒在 20 個月之前沒有得到父母很好的照顧,沒有和人很好的互動,那麼他終生的社交能力都會受限。
現在科學家在想辦法重新打開大腦各個區域的可塑性,讓我們比如說成年以後也那麼容易學習語言。藥物的方法,甚至電擊的方法都用上了,不能說完全沒希望,但是至少目前來說,我們不得不尊重大腦的發育順序。
那你說大腦為什麼非得有一個敏感期,為什麼不一直都保持高度的可塑性呢?根本的原因是你希望基本功能能穩定下來、成熟下來。你不希望永遠花時間分辨識人說話的四聲,你希望讓那個技能進入快速通道,完了你好關注更進階的東西。
而另一方面,大腦的固化也定義了你是誰。将來不論你有什麼境遇,隻要一歲以前聽的都是中文,你就永久性地被打上了中國的烙印。
好在我們的前額葉皮質固化的速度很慢,一直到青春期還在快速生長,永遠都不會徹底固化。這使得你永遠都可以學習新知識。跟别的動物相比,這是一個奇迹。
也就在一百年前,世界上大部分人都是文盲。人們做的都是一些粗糙的工作,主要靠力氣謀生,而今天相當大比例的人是從事腦力勞動,做非常精細的工作。這個變化不可能是自然選擇的結果,生物進化太慢了。這是教育的力量,是學習的力量。
學習,隻需要不到二十年,就能把一個父母都沒上過學的人變成數學家。
這是怎麼做到的呢?我們設想,數學家的大腦跟沒上過學肯定有重大的差別……那是什麼差別呢?斯坦尼斯拉斯·迪昂在《我們如何學習》這本書中說,差別的确是有差別。隻要掃描一下大腦,任何一個腦科學家都能看出來誰是數學家誰沒上過學,這個差別是硬體水準的差距。但是,這個差別不是什麼本質的不同。數學家的大腦也是他父母給的,後天的學習并不能徹底改寫大腦結構……
就好像孫悟空學會了七十二般變化也不得不保留自己的尾巴一樣。你再怎麼學,也會偶爾流露出原始大腦的本性。
你說我們在做加減乘除計算的時候,是在做數字元号式的計算呢,還是模拟生物式的計算?我先說說這是什麼意思。我們算乘法都是背口訣,八九七十二,二六一十二,8×9 和 2×6 這兩道題的難度對你好像是一樣的,你并不關心其中數字的大小,順着口訣就說出來了答案,數字對你來說隻是符号。如果是這樣的,那就叫符号計算。
但是對加減法,我們通常不是靠口訣。算 2+1=3,我們好像就是想象兩個東西加一個東西是三個東西,我們好像産生了某種“數量”的直覺感受。
迪昂沒說乘除法的事兒,但是迪昂認為,我們算加減法是模拟生物式的運算。科學家有充分的證據表明,人們算 9 - 6 所花的時間比算 9-4 要長,而算 9-4 又比算 9-2 用的時間長。我們就好像剛學算數的小孩用手指頭算減法一樣,先想象 9 個東西,然後一個一個地拿掉 6 個、4 個或者 2 個東西。要拿掉的東西越少,計算時間就越短。
數字在我們大腦中并不是單純的、抽象的符号,而是真的代表數量,這是原始人、包括動物也有的數量感。
因為我們對數量有直覺的“感”,我們有時候會做一些事後想想有點怪的事兒。比如有一天上午你去簽約買房。房子成交價是兩百多萬,其中有個小細節涉及到一萬多塊錢的争議。你心想兩百多萬的房子都買了也不差這這點錢,就直接同意了。
然後當天下午你在淘寶買一根二十多塊錢的資料線,你花了五分鐘又是琢磨性能又是評估品質貨比三家,終于節省了兩塊錢。
如果你不在乎一萬多塊錢,為什麼要在乎那兩塊錢呢?根本原因就是我們的大腦對數字”本身“的感覺,比數字的”機關“強烈得多。200萬和200元給我們的數字感差不多,兩塊錢之于二十塊錢的比例對我們的刺激很深。
學習再進階的數學,也離不開這個數字感。
迪昂本人提出一個關于人類學習的關鍵思想,叫做“神經重用假設(neuronal recycling hypothesis)”。
迪昂認為,學習帶給我們的新能力,不管你是數學家、音樂家還是抽象藝術家,不管多麼進階,都是對人類大腦中早就存在的舊腦區的新利用,而不是開辟一個新的腦區。你不是在白紙上建設一個新功能,而是把大腦已有的功能區域給來一個重新定向使用。這個假設如果成立,就說明學習改變不了大腦的根本結構,隻是把大腦的神經網絡變得更敏銳、更精細化而已。而這也就意味着,我們的學習要受到大腦結構的限制。
腦神經科學的新研究給迪昂提供了有力的證據。
我們的數字感來自大腦的頂葉皮質(parietal cortex)和前額葉皮質(prefrontal cortex)中的神經網絡。每個數字都對應特定的神經元,當你看到阿拉伯數字“5”的時候,你大腦中并不隻是一個符号,而是一個數量。原始人和動物不會掌握精确的數字,有些原始部落裡的人無法表達比 3 大的數,但是,他們都有一個“近似的”數字感。他們對 5 和 6 之間的差别确實不敏感,但是 5 和 10 的差别很大,他們完全能感受到。
頂葉皮質裡的神經活動是一維的,專門處理數量關系。哪個小哪個大,從低到高的排序,甚至包括社會地位的高低順序,隻要跟數量和大小有關,就歸頂葉皮質管。你是再厲害的數學家,沒有這個區也不行。
頂葉皮質本來是動物們用來模模糊糊地評估數量大小的,我們學了數學以後,它就好像煥發了第二春一樣,獲得了思考高精度數學問題的能力。職業數學家考慮數學定理也用頂葉皮質,就跟國小生算算術一樣。這就是神經重用。
當然數學計算還需要調動其他的腦區。後頂葉(posterior parietal lobe)本來是幫助動物轉移凝視的對象和注意力用的,而現在它開始參與數學計算了:要算個加減法,你得想象數字在空間移動,你的注意力一次處理一個數。
為什麼一個從小失明的人長大之後成了數學家,還研究幾何?因為幾何調動的關鍵腦區不是視覺之類的感官區域,而是頂葉、後頂葉和前額葉。迪昂認為盲人也能成為數學家這件事恰恰說明每個人對數學都是本身具足:要不是他們已經擁有抽象思維的能力,又怎麼可能隻靠那麼有限的感官經驗掌握數學呢?事實上失去視覺對盲人搞數學可能還成了一個優勢:本來視覺信号進入大腦之後要在皮質進行分析,現在大腦皮質不用管視覺了,就可以更多地用來做數學。
有些看似簡單的能力,都是基于特定腦區的。
為什麼你能看懂二維的東西,比如說地圖、表格和統計分布圖?因為你的大腦中有個“内嗅皮質(entorhinal cortex)”,其中的神經元編碼是二維的。否則要是光靠頂葉皮質,我們就隻能了解一維的數學。
腹側視覺皮層(ventral visual cortex)善于思考線條和形狀。
布若卡氏區(Broca’s area)善于處理語義樹。
不同的腦區對世界的邏輯結構有不同的假設:有的認為世界是一維的,有的認為是二維的,有的認為是樹狀的……你得先擁有産生這些假設的能力,才能去驗證、去了解相關的知識。
原始人用這些腦區去識别動物花草和區分大概的數量,今天的人們才能用它們來做計算、程式設計和搞藝術創作。但我們并沒有脫離它們。
民間哲學家王東嶽發明了一個說法叫“遞弱代償”,說生物的生存能力總是一代比一代弱,同時越來越依賴外界的支援。神經重用假設是一種遞弱代償嗎?我們把那些腦區都用在學習新知識上了,它們原本的功能會不會是以減弱呢?
我認為“遞弱代償”既不符合進化論也不能解釋所有的相關現象,根本就不是一個科學理論,沒有預言能力,隻能讓人拿來對社會變遷發發感慨。沒有任何證據說因為人腦學了新知識,舊的功能就變弱了。
我們不要低估大腦的潛能。咱們說一個迪昂本人參與的研究。
視覺皮質裡有一個小區域,本來是專門識别人臉和給各種物體分類用的,它位于大腦的左半球。我們學習文字、把文字轉換成聲音和意思,也用這個區域。我們把它稱為“文字區”。
迪昂專門去葡萄牙和巴西研究了幾個從來沒上過學的成年人,掃描發現他們的文字區已經被識别人臉和物體的功能占滿了。他們面對文字就好像《俠客行》裡的石破天一樣,隻能看見各種線條和形狀。而對比之下,識字的人看文字能看出聲音和意思來,不管文字是大是小、變換字型、位置和大小寫,你都不在意。你的文字區裡除了人臉和物體分類功能之外,多了一個文字功能。
這個過程是小孩從六七歲上學開始逐漸進行的,
上學之前,這片區域中有物體、有人臉、有地點專屬區,同時還留有一些空白。上學之後,空白的地方就慢慢被文字所占滿。而那些從來沒上過學的人,則繼續用物體、人臉和地點占滿剩下的空白區。文字,搶占了其他功能的地盤。
但是!人臉、物體和地點功能并沒有就此止步,它們在人的右腦對稱的位置,開辟了新的領地。我了解那片領地本來是個備援,現在因為你受教育,而變得有用了,
是以學習文字并沒有讓你損失人臉識别能力,隻是讓你的大腦更有用了。
不過問題并沒完。我們要是用得再狠一點,會怎麼樣呢?職業數學家閱讀數學公式是個超能力。普通人看公式如讀天書,數學家掃一眼就知道怎麼回事兒。這個功能也是長在識别人臉的那個區域,而且數學家用得比較狠,把大腦左右半球的兩個相關區域都用上了……那麼數學家在識别人臉上會不會有困難呢?
沒有證據能證明這一點。是,有些數學家好像有社交障礙,不怎麼在意人臉,但是别忘了,很多不懂數學的人也這樣。而且也有很多數學家非常善于交際。
不管怎麼說這都跟“遞弱代償”沒關系,科學結論是多學點東西對大腦根本不是負擔。多數人隻會一種語言,但大腦不是隻為一種語言準備的:有些人從小聽着兩種語言長大,大腦不但夠用,而且語言學習潛能還被開發出來了,将來再學第三門、第四門外語都很容易。
教育對絕大多數人的作用隻是開發大腦,不是擠占大腦,大腦裡的神經元很多,原始人會的那點技能很少。
“神經重用假設”給我們的教訓和啟發大概有這麼幾個。
一個是大腦發育“敏感期”很重要。六七歲開始學文字是一個非常恰當的視窗期,文字區沒被占滿而且正在成長之中,這就是為什麼小孩學得快。等到長大成人,文字區變“硬”了,再學認字可就難了。從國小音樂的人讀樂譜的速度都比後學的人快。
迪昂研究過兩個成年以後才學認字的人。一個人是從來沒上過學,他最後費了很大的勁,竟然在通常的文字區之外新開辟了一個記錄文字的腦區,但是學得很慢。另一個人則是因為中風把文字區整個破壞了……他努力了,但是終究沒有長成一個新的文字區。
所謂“數學家的直覺”,到底是什麼呢?機械化的計算談不上直覺。現在我們知道大腦是個模拟裝置,那些區域裡本來一切都是形象化的東西,那麼直覺也許就是某種形象思維。
講學習方法沒有不強調專注力的。專注力是最硬的學習功夫,是比智商更重要的能力,對普通人的學習成績有決定性的作用。學習需要專注,這個道理誰都贊成,但是魔鬼在細節之中。腦科學能回答一些有争議的問題,比如說,打電子遊戲能不能提高專注力。
我們簡單地說,專注力(concentration)是使用注意力(attention)的能力。而注意力是對資訊的選擇。我們每時每刻都在接觸大量的資訊,而大腦處理能力有限,是以必須有選擇地接收。這表現在各種資訊進入大腦的深度不一樣。
有的資訊到達感官,比如聽覺、視覺、觸覺,就打住了。引起你充分注意的資訊,才能從感官形成概念,再由概念形成解讀,一直進入到前額葉皮質之中。前額葉皮質中有大量的神經元能夠更長時間地被激發,資訊深入到這裡你才能記住和學到。
是以注意力是學習的必要條件。大腦一共有三種注意力系統,分别決定了你
“什麼時候注意”
“注意什麼”
“如何注意”
能被外界信号引起注意,是我們最原始的一個動物本能。你不但要機警,還得機敏。你在叢林裡散步,走着走着突然有一隻老虎大叫一聲蹦出來了,那你肯定會立即忽略其他一切想法而專門注意這個威脅……否則你就會被演化淘汰。
報警信号決定了我們什麼時候注意。這個機制是警報一拉響,大腦馬上就會釋放大量的神經調節質,比如多巴胺、血清素之類,它們會讓你立即産生強烈的情緒波動,調動很多個長距離的神經元連接配接,把信号迅速傳遞到整個大腦皮質之中。用老鼠做實驗,如果提供一個聲音信号的同時還提供神經調節質,老鼠就會更容易學會和分辨這個信号。
這種強烈的刺激,能提高大腦皮質的可塑性,包括對成年大腦也是這樣。我們大腦皮質裡總是有兩個過程在同時進行。一個是激發,讓神經元變得活躍;一個是抑制,讓神經元變得不活躍。強烈的刺激,不但提高了激發,而且還“抑制”了那個抑制過程,這就可以暫時開啟皮質的可塑性,那一刻的大腦就好像重返青春一樣。我了解現在有些研究使用藥物甚至電刺激大腦的方法試圖重開可塑性,就是這個原理。
但是你明白了這個原理,其實不需要那些“硬”刺激。迪昂說如果你對自己所學的這個東西有強烈的興趣和熱情,你學習的時候産生強烈的興奮情緒,那你的大腦就會更活躍,可塑性就會提高,你就會學得更好。
要這麼說的話,我們學東西最好不要默默地學,應該有一驚一乍的感覺。拿過來一個知識點應該拍案驚奇。古人聽說一個快意的事兒動不動就“當浮一大白”,我們讀書讀 high 了應該在想象中跟作者幹一杯。這樣你學習效果才好。
正是在這個意義上講,電子遊戲其實是一種高效的學習方式。特别是暴力遊戲,随時都有警報,一個動作沒做好你就被打死了,做好了你就能把對方打死,你就立即收獲多巴胺,你說打遊戲的學習能不快嗎?旁觀高手在遊戲中的微操作能讓人心生敬畏。他眼神的反應、滑鼠的速度、站位的選擇、時機的把握,絕對不是鬧着玩能玩出來的。
有實驗表明,10個小時的電子遊戲訓練足以提高人的視覺探測能力,你掃一眼就知道螢幕上局面是怎麼回事兒。遊戲能最有效地提升專注水準。你能更長時間地集中注意力,面對幹擾沉着冷靜。你在壓力面前毫不退縮,在極短的時間内能夠連續做出精準決策……請問誰不想要這樣的能力?
也許電子遊戲能延緩大腦衰老。當然遊戲有很多壞處,占用了你的學習時間和社交時間,還會讓人上瘾……但是,我們可以把遊戲思維用在學習上。老師講課能不能講得刺激一點?教科書能不能寫得更引人入勝?教學環境能不能提供一個更沉浸的體驗?
注意什麼,是我們主動把注意力轉向的能力。你去參加一個聚會,房間裡有很多人在說話,你能精确地選擇聽誰說話。同一幅畫,有的人看色彩,有的人看線條,有的人看風格,而有的人看筆法和技術。如果不是突然的刺激,每個大腦接收到的都是主動選擇的東西。
專注力意味着你可以選擇看什麼就能看到什麼,也意味着你不看什麼就忽略了什麼。有個著名的實驗叫做“看不見的大猩猩(invisible gorilla)”,現在已經被重複驗證了很多次,受試者每次都感到很震驚。
你要看一段錄像,内容是兩個隊伍在打籃球。你的任務是數清楚穿白色球衣的那支隊伍的總傳球次數。這是一個簡單任務,隻要注意力集中就行 —— 結果受試者的注意力都非常集中……以至于大多數人沒有注意到,有一個大猩猩從球場上大搖大擺地穿過。
有的研究掃描受試者眼球,發現有好幾次,受試者的眼睛正好對準了那個大猩猩,但是他們視而不見。是以真正的看是用大腦去看,而不僅僅是用眼睛。你的注意力要是沒到位,這件事對你就相當于不存在。
學習,得會看門道才行。同樣是學單詞,你要是隻注重字形整體就很難學會,你要是注意其中的字母組合規律,就更容易學會發音的規則。
這麼說的話教學必須管理好注意力。老師必須随時引導學生的注意力才行。
高水準的學習者必須善于控制自己的注意力。所謂“如何注意”,靠的是大腦的“執行控制系統(executive control system)”。這是大腦最進階的功能,由額葉皮質主導,作用是督導大腦的活動。
比如你做一道簡單的算術題,23×8。大腦會讓你先算 3×8=24,然後把 24 這個數字在“工作記憶”中暫存起來,然後算 2×8=16,因為是十位,要變成160,然後你再把剛才暫存的 24 拿過來,算出 160+24=184。
整個過程中,你的注意力在不斷地移動,有時候在 8 上,有時候在 3 上,有時候在 160 上。這個移動,就是執行控制系統的作用。要用電腦強行打個比方的話,執行控制系統就好像是 CPU 和記憶體的聯合工作,它能確定你按照正确的順序執行操作,能發現你的錯誤,還能随時調整計劃。
執行控制系統每次隻能做一個任務,是以一心多用是不可能的。執行控制系統的強弱展現在你的工作記憶能暫存多少個東西,你能同時用多少個東西思考,你的執行速度快不快,你能不能堅決有效地完成一個高水準邏輯項目,是以執行控制系統跟智商密切相關。工作記憶就好像記憶體一樣,我以前聽到一個說法認為沒受過教育的人的工作記憶隻能容納 4 個東西,而受過多年教育的人的工作記憶可以容納 7 個東西。迪昂提到的一個研究說人每接受一年正規教育,智商提高1到5分。
是以執行控制系統是可以練的,但是它首先有一個成長的過程。對專注的自控包括兩個方面,
一個是控制自己做該做的事
一個是抑制住自己,不去做不該做的事
一個特别有意思的實驗是這樣的。對一歲以下的兒童,研究者一開始總是把一個玩具藏在 A 地點,然後孩子就記住了這個地點,每次都去 A 處找玩具。後來研究者改為每次都把玩具藏在 B 地點,但是他每次找玩具仍然會先去 A 地點,這是為啥呢?
以前人們曾經以為這是因為孩子缺乏對物體位置的判斷力,後來發現不是。從孩子的眼神之中,研究者能看出來,孩子其實已經知道玩具現在在 B 地點了,但是他還是要先去一下 A 地點 —— 因為他已經養成去 A 地點的習慣了!他的大腦裡有一個去 A 地點找玩具的沖動,他必須抑制住這個沖動,才能不去 A 點直接去 B 地點。
但是不到一歲的孩子還不會抑制自己的沖動。事實上這個執行控制系統是人類特有的系統,也是人成長最慢的能力,是一直到 20 歲才長成。這就是為什麼那些青春期少年能機敏地對信号發生反應、能夠把電子遊戲打得很好、能了解現在應該注意什麼東西,但是很難長時間專注于做一件事。
那怎麼練習專注力呢?迪昂認為打遊戲是個好辦法。當然練習一門樂器也是個好辦法。比如每天練練彈琴,你必須控制好身體、思想和手,耐着性子執行固定的流程,這個可以提高專注力。
我認為老師和家長比學生本人更需要專注力的知識。你要教孩子學習必須牢記一點:孩子是通過“你的”注意力判斷所要學習的東西的。還記得我們前面說的關于蝴蝶和潛水艇的故事嗎?光說不行,你的注意力得在這個東西上,孩子才知道你是在教他。
有個實驗是這樣的。老師面前擺了兩個東西,如果老師隻是拿起來其中一個東西,孩子對這件事的解讀就是老師本人喜歡這個東西。但如果老師在做選擇的時候,通過手勢或者眼神向孩子做了示意,明确指出這個東西,孩子就會了解到,是這個東西本身是個好東西,他才能學會這麼一條知識,才會模仿老師的行動。
是以教學的過程中,老師一定要始終讓學生知道你的注意力在哪裡:你的注意力應該始終放在學生不知道、但是應該知道的那個知識點上。然後學生必須知道你知道他不知道這個知識點。老師的注意力就好像是一種靈力一樣,是學習的關鍵資源。
這就是為什麼家長對孩子說話很重要,讓孩子看電視聽錄音學語言就不行:因為電視裡的話不是對着孩子說的,電視機錄音機沒有注意力,必須得是一個真人的注意力才管用。注意力是非常微妙的互動,可能無法用視訊表現。網課、視訊會議效果不如真人見面,也許道理就在這裡。這大概也解釋了為什麼成功的演講需要眼神和手勢的配合:你最好時刻讓觀衆知道你的注意力在哪。
學習有兩個方法。自己在環境中主動試錯,這種方法連動物都會。跟父母和老師學習需要你調動專注力,這個方法看似被動,卻是人類特有的能力,是人類文明得以傳承的關鍵。
為了增強你的學習效果,我先問你一個問題。假設你是一個國小數學老師,這一節課要教給學生一個他們沒見過的新題型。在以下兩種教學方法中,你認為哪個效果更好,
第一個方法,你先把題目抛給學生,讓學生們自己摸索計算。比如一堂課 45 分鐘,你先讓他們摸索半小時,再用最後的 15 分鐘點評講解。
第二個方法是你一上來就先講一道例題。明确告訴學生這個新題型的要點是什麼,應該怎麼解,并且總結解題的步驟。你講完了,再出幾道練習題給學生做。
我先說說背景。這個第一種方法是被很多教育專家所推崇的“發現式學習”,思路是讓學生們通過探索、自己發現知識。你自己發現的知識,肯定自己更容易接受,對吧?
不對。科學家做了很多個研究,不同學科的教學都做過實驗,結果都是第二個方法 —— 那個聽起來很傳統的方法,教學效果更好。甚至哪怕是你教的學生很聰明,自己真的把新題型給解出來了,他的掌握程度也不如傳統方法教出來的學生熟練。
這是為什麼呢?學習不就應該積極主動嗎?
如果學生隻是被動地聽講,哪怕他老老實實心無旁骛,每個字都聽見了,意義也不大。高效率的學習,學生必須非常活躍、非常積極地參與才行。積極參與的關鍵是随時提出自己的假設,預測這個知識點将是什麼,然後驗證老師講的和自己想的是否一樣。為此你應該主動思考、主動探索。用自己的語言去總結新學到的知識,對知識有自己的想法。而這一切的前提,是學生必須得明确地、深度地領會知識。
這個“深度領會”并不神秘。有個實驗是這樣的,給每個學生發一張英文單詞表,上面很随意地羅列了很多單詞。學生們被分成三組,給同樣的時間,但是他們的任務不一樣,然後測試每組學生平均記住了其中多少個單詞。
*第一組學生的任務是判斷每個單詞是大寫還是小寫,結果他們隻記住了 33% 的單詞;
*第二組學生關注單詞的發音,看看是否跟一個特定單詞有同樣的音韻,他們記住了 52%;
*第三組的任務是判斷每個單詞是不是動物的名稱,結果這組學生記住了 75%。
為什麼會有這樣的差異呢?因為單詞資訊可能隻進入了第一組學生的視覺區,連默念一遍都沒有;第二組學生讓單詞資訊進入了語音區,而第三組則進入了語義區。同樣都是集中注意力接收資訊,因為資訊進入大腦層次的深度不一樣,學習效果就不一樣。
積極參與是為了讓學習進入更深的腦區:不但要進入海馬體,而且要到達前額葉皮質,想得越深越能記住。科學家通過掃描大腦活躍情況就知道誰在積極參與,學習整個都是硬體過程。讓學生積極參與,老師可以使用這麼幾個辦法,
課堂提問
當場做練習
分組讨論
小組聯合完成一個任務
用教具提供直覺體驗
關于最後一點,有人做過實驗。比如大學生學習“角動量”這個實體學概念的時候,拿一個自行車輪子給學生直接上手轉一轉,就能明顯提高學習效果。而與此同時,那些沒有上手參與,隻是在旁邊看别的同學玩那個輪子的同學,學習效果就沒有那麼好。
如此說來,課堂學習中調動更多的“感”,提高參與度,是個好辦法。
開頭說的那個發現式學習為什麼不行呢?咱們舉個例子,程式設計。你扔給學生一台計算機、打開一個程式設計界面,告訴學生自己探索,他的确能摸索出來一點門道。但是那個會很淺。
學生可能一開始覺得很好玩,迅速學會了幾個簡單的語句,能編幾個小程式,但是僅此而已。如果老師不給一個指引,學生就找不到繼續深入學習的方向。
現在有個說法說“00後”這一代年輕人是“數字時代的原住民”,他們從小就接觸電腦和手機,是以對數字技術玩的非常溜 —— 迪昂說,這其實是一個迷思。他們玩的是很熟練,但是如果沒有專門的學習,他們玩的都是一些膚淺的應用,他們的計算機水準并不高,他們并不真的了解計算機。
這麼說的話,讓孩子自己摸索學習,就如同指望猴子拿打字機打出莎士比亞作品一樣。生物演化沒有方向,學習得有方向。學習需要有個引導,不然學生很容易就會陷入困惑止步不前。
科學學習的“積極”,是認知上的積極,而不是行為上的積極。
老師又是演節目又是弄教具教得挺熱鬧,但是如果學生在認知上沒有感受到新知識的刺激,或者感覺這個刺激太強了跟不上,那再熱鬧也沒用。反過來說哪怕自己默默地閱讀一本書,外表沒什麼動作内心卻是驚濤駭浪,那也是認知的積極。
有些教育家認為人有“學習風格”的差別:有的學生是視覺型的,适合多看;有的學生是聽覺型的,需要多聽 —— 這個“風格說”,也是個迷思。視覺跟聽覺、調動更多感官,對所有人都有好處,都能加深印象,但是都有同樣的好處,每個人在這一點上沒有不同,而且都是有限的好處。如果認知不積極,光折騰視聽感官沒用。
那人與人學習能力的差異到底在哪呢?隻有兩個。一是學習的速度,這是由智商決定的;二是學習的動力,這是由好奇心決定的。
動物都有好奇心。為了尋找食物和異性伴侶,每個動物都有離開舒适區出去探索新資訊的沖動。腦科學告訴我們,好奇心直接和多巴胺聯系在一起。你每次去冒險、去旅行、參與一個新活動、有個新發現,大腦都會産生大量的多巴胺。這些多巴胺會加深你的神經元連接配接強度,以至于你連事情發生時候周圍無關的細節都能記得一清二楚!
而且多巴胺還不僅僅是在好奇心得到滿足之後才出來,好奇心本身就能産生多巴胺。比如你要去參加一個預計會非常有意思的旅行,旅行還沒開始,在出發前幾天,你在充滿期待的那個時候,大量的多巴胺就已經讓你很興奮了。多巴胺是大腦的獎勵,我們很享受好奇心。
而人類和動物不一樣的是,我們對知識也有好奇心。哪怕這個知識和食物和異性都沒關系,就是一個非常抽象的東西,比如一個數學方程,我們也可以産生強烈的好奇心。
學會一個新知識,你會獲得極大的愉悅感。啊,我以前不懂這個道理,這回搞明白了,恍然大悟,原來這麼回事兒!跟我想的太不一樣了!哈哈這個認知的更新太爽了。英文世界把這種感覺叫做“mirth”,意思是歡樂和喜悅,我看最合适的中文翻譯就是胡适說的那個“歡喜”:“怕什麼真理無窮,進一寸有一寸的歡喜”。
那既然好奇心這麼好,人類又自帶超強的好奇心,為什麼我們在學習過程中不總有好奇心呢?
因為喂料的速度不對。
好奇心,是保持學習速度的機制。迪昂把學習比喻成開一輛蒸汽火車。好奇心就相當于蒸汽機的那個節流閥,它的作用是保持發動機内部的壓力。壓力太小,節流閥就收緊,讓壓力增加;壓力太大,節流閥放開,釋放壓力。蒸汽機壓力不變,火車就勻速前進。我們學習也是這樣,我們希望學習能夠按照最适合自己的那個速度勻速前進。
好奇心,由“你想知道的知識”和“你現在已經知道的知識”,之間的那個差距,決定。
差距太小,你會覺得無聊,你希望差距再大一點;差距太大,你會感到茫然,你希望差距再小一點。好奇心取決于你對那個差距的評估,好奇心最大的時候就是那個差距對你來說最合适的時候,也是你的學習最愉快的時候。
是以我們不是希望學習材料越新奇越好,也不是越容易越好,我們希望它帶給我們的意外程度恰到好處,保持最優化的好奇心和學習速度。我們需要學習材料在“熟悉”和“意外”之間找到最理想的一個點,這就是為什麼我們以前講過的那個研究裡說,“最高學習效率 = 15.87%”。
這個好奇心的原理,給“因材施教”提出了更高的要求。因材施教不僅僅是根據個人的興趣愛好選擇學習内容,也是根據個人情況調整學習的進度。老師把學習材料喂給學生的速度,得正好适合他的好奇心水準才行。
這就要求學習進度應該根據學生本人的節奏走。
可是現在哪有這麼好的條件呢?一個老師教幾十個學生,課堂上統一的學習材料,對有些學生太簡單對有些學生太難,這兩種學生的好奇心就都……泯滅了。甚至有很多老師,不但不按照學生的節奏走,還生怕學生打亂他自己的節奏。特别有些國小老師不但不鼓勵、而且還禁止學生在課堂上提問。他們隻想讓學生老老實實背着手坐在那裡一動不動地“專心”聽講,他們想要的是在規定的時間内把準備好的内容講完。這叫教學嗎?這叫廣播。
總結一下。學習需要積極參與,調動更深層的大腦活動。積極參與的狀态由足夠的好奇心決定,而好奇心由恰到好處的學習進度決定。
為了激發好奇心,你要用提問之類的方法調動他,你要刺激他,但是這裡面有一個度的問題。學習内容不能随機安排也不能指望學生自己去發現。老師應該事先精心準備好一系列的、結構化的、由淺入深層層遞進的内容,然後根據學生的掌握速度安排學習進度。
老百姓有個說法,說如果你最近特别饞什麼東西吃,那就說明你的身體正好缺什麼,這個在營養學上肯定不對,演化的機制讓我們永遠都愛吃糖和脂肪。知識好像也是這樣,一般人可能總是對娛樂八卦之類的東西很好奇,但是對于學習來說,有結構、有層次的真知識,我敢說能讓你的好奇點沿着從低往高的方向迅速轉移。
要這麼說的話,感到無聊其實是個好事兒。無聊感讓我們等待好奇心,好奇心驅使我們尋求更進階的知識。
你最近對什麼知識最好奇,學什麼東西最快,也許就說明那是最适合你學的。這也許就是你的大腦在向你發出一個信号,表明它最近需要哪一方面的新知識去刺激它。
那麼多書先讀哪一本呢?别讀無聊的書。太簡單太難都不好,讀你最感興趣、讀着最爽的書。别擔心别人嘲笑你的品位。好奇心的原理表明,你的品位會改變的。
我們讀了斯坦尼斯拉斯·迪昂的《我們如何學習》這本書,應該全面反思現在的教育。官辦教育系統,你說它到底是為了育人,選人,還是管人?它非常高效地把一部分人送上大學,它成功地給青少年安排了事兒做讓他們不至于生活混亂。但你要說育人,現代教育的很多做法恰恰是背道而馳。
了解了學習的科學,你會發現現行的教育方法主要是為了老師教學友善、為了學校的組織和管理友善,而不是為了學生學習友善。我認為腦科學應該劇烈地改變我們的教育方法。
這一章我們說的是學習的四個支柱中的第三個,回報。一個關鍵觀點是回報提供了意外,而沒有意外就不能學習。
心理學家講刻意練習的時候就無比強調回報的重要性,而腦科學更把回報上升到了根本性的地位。
迪昂貫穿全書的核心思想,學習,是一個【猜想 → 回報 → 改進】的過程。你的大腦是自身具足的,你對任何知識都已經有一個思維模型,你用你心中的模型對那個知識做一個預測。然後你把外界的回報和你的猜測進行比較,然後你改進你的模型。學習是一個貝葉斯過程,回報是其中的關鍵一步。
了解了這個思想,你才知道什麼是回報。隻有當這個回報對你來說是一個“意外”,讓你調整了自己的思維模型的時候,才是學習。比如我問你魯迅的本名叫什麼,你非常肯定地說是“周樹人”,我說你答對了。這個回報對你是無效的,因為你的思想沒有任何改變,你沒有學到任何東西。
但是答對了不一定就不是回報。比如我再問你一個問題:錢锺書是清華畢業的還是北大畢業的?這個問題你拿不太準,但是你有一點印象,覺得清華的可能性比較大,是以你說是清華。我說,你答對了。
這對你是一個有效回報。你心中模型的參數改變了:可能你之前估計清華的機率是 75%,現在變成了 100%。這是一個廣義的意外。隻要能調整你估計的機率,就叫意外。
是以說不一定非得出錯了才叫回報,驗證了一個猜想也叫回報。能降低不确定性的任何資訊都是有效的回報。學習,就是降低世界在你心目中的不确定性。世界的确是充滿不确定性,但絕不是一切都不确定,否則我們學習就沒有意義。
學習的過程就是消化意外的過程。我們前面講過,剛出生沒多久的小嬰兒遇到意外的事情就會盯着看,他們本能地想從意外中學到東西。人腦對意外非常敏感。
我們對意外的敏感不僅僅發生在前額葉皮質這樣的進階區域。大腦所有的區域,都在偵查意外。
這意味着要識别意外,需要你已經有一個相關的思維模型。三國時期有句話叫“曲有誤,周郎顧”,說周瑜這個人精通音樂,你彈琴彈對了他可能感覺不到,你要彈錯了,他立即就能察覺。
其他腦區,視覺、句子、設計,都是如此。有時候低級區認為沒有意外,進階區還會覺得沒有意外本身也是一個意外……
大腦的學習和 AI 的學習在“意外”這個意義上是一樣的,意外是學習的資源。
而意外隻是資訊而已,是以回報是個中性詞。并不是非得遭遇失敗才算回報,為了長一智不一定非得吃一塹。調動更多的“感”、老師演個節目、加深印象,那些都是為了強化記憶的外圍功夫。真正從修正思維模型來說,人腦和AI需要的回報是一樣的。
回報隻有兩點最重要:一是及時,二是準确。
做到這兩點,有監督式的學習就是最高效的。同樣的道理,在公司管理群組織建設上也是類似的,這也是管理學大師德魯克強調的“回報式管理”。
可是既然回報的道理這麼簡單,我們在平時的教育和學習中合理使用回報了嗎?遠遠不夠。
咱們設想你是一個家長,正在教女兒做數學題。這是一道選擇題:請問兩個奇數相加,得數是奇數呢,還是偶數?女兒拿不太準,她試探地說,奇數加奇數等于……奇數?這是錯誤的答案,請問你怎麼給回報。
很多家長在這時候一定要說一句“你錯了”。千萬别這麼給回報。是,孩子确實錯了,但是你這麼說她會感到你是在針對她。她會産生情緒的劇烈波動,會自我懷疑。正确的做法是簡單地告訴孩子奇數加奇數等于偶數,然後她要是不明白就給她講講為什麼。
回報隻要及時準确就行,不需要情緒波動。為什麼呢?難道有情緒波動不是讓人印象更深嗎?是印象更深,但是你不想要這樣的印象。被人指出錯誤會本能地産生恐懼心理,而恐懼會讓大腦的可塑性下降。一個被指責的大腦将會是封閉的大腦,根本不想學習。學習的第一步是積極主動的預測,而預測需要大膽,需要放松的環境。你要讓孩子學習就不能讓她把頭腦縮回去,得給充分的安全感。
那我們想想,學校裡的考試,是這樣的回報嗎?考試給學生提供的不是正确答案的資訊,而是一個分數和一個排名。
如果你經常排前面你可能喜歡排名,這有點像體育比賽,很刺激。但是對大多數學生來說,考試不是理想的回報。首先它不及時,等過了好幾天分數出來你對考場上那道題已經不感興趣了。更重要的是它不具體,成績并不能告訴你哪塊知識點比較弱、為什麼答錯了、需要怎麼改進。
特别對于靠後的學生,排名簡直就是侮辱。我們想想這個情景是不是有點殘忍,這位同學每天坐在教室裡學習,被學校一次次地證明自己不行!有些學生考試都考出 PTSD 來了,現在就有一種症狀就叫“數學焦慮症”,一拿到數學題就緊張害怕,因為每次都答不好數學題。這還是學習嗎?
如果學校的目的是為了服務學生,考試制度絕對不應該這麼設計。我們恰恰應該借鑒一下遊戲的做法。任何一個電子遊戲,一開始的關卡總是非常簡單,恰到好處地讓新手既能過關、又保持興趣。在遊戲的進行中再一點點地增加難度,而設計師的目标總是盡量讓遊戲難度和玩家的水準相比對。闖關失敗了你總是可以再打一遍,一直打到你能熟練過關。你過關了遊戲會用更新奇的任務吸引你玩下一關,你沒過關遊戲絕對不敢否定你,恨不得多給幾個提示好把你留住。遊戲這樣設計,因為這符合人性!
美國的學校在期末考試這一點上做得可能更人性化一點。它沒有全班排名也不公布分數,同學之間互相不知道成績。家長在期末會收到一份詳細的報告,知道自己孩子在全學區甚至全國的同類學校中大概是個什麼水準。報告中各個學科被分成了若幹子產品,能顯示孩子哪塊比較強哪塊比較薄弱,是閱讀不行、文法不行還是寫作不行?你能有個大概的概念……
但是這些距離腦科學要求的教育方法,還差得很遠。
除了把回報當懲罰之外,迪昂認為,世界各國的教育有個最根本的問題,那就是測驗……太少了。
如果你能以不悲不喜、對事不對人的心态面對測驗,測驗是最好的回報。學了一個知識點不應該等幾個月後的期中或者期末考試再測驗,應該在一天後、一周後、一個月後這種漸漸拉長的間隔期進行多次測驗。答錯了,你知道自己沒學明白可以立即改進;答對了,也許你的猜測得到證明;就算你是非常有把握地答對了,拉長間隔式的測驗也是喚醒記憶和鞏固記憶最高效的方法。
有人做實驗證明,用同樣的時間教同樣的内容,分 8 次講課就不如講 6 次測驗 2 次,更不如間隔式的講 4 次測驗 4 次。最好的辦法就是講一個知識、當天練習一遍、晚上睡一覺、第二天立即測驗,然後過幾天再測驗、然後過更長的時間再測。
這個方法已經被無數的研究所證明。你是學英語背單詞也好,是學數學學曆史也好,讓測驗時間占到總學習時間的一半是最科學的。
為什麼測驗這麼好呢?因為測驗最符合 猜想 → 回報 → 改進 這個模式。間隔一段時間等你對那個知識稍微有點淡忘了的時候,意外感正好又回來了,是測驗的最佳時機。你每次測驗都對知識有新鮮感,簡直是“人生隻如初見”,一直到徹底掌握為止。你說這樣的學習豈不是很愉快嗎?
是以從腦科學角度來講,教學進度不應該按照課本的章節順序勻速前進,而應該是把内容給打亂。剛學點新知識、測驗了新知識,馬上又複習舊知識,讓新舊知識按照最符合大腦認知習慣的方式交替滾動前進。
在微觀層面,回報最好是像遊戲那樣,一旦發現薄弱點,給你講一遍對的,馬上再出一道類似的題目讓你練習一遍,然後第二天再測一遍。
晚上睡覺的時候大腦并沒有閑着,是在回放白天的經曆,把海馬體的資訊傳輸到更深的腦區,鞏固白天所學的知識。我們已經知道這些,但是迪昂沒有讓我失望,他提供了更有意思的腦科學知識,而且還提供了比較極端的方法。
我們先來看一張圖,說的是剛剛學習認字的一年級國小生是如何閱讀英文單詞
一年級國小生讀一個單詞要調動好幾個腦區。他們不但需要閱讀的腦區,而且需要前額葉皮質參與中央控制,需要空間注意力随時調整眼睛盯着的地方,為什麼呢?因為他們是一個字母一個字母地讀單詞。
展現在右邊這個曲線上,就是一年級國小生讀一個單詞需要的時間,和單詞的長度是成正比的。如果這個單詞隻有兩個字母,他們大概需要 0.9 秒,如果是 5 個字母,則需要 1.4 秒。這恰恰也是閱讀障礙症患者的讀法,他們的速度還不如一年級國小生。你可以想象,這些人讀書可以說是用手指指着一個個的字母讀,非常費力。
然後咱們再看二年級和三年級國小生的閱讀,
首先他們用到的腦區很少,并不需要調用中央控制系統。特别是三年級學生,閱讀時間和單詞長短已經幾乎沒關系了,等于是掃一眼就知道那個詞是什麼。這是一種無意識地操作,是閱讀的自動化。形成自動化,說明大腦裡已經為單詞和常見的字母組合長成了專門的神經回路,單詞已經深深烙印在大腦裡面了。
我們讀中文也是如此。你不需要先辨認偏旁部首、再一個一個判斷每個字都是什麼,你甚至都不需要辨認幾個字的組合:“中華人民共和國”,你掃一眼就知道這七個字說什麼。更熟練以後你甚至都不用一句一句、可以一片一片地閱讀,像羅胖更是可以“刷書”:眼睛一掃,幾個關鍵詞自動就蹦出來了。
其他的技能也是如此。打字、演奏樂器、開車,剛開始學的時候都需要前額葉皮質的參與,你是非常有意識地做動作,方向盤怎麼打,什麼時候踩刹車,動作非常僵硬。等到熟練以後你就可以無意識地完成這些操作,技能已經成為你的“程式記憶”。
自動化對大腦非常重要。從基層的小事中解放出來,你才能去思考大事。初學者手忙腳亂,高手雲淡風輕。
是以,一個人在學習中付出了注意力,積極地參與,調動了好奇心,獲得了有效的回報,這些還不夠:他還需要把學到的知識鞏固到大腦裡,變成快速的、自動的知識才行。
那鞏固是如何發生的呢?當然是訓練。你需要通過重複訓練達到熟能生巧。但白天清醒狀态下的訓練隻是一部分,還有更重要的一部分,是睡眠狀态下的訓練。
你可能經曆過或者聽說過這樣的事情。教一個孩子比如說彈琴,白天你陪着他練了那麼長時間,他就是不會,可是晚上睡了一覺,第二天突然會了!他是怎麼會的呢?這是因為大腦在睡眠中把白天的訓練重複了很多遍。
這個效應已經被很多實驗證明了。比如有個實驗是這樣的,兩組學生接受同樣的訓練,同樣是間隔八小時之後測試。第一組是早上8點學習,下午4點測試;第二組是半夜學習,第二天早上測試。結果因為第二組中間有個睡覺的過程,這組的成績就明顯更好。
而且你白天學的東西越多、經曆越豐富多彩,你晚上就越想睡覺,睡得就越好,因為你需要更多時間去回放和消化吸收白天所見所學的東西。白天瘋玩一整天,晚上大睡一場,這真是美好的一天。
而且睡眠中的回放式訓練很可能比白天的訓練更有效。關于睡眠科學,有兩個知識點,可能會讓你驚訝。
一個是睡眠對白天經曆的回放,是非常精确的回放
科學家讓一隻老鼠白天到處運動,那個路線它隻走了一遍,但是海馬體記住了。海馬體中有一套專門記錄位置的神經元。晚上老鼠睡覺的時候,科學家觀察它的腦神經活動,發現老鼠海馬體的那些位置神經元先後活躍的次序,完美地等于它白天行動的路線。精确到什麼程度呢?你把老鼠夢裡的神經活動錄下來,用計算機解碼,能夠反推它白天去的是哪些地方。
另一點,睡眠時候腦神經活動的回放速度,是白天實際經曆速度的20倍
你可能還記得《盜夢空間》(Inception)裡的那個設定,說服用普通鎮靜劑能讓夢的速度是生活速度的 12 倍,強效鎮靜劑能達到 20 倍 —— 其實不用鎮靜劑,你正常睡覺就是 20 倍。
這意味着什麼呢?意味着你白天經曆過一次的事情,睡眠中可以回放很多很多次。你白天練習了10遍,睡眠中可以以同樣的精度練200遍。那你說睡眠能不重要嗎?
當然因為你是在睡覺,你并不記得自己回放了白天的經曆,這些都是科學家做實驗和掃描大腦觀測出來的結論,但是你的大腦記得,你的程式記憶記住了,你的技能長上了。我們有時候能記得的是做夢,而夢通常都跟白天經曆不一樣,有很多離奇的情節,那這是怎麼回事兒呢?
這就是睡眠的另一個作用,那就是建立新的思維模型。我們白天接收到的資訊很有限,不像 AI 訓練可以使用海量的資訊,但我們的大腦在睡眠中把資訊給壓縮了,快速播放,它不僅僅是簡單回放,還有混合播放。這種混合播放就好像搭積木一樣,能把新資訊和舊資訊給聯系起來,重新排列組合。
往往這種排布能給你帶來白天沒有的洞見。夢境不會直接給你答案,但是可以給你埋下答案的種子。有時候一個問題你白天絞盡腦汁不知道怎麼辦,一覺睡醒再一想,突然想明白了,那就是因為你在夢中已經嘗試過各種連接配接方案。夢,是大腦在模拟現實,在做思想實驗。
睡眠讓我們在訓練素材有限的情況下,不但大大增加了訓練的次數,還變着花樣把玩了那些素材。是以現在研究者也在設法讓 AI 做夢……
那我們怎樣才能進一步利用睡眠的好處呢?
科學家對睡眠周期的理論現在還不是完全成熟的。迪昂說,現在大家比較認同的說法是有兩個睡眠階段最關鍵。
一個是“深度睡眠”,這時候大腦發出一個“慢波”,大概每秒波動 40 到 50 次。深度睡眠是鞏固知識性的學習的時候
另一個是“快速眼動睡眠”,也就是 REM 睡眠,大腦活動很快速,容易做夢,是鞏固動作性的學習、加強程式記憶的時候
我們有四個利用睡眠學習的方法。這些方法都不是随便推測出來的,都經過了實驗的檢驗,但是我得強調一句,有些實驗驗證還在進行之中,具體哪個更有效、效果好到什麼程度,目前并沒有精确的結論。
第一個方法最簡單,就是多睡覺
以前人們說早睡早起身體好、一日之計在于晨,那個肯定适合農業社會,在現代社會不一定科學。特别是今天很多腦力勞動者都喜歡晚睡,那你既然晚睡,又需要保障睡眠,就應該晚起。
從腦科學角度,現在的上學和上班的時間可能是偏早了。美國有很多中國小已經改成了 8 點半、甚至 9 點開始上課,讓孩子們多睡會兒。除了對學習有好處,還有研究表明,晚點上學還能降低肥胖和抑郁的可能性。
午睡也是個辦法。研究表明幼稚園的小孩上午學完知識,中午如果有午睡,鞏固知識的效果會好很多。
第二個辦法是你應該盡量在睡覺之前、或者離睡覺比較近的時候學習
如果是上午學的知識,到晚上睡覺之前因為已經過去了十來個小時,你已經淡忘了一部分。你要是下午學,大家都比較困效果也不好。晚上睡覺之前學、學完馬上在睡眠中鞏固,這個效果最好。
當然學校不可能這麼安排學習時間。但是你總可以在睡前讀讀書、把白天所學的重點回顧一遍,以期做個“好”夢。如果你是個自由職業者就更好辦了,白天應該用來處理一些日常的、社交的事物,晚上夜深人靜的大好時光應該用來讀書學習。
第三個方法就比較激烈了,是直接給大腦來一個實體刺激
既然深度睡眠對鞏固知識最有效,而深度睡眠又伴随着一個慢波,那我們能不能在睡覺的時候從外界給大腦來一個慢波的刺激,引導大腦更多地處于深度睡眠狀态呢?
這有兩個方案,都需要你在睡覺的時候戴一個頭盔或者頭環之類的東西。一個方案是直接對你的頭顱進行電刺激,一個方案是播放某種慢波聲音。這兩個方案現在都有産品,但是我不知道哪個品牌好,也不知道效果到底如何。
第四個辦法很有想象力,是想辦法在睡眠中喚起你白天特定的記憶
比如一個學生白天上了兩節很重要的奧數課,還上了一大堆她認為不重要的别的課。回家寫完作業看了一會兒電視劇,叫《還珠格格》。那你可以想見,她肯定更希望在睡眠中回顧那兩節奧數課的知識,而不是反複播放《還珠格格》。可是她怎麼才能選擇自己的夢境呢?
科學家測試成立的一個辦法是這樣的。上奧數課的時候,老師可以在教室裡弄點香水,散發出某種特定的玫瑰花的香味。學生晚上睡覺的時候,也給她聞到同樣的玫瑰香味。這個香味會觸發她大腦相關的神經網絡,開啟對奧數課的回放。
當然我不知道這個方法如果用多了會不會讓大腦适應了香水味道就不靈了,又或者必須每天換一種香水。另有一個實驗的辦法是白天學習某些特定知識的時候播放一種聲音,然後在睡覺的時候放同樣的聲音,這個也能加強鞏固知識。
請注意!所有這些方法都隻是用來鞏固白天學習的知識。睡眠狀态下你不能學習新知識,學新知識,你必須使用專注力、積極參與、有效回報那些辦法,而那些在睡覺的時候是做不到的。有人說睡覺的時候聽有聲書或者聽外語有用,那個已經被科學否定了。