知名計算機專家吳軍：ChatGPT不算新技術革命，帶不來什麼新機會

導讀

4月3日晚上，計算機科學家、自然語言模型專家吳軍，就人工智能和ChatGPT等當下熱議的話題作了一次直播分享。

吳軍，畢業于清華大學和約翰霍普金斯大學，計算機專業博士，前Google進階資深研究員、原騰訊副總裁、矽谷風險投資人。

為何ChatGPT沒有出現在中國？吳軍表示，其“硬體成本就要差不多10億美元”，一般的科研機構做不成，更不用說研究水準的問題。

吳軍 | 演講

ChatGPT的出現，為什麼會引起恐慌？

我知道，最近ChatGPT這事兒在中國很火，很多人在讨論，但很有意思的是，其實這件事在美國，已經沒有太多人去談論這個話題了。其實不光是ChatGPT，往前看十年，當時很多新技術出現的時候，我就發現在中國媒體上讨論的熱度要遠遠高于美國。雖然那個技術其實主要出現在美國，但是中國人老百姓對此更關心。我認為這是一件好事，但也是一件壞事。

這個“壞”在于，這些技術實際上是被過度的炒作了，在這個過程中，有很多渾水摸魚的人從中賺錢。就比如說區塊鍊，當時炒得那麼熱，但如今這個事已經很少有人讨論了，對吧？這是第一個。第二個就是元宇宙，目前美國隻有 Facebook一家還在堅持做。那到了中國，很多人就在讨論說，我們是不是将來會生活在一個完全虛拟的世界。最後，大概去年底到今年初，Facebook在這個領域幾百億美元投下去，一個響也沒聽着，最後開始了大規模的裁員。到了現在，被熱炒的一個話題就是ChatGPT，有的人興奮，有的人恐懼，還有我現在也看到在中國還有很多人在渾水摸魚，試圖再割大家一次韭菜。

在講ChatGPT是什麼以前，我先給大家講一個曆史故事，這曆史故事你聽起來你就會發笑，但是你回頭看，今天很多人的表現也是如此。

1503年，哥倫布的兒子記下來的這麼一件事兒，哥倫布往西航行，去往新大陸，結果航行到中途，到了牙買加這個地方，船上就沒吃的了。于是，哥倫布和船員隻能寄希望于當地人來提供飲食。但是，提供了幾天以後，船員就跟當地人發生了沖突——有些船員偷了當地人的東西，是以當地人就斷了飲食的供應。

為了擺脫這個困境，哥倫布想到了一個妙招。哥倫布當時随身帶着一本萬年曆，在月曆上标着說某年月日會出現日食、月食等等所有這些資訊。哥倫布當時就把當地的部落首領找來，說你們不給我提供食物，已經得罪了上帝，上帝會發怒，月亮就會變紅，然後上帝就會把月亮收走。

當然，我們現在基本上都知道，在月全食發生的時候，也就是地球還沒有完全擋住月亮的時候，月亮确實是紅的，就是我們所謂的“血月”。但是，當時的牙買加人并不知道。結果，到了晚上，牙買加人就發現，月亮果然變紅了，然後慢慢地就一點點消失了。當地人就陷入了恐慌，大家紛紛說，上帝要懲罰他們了。

這個部落首領慌忙去求哥倫布，承諾答應哥倫布的所有條件。哥倫布就說，好，我去帳篷裡向上帝禱告，讓他不懲罰你們，但是我需要一點時間，然後哥倫布就走進了帳篷。其實，進了帳篷之後，哥倫布就是拿着一個沙漏，在看那個計時。

今天咱們有天文學知識，肯定知道月全食的時間，也就會維持大概48分鐘，到時候月亮就會重新出現。但是，這些牙買加人不知道。他們看到的就是，哥倫布從帳篷裡出來，月亮也就出來了。然後哥倫布說，這是上帝已經聽了我的勸解，答應寬恕你們，但是你們必須要給我們好好地提供食物。是以，當地人千恩萬謝，給他們不斷提供食物。

這個故事說明什麼呢？月全食這件事，它的發生背後自有其原因，但是在人們不知道這個原因的時候，往往隻能把這個自然現象歸結為一個神的作用。而這個神，本身又是人創造出來的。也就是說，人自己創造一個神以後，然後趴在神的腳下，成為了他的奴仆。

這就是我為什麼要給大家開《世界文明史》的課程。

其實這個文明的發展過程，就是人類不斷認識自然規律的過程。我們一點點的進步，為的就是讓現在的我們不再像當地的土著人那樣，盲目地相信一個人向上帝禱告真的可以阻止月亮消失。我們現在知道，在日食月食的背後，實際上是開普勒行星的三定律在起作用，然後在開普勒行星三定律背後是牛頓的萬有引力定律。人類搞清楚這個原因以後，對自然就不再僅僅是畏懼了，我們可以利用自然規律做很多很多事情。

ChatGPT的技術基礎是什麼？

從曆史回到現在，其實ChatGPT的情況也差不多，背後是一個叫做語言模型的一個數學模型在發揮作用。換句話說，ChatGPT的背後是一個數學模型。在今天，這項技術顯得很強大的原因主要是三個：

第一，它用到的計算量很大；

第二，它的資料量很大；

第三，今天訓練語言模型的方法比以前要好很多。

那麼，語言模型是什麼呢？或者說它是一個什麼時代的産物？

它是1972 年，由我的導師賈裡尼克(Fred Jelinek)帶領團隊研發的一項技術。具體地講，是他當時在IBM帶着人來完成的一項技術，是用來衡量一句話或者一個語言現象有多麼的可能産生。那它有什麼用？它最初的用處是做的語音識别，後來是做機器翻譯，再後來是做計算機問答，也就是我們今天熟悉的回答問題。

當時它就可以做摘要，比如舉一個例子，有一篇一萬字的文章，那麼你怎麼摘要出十句話能概括這一篇文章的内容，這對于做這個自然語言處理的人來講，就是一個數學問題。也就是說，你的條件是什麼？條件是這一萬個字，然後你想得到的結果是什麼？結果可能就是十句話，一百個字。然後這裡頭有很多種組合，你可以随便挑幾個句子，也可以把有的句子拆成兩段，把後面那些不太重要的修飾或者形容的部分去掉。然後，你也可以把兩個句子合成一個句子，那麼你在合成一段文本的時候，這個計算機就會計算一個機率，哪些句子合成在一起的機率比較大，它會按照機率幫你合成。

而我們今天看到的ChatGPT，就是這個大的語言模型，它就是會挑一個機率最大的、最有可能發生的這樣一個文本來給你看。是以總體來講，ChatGPT生成結果的過程，是一個用大量的計算資源來計算的過程。它需要非常龐大的資料量來支撐，有很多很多的GPU（電腦處理器）。沒有這些東西的話，ChatGPT是做不起來的。

而且今天這個ChatGPT，其實不光是技術，還有很多人工在背後。他們還雇了一家公司，專門負責稽核ChatGPT産生的結果。比如說，ChatGPT産生了一百篇摘要，都挺好，我已經分辨不出來了，那麼這些人就負責幫我分辨一下，到底哪一篇更像是準确的摘要。

那實際上，你可以看到，ChatGPT背後就是一個語言模型，而這一語言模型的技術是1972年就已經有了的。到現在，經過了五十年，現在行業内其實大家并不覺得它是一個什麼了不得的東西。在此以前，這個語言模型其實已經做了很多的事情。

提到“語言模型”（language model）這個詞，最初是由我的導師賈裡尼克提出來的。他大概在1993年的時候到了約翰霍普金斯大學，我是1996年到這個大學，然後成為他學生。那麼這個詞的中文，也就是你看到的“語言模型”這四個字，則是我在20世紀90年代的時候發表論文時候創造出來的。那時，隻有我們這些圈内的人知道它能做很多事，但是你不會想到說，哎，這個事後來會被熱炒。

你可以這樣了解，“語言模型”之于ChatGPT，就相當于開普勒的這個行星三定律之于月食。

“語言模型”誕生之初是什麼情況？

那麼在發明的當時，語言模型是一個什麼情況？

其實，在20世紀90年代的時候，用簡單統計方法得到的模型很不準确。這就相當于，我打個比方，你觀察行星，但用的是托勒密的地心說來預測，是很不準确的。是以，那時候我們開始引入了文法、主題、語義的很多資訊。然後，這個語言模型就變得很複雜了。複雜之後就又帶來了一個很大的問題。

什麼問題？

比如，我當時做過一個很複雜的語言模型，這個語言模型當時有多少參數？600萬個參數，就是說，這個語言模型大小基本上按這個參數來定。我那時候做的已經是那個時代能做的最大、最複雜的語言模型了。我當時用的還不是PC機，而是20台超級伺服器，然後大概算了三個月才訓練出這樣一個語言模型。是以你看，它的計算量是非常大的。那麼，第一版ChatGPT，它用的語言模型參數是多少呢？大概是 2000 億個參數，大家可以看到這些年的變化。

是以，今天很多人問，ChatGPT在美國出現了，中國研究機構什麼時候能做ChatGPT？其實，中國的大部分研究機構是做不了的，不是說研究水準的問題，而是因為ChatGPT太耗資源。今天的ChatGPT，可能光硬體的成本就要差不多10億美元，這還沒算電錢，是以成本和耗資是非常巨大的。是以，如果開完玩笑，問ChatGPT的最大貢獻是什麼，我倒覺得它對全球變暖是有很大貢獻的。

是以，我想說的是，ChatGPT這件事，它的原理很簡單，但是在工程上要想做到，其實是蠻困難的一件事。

計算機擅長回答什麼問題？

到了大概2010年前後，也就是13年前，語言模型能做到什麼程度？我給大家看兩個例子。這兩個例子都是我在2014年離開Google以前做的。當時我負責的是Google的自動問答系統，就是讓計算機回答問題。不過因為這個産品是英文的，是以在中文世界基本上沒有太露臉。

我給你看一下谷歌回答的一個問題——為什麼天是藍色的，why is the sky blue？

它的回答是這樣的：太陽光透過大氣層到達地球時會發生折射，空氣中的氣體會讓不同顔色的光散射到各個地方，藍光波長短，比其他顔色折射率高，是以看上去天是藍色的。

這是當時計算機産生的一個答案。公平地講，這個答案比我自己寫一段答案寫得要更好，因為要解釋這現象，你要知道不少實體學知識，而且這個句子看上去也挺合情合理的。而今天人們使用ChatGPT的一個目的，就是讓他回答問題。

這裡面，我給大家做個拆分。

其實，我們問計算機的問題可以分為兩類，第一類叫做簡單問題，第二類叫做複雜問題。簡單問題就是關于事實的問題，比如某某明星是哪兒人，哪一年生的。這都是一些容易的問題，因為它是事實，有明确答案。

第二類是複雜問題，這也是大家覺得 ChatGPT 非常驚豔的地方。它能整合資訊，回答天為什麼是藍色的，好像它自己有邏輯一樣。再有一個，就是問過程的問題，比如說我怎麼烤蛋糕，你能不把一步步寫下來？今天我們問ChatGPT怎麼烤蛋糕，它可以把這個過程給你寫得很詳細，多少杯水，加多少個雞蛋，加多少面粉等等，它都可以告訴你。然後你根據它提供的答案，就真能烤出蛋糕，而且烤得可能還挺不錯。

這是大家覺得很了不得的地方。但是你要知道，這件事，在2014年其實計算機已經做到了，而且做得很好。是以，這項技術本身并沒有太多神秘的地方。

計算機和人，誰更擅長寫作？

現在，大家熱議ChatGPT，還有一個原因就是覺得它能寫作。比如說寫一個工作簡報，這是今天美國人用ChatGPT用得最多的地方。我這周幹了1234567，這七件事，哎，你看我就不用自己費勁地寫了，我讓ChatGPT生成一個，然後再編輯一下子就可以了。

但是，計算機寫作這件事，其實你說難也難，說容易也容易，我可以給你舉個例子。

在2014年我離開Google之後，當時不太做程式設計了，不過那時候我還有一些計算資源，是以我自己在空閑時間會寫一些程式，做着玩。當時呢，我就讓計算機寫了兩首詩，大家可以讀一下這兩首詩。

第一首詩是個五言詩，這是用我的話說，叫做李白風格的一首詩，大家可以讀一下。這首詩就是計算機自己寫的。實際上，你如果讀一讀，這個詩裡還真有一些李白的這個特點。

那第二首詩，我也把圖檔放在下面了，你可以看一下。

先說一下，因為古詩都有平仄一說，但是我們現在的讀音和當時的讀音不一樣，是以我們也沒去管這個平仄到底合不合古，但是這個我們單從它的内容意境來講，你讀的會覺得很順暢。

好，那麼話說回來。第一首詩怎麼做的？

其實再簡單不過了，你就把李白的詩放到計算機裡。李白詩一共1000 多首，也就一萬來句話，這個對計算機來講太簡單了。它寫的時候，就是把句子分拆開來，拆成兩個字、三個字一組，比如“空愁”這是一組，“憶長安”這三個字一組。然後它就去拼剛才我講的語言模型，算機率，哪個機率最大；拆完了以後，我就跟他提一個要求，說要寫一首憶長安的詩，它就排列組合，生成出這個《憶長安》，實際上就是這麼拼湊出來的。第二首詩稍微複雜一點。

但你知道這兩個程式我寫了多長時間？兩天。這說明什麼呢？說明你讓計算機寫出一些還挺像樣的東西，其實不是一件很困難的事情，它沒有你想得這麼神秘，或者說計算機寫作本身沒有這你想得這麼神秘。

那為什麼這兩首詩看起來特别好？因為這是唐詩，唐詩的格式是固定的。同樣的道理，為什麼用ChatGPT寫周報寫得好？因為周報的格式基本上是拉清單，那也是個固定的格式。包括，如果你讀《華爾街日報》中文版，這裡頭我跟你講，90%的内容都是計算機寫的，隻是你不知道。寫完了以後人當然要給它一個主題，然後給它寫的第一段話寫個引子，然後給一個總結，起個标題，這是人要做的。

為什麼寫财經文章比較好？因為它有好多的事實在裡頭，格式也是固定的，是以這件事它做起來就很好。

我花這麼長時間來講ChatGPT的背景，實際上就是想說它并不神秘，不是一個什麼很高深的機器在背後。一方面，ChatGPT依靠的是一個數學模型，而這個數學模型1972年就有了，隻是今天它的計算能力非常強，靠蠻力計算。

那麼，ChatGPT訓練一次要耗多少電？大概可能是3000輛特斯拉的電動汽車，每輛跑到20萬英裡，把它跑死，這麼大的耗電量，才夠訓練一次，這個非常花錢的一件事。

ChatGPT對我們到底有什麼影響？

那麼接下來講講，ChatGPT對人有什麼影響。

這就要回到曆史上來看了，每一次技術革命，其實它對人都會有一些影響。不過，ChatGPT它不算是一項新的技術革命，因為這我剛才講了，這個過程很長，從20世紀70年代到90年代，我們做了很多事，90 年代到現在又有很多人做了很多事。這裡頭最大進步其實不是這個語言模型本身，實際上是後來2000年左右産生的深度學習，使得訓練語言模型能比以前準确了，不是簡單的做統計。

今天訓練語言模型早已經不是簡單做統計了，這才是ChatGPT能産生比較好的結果的一個原因。

至于說ChatGPT對人能産生什麼樣影響，這個問題我先不直接回答你，我先問你，剛才給大家看這兩首唐詩，你有沒有發現一個什麼特點？對了，這兩首詩寫得不錯，但是你原來對唐朝了解，不會因為多了這兩首詩會有更新的了解。因為，ChatGPT它某種程度上有點像鹦鹉學舌，你先要說一段話，它才能跟着學。它說出來的聲音可能很好聽，但是它并不提供更多的資訊。

今天網際網路上90%的内容都屬于這一類——不提供更多的新資訊，也不是原創内容，也不是自己的感悟，無非是東抄抄，西湊湊。目前，抖音、快手這類短視訊，我覺得99%的内容都屬于這一類，沒有營養，你讀完以後可能覺得挺有意思，但實際上你在上面讀了再多，其實對你沒有任何幫助。

如果說ChatGPT真的威脅到了誰，我覺得威脅到的就是這一類人的工作，就是說這個抖音上頭那個做短視訊的，或者釋出一些内容的，ChatGPT會做得比他們好很多。你就想這樣一件事兒，假設說，有一群人天天把那唐詩三百首裡頭的句子翻來覆去的捯饬，也能捯饬出一些詩，那麼ChatGPT捯饬起來肯定比人快得多，是以這項技術會對這一批人會有影響。

那麼，什麼人不會受到影響？就是内容創造的人不會受影響。

為什麼我會這麼講？還記得剛才我說的“為什麼是天是藍色的”這個問題嗎？Google為什麼能回答這個問題？

因為在Google進行回答的時候，它大概把當時英語幾乎所有的像樣的句子都做了分析，大概有1000 億句英語句子。那麼實際上你會發現，在一些大學的網站上和NASA的網站上，它就有這個答案，隻是我們把它拼拼湊湊，删删減減，就把它挑出來了。但是最早的實體學家做這項研究，把這個道理搞清楚，這個工作是有意義的，也是ChatCPT取代不了的。

是以，ChatGPT的工作相當于什麼呢？舉例子，托勒密創造出這個模型以後，那麼每過一段時間，他們歐洲就會編一個大概幾十年的一個月曆，然後上面标上哪天有日食，哪天行星會怎麼運動等等。那麼人們根據這些規律，印好多本這個書，這個ChatGPT就相當于有好多本書，你拿着以後一看，說，喔，某年月日會發生月食，答案就會很清楚。但是，背後真正有意義的工作不是印這個書，而做托勒密的那個研究。

是以我認為，從曆史上看ChatGPT其實不算是一次技術革命，它影響到的都是那個比較懶的人，懶得動腦筋，創造新東西的人。真正探索人類知識奧秘的人，是不會被取代的。

ChatGPT對我們到底有什麼影響？

很多人問說，ChatGPT有什麼新機會？坦率來講，你沒機會，因為太耗資源了，你耗不起。那麼什麼人能夠受益？那就是賣資源的這些人。

我可以打個比方，就是說在這個加州淘金熱的時候，很多人蜂擁而至，去淘金，單我們到今天為止還不知道哪一個淘金者真的掙得着錢，沒一個人把名字留下來。但是最後誰掙着錢了？是賣水的人和賣牛仔褲的人。ChatGPT也是一樣的道理。大家跟着一起去淘金，其實你是掙不着錢的，但是在過程中，你還不斷地要買水喝，買牛仔褲穿，最後就是這兩撥人掙到錢了。李維斯Levi's，就是那時候産生的這麼一個公司，它就是做牛仔褲的。

那麼最後你可能是給幾家大的做雲計算的公司在交錢，這可能是一個結果。

好了，講完了這個ChatGPT的曆史，我給你做一個簡單的總結。

第一，不要恐懼。

今天是很多人恐懼ChatGPT，就如同不要像當年哥倫布遇到的牙買加土著人恐懼月食，一樣的道理。

第二，不要勉強去找所謂的機會，該怎麼工作就是怎麼工作。

我看有同學問我，說蘋果為什麼這個不做ChatGPT，我說這就對了！這就是為什麼蘋果是世界上最有錢的公司，利潤最高，市值最多。目前，很多所謂做這種人工智能的公司到現在都在虧錢。是以，這也是為什麼很多同學有時候問很多太不着調的問題的時候，我就開玩笑地問他說，你的房貸還清了嗎？你要沒還清，你就好好回去工作，把工作做好，這才是對大家最有意義的事情，從曆史上看也是如此。

第三，你要識破這些所謂的陰謀家或者想割你韭菜的人的那些把戲。

就是說，如果再來一個人假裝哥倫布說他是神的代表，然後他能祈禱上天能讓這月亮出來，你不要信。是以你需要了解ChatGPT背後的一些科學原理。最簡單的一些原理，像今天我講的這些，你還是需要有所了解。

注：本文來自吳軍博士在“得到”上的分享。

知名計算機專家吳軍：ChatGPT不算新技術革命，帶不來什麼新機會

繼續閱讀

英語新聞選譯：人工智能為中美在非洲競争開辟了又一個新戰場

這樣開車不出事故才怪？近日，網絡上一個視訊廣為流傳，一輛問界M7在高速上狂奔，車上有5個人，其中3個人包括司機在打王者榮

腐敗"毒瘤"将遭數字化"拆除":人工智能2025年讓87萬村鎮重制陽光

全球首台商用協作機器人制造商：拒絕價格戰，大力引入人工智能

擁抱人工智能新時代

美國國土安全部加強關鍵基礎設施免受人工智能威脅

最新進展 | 生成式人工智能在骨科中的應用

【新經濟新職業】人工智能訓練師：讓AI更懂世界

采訪奧特曼：預計會有幾個不同版本的通用人工智能，并且各有擅長

2023年醫學人工智能領域九大前沿成果釋出！

奧特曼談人工智能：進步是不可預測的，也很難監管

人工智能設計的熱泵消耗更少的能源

美國人工智能戰鬥機來了，卻面臨空前戰術困境，對中國有何啟示？

張文傑：人工智能将重塑自動駕駛作業系統

斯坦福釋出，人工智能政策與管理五大進展

巴菲特緬懷芒格，産生退意并物色接班人，提醒世人警惕人工智能。