天天看點

陶哲軒:ChatGPT已加入我的數學工作流

Pine 夢晨 發自 凹非寺

量子位 | 公衆号 QbitAI

ChatGPT,已經成為天才數學家陶哲軒的研究助手了!

不止ChatGPT,他還直接在網上宣布:

多種AI工具都會納入自己的工作流。

最近這些日子,陶哲軒對AI可是青眼有加,甚至在網上隻談論一個話題:AI,特别是大語言模型在數學研究中的應用。

期間,各種ChatGPT的“隐藏功能”都被陶哲軒挖了出來:

大到尋找公式、輔助證明定理;小到改寫論文語句、查詢小語種數學名詞的發音。

而為何突然對AI協助工作這麼關注?陶哲軒用自己的老本行數學對AI做了個類比:

傳統的計算機軟體就像是數學中的标準函數,比較死闆;

AI工具更像是數學中的機率函數,會更加靈活。

對這個類比,中科院計算所研究員包雲崗直接稱贊很形象。

也有網友表示:

AI生成的内容有時候真的會有“神來之筆”,幫助人們更好地工作。

不過也有網友對陶哲軒用ChatGPT協助搞數學研究接受無能,畢竟之前很長一段時間大衆對ChatGPT的吐槽都集中在數學能力上。

于是,在陶宣稱ChatGPT在數學中可以完成一些半成品工作時,有人直接在評論區發問:

你是認真的嗎?我可是(你的)超級粉絲。

那話說回來,一個“數學菜雞”ChatGPT在一個大數學家手裡究竟能有什麼用處?

一起來看~

ChatGPT對搞學術的來說“剛剛好”

總的來講,陶哲軒大概的意思就是:

ChatGPT數學能力雖然不咋滴,但對做學術研究的人來說是個發散思維的好工具。

(對普通人來說有點不太專業,但對搞數學的學術人員來說剛剛好)

那這個剛剛好的尺度ChatGPT是如何拿捏的?

陶哲軒直接給出了他用ChatGPT求解數學題的幾個示例:

剛開始,他直接把同僚詢問的問題逐字逐句抛給了ChatGPT。

ChatGPT也有模有樣地回答了起來,期間還提到了一個高度相關的術語:對數矩生成函數,甚至在給出的答案中還讨論了一個具體的例子。

這術語,這舉例…乍一看,甚至騙過了陶哲軒的“法眼”,不過在檢查一遍之後,陶發現:

答案是錯的!

Emmmmm,按理說一般人的邏輯到這裡就該結束了——得出結論:ChatGPT的數學能力不太行。

但陶哲軒還沒有止步,他仔細分析了ChatGPT給出的解答過程,發現并不是完全錯誤的,還是有可取之處。

比如說,ChatGPT在解答過程中用的是lmgf公式,而在克拉默定理給出的标準答案中用到的是lmgf公式的Legendre變換。

雖然不是正确的解題思路,但也很接近正确答案了。

(有點意思)緊接着他又用兒子幫忙做的ChatGPT手機短信版再試了一個數學問題:

我該如何證明有無窮多個素數?

雖然給出的證明的是意料中的不完全正确,但陶發現ChatGPT給出的論證思路是可以被固定下來的,并且這個思路他之前還從未見過。

這一通試用下來,直接打開了陶哲軒的思路。

既然ChatGPT在具體數學問題上給出的答案是不完全正确的,那不如索性發揮發揮它生成答案部分正确的特性:

在處理數學問題時,可以讓ChatGPT這類大語言模型做一些半成品的語義搜尋工作。

也就是說,ChatGPT不用提供确切的答案,隻用生成一些可能的提示(類似于幫你找靈感balabala)。

這樣一來,依據ChatGPT生成的提示+傳統搜尋引擎搜尋,就能很輕松找到答案了。

随後,陶哲軒還具體上手示範了一把。

首先要有技巧地抛出一個問題,假設陶想找庫默爾定理但記不起來這個定理的名字,他是這樣來問的:

我正在找一個關于(balabala)的公式,它是一個經典的理論但我想不起名字,你能給我解答嗎?

最終ChatGPT給出的答案是Legendre公式(一個相關的結果),然後根據這個答案用傳統的搜尋引擎就可以輕松找到庫默爾定理。

話說回來,既然都隻是用作數學研究中的一個工具,為啥在陶哲軒眼中AI會更合适,而傳統搜尋引擎就不太行呢?

AI“思維邏輯”更發散

陶直接從傳統計算機軟體和AI工具的内部運作邏輯分析了一通。

先來說傳統的計算機軟體,它的運作邏輯類似于函數:→,這是一個很标準的數學概念。

具體來說,若輸入的在給定域中,軟體就能夠可靠地給出範圍中的單個輸出(),若輸入不在給定域中,則就不能給出結果或者說亂給一些結果。

而AI工具,就不會像傳統計算機軟體那樣死闆,它運作的邏輯不是基于經典函數,而是類似于機率 kernel μ:→Pr()。

輸入,AI會從一個機率分布μₓ中采樣,然後随機輸出。而這個機率分布,集中在完美結果()附近。

不過這樣也會導緻一些随機偏差和不準确結果的産生。

但整體比較下來,AI工具還是具有一定的優勢。

一方面它更加靈活,可以比傳統的軟體工具更優雅地處理嘈雜或格式不好的輸入。

另一方面,在一定程度上AI的“思維方式”也會更加發散。

在宣布把AI工具納入自己的工作流之後,陶哲軒還在mathstodon上不斷更新用AI工作的文章。

比如說用AI寫郵件:

或者發現了ChatGPT在處理數學問題時的亮點:能夠識别不同語言的數學概念音譯版。

AI半自動證明定理,審稿人難了

陶哲軒對AI的觀察,也在學術圈引起了一場讨論。

他指出,閱讀AI寫的論文和人寫的論文體驗完全不同。

閱讀人寫的論文,通常能在上下文和風格上捕捉到一些線索,通過這些線索可以快速分離出論文的“肉”,加快閱讀速度。

AI生成的數學論文,文字看起來都很有說服力,必須一行一行仔細看才能發現其中的缺陷。

紐約大學教授馬庫斯将其解讀為:同行評議從此更難了。

不過網友中也有人認為,讓審稿人必須一行一行仔細看,而不是依賴于膚淺的格式信号,也算得上一件好事。

還有人腦洞大開,想知道AI能否提出一些全新的數學猜想。

AI能不能提出猜想不知道,但是AI自動、半自動證明定理已經是現實,并且走向實用化了。

還是陶哲軒,2月份他在加州大學洛杉矶分校的IPAM(純數學與應用數學研究所)組織了一場機器學習輔助證明主題研讨會,會上展示了很多這方面的前沿成果。

IBM研究員Jason Rute展示了一種受AlphaGo啟發的方法,将定理證明類比成圍棋,下一個步驟相當于下一手棋,得證相當于獲勝。

谷歌科學家吳宇懷則分享了大語言模型在自動形式化(Autoformalization)上的進展。

而陶哲軒本人對AI的興趣也不止于此,用機器學習解決實際問題也在他的涉獵範圍之中。

剛剛在澳洲的一場講座上,他還分享了如何用數學結合機器學習預測火災變化。

參考連結:

[1]https://mathstodon.xyz/@tao/109945628011027107

[2]http://www.ipam.ucla.edu/programs/workshops/machine-assisted-proofs/

[3]https://twitter.com/GaryMarcus/status/1632191991021965313