今天來看數學問題,對于ChatGPT和文心一言來說,思考數學問題的次元決定着能否準确了解并計算出結果。
問題:雞鴨兔共6個頭,14條腿,雞比鴨多一隻。問雞鴨兔各幾隻。
這是一道非常檢驗AI思考次元的題,首先要了解題目,第二要知道
AI的訓練次元目前可到1億+
雞鴨兔的屬性:頭、腿。
第三要知道根據它們的關系如何計算出結果。
說說結論:GPT3.5和文心一言都沒有得出正确結果,GPT-4.0得出正确結果。
看看文心一言:
文心一言
GPT3.5
可以看出,文心一言比之前的雞兔同籠問題有進步,但缺點非常明顯:是靠掰手指頭算的,是以不可能算對。
GPT-3.5要好很多,雖然沒有算對,但方程的思想就是巨大進步,有了方程就可以解決更多更複雜的問題。但可惜的是,最後一步等式帶入方程還是錯了,這方面的思考次元還是少了點。
GPT-4.0的解決過程我給重點列出來。
我們可以使用代數方法來解決這個問題。設雞的數量為x,鴨的數量為y,兔的數量為z。根據題目,我們可以得到以下方程:
- x + y + z = 6 (頭的數量)
- 2x + 2y + 4z = 14 (腿的數量)
- x = y + 1 (雞比鴨多一隻)
我們可以先解第一個和第三個方程,得到y和z的關系:
y + z = 5 - x y = x - 1
将第三個方程代入第一個方程,得到:
x - 1 + z = 5 - x 2x = 6 x = 3
是以雞的數量是3隻。将x的值代入第三個方程,得到:
y = 3 - 1 y = 2
是以鴨的數量是2隻。最後,将x和y的值代入第一個方程,得到:
3 + 2 + z = 6 z = 1
是以兔的數量是1隻。
綜上所述,雞有3隻,鴨有2隻,兔有1隻。
是以說,哪個模型是“智能”還是“智障”就要看它的思考次元,雖然我們并不清楚它們是如何訓練的。但結果是可以驗證的。
目前來看,文心一言相對ChatGPT來說還是國小生,ChatGPT中3.5是個國中生了,4.0那是大學生。差距就是這麼明顯!