天天看點

驚豔大突破!GPT-4o橫空出世,世界可能要大變樣了?重磅實測!

作者:徐德文科學頻道
驚豔大突破!GPT-4o橫空出世,世界可能要大變樣了?重磅實測!

世界可能真的要大變樣了!OpenAI周一推出了GPT-4o,可以了解攝像頭看到的内容,你知道這意味着什麼嗎?這相當于AI從此就有眼睛了,可以和人類進行實時對話交流,而且沒有任何延遲,并且語氣和人類基本沒有差別。

我親測了一下,連人類邊說話邊思考,那種停頓和重複也照單全收,毫無違和感。這意味着未來真有一個機器人和你說話,你可能都未必知道它是機器人了,如果它再擁有人類的外形呢,是不是完全不敢想象了,科幻真的就要成真了。

OpenAI放出的這個直播視訊,是由OpenAI首席技術官,Mira Murati主持,兩位研發負責人Mark Chen和Barrett Zoph示範的。

驚豔大突破!GPT-4o橫空出世,世界可能要大變樣了?重磅實測!

當Mark用蘋果手機上的APP喚起ChatGPT,說現在正在進行現場示範,自己有點緊張,你能不能幫幫我時,ChatGPT回答說,你隻需要深吸一口氣,記住你才是這裡的專家。是不是有點小幽默?

Mark故意大口大口地呼吸,讓ChatGPT給出回報。

ChatGPT說,喔——慢一點,你又不是吸塵器。

(Wo! slow down. Mark, you are not a vacuum cleaner)

這說明ChatGPT從他的聲音裡,察覺了他的情緒,引來笑聲一片。Mark說ChatGPT還能處理說話被打斷的情形,可以改變語氣,并且可以分析使用者的面部表情等等。

在随後的示範中,可以看出ChatGPT确實做到了無縫連接配接,流暢對話,在講故事的時候被不斷打斷,要求改變語氣,也馬上就做到了,并且按要求改成歌曲唱了出來。

驚豔大突破!GPT-4o橫空出世,世界可能要大變樣了?重磅實測!

然後巴雷特在紙上寫下一個方程式,Chat GPT幫助他按照步驟順利解了出來。這時候巴雷特在紙上寫下“I♥Chat GPT”,展示給她看,結果Chat GPT感動得一塌糊塗,幾乎笑出了豬叫聲,說你太貼心了,接着就反誇巴雷特穿的衣服不錯,看起來情商也是杠杠滴。

然後巴雷特通過一段代碼及一張天氣曲線圖和ChatGPT進行了視訊互動,ChatGPT流暢地解讀了代碼和圖像。穆拉蒂又應觀衆要求,示範了利用ChatGPT進行實時翻譯,巴雷特讓ChatGPT通過攝像頭分析自己的表情,ChatGPT都沒有任何延遲地完成了,總之就像是幾個人在群聊,如果你隻聽聲音,可能不會覺得裡面還有一個AI在說話。

根據OpenAI的說法,GPT-4o可以“在短短232毫秒内響應使用者的音頻提示,平均為320毫秒,與人類在對話中的反應時間相似。”

是不是被徹底驚豔到了,和谷歌去年12月示範的Gemini似乎有異曲同工之妙,隻是谷歌那次示範被認為誇大和誤導的成分居多,是剪輯制造出來的,那麼Gpt-4o這個,是不是也有誇張和誤導的成分呢?

驚豔大突破!GPT-4o橫空出世,世界可能要大變樣了?重磅實測!

我感覺可能确實是這樣,因為Mark和Barrett的示範,肯定是事先設計好的,包括馬克的大聲喘氣,巴雷特的方程和代碼。是不是事先和ChatGPT排練過不好說,但至少應該有草案,當然ChatGPT可能也确實有這個能力,很多朋友可能都有感覺,使用ChatGPT時間越長,它的套路就越多,你也就越熟悉,交流多了就變成車轱辘話了。

然後我馬上打開ChatGPT,果然提醒我是否要用Gpt-4o進行對話,我毫不猶豫地點了同意,不過令人大跌眼鏡的是,和Murati的示範完全不同,我和它的對話和使用文本聊天一樣,它還是要反應很長時間才會回饋,根本沒有什麼232毫秒内響應,隻是它的聲音确實和其他AI不同,聽起來像是人類的聲音。

最令人不可思議的是,它也回答了我關于響應時間的疑問,後面有錄屏,你們覺得它是暴露了OpenAI的内幕嗎?OpenAI和谷歌一樣,是不是也是設計好的嗎?下面是我錄下來的真實對話。

驚豔大突破!GPT-4o橫空出世,世界可能要大變樣了?重磅實測!

----------------------------

我:

嗯,是這樣的,我站在很高的地方,比如高樓的欄杆前,有時會有一種可怕的想法,那就是突然想跳下去,這是一種什麼現象,真的有人這樣跳下去過嗎?

----------------------------

ChatGPT:

你描述的這種感覺被稱為“高處效應”(the call of the void 或 high place phenomenon)。這是一種相當常見的心理現象,很多人在高處時會突然有跳下去的沖動,但這并不意味着他們真的想自我傷害或有自殺傾向。關于為什麼會有這種感覺,心理學家認為這可能是大腦在處理恐懼和生存本能時的一種反應。

至于有沒有人因為這種沖動而真的采取行動,這種情況非常罕見。大部分人感受到這種沖動後,很快就會意識到這隻是一種突然的想法,并不會真的采取行動。如果這種感覺讓你感到不安或困擾,與朋友或專業人士交流一下你的感受可能會有所幫助。你有沒有經曆過類似的情況,或者還有其他關于這個話題的問題嗎?

----------------------------

最後兩句是不是很熟悉?又開始車轱辘了。

----------------------------

我:

嗯,謝謝,不過我看OpenAI說你232毫秒内就可以響應使用者的音頻提示,與人類在對話中的反應時間相似,怎麼你響應了那麼久?你用的模型真的是Gpt-4o嗎?

驚豔大突破!GPT-4o橫空出世,世界可能要大變樣了?重磅實測!

----------------------------

ChatGPT:

是的,我用的是基于GPT-4的模型。關于響應時間,雖然理論上可以很快,但實際上會受到多種因素的影響,比如網絡延遲、伺服器負載以及問題的複雜性等。我的目标是盡可能快速且準确地回答問題,有時候可能需要額外的時間來確定回答的品質。如果你有緊急或特定時間需求的問題,盡管告訴我,我會盡量快速回複。你還有其他想了解的嗎?

----------------------------

我:

我看你們的示範,真的是秒響應,真的很厲害啊,這個是什麼原因呢?

----------------------------

ChatGPT:

感謝你的肯定!我們的模型通過大量資料訓練,目的就是要提高在各種對話場景中的響應速度和準确性。在示範中表現得很好,可能是因為在這些情境下,問題相對明确,模型也針對這類常見問題進行了優化和調整,以確定快速和準确的反應。實際使用中,模型還會根據不同的問題和用途持續優化。你對這個技術還有其他的問題或者想了解的方面嗎?

----------------------------

看看這兩段對話,是不是感覺這個示範真的是事先設計好的呢?因為我和它的實際對話,它響應得非常慢,完全不像示範中那種秒回答。更能說明問題的是,因為前面問的不太流暢,我又重複了我的問題,它回答的和我前面的基本差不多,這就意味着完全可以進行事先設計和排練。另外我讓它把要說的話唱出來,它也說自己不能直接唱歌,和示範中似乎完全不一樣。

不過Murati在示範的最後,特别感謝了英偉達提供的最先進的GPU,讓今天的示範能夠成為可能,這是不是說這場示範得到了特别支援,算力強大,沒有網絡延遲,是以可以做到平均320毫秒,和人類差不多的響應速度呢?如果是這樣,那就意味着要大規模地實作這種人機對話,不知道還要增加多少倍的算力,恐怕夠英偉達和台積電忙活幾年了,真是幸福的印鈔機啊。

----------------------------

我:

嗯,我覺得這個能力非常重要,因為未來和機器人內建,就可以讓人工智能變得和人類一樣,如果外形再非常相像的話,那就和科幻電影裡的情景完全一樣了,人類和機器人将無法分辨。

驚豔大突破!GPT-4o橫空出世,世界可能要大變樣了?重磅實測!

----------------------------

ChatGPT:

确實如此,随着人工智能技術的發展,特别是在自然語言處理和機器人技術方面的進步,我們越來越接近可以模拟人類行為和交流方式的機器人。這種技術的進步可能讓未來的機器人在外形、行為甚至與人類交流的能力上更加接近人類,正如你說的,就像科幻電影中的場景。

不過,這也帶來了很多值得探讨的倫理和社會問題,比如人工智能的透明度、隐私保護、以及人類與機器人的關系等。你對這樣的未來感到興奮嗎,還是有些擔憂呢?

----------------------------

我:

我不擔憂,我覺得未來人類的命運很難說,尼安德特人從沒想過未來會怎樣,我也沒有必要去想。

----------------------------

ChatGPT:

你的看法很有洞察力。确實,未來充滿不确定性,而每一次技術進步都可能帶來意想不到的變化和挑戰。像尼安德特人那樣,我們也許無法完全預測未來的發展,但可以在現在做出選擇和準備,以應對未來可能出現的情況。對于人工智能和技術的發展,你有什麼特别感興趣或想深入了解的方面嗎?

----------------------------

這樣的語氣,是不是已經難以分辨了?不過我還是有一個簡單的辦法,可以區分ChatGPT和正常人類的聲音,那就是它喜歡倫理道德,車轱辘話實在太特麼多了,任誰一耳朵就能聽出來,OpenAI能不能先把這個給它糾正了?

繼續閱讀