天天看點

百度的“New Bing”終于來了,但我想說别高興得太早

作者:差評
百度的“New Bing”終于來了,但我想說别高興得太早

昨天,百度搜尋突然小範圍内測了對話式 AI 。号稱對标 New Bing ,還具有聯網能力。如果是真的,那百度這回,又是國内第一家整出有聯網功能大模型的公司了。

巧了的是,差評君也剛好拿到了資格,又能帶大家趕個熱乎的了。廢話不多說啊,咱們就上手試試這個對标 New Bing 的百度新産品。

如果你是能搶先體驗的使用者,在百度搜尋界面的引導欄裡,你就能看到排在第一個的 AI 對話。

百度的“New Bing”終于來了,但我想說别高興得太早

點進去之後,整體的聊天界面非常簡潔。使用方法跟 New Bing 一樣,都是對話形式。

百度的“New Bing”終于來了,但我想說别高興得太早

至于跟自己的親哥文心一言,到底有啥差別,它本人是這麼說的。不是一個東西,不是一個模型,甚至不是一家公司,。。。

百度的“New Bing”終于來了,但我想說别高興得太早

但據報道,這個對話 AI ,明明是基于文心一言開發的。

百度的“New Bing”終于來了,但我想說别高興得太早

但考慮到New Bing 也曾“ 發表 ”過自己是百度家産品的炸裂言論,畢竟對大語言模型來說,偶爾胡言亂語也算正常。

這玩意真能聯網嗎?是以為了驗證它連上網線沒,差評君趕緊着問了道測聯網的問題:百度釋出智能手機。

百度的“New Bing”終于來了,但我想說别高興得太早

這回,它給了我正确的回答,并且貼上了資料來源的 “ 百家号 ” 連結。起碼證明了,百度的這個産品,确實是能夠聯網的。

既然這樣,咱們幹脆來個橫評測試,看看百度和New Bing 兩個聯網大模型的能力到底誰比較厲害。這不,今天上午,熱騰騰的 NBA 比賽剛剛結束。那第一題,就問它們:NBA 最新比分。

結果讓差評君有點吃驚, New Bing 和百度居然都犯了同樣的錯誤。

兩個參賽選手抓取的網頁都是對的,都貼了 NBA 官網的連結。但是,盡管已經翻到了對的那一頁,兩個選手總結出來的比分都錯了。

百度的“New Bing”終于來了,但我想說别高興得太早
百度的“New Bing”終于來了,但我想說别高興得太早

熱火和尼克斯真正的比分是 103 : 112 ,湖人對勇士是 106 : 121 。怎麼對着答案抄,居然都能抄錯的。。第一局,雙方都沒得分。那第二題,我們來點最近的網際網路熱梗——華語樂壇新四大天王。

雖然在我提示之後,百度抓取到了正确的文章連結,給出了一份對的人員名單。但是,當差評君追問到代表作的時候,百度這小子又忘了,現在的華語樂壇,到底誰是真天王了。

百度的“New Bing”終于來了,但我想說别高興得太早

至于 New Bing 這邊,全程發揮穩定,一首“ 雪Distance ”驚豔全場。這場華語樂壇角逐,到底還是微軟技高一籌。

百度的“New Bing”終于來了,但我想說别高興得太早

而第三題,我覺得還是犯璞歸真,聊聊咱們普通人搜尋機率更大的問題。

百度的“New Bing”終于來了,但我想說别高興得太早

結果,百度可以通過調用百度天氣的資料,給你更精準的資料,甚至還有一個賞心悅目的圖注。

百度的“New Bing”終于來了,但我想說别高興得太早

而 New Bing 就有點傻傻分不清楚了,直接把 “ 接下來5天 ” 了解成了過去 5 天的天氣情況。1比1平,局面頓時焦灼了起來。

那決勝的最後一題,差評君想試一些聯網功能,給日常生活帶來的便利。這裡,我讓它們給我規劃一下路線:從創景路到 in77 最快的路線。

百度的“New Bing”終于來了,但我想說别高興得太早

本來,百度有自家的百度地圖,差評君覺得這一局,應該是百度穩赢。結果出乎意料的是, New Bing 居然抄着百度的家夥,把百度 AI 給碾壓了。

New Bing 直接調用了百度地圖,很快就規劃出了一條可用的路線。雖然答案稍微有點小問題,因為 19 号線地鐵剛剛開通到創景路。New Bing 提供的 5 号線,已經不是最快方案了。

百度的“New Bing”終于來了,但我想說别高興得太早

但是,不管怎麼說,比百度的回答好。。它給出的幾個路線全都不對,尤其是第一條步行的建議,更是相當炸裂。

創景路距離 in77 有 19 公裡,一刻不停的走,也得走 4 個小時 34 分鐘。。

百度的“New Bing”終于來了,但我想說别高興得太早

但經過北京小夥伴的測試,它其實是能用調用百度地圖的。至于究竟是怎麼一個調用邏輯,咱家不太清楚了。

百度的“New Bing”終于來了,但我想說别高興得太早

這麼幾輪血戰下來,在 New Bing 面前,百度還是略顯遜色的。總的來看,百度的搜尋 AI 肯定是有聯網能力的,這個是沒有異議的。

但可能因為還是内測,使用起來很不穩定,比如抓取的資料内容品質不高、對連結文章内容總結不準确等等。

隻不過讓我比較納悶兒的是,有些時候,這個對話 AI 可能還不如身為 “ 離線劃水 ” 的文心一言,來的靠譜。就拿我們首測文心一言的經典案例 “ 松鼠桂魚的做法 ” 來說。如果說文心一言平平淡淡的發言隻能給 60 分的話。

百度的“New Bing”終于來了,但我想說别高興得太早

那這個對話 AI ,就隻能算 30 分。答案不夠詳細就算了,甚至還在抄人家卷子的時候,把隔壁同學的名字都給抄過來了。

引用連結裡,人家分享說自己 “ 廚房燈光暗,改刀看不清楚! ” ,百度把這種 “ 口水話 ” 都照搬上去。這不是無腦打小抄的國小僧嘛。

百度的“New Bing”終于來了,但我想說别高興得太早

當然了,這也不能全怪百度。

差評君覺得,主要還是目前網際網路上,互相都不夠開放的原因。比如百度就不容易抓到微信上的内容。再加上,百度AI 引用的連結更傾向是百度百科等百度系的内容,自産直銷。

百度的“New Bing”終于來了,但我想說别高興得太早

這麼一來,導緻參考的資料可能不夠多元,就容易出問題。

百度的“New Bing”終于來了,但我想說别高興得太早

不過,針對這個問題,已經把 AI 玩出花來的編輯部同僚,就給我安利了一個小妙招。可以通過英文網際網路的資料譯回中文,直接曲線救國。

百度的“New Bing”終于來了,但我想說别高興得太早

還真别說,内容品質好像有肉眼可見的提高。但是,引用不準确還可以了解,一些基本大模型能力,怎麼也比文心一言遜色不少。

後面又試了幾道弱智吧問題,基本招招緻命。怎麼還質疑起遊戲NPC 造假了

百度的“New Bing”終于來了,但我想說别高興得太早

關于 “ 張三差點沒上上上上海的車 ” 的問題,明明它差一點就了解對了。

百度的“New Bing”終于來了,但我想說别高興得太早

結果,當我給它開個了後門——再給他一次機會的時候,他不僅直接選擇 “ 擺爛 “ ,甚至還通過引用資料來吓唬我。

百度的“New Bing”終于來了,但我想說别高興得太早

讓你引用資料的時候,引用錯了,頂嘴的時候,又引用得比誰都快。。

百度的“New Bing”終于來了,但我想說别高興得太早

當然了,百度這次的新産品,也不是沒有優化更新的。除了聯網之外,還跟 Bing 一樣,支援對話文成圖。甚至在頁面左下角,開了一個叫 “ 靈感中心 ” 的東西。

裡面全都是各種 AI 生成的小工具,比如解夢、抽象畫,甚至還有賽博求簽。。粗看起來,是有點兒AI 應用商店那味兒了

百度的“New Bing”終于來了,但我想說别高興得太早

而且,在使用過程中,差評君發現這個對話 AI ,好像一直緻力于給你解決更具體的問題。

百度的“New Bing”終于來了,但我想說别高興得太早

既然它這麼渴望,我就給他們來一道加時賽——應用題。說實話,光看這個标題倒是挺驚豔的。

百度的“New Bing”終于來了,但我想說别高興得太早

結果,我想讓百度順便給我生成對應圖檔的時候,它就罷工了。這牛脾氣,真不知道是跟誰學的。

百度的“New Bing”終于來了,但我想說别高興得太早

最後,我隻能指名道姓地說出描述對象,讓它給我畫個歐洲早餐店圖。當然,出于合規的要求,還是會顯示 AI 作圖的水印,這該死的求生欲。

百度的“New Bing”終于來了,但我想說别高興得太早

為了公平起見,我們也用 New Bing 重複了這個步驟,分别生成了一段文案和一張圖。

百度的“New Bing”終于來了,但我想說别高興得太早
百度的“New Bing”終于來了,但我想說别高興得太早

最後,咱們把兩個圖檔和文案,同時丢到小紅書上。看看到底誰的效果更好。

雖然百度的浏覽量會越高一絲,但是 Bing 比百度多了兩個點贊數。是以這道題就算是開放式題目了,具體哪個更好,相信每個茶友都有自己的答案。

百度的“New Bing”終于來了,但我想說别高興得太早

最後總結一下,整體玩下來,還是能感覺到百度這産品和 New Bing 的客觀差距。

但是考慮到,這隻是初代版本,并且也還隻是在小範圍測試,以目前 AI 的更新速度來看,相信很快就會有體驗上的提升。

北京航空航天大學的教授吳文峻說過一個觀點,生成式 AI 的特點就是生成,是以不可避免會出現幻覺問題。

解決這個問題的唯一辦法,就是需要更長的技術演進。要用看待人類學習進化的觀點,去看待 AI 的發展。

至少在差評君看來,在微軟一騎絕塵的 AI 時代,百度能做出來,并且敢推出這個産品,已經是相當不易了。首先我們要有,這樣才能談演進,談進化。

繼續閱讀