天天看點

AI 搜尋哪家強?史上最全評測告訴你

作者:開山怪阿土

大家是不是跟我一樣煩透了百度搜尋裡的垃圾資訊,随着國内 AI 廠家普遍接入搜尋功能,我已經開始全面轉向用 AI 來搜尋了。跟傳統網際網路時代,百度獨霸國内搜尋不一樣的是,目前 AI 搜尋算是遍地開花,我手機裡就有6、7個APP,更不用說電腦端了。我一直想對目前所有常用的 AI 搜尋做一個完整的評測,一直耽于瑣事,最近兩天終于決定把這個事完成。

AI 搜尋哪家強?史上最全評測告訴你

據我搜尋了解,目前國内有對一些 AI 搜尋評價是否免費、易用的,或者有拿部分産品做對比的,還沒有人做一個所有 AI 搜尋的實測對比。這次,我選擇了全球最知名的 AI 搜尋 Perplexity.AI 來跟國内所有的手機端 AI 搜尋一起評測。主要是 perplexity 一直号稱英語 AI 搜尋第一,也是我桌面端搜尋的第一選擇。國内我能找到的手機端 AI 搜尋有豆包、360AI、文心一言、訊飛星火、Kimi、天工、秘塔AI搜尋,最後這個隻有微信小程式。

這次評測不做什麼易用型啥的對比,隻拿實際搜尋結果說話。首先找了開源的 AI 搜尋引擎評估資料集為基礎來做問題庫,然後自己再添加了一些其資料集缺少的問題。評測問題涵蓋中、英、日、韓、俄五種語言,并分為本地搜尋、産品咨詢搜尋、商業咨詢搜尋、技術咨詢搜尋、複雜搜尋、時事新聞搜尋六大類。

說了那麼多,先看看評測結果,不要笑圖簡陋,一個字一個字打出來的,不像大神用Python程式設計做,界面那麼好看。

本地搜尋評測表

AI 搜尋哪家強?史上最全評測告訴你

産品咨詢搜尋評測表

AI 搜尋哪家強?史上最全評測告訴你

商業咨詢搜尋評測表

AI 搜尋哪家強?史上最全評測告訴你

技術咨詢搜尋評測表

AI 搜尋哪家強?史上最全評測告訴你

複雜搜尋評測表

AI 搜尋哪家強?史上最全評測告訴你

時事新聞搜尋評測表

AI 搜尋哪家強?史上最全評測告訴你

由于個人精力有限,每個語言的大類隻用了一個樣本,但是這個獨樣本是從資料集中精挑細選出來的,不是那種很簡單随便那個搜尋都能答對的。評分的标準就是全對加1分,不完全正确有×√的算0.5分。有道英語問題主要考察 AI 搜尋的深度和廣度,依照回答結果的廣度來評分,5個星及其以上是1分,以下是0.5分。

評測結果有幾個是我沒想到的,第一個就是沒想到天工 AI 竟然在多語言和綜合搜尋得分最高,這個綜合得分是包括所有語言和純中文搜尋的權重得分。豆包在純中文得分上最高,這個倒是在期望之内。​考慮中文樣本太少,分數拉不開,我下來又多問了兩個問題,結果還是一樣,就懶的改分數了。豆包也是我兒子最愛用的 AI 搜尋,經常問它作業上的問題。

AI 搜尋哪家強?史上最全評測告訴你

第二個沒想到的是 Kimi 竟然在英文搜尋得分上跟 Perplexity 不相上下,說好的 Perplexity 英文搜尋遙遙領先呢?!要不是在那個“Why was the Chinese national flag draped over Genex Tower?”這個問題上給 Kimi 打了零分,Kimi 甚至要壓 Perplexity 一頭。Kimi 其實推測出了正确答案,但是沒有舉例實際新聞,手松點還是可以給0.5分的。

AI 搜尋哪家強?史上最全評測告訴你

最後說一下評測感受。360 AI搜尋感覺還是用網際網路時代的腦子在做 AI,每次搜尋一個問題後隻能新開搜尋,不能追問前面的,AI 的上下文呢。 天工作為國内最早發力 AI 搜尋的公司,在 AI 領域是下了功夫的,目前國内手機端最全 AI 應用就是它了,一個APP內建了搜尋、寫作、智能體、音頻生成、圖像識别、圖像生成。除了通義把它的兩個視訊生成模型Animate Anyone 和 EMO 放在 APP 裡,在視訊生成這塊壓天工一頭,天工算是國内獨一份了。不過天工,你還是找個好設計師,重新設計一下APP吧,裡面就一個亂字。