天天看點

阿裡提供中文搜尋新選項!AI引擎+達摩院黑科技,你要試試嗎?

雲栖号資訊:【 點選檢視更多行業資訊

在這裡您可以找到不同行業的第一手的上雲資訊,還在等什麼,快來!

最近中文搜尋引擎市場又突然熱了起來,一家巨頭的入場讓外界充滿期待。

6月9日,阿裡向外界确認成立智能搜尋業務部,隸屬阿裡創新業務事業群,由UC事業部總經理、書旗事業部總經理吳嘉擔任負責人。

阿裡人事變動,莫非要進軍搜尋引擎市場?其實阿裡的産品早已先行。

今年4月,一款名為“誇克”的智能搜尋App首次在蘋果應用商店排名超越百度,并首次跻身前20。

阿裡提供中文搜尋新選項!AI引擎+達摩院黑科技,你要試試嗎?

其實早在2018年,誇克就開始發力智能搜尋,2019年1月,誇克釋出3.0版,在自主訂制的AI搜尋引擎、搜尋直達、指令控制等方面實作了重要更新。

搜尋引擎誕生已有20餘年,無論國内外,市場似乎早已塵埃落定,阿裡為何如此“頭鐵”,誇克為何近兩年來越來越進擊智能搜尋?

阿裡提供中文搜尋新選項!AI引擎+達摩院黑科技,你要試試嗎?

這恐怕與近年來AI成熟落地密不可分,也不得不從搜尋行業的變化開始說起。

多模态搜尋的變革

PC時代,我們以文字作為主要的搜尋形式。移動網際網路興起後,手機端的搜尋引擎App依然如此。

後來,智能手機開始普及,說一段話、拍一張圖變得容易起來,各大搜尋引擎公司又加入了語音、圖檔搜尋。

如果我們仔細思考就會發現,現階段大多數語音、圖檔搜尋,其實本質上還是把多媒體資訊轉變成文字,然後再進行搜尋。

這類搜尋隻是了解使用者輸入的資訊,實際上對另一端抓取的資訊是沒有了解的。誇克要做的就是跳出這種機械文字檢索的圍牆,改變搜尋引擎。

阿裡提供中文搜尋新選項!AI引擎+達摩院黑科技,你要試試嗎?

在吳嘉看來,這次的轉變是一場搜尋引擎的真正變革。

吳嘉認為,今天的内容生态有很大的變化,搜尋技術也應該擁抱相應的變化。

至少在語音、圖像了解的搜尋上,誇克背後的阿裡已經擁抱變化。淘寶的圖檔搜尋技術早已在移動端得到應用,天貓精靈也是國内智能音箱領域的頭部玩家。

在誇克的産品中,也有這兩類智能搜尋技術的展現。

那麼未來的多模态搜尋又會怎樣?

誇克的判斷是,未來搜尋很大程度上會是視訊内容檢索。注意不是對标題的搜尋标題,而是對視訊内容本身。

随着短視訊這種娛樂、學習方式的興起,傳統的搜尋方式變得無效,因為它不能對視訊内容做出了解。

而這正是誇克在今天做的工作。

據誇克搜尋技術負責人介紹,他們正在做視訊了解——深入到視訊每一幀畫面、每一句語音裡,去分析這個視訊的主題和品質,然後在分析的結果上建設一個視訊庫。

将來使用者隻要一搜,就能把現在最好最熱門的視訊内容傳回給使用者,提升使用者在視訊搜尋上的體驗。

這項技術離我們不會太遙遠。誇克産品負責人鄭嗣壽透露,誇克将在不久後就會這樣的視訊搜尋産品。

誇克為何要做搜尋

通過搜尋框和AI,我們初步了解了誇克産品。可是在資訊孤島化的今天,有人認為通用搜尋已死,誇克為何還要做搜尋?

因為在誇克團隊看來,通用搜尋不但不會死,未來的價值還會越來越重要。

而且,直到今天,搜尋引擎一直是網際網路的基礎服務之一,每天國内就有數億使用者在用。

隻要使用者有需求,通用搜尋就會一直存在。

阿裡提供中文搜尋新選項!AI引擎+達摩院黑科技,你要試試嗎?

吳嘉在接受采訪時說,過去我們的搜尋内容在連結裡、在H5裡,但是今天想做好一個内容,已經沒有現成的連結和H5可供抓取了。

隻有把要把内容生态做起來,同時提高技術,搜尋引擎才有出路。

生态方面,誇克不必擔心,有阿裡的電商和大文娛内容有阿裡的生态内容作為支援。

而更重要的是有AI搜尋還有對内容的了解,從海量化資訊中把有價值的資訊呈現給使用者。在這方面,誇克有自然語言了解AI技術幫助提取有效資訊。

誇克為何有底氣做好搜尋

無疑,阿裡的中台架構幫助誇克在一年内快速實作智能搜尋的願景。

産品負責人嗣壽自豪地說:“阿裡的基礎設施建設是非常完善的,算力也有很大的優勢,在這裡可以實作更先進的算法。”

在技術方面,誇克搜尋技術負責人向我們介紹,誇克在自然語言了解、知識圖譜、多模内容了解方面都有大量投入:

在過去一年多的時間裡,誇克建構了超大規模的基礎的閱讀了解的資料集,為網頁搜尋提供了段落級、句子級、單詞級别不同粒度的閱讀了解技術。

抽取網頁文本的知識,将其與結構化的知識做融合,建構知識體系。目前已經在醫療類搜尋中得到應用。

最後就是之前提到的對視訊内容的了解。

除了搜尋的基礎技術外,誇克還在AR、VR圍繞這些互動方式上有非常多的探索。

作為阿裡前沿技術的大腦,達摩院也為誇克輸送了大量的技術。

前不久達摩院提出的StructBERT,在通用語言了解評估基準GLUE上超過了谷歌、微軟,排名第一。

阿裡提供中文搜尋新選項!AI引擎+達摩院黑科技,你要試試嗎?

這篇研究成果也被國際頂級AI學術會議ICLR 2020收錄,誇克團隊也很快将這項技術用到自己的搜尋産品當中來。

去年谷歌将BERT用于文字搜尋,大大提高搜尋結果的準确性,誇克在方面緊跟國外前沿公司的潮流。

技術以人為本,以上的技術離不開誇克團隊内部人才的吸引和培養機制。

現在的團隊中也有很多搜尋行業的老兵,他們分别來自各大網際網路頂級公司。

據誇克搜尋技術負責人介紹,現在的搜尋技術團隊,最初來自于阿裡的多個業務領域的技術團隊,之前研究過聊天機器人、智能問答等技術場景,後來還參加過智能音箱相關技術的研發。

技術團隊不是天生為搜尋,但是卻與現在的智能搜尋技術緊密關聯。

面對瞬息萬變的搜尋市場,誇克也在及時擷取新鮮血液,有很多入職不到兩三年的新阿裡人漸漸加入到當中來,不斷壯大團隊。

雖然誇克的完成度已經很高,但是未來還有很大的提升空間,尤其是視訊搜尋、互動模式等方面。這離不開更多新人的加入。

嗣壽希望,能夠更多年輕人加入誇克,誇克的AI研發崗位會一直向頂尖技術人才敞開,為做出更好中文搜尋引擎的願景一起努力。

【雲栖号線上課堂】每天都有産品技術專家分享!

課程位址:

https://yqh.aliyun.com/live

立即加入社群,與專家面對面,及時了解課程最新動态!

【雲栖号線上課堂 社群】

https://c.tb.cn/F3.Z8gvnK

原文釋出時間:2020-06-16

本文作者:曉查

本文來自:“

量子位公衆号

”,了解相關資訊可以關注“公衆号 QbitAI”

繼續閱讀