智能搜尋AI創新健康領域,減低大模型幻覺率,提供更專業、準确的健康資訊
GPT的語音化、Gemini的橫空出世,讓大衆更早地将大模型的關鍵名額投向了多模态的想象力。殊不知,在技術場景的另一端,一批實用主義的大模型也在冉冉升起。
在垂類的世界,廠商已經開始“卷”幻覺率。幻覺是大模型還沒有廣泛投入應用的最大緻命缺陷,低幻覺率則代表着更高的科學性、真實性。對于專業資訊的要求更加嚴苛的垂類大模型來說,生成正确的内容,遠比自然地生成内容重要得多。
由于資料集的龐雜是導緻幻覺率的最大因素之一,大模型廠商需要在開發過程中謹慎、嚴格地使用和過濾資料集,從資料集的品質、更好的模型結構來緩解幻覺問題。
傳統健康搜尋:高頻使用者需求,低效資訊比對
日前,在專業測評中,誇克大模型在健康内容上的幻覺率降低到了5%以内,這個數字目前在海外流行的通類大模型中也隻有GPT能夠達到。由此可見,大模型有望成為大健康領域的“革新者”。
在釋出了自研大模型後,誇克首先更新了健康搜尋的服務體驗,通過此前累積的健康知識圖譜和全新的健康大模型應用,似乎在向市場宣告:大模型,就是健康搜尋最好的燃料。
事實上,國内的醫療健康領域早在十年前就邁入了“網際網路+時代,至今卻尚未出現一個标準化的平台,随着健康資訊密度的增加,缺乏驗證的謠言和營銷内容也越來越多,對于患者和使用者來說,篩查和判斷病因,好像反而“比以前更難了”。
與此相對的,近幾年國人對健康的重視程度迎來了顯著爆發期。健康焦慮帶來了大量的使用者線上行為和搜尋場景。高頻化的求醫問診、健康咨詢等需求也造成了各個地區醫療資源的短缺。搜尋引擎、社交媒體等線上平台,無疑是對于普通人來說最快速的篩查方式。
然而縱觀全球市場,傳統的搜尋引擎至今也沒有能夠很好地比對健康搜尋需求,搜尋結果飽受質疑。基于第三方平台和文章頁面的健康資訊、診斷内容等參差不齊,而第三方資訊一旦對使用者造成誤導,對于整個健康搜尋領域來說都是不可挽回的損失。
是以,近幾年來,社交媒體在健康搜尋方面的“公信力”似乎已經超過了搜尋引擎。不過,由于社交使用者更多地是在分享個人經驗,并不具備系統性診斷和科普的能力。是以,無論是大衆還是整個大健康産業,其實更加需要的都是搜尋引擎的針對性變革。
AI時代的健康搜尋:智能篩查,完整的診斷路徑
在垂直大模型分數表現出色的基礎上,近期,誇克針對健康搜尋進行了全面更新,上線“誇克健康助手”,将搜尋和AIGC内容進行全面融合,在幫助使用者進行健康資訊查詢的同時,也邁出了大模型應用于垂類搜尋的第一步。
近日,Google DeepMind資深工程師盧一峰在采訪中表示,大模型目前最有潛力的方向之一是檢索增強生成(RAG)。而早在2015年,中國工程院院士、網絡資訊安全專家方濱興就在論文中提出,傳統搜尋引擎并不能滿足泛在網絡空間中日益變化的搜尋需求。同時, “如何将各個行業的資料價值挖掘服務,變成一種通用的、可釋出的、服務于廣大群眾的搜尋技術,人們已經不滿足于搜尋引擎隻是給出存在性的結果,而是需要一組智能解決方案。”
比如,傳統搜尋體驗中的健康查詢與使用者需求的不适配,問題主要出在兩個方面。
其一,是搜尋内容的限制。搜尋框這一産品形态被設計出來的時候,是為了針對資料庫内的已有資訊進行檢索,是以更适用于關鍵詞的輸入和精準比對,會讓使用者在描述問題的時候本能地簡短化、關鍵詞化,一旦想要進行針對性地詳細表述,就會覺得無所适從。然而,對于健康查詢來說,短描述和關鍵詞顯然是不夠的。即使是線上下問診中,醫生也需要通過完整、邏輯清晰的表述,來幫助患者做出正确的判斷。
在這一點上,AI所帶來的智能比對能力隻是一方面,産品形态和路徑也需要更好地重構與打磨,從入口頁面提高健康查詢的引導性。是以,更新後的誇克健康搜尋首先在結果頁上改變内容的展現形态,由“誇克健康助手”提供的AIGC内容已經出現在使用者眼前。其優點是,将資訊海化為精準篩查,讓使用者接受資訊更簡單。
同時,還有誇克健康百科、智能篩查等功能,進一步幫助使用者了解病症、用藥、就業、保養等建議。尤其是智能篩查功能,使用者可以根據自身情況,通過勾選症狀資訊的方式,進一步描述所面臨的健康問題,然後系統會生成相關建議,輔助使用者決策。
傳統健康搜尋的第二個症結,是目前的搜尋引擎雖然是“收集問題”的最大資料庫之一,但解決問題的鍊條卻遠遠沒有達到标準化的程度。這也就導緻了,即使篩查結果已經足夠精準,能夠幫助使用者判斷病症,也無法針對具體的症狀告訴使用者應該怎麼做。尤其是在醫藥分離的時代,同一種病症的不同階段,在基礎護理、買藥、去醫院進一步檢查這些行為的流向下,都會産生截然不同的場景和結果。
此外,從資料本身的角度來說,搜尋引擎隻有陪伴使用者走完更深的查詢與解決場景,才能更好地優化大模型的能力,讓AI提供的資訊保持時效性。
是以,誇克在AIGC内容和智能篩查以外,還上線了“誇克健康助手”的功能頁面,讓AI像人一樣學會“對話”和“追問”,這也是給使用者充分放權的同時,降低了資訊查詢的門檻。
誇克健康助手所給出的是否需要就醫、治療建議等針對性分析,則能夠更好地提高就醫準确性。因為,健康搜尋雖然是基于當下症狀的垂直場景,但真正的診療卻需要對病患進行綜合觀察。生成式AI能在對話中提取和主動詢問關鍵資訊,進而提供更加深層次的實際指導。
這也就呼應了業界對于大模型應用能力的期望。此前,清華大學新聞學院教授、博士生導師沈陽曾表示,大模型要減少錯誤率,一個重要的措施就是要跟搜尋引擎進行協同。而在海外市場,微軟必應與GPT的深度協同、Google在Bard、Gemini上的發力與突破,也驗證了這一觀點。即使在科技巨頭看來,在搜尋引擎内的應用也是大模型想象力的根基和着力點。
隻不過,在浩蕩的技術革新中,海外頭部搜尋引擎花了更多的精力來錘煉産品的通用解決能力,讓AI時代的搜尋更加貼近一個全能、多模态的AGI。而在一向擅長将未來技術投入垂直應用的國内市場,由于使用者标準化需求的流量和頻次更高,廠商更關注如何以産品化探索的方式,讓新興技術與使用者體驗協同起來。
由此,健康搜尋或可成為國内最早獲益于大模型應用能力的領域和場景之一,同時也可以作為智能搜尋時代的先行軍,為搜尋引擎補充更多來自來自第一方、可控性更強的内容,進而打破使用者對傳統健康搜尋的偏見,在表達門檻更低、更自由的互動體驗中,拉近普通人和正确、專業、權威知識的距離。
大模型産品的未來:一切以使用者體驗為先
如火如荼的AI化轉型階段,大模型的能力如何融入自身産品形态,誇克健康搜尋給出了一個有力的創新示例。
誇克很好地認識到,産品互動的創新和繼承是不可或缺的:基于大模型的搜尋不能僅僅以生成式對話的形式存在,專業的診斷建議必須和現有的使用者查詢路徑結合起來。
而Google盡管目前還沒有像誇克一樣,為C端使用者上線健康查詢的智能搜尋版面,但今年十月,谷歌雲也曾借助Vertex AI的能力,釋出了幫助醫生從醫療記錄中精确提取臨床資訊的搜尋産品。
諸如此類,為健康行業提供AI解決方案的嘗試正在如火如荼地進行。全球範圍内,人工智能輔助診斷的案例也變得越來越多。網際網路醫療出現以來,通過聊天機器人、線上醫生等進行線上對話問診的病患比重不斷提高,這些過去的程序都為如今AI健康搜尋的市場打下了認知基礎。而相比上一個技術時期,大模型雖然不能完全替代醫生的診斷,但其對于疾病和潛在疾病的診斷率已經相當出色。尤其是在誇克等大模型自研廠商将健康能力作為技術标的之後:誇克大模型曾以485的高分通過臨床執業醫師資格考試。
也許在短期内,AI還不能“成為”醫生,但目前AI已經能替醫生解決很多輔助性和預判性的工作。根據誇克的技術與資源布局,可以預見到,明年的健康搜尋領域還将呈現出兩個趨勢:
一.行業圖譜将會更加垂直和細分。比如根據病症類型、人群、年齡階段産生不同的垂類查詢場景,結構性的智能問答所覆寫的健康需求類型也會更加靈活。同時,在健康搜尋所展開的醫療健康解決方案方面,搜尋引擎将會作為一個數字平台,更好地連接配接使用者與醫院、服務端等,因為使用者的線上查詢同時也能為醫生快速提供診斷方向,Vertex AI在北美醫療保健與部分衛生組織中的測試應用已經為此提供了可行性。
由此,也就引發了第二個趨勢:出于對健康診斷實用性、正确性的考慮,來自業界的前沿判斷和專業資料将會得到迅速的生态整合。誇克大模型之是以能夠在健康領域呈現出較高的專業能力,除了技術和使用者資料層面的優勢之外,還有來自超過200位權威醫學專家的領銜編審、60多家全國公立三甲醫院、40多個醫學機構的合作。現階段,人與AI之間并非抗衡,而是協同關系。有限的人才資源,才是“無限”的智慧來源,一個優秀的大模型也不能脫離專業的知識積澱和校正。而在此過程中,一個開放活躍的業界生态尤為重要。
無論是Google、必應還是國産搜尋引擎誇克。從聯考報志願到健康搜尋,一直以來,誇克也是為數不多擅長圍繞行業圖譜進行“場景突破”的平台。而在大模型時代,如何平衡技術變革的感性和實用場景的理性,也讓這一類,重新開啟了對于使用者體驗的構想。
如今,傳統健康搜尋的“頑疾”正在得到技術的摒除。比起,更加值得期待的是越來越多的醫學從業者能夠擁抱,以AI的形式幫助更多人便利、低成本地獲得健康、保持健康。
該文觀點僅代表作者本人,36氪平台僅提供資訊存儲空間服務。
本文圖檔來自:企業授權