天天看點

融合GPT大模型産品,WakeData新一輪産品更新

作者:砍柴網

近期,WakeData惟客資料(以下簡稱 “ WakeData ” )完成了新一輪的産品能力更新。就 ToB 企服公司如何融合GPT 大模型,WakeData 給出了自己的答案。

在2022年11月的産品釋出會上,已傳遞出WakeData的“三個堅定”:始終堅定技術投入,全面夯實核心産品的科技能力和自研率;始終堅定國産化适配能力,支援國産晶片、作業系統、資料庫、中間件、國密算法等,并在同領域實作對國外廠商的國産化替代;始終堅定擁抱生态,與夥伴共創共赢。

WakeData繼續新一輪的産品能力更新,憑借過去5年的技術積累,以及在地産、零售、汽車等行業和垂直領域的實踐,與戰略夥伴聯合研發具有私有化部署能力的行業大模型WakeMind,将在 AIGC 時代幫助更多企業自我革命、提升效能,持續解放生産力。

融合GPT大模型産品,WakeData新一輪産品更新

WakeMind模型的三大平台層

模型層:母艦平台将以具有私有化部署和行業定制能力的WakeMind作為核心引擎,已接入了ChatGPT等大模型,同時支援接入如文心一言、通義千問等多個大模型能力

平台層:WakeMind基于Prompt提示工程、Plugin、LangChain等方式,實作與接入大模型的高效對話能力。在零樣本學習的基礎上,通過Prompt和Plugin管理,讓模型能夠更好的了解上下文資訊;通過投喂行業語料,讓模型快速學習行業知識,并具有行業和垂直領域的思考推理能力。

應用層:WakeMind母艦平台提供底層能力,通過一架又一架的艦載機去賦能産品應用和行業場景,提升企業内部生産力。

舉個例子,母艦平台如何賦能惟數雲。企業在借助惟數雲平台建設和使用資料資産的過程中,往往需要投入大量專業的資料開發工程師,參與到業務需求分析和資料開發工作中,而大量繁瑣的開發任務會導緻整個資料價值實作周期被拉長。基于WakeMind賦能,隻需要通過文本互動,惟數雲就可以自動生成對應的資料查詢語句,并一鍵執行查詢,能夠大幅度提高資料查詢、分析、開發的效率,全面降低資料使用的技術門檻,以實作資料人人可用的目标。

融合GPT大模型産品,WakeData新一輪産品更新

WakeMind模型的三大特征

1)參數量更适合行業化和垂直領域場景。AI生成的内容要達到人類水準,往往需要以“預訓練+微調”的大模型為基礎;WakeData聯合業界領先的千億參數多模态預訓練大模型廠商,通過知識蒸餾和動态量化,壓縮出100億參數量的WakeMind模型;在聚焦的行業和垂直領域,基于P-Tuning V2可以将需要微調的參數減少到原來的千分之一,大幅度降低微調所需要的計算量。

2)具備行業化和垂直領域能力的文本創造和代碼生成。

3)支援私有化部署和行業化定制。行業或垂直領域的頭部企業,更希望具備私有化部署和行業化定制大模型的能力。而如何在小樣本學習和低算力消耗的情況下進行有效的預訓練,已成為行業化定制模型的技術門檻。WakeData行業資料和垂直領域資料的積累,将使行業大模型具有行業Know-How,并形成獨特的競争優勢。

同時,WakeMind采用Transformer架構,以self-instruct方式生成數萬的指令遵循樣本資料,使用SFT(Supervised Fine-Tuning)、RLHF等技術實作意圖對齊,通過INT8量化後,可大幅降低推理成本,使模型具有私有化部署的可行性

大模型與行業化預訓練大模型

自OpneAI釋出ChatGPT以來,給世界帶來了巨大沖擊。其背後的大型語言模型 (Large Language Model,LLM) ,以及RLHF (Reinforcement Learning from Human Feedback) 即以強化學習方式依據人類回報優化的語言模型,得到了廣泛關注。

WakeData創業初期,在NLP、CV、語音等領域就釋出了11個AI模型,其中NLP語義分析大模型的應用場景最為豐富。例如在低頻高客單價的地産置業、汽車、品牌零售等行業領域,SCRM是最有效的潛在客戶和存量客戶經營方式之一。WakeData通過行業語料的積累和特定的預訓練,使AI對行業産生深刻了解,能夠在對話過程中24小時快速響應客戶問題,并且能夠基于會話資訊,自動抽取客戶标簽,提升客戶畫像的分辨率。

融合GPT大模型産品,WakeData新一輪産品更新

在WakeData,AI大模型能力已經覆寫到從底層客戶資料資産建構,中層客戶經營旅程和經營規則,再到上層的多接觸點營銷鍊路;具備能夠為整個數字化客戶經營的垂直領域‘降本、提效、賦能’的能力。例如在CDP客戶資料平台領域,以前營運人員需要繁瑣的規則設計才能圈選到合适的目标客群,現在則通過簡單的語言描述和對話,AI即可以輔助找到對應的目标客群,大幅降低平台的使用學習成本,跨越式的提升使用效率和互動體驗。

融合GPT大模型産品,WakeData新一輪産品更新

在MA營銷自動化領域,WakeData的産品已經接入了微信生态、抖音、小紅書等觸點,并且支援自動化建構營銷旅程,提供豐富的旅程模版庫,可以實作“實時的、一對一的、個性化的”使用者觸達。這其中有一個重要的環節是個性化營銷素材的生成,包括文本、圖檔、圖文混排等,AI大模型可以大幅提升這個部分的效率和品質,同時降低成本。

在Loyalty大會員領域,當大會員系統橫跨不同行業、不同業态的時候,會員規則和會員資産拉通就會存在挑戰,WakeData的AI大模型基于大量行業經驗和語料訓練形成的Prompt引擎,通過簡單會話,描述不同業态會員的特性和業務訴求,就可以自動生成不同會員規則的映射邏輯群組合方案。

大模型在行業和垂直領域的實踐已證明其價值。

WakeMind商業路徑的三個階段

1)2018-2021年,自有模型應用和商業化探索期。基于WakeData的惟數雲、惟客雲、昆侖平台三條基礎産品線,将自研的NLP大模型在地産、新零售、汽車等行業,以及數字營銷等垂直領域進行全面的探索和實踐。

2)2022-2023年,WakeMind釋出和母艦平台建設期。WakeData聯合戰略夥伴加速行業大模型WakeMind的研發,并通過母艦平台,使WakeMind具備行業化和垂直領域的定制化能力,具備私有化部署能力,具備通用大模型的接入和管理能力,實作對自有模型不能覆寫場景的有利補充。

3)2023年及以後,全面進入WakeMind模型應用期。 WakeMind基于母艦平台的能力,全面接入到惟客雲、惟數雲、昆侖平台等産品線,通過行業知識積累、行業場景優化、行業提示工程訓練,進一步提升模型的行業化能力,并将在地産、新零售、汽車等行業發起更大規模的商用。與此同時,WakeData自身也基于WakeMind母艦平台的能力,開始實作自我生産力的革命。

WakeData如何用AI解放生産力

WakeData公司的使命定義為「喚醒資料」 ,并已在大資料平台領域布局多年。作為一家TOB企服公司,就「如何運用大模型」WakeData看到了巨大的機遇,并将大模型的運用覆寫到了兩個方面:一方面是将大模型接入産品,另一方面則幫助企業内部的設計師、程式員等人群使用大模型進行産品開發和客戶項目傳遞。

大模型的接入運用有兩個基本要素,有更适用的場景和具備大資料AI能力,WakeData主要的兩款産品“惟客雲”與“惟數雲”則為大模型的接入提供了便利。惟客雲能夠更友善的基于行業數字化應用将大模型工具無縫接入,客戶無需關心應用背後的複雜配置和技術優化;惟數雲則能夠基于行業幫助場景應用優化提示工程和垂直模型。而這也是WakeData一直堅持平台+應用的産品方案優勢。

與此同時,WakeData将大模型接入産品又分為了兩類,一類是基于産品和行業業務流接入,這類接入的重點在于優化體驗和行業知識,幫助客戶快速、便捷和有效的運用;第二類是基于産品結和開源大模型深度優化垂直場景,這類産品更符合大客戶對抗風險和資料安全上的訴求,同時基于行業的了解對模型可以不斷優化,可以保持這類客戶在垂直行業的持續競争力。

“企業在數字化轉型和數字化客戶經營當中要融合好大模型,大資料和場景是兩個關鍵要素。”WakeData創始人兼CEO李柯辰表示。

在通常情況下,大模型都需要大量的資料進行有效訓練,是以具備行業化的資料平台能力變得至關重要。近日國家網際網路資訊辦公室釋出了《生成式人工智能服務管理辦法(征求意見稿)》,其中特别強調了訓練和預訓練資料來源的合法合規,以及資料的真實性、準确性、客觀性、多樣性。大模型的價值應用場景,更是大模型發展和商業化的重要因素;所謂場景就是指我們訓練的模型的用途,是否能在合法合規的前提下,為業務創造核心價值。

李柯辰認為,場景是運用大模型的環境,大資料和AI技術基礎是能力;擁有行業場景和行業資料的企業在獲得大模型能力時會更快、更有效、更靈活。

WakeData的兩條核心産品線,正是對這兩大要素的累積;惟數雲作為新一代資料平台,具有強大的大資料End-to-End的資料處理能力,惟客雲作為新一代數字化客戶經營平台,其中包含了CDP、MA、SCRM、Loyalty等套件,擁有海量的業務應用場景,并且通過垂直行業深耕戰略,擁有更強的行業Know-How,擁有更多有價值的訓練樣本資料。在2022年惟數雲就釋出5.0版本,其資料內建、資料計算、資料分析和治理、資料可視化、資料資産化的能力均具有行業領先的優勢。而這些資料側的優勢,也成為大模型時代行業化人工智能應用的競争壁壘。

“在WakeData内部已經初步形成推進生産力解放的工作氛圍,WakeMind能力在産品設計、開發測試、營銷營運等領域,都已經展開使用,初步運用已實作人效達到20%的提升。在加快産品研發的同時,也提升了客戶項目傳遞的效率,還為客戶的數字化項目落地節省了時間成本。。”WakeDataCTO錢勇說到。

昆侖平台由基礎雲、開發雲、內建雲三部分組成,是WakeData産品研發和實施傳遞過程中非常重要的雲原生技術底座。昆侖平台開發雲通過WakeMind賦能,工程師已經在探索“基于産品文檔,輔助生成對應的架構設計、資料模型設計,再輔助生成代碼、檢測代碼的正确性”等方面的應用。例如在推進領域驅動設計的過程中,WakeMind可以輔助學習DDD、輔助工程師進行領域模組化;在資料模組化的過程中,可以通過自然語言互動進行資料模型的建立、修改、自動補充完善,快速生産SQL語句;在産品研發過程中,通過輸入産品文檔,提取和生成産品術語表,并進行詳細的解釋說明等。

融合GPT大模型産品,WakeData新一輪産品更新

對普通的工程師來說,在生成規則類代碼、自動生成單元測試、代碼審查和優化等領域,已經可以大幅提高開發效率了。

WakeMind提供全員可用的文案生成助手。

融合GPT大模型産品,WakeData新一輪産品更新

市場部門通過AI的 Text to Video快速建構的營銷增長矩陣。

AIGC賦能行業和垂直領域是必然趨勢,也是WakeData自創業以來的核心發展路徑。對于類ChatGPT的技術和服務,WakeData一直保持開放和擁抱的态度,并且積極投身其中,在聚焦行業化經營的戰略基礎上,緊緊把握其價值化和商業化的路徑。惟客資料的 WakeMind 行業大模型,将在 AIGC 時代幫助更多企業自我革命、提升效能,持續解放生産力。

繼續閱讀