天天看點

OpenAI籌備手機用戶端,小愛、Siri将被趕盡殺絕?

作者:雷科技

原本小雷還以為「2023年是屬于元宇宙的一年」,實在沒想到以ChatGPT為代表的AI技術能在這麼短的時間内搶走元宇宙的風頭,成為2023年的技術關鍵詞。從OpenAI到搜尋引擎、從繪圖工具到遊戲公司,幾乎所有「稍微出名點」軟體企業都在今年推出了自己的自然語音AI對話模型。

但可惜的是,本應「造福所有人」的AI技術,卻不是每個人都用得上。比如有的AI模型嚴格限制使用者的IP位址,有的AI模型動不動就會封禁某個區域的使用者賬号,相比之下那些「資源有限」要求排隊抽簽領取測試資格的AI模型都變得那麼的平易近人。

當然了,有使用門檻就意味着有資訊差,也意味着有人可以用這個資訊差「大賺一筆」:在Google Play、App Store甚至是微信小程式平台,我們可以找到各式各樣的AI App。他們有些調用的是OpenAI給出的免費接口,有些則直接挂羊頭賣狗肉,用貨不對本的低級AI模型來糊弄使用者。但有一點這些App倒是表現出驚人的一緻性:他們要麼全是廣告,要麼向使用者收費。

不過這些App的好日子馬上就要結束了。

OpenAI籌備手機用戶端,小愛、Siri将被趕盡殺絕?

圖檔來源:OpenAI

前段時間,推出了大量成功AI模型的OpenAI更新了招聘職位清單,開始尋找「移動工程師」,簡單來說就是正在組建移動平台上的AI團隊。沒錯,OpenAI終于要對移動網際網路生态下手了。

姗姗來遲的AI移動端

盡管OpenAI這才開始組建移動團隊,其他幾大AI平台行業也都不約而同地選擇了浏覽器(網頁端)作為自己的主要載體,但從App Store、Google Play等平台的搜尋量以及第三方App的下載下傳量來看,移動端AI顯然有着極為廣闊的市場前景:

比如文心一言才釋出沒多久,在App Store上就出現了很多「第三方文心一言」App。這些App從LOGO到文案介紹都和文心一言别無二緻,再配上有模有樣的圖檔展示,讓很多網友們以為,這就是百度官方推出的文心一言App。小雷不久前也和大家分享過這些山寨AI App的事情,有興趣的話可以點選(https://www.leikeji.com/article/56192)重溫。

雖然小雷不建議大家使用這一類「第三方AI App」,但從下載下傳量來看,确實有不少人對這種手機AI App有迫切的需求。不過話又說回來,為何各大AI模型都還隻提供浏覽器的通路入口?在移動平台上部署AI,真就這麼難嗎?

從開發者的角度看,「将AI模型帶到移動平台」具體可以分為兩種情況:隻在本地部署前端,模型放在遠端的「線上模型」以及将整個AI模型部署在移動裝置上的本地模型。

OpenAI籌備手機用戶端,小愛、Siri将被趕盡殺絕?

圖檔來源:OpenAI

我們先說第一種,所謂「隻有前端在本地」這個方案其實已經非常成熟,成熟到無數「第三方AI App」都已經實作了這個需求。簡單來說,隻部署前端指的是使用者手機上安裝的App隻負責使用者界面等軟體互動,實際上所有的資料都通過AI模型的API發送到對應的遠端伺服器中。舉個不太恰當的例子;使用者安裝在手機裡的App隻不過是一個外賣軟體,實際炒菜的是外面的餐廳。至于最終炒菜的餐廳是「麗晶飯店」還是「麗晶蒼蠅館」,使用者并不知悉。

在這裡小雷也必須澄清一點,這類隻提供前端的第三方App并非都是「偷蒙拐騙」的App,有些App确實能解決OpenAI的ChatGPT在使用上的不便。如果大家有使用過ChatGPT,應該對它複雜的通路環境要求和煩瑣的登入驗證流程有印象。即使小雷品是都是通過Google直接登入,但反複的驗證确實也非常麻煩。

而有些第三方App就在本地重寫了ChatGPT的互動,優化了原本使用浏覽器時的不便。這類App通常需要使用者自己在OpenAI的控制闆中生成自己端口的API(AI ID)并添加到App中。

OpenAI籌備手機用戶端,小愛、Siri将被趕盡殺絕?

圖檔來源:OpenAI

可能有人覺得這類App技術技術含量低,但至少從OpenAI招聘啟事來看,他們正在組建的移動App團隊,采取的也是這種方案。對于采用這種方案的App來說,它的難點主要在于如何把一個有潛力成為國民級App的互動界面設計得更人性化,而不是像某個真國民級App那樣讓全國人民教産品經理做軟體。

換句話說,這種App做起來并不難。但作為對比,采用第二種方案開發的App,它的工程難度高了可不止一點半點。

移動AI之難,難于上青天

從技術的角度看,完全在移動平台上部署AI模型背後的技術難點可以分為五個部分:計算資源限制、網絡資源限制、電量限制、儲存空間限制和資訊安全限制。

一般來說移動裝置的計算資源通常有限,而深度學習模型需要大量的計算資源。是以在移動平台上使用AI的使用者一般會使用專門為移動裝置設計的硬體來提高計算速度,比如筆記本電腦就會配備更适合AI加速的專業顯示卡。

OpenAI籌備手機用戶端,小愛、Siri将被趕盡殺絕?

圖檔來源:Veer

但很顯然手機上沒有用來加速AI運算的專業GPU,甚至在大多數手機移動平台上,和AI最沾邊的不是神經網絡單元NPU就是用來處理相機圖像信号的ISP。當然了,開發者也可以調整AI模型的邏輯,讓AI主動适應移動平台上并不充裕的計算資源。隻不過出來的效果可能就隻有Siri的級别了。

網絡資源限制聽起來有些沖突,畢竟我們讨論的是部署在移動裝置本地的AI模型。但如果大家有試過在本體部署AI模型,應該明白不斷更新的網絡資源對AI模型的重要性。

電量限制和存儲空間無需多講——深度學習模型需要進行大量的計算,這會導緻移動裝置的電量迅速耗盡,這對于本上就不以續航見長的智能手機來說則更是要命。另外在計算機科學領域有一句非常著名的話叫「空間換時間」,簡單來說就是算法的「空間複雜度」和「時間複雜度」通常無法兩全——想要在手機上部署并維持一個好用的AI模型?OpenAI你問過手機裡那一個檔案儲存5份還會過期的國民級App了嗎?

資訊安全限制聽起來很複雜,但是實際上非常簡單:在移動裝置上運作AI模型需要使用大量的使用者資料,而手機這個載體記錄的個人資料已經遠遠超過了其他個人電子裝置。我們該如何保證AI拿到所有資訊都是我們「想讓AI知道」的呢?

我們需要怎樣的移動AI?

雖然讓AI登陸手機背後有無數的難點,但作為一個AI模型使用者,我不得不承認AI技術的加入将對整個手機行業帶來天翻地覆的變化,甚至有可能打破iOS與Android之間「一超多強」的格局。

一旦AI模型登陸手機平台,首先可以肯定的是上遊SoC供應商會積極改變産品政策,大幅提升SoC中用于AI運算的NPU數量和性能。AI也不再是我們評判手機拍攝表現時的名額,而是成為一個通用的綜合能力名額,甚至跑分軟體都會争相加入對AI算力的測試環節。

而在使用者層面,AI技術的加入也将解決一些過去手機中那些有大量資料,但因算力不足而無法解決的問題。比如用AI學習使用者的臉部變化,進而提供更安全的口罩人臉解鎖或聲紋解鎖,或者利用AI學習使用者的使用習慣,進而在使用者橫着掏手機時精确判斷使用者意圖并打開相機自動拍攝。針對采用曲面屏的手機,AI的加入可以根據使用者拿手機的方式提供更智能的邊緣防誤觸政策。

至于AI在相機領域的應用更是一絕:在AI的幫助下:某些手機品牌可以跳過拍照的步驟,直接「增強」一張月亮照片出來。實際上,對智能手機行業來說“AI”并不是陌生的詞彙,甚至早在七八年前,就已經有手機廠商宣布會借助AI能力對手機體驗進行優化,而發展至今AI也依然潛藏在我們的手機裡。

但我們需要認識到的是,ChatGPT技術發展的速度、所展現的能力遠不是智能手機上那種“增強AI”可比的,如果類似的大模型AI真的深入到智能手機中,說不定直接會讓智能手機變成一個全新的品類。

但如果OpenAI隻想打造一個适用于移動端的App,那麼手機廠商暫時還不用過多擔心,甚至可以嘗試和OpenAI合作說服他們開放接口,好讓這種AI能力接入到手機的各個應用層面之中。

當然了,AI模型的加入也會為手機帶來真正智能化的語音助手,而當大型AI模型真正在使用者手機上部署時,Siri也應該擺脫「人工智障」的外号了吧。隻是又有多少iPhone存得下一個完整的AI模型呢?

但願AI時代沒有64GB的iPhone。

繼續閱讀