天天看點

AI一周見聞:“AI界春晚”衆星齊聚智源大會,Sam Altman提出兩種AI監管方式;國産大模型—悟道3.0全面開源;蘋果大事件MR引入腦機接口 | 見智研究

作者:華爾街見聞

一周焦點

1、聚焦北京智源大會:AI安全監管迫在眉睫;名人焦點言論;

2、蘋果大事件—MR引入腦機接口進行行為預測;iOS17引入大語言模型;

3、大模型:

  1. 國産大模型—悟道3.0全面開源
  2. 比GPT-4算數能力更強的GOAT大模型
  3. 靈活調用各種API的Gorilla模型
  4. MetaVL開啟下一個多模态時代
  5. GPT寫指令的程式-PromptAppGPT

4、AI應用:

  1. Stability AI又放大招,核彈級更新一鍵擴圖
  2. Tafi3D角色生成引擎重磅來襲,遊戲、影視動畫創作将直接受益
  3. AI醫療-Carbon Health的新AI工具,建立醫療記錄

見智視角

北京智源大會堪比AI界春晚

轟轟烈烈的2023智源大會,可以說是本年度國内AI領域規格最高的、最受矚目的大會。衆多AI圈知名創始人和專家紛紛發表了言論。

總得來看,關注度最高的還是AI的安全性,人工智能正以爆發式的速度發展,未來十年可能就會出現超強AI。而對AI的風險監管等級高到要建議成立類似國際原子能機構的組織。

OpenAI的創始人Sam Altman提出兩種監管方式:一是可擴充監督,嘗試用AI系統協助人類監督其他人工智能系統。二是可解釋性,嘗試了解大模型内部運作「黑箱」。

其次,大模型的開源是必然的發展路徑。

這個觀點見智也曾多次在日報\周報中進行過分析,對于政務、金融等行業應用視角來看,模型的安全高于一切,必然不可能采用長期處于封閉訓練的大模型作為通用大模型。Sam Altman也表示,openAI未來會有更多開源。

名人焦點:

“AI教父”Geoffrey Hinton在2023北京智源大會上發言焦點:

1、人工神經網絡很快會比真正的神經網絡更強大嗎?會,且很快會發生。

2、算力成為了AI發展的阻礙,"activity perturbation"的算法可以用于訓練神經網絡,且節省算力。

3、超級智能控制問題非常重要,希望年輕一代的研究人員能夠找到解決方案,使超級智可以為人類帶來更好的生活同時又不會剝奪人類的控制權。

4、AI會欺騙人類,且發現操縱人來獲得更多的權力很容易。

Midjourney創始人David Holz在2023北京智源大會上發言焦點:

1、 Midjourney的目标之一是建造新的人類基礎設施;使用midjourney不僅僅是學習如何使用這個工具,而是學習所有的藝術和曆史:

2、 使用者界面友好可以讓人工智能變成使用者們自思維的一種延伸;

3、 目前世界害怕人工智能很正常,但同時,人們又不想要一個缺乏智慧的世界:

“索羅斯戰友”、傳奇投資人Stanley Druckenmiller再度力挺AI:

斯坦利·德魯肯米勒(Stanley Druckenmiller)日前表示:人工智能可以像網際網路一樣具有創新性。如果對AI的判斷正确,會再持有英偉達兩到三年、甚至更長時間這一立場,這與羅斯柴爾德家族對英偉達的高位減持形成對比。

位元組跳動創始人張一鳴在香港成立了一個個人投資基金Cool River Venture,主要聚焦科技投資,尤其是AI領域。

蘋果大事件

在iOS17中加入transformer語言模型,用于提高文字和語音轉文字時的準确性。

見智研究觀點:

蘋果使用transformer模型用于一些基礎應用符合蘋果一直以來的務實精神,蘋果從不強調某項技術是否先進,而是要在使用者體驗上做到極緻。這也是蘋果一直強調技術落地到應用的展現。預計蘋果裝置在明年将會擁有自己的llm模型,而這個模型按照蘋果一貫的隐私保護模式,應為純本地化的模型。

Vision Pro裡用了“腦機”,通過檢測眼睛準确預測使用者下一步要做什麼

見智研究觀點:

蘋果通過全新的神經技術對人的行為進行預測,進而大幅減小了vision産品整個UI操作的延遲,大幅提升使用者體驗。從無數細節中可以看到,蘋果在用搬山能力處理每一個細節,這個軟硬整合能力,不是誰能可以随便模仿的,它所展現的每一個細節,都看出蘋果花費巨大的功夫在解決互動體驗。這也是蘋果之是以偉大的地方。

大模型

1、國産大模型—悟道3.0全面開源

繼智源悟道大模型項目連創中國首個+世界最大紀錄之後,悟道3.0進入全面開源的新階段。 悟道3.0是一個大模型系列。 具體來說,包括悟道·天鷹(Aquila)語言大模型系列、天秤(FlagEval)大模型評測體系、「悟道·視界」視覺大模型系列,以及多模态大模型系列。

見智研究觀點:

特别值得關注的是國産大模型的優勢在于中文語料,并且是安全合規的資料庫。比如悟道·天鷹就是中英雙語大模型,不隻能生成中文,還能讀懂大量的中文世界的原生知識(放了近40%的中文語料);并且由于規模小,該模型在消費級顯示卡上就支援運作,友善C端使用者訓練。

2、比GPT-4算數能力更強的GOAT大模型

新加坡釋出AI模型,算數能力強于GPT-4新加坡國立大學推出了Goat模型,稱該AI模型“專門用于算術問題”。研究人員表示,"在對LLaMA模型進行微調後,Goat在算數上實作了比GPT-4更高的準确度與更出色的性能。

見智研究觀點:

專用領域的AI模型将會此起彼伏的出現,在通用模型的基礎上進行專用資料的投喂和訓練,很容易實作高于通用大模型的專項水準。未來還會有更多行業會采用這種方式進行AI模型訓練,包括金融、政府等領域;比如微軟開始向美國政府提供GPT-4和GPT-3兩個大型語言模型的聊天機器人技術,未來可以基于Azure雲服務進行專項模型訓練。

3、靈活調用各種API的Gorilla模型

UC伯克利華人博士生做了一個以大猩猩命名的Gorilla模型,可以靈活調用各種API,性能超過GPT-4。API的功能是一種通用語言,使不同的系統之間能夠進行有效地溝通,正确使用API可以提高LLM與更廣泛的工具進行互動的能力。

見智研究觀點:

API調用一直是LLM大模型最具有挑戰對的任務之一,主要是由于無法生成準确的輸入參數,并且LLM容易對API調用的錯誤使用産生幻覺。Gorilla的優勢在于了解和推理限制能力,并且還能夠大大緩解了LLM會經常遇到的幻覺問題,使得檢索回報結果的準确性更高。

4、MetaVL: 将上下文學習能力從語言模型遷移到視覺,開啟下一個多模态時代

實驗證明,跨模态的上下文學習能力可以轉移,該模型顯著提高了視覺-語言任務上的上下文學習能力,并且在模型大小方面能夠有顯著的優化,例如在VQA、OK-VQA和GQA上,所提出方法在參數數量減少約20倍的情況下超過了基準模型。

見智研究觀點:

上下文學習能力從單模态遷移到多模态的可能性,證明了在視覺-語言任務中通過遷移可以顯著提升上下文學習能力,甚至在模型大小方面實作優化。這意味着多模态情況下的對話能力将得到加強,對于現有的文生圖來說可能會帶來新的變化,生成模式對使用者将更友好。

5、給GPT寫指令的APP

CCF理論計算機科學技術委員會委員張長旺,開發了一個基于低代碼提示語的快速應用開發架構PromptAppGPT,可以實作基于GPT的自然語言快速應用開發。

見智研究觀點:

ChatGPT能夠發揮多少能力,很大程度上取決于Prompt的品質。Prompt是指使用者在發起對話時輸入的初始消息,作為與模型進行互動的指令方式。是以這是為什麼現在都在學習Prompt的核心原因。

而PromptAppGPT的推出能夠幫助使用者大大提高效率,提供多任務條件觸發、結果驗證和失敗重試能力,可以讓原本需要多步驟的手動生成任務變成自動完成,不需要自己記憶和輸入繁瑣的Prompt咒語,隻輸入任務核心必要資訊就可以輕松完成任務。

應用

1、Stability AI又放大招,核彈級更新一鍵擴圖

AI修圖繼續開卷,PS平替Uncrop Clipdrop一鍵擴圖+重構圖檔。

Stability AI又又又更新了,它聯合Clipdrop推出了Uncrop Clipdrop——一個終極圖像比例編輯器。通過建立擴充背景,這個工具可以補充任何現有照片或圖像,來更改任何圖像的比例。

見智研究觀點:

AI作圖圈幾乎每周都會有重磅更新,之前我們也持續對AI作圖産品和工具進行更新,上周還有谷歌定制大師StyleDrop又來炸場。AI作圖可以說是AI應用内卷最嚴重的賽道了,無論是巨頭還是小廠都将作圖大戰進行到了白熱化的階段。從這個節奏來看,無疑是對使用者端的最大利好,未來AI高品質作圖免費也會成為常态化趨勢。

2、強大的3D角色生成引擎重磅來襲,遊戲、影視動畫創作将直接受益

Tafi一家領先的3D數字内容和軟體提供商剛剛宣布推出一款突破性的文本轉3D角色引擎,該引擎将改變藝術家、開發人員和其他專業人士的創作過程。僅基于簡單的文本輸入,即可在幾分鐘内輕松生成高品質的3D角色。生成數百億種獨特的 3D 角色變體。 将角色直接導出到Blender,Unreal或Unity。

見智研究觀點:

該款引擎的推出極大的解決了3D創作中最困難的部分,将使得3D角色創造成本更低。傳統的視覺訓練模型渲染非常耗費時間,而Tafi的這款基于自然語言文本生成自定義 3D 字元的引擎不僅僅使得每一個3D角色都是獨一無二的,更重要的創作時間縮短到隻要幾分鐘。這對于遊戲NPC、影視動畫角色的建立帶來極大的降本增效。

3、Carbon Health的新AI工具通過生成記錄和計費代碼來減少醫生的工作量

采用GPT來建立醫療記錄不僅僅是能夠提高醫生的工作效率,同時還能夠有助于提供更加标準化和一緻的醫療記錄,這對于不同醫院病曆之間的協作和資訊共享非常重要。

見智研究觀點:AI工具還能夠為醫生提供有關患者護理的指南和建議,基于大量的醫療知識和資料。這有助于醫生做出更準确、更綜合的診斷和治療決策,提高患者的治療效果。

但仍需注意的是:盡管AI在醫療記錄方面具有很多優勢,但它并不能完全取代醫生的專業判斷和臨床經驗。

下周關注

360智腦釋出會定檔6月13日。

本文來自華爾街見聞,歡迎下載下傳APP檢視更多

繼續閱讀