天天看點

機器人“接管”亞運會,AI算力70年增長6.8億

作者:粵智協

本周熱點

1、機器人“接管”亞運會

2、AI算力70年增長6.8億倍,未來AI各方面能力将全面超越人類

3、研究稱GPT-4審稿意見與人類評審一緻性超50%

4、GPT-4V亮相:支援圖檔和語音輸入

5、Meta釋出Llama 2 Long,支援3.2萬Tokens

6、百度釋出首個量子領域大模型及兩大AI原生應用

大家好,歡迎來到我們的人工智能一周熱點推文!在這裡,我們将為您呈現最前沿、最熱門的人工智能資訊,涵蓋了機器學習、深度學習、自然語言處理等多個領域。我們的目标是讓您能夠及時了解人工智能領域的最新動态,掌握行業發展趨勢,為自己的職業發展和科技創新提供有益的參考。歡迎點贊關注與分享,讓我們攜手共進,探索人工智能的無限可能!

01

人工智能行業動态

1、機器人“接管”亞運會

第19屆亞運會在杭州舉辦,約1.2萬名運動員和數千名媒體人員、技術官員齊聚杭城。從自動滅蚊器到仿真機器人鋼琴師和無人駕駛冰淇淋車,機器接管世界——至少是在中國舉行的亞運會上。杭州是中國科技行業重鎮,機器人和其他令人大開眼界的裝置将為訪客提供服務、娛樂和安保。

機器人“接管”亞運會,AI算力70年增長6.8億

02

人工智能研究動态

1、AI算力70年增長6.8億倍

AI算力70年增長6.8億倍,未來AI各方面能力将全面超越人類。電子計算機誕生後的10年内,人類曆史上的第一個AI應用就出現了。70多年過去了,AI模型現在不僅能寫詩,還能根據文本提示生成圖像,甚至是幫助人類發現未知的蛋白質結構。計算能力、可用的訓練資料和算法是AI進步的三大要素。AI發展的三個時代分别是:人工學習時代、深度學習時代和大規模AI模型時代。未來AI技術的進展将取決于計算能力和可用資料的增長。AI行業的初創公司融資規模達到了140億美元,生成式AI領域的發展勢頭良好。

2、研究稱GPT-4審稿意見與人類評審一緻性超50%

斯坦福大學等機構的研究者釋出論文稱,GPT-4對于Nature、ICLR等頂會的近5000篇論文給出的審稿意見與人類審稿人的意見有超過50%的相似性,且超過82.4%的作者表示,GPT-4給出的意見相當有幫助。論文作者James Zou總結道:我們仍然需要高品質的人工回報,但LLM可以幫助作者在正式的同行評審之前,改進自己的論文初稿。

機器人“接管”亞運會,AI算力70年增長6.8億

3、中美多家機構聯合釋出大模型可解釋性技術綜述

中美多家機構(紐澤西理工學院、約翰斯·霍普金斯大學、維克森林大學、佐治亞大學、上海交大、百度等)聯合釋出了大模型可解釋性技術的綜述,分别對傳統的Fine-tuning模型和基于Prompting的超大模型的可解釋性技術進行了全面的梳理,并探讨了模型解釋的評估标準和未來的研究挑戰。

機器人“接管”亞運會,AI算力70年增長6.8億

4、斯坦福等開源高效記憶體管理機制PagedAttention

來自加州大學伯克利分校、斯坦福大學、加州大學聖疊戈分校的研究人員基于作業系統中經典的虛拟記憶體和分頁技術,提出了一個新的注意力算法PagedAttention,并打造了一個LLM服務系統vLLM。據介紹,vLLM在KV緩存上實作了幾乎零浪費,并且可以在“請求内部”和“請求之間”靈活共享KV高速緩存,進一步減少了記憶體的使用量。評估結果表明,vLLM可以将常用的LLM吞吐量提高了2-4倍,在延遲水準上與最先進的系統(如FasterTransformer和Orca)相當,并且在更長序列、更大模型和更複雜的解碼算法時,提升更明顯。

機器人“接管”亞運會,AI算力70年增長6.8億

5、研究團隊提出提升開源數學模型的推理能力的新方法

來自滑鐵盧大學和俄亥俄州立大學的研究團隊提出了一種新的數學指令微調方法,可以增強開源數學模型的推理能力。他們建立了一個多樣化的混合指令微調資料集MathInstruct,涵蓋了不同的數學領域和複雜程度,并将思維鍊和思維程式兩種方法結合起來。通過在MathInstruct上微調,他們得到了不同大小的模型,并發現這些新模型在領域外資料集上的性能優于之前的模型。這項研究為提升開源數學模型的能力提供了新的思路。

6、中國研究人員推出名為“FreeMan”的大規模真實多視角資料集

中國研究人員推出了一種名為“FreeMan”的新型大規模多視角資料集,旨在解決現有資料集在真實場景下進行3D人體姿勢估計時的限制。該資料集包含8000個序列的1100萬幀,使用8台同步智能手機在各種場景下拍攝。研究人員通過自動化注釋流程生成了精确的3D注釋,該資料集對于多個任務具有價值,包括單目3D估計、2D到3D轉換、多視角3D估計和人體主題的神經渲染。研究人員還通過與現有資料集的比較,展示了FreeMan在真實場景中的優越泛化能力。這一研究成果有望推動人體模組化、計算機視覺和人機互動領域的進展,彌合了受控實驗室條件和真實場景之間的差距。

03

人工智能企業動态

1、GPT-4V亮相:支援圖檔和語音輸入

OpenAI宣布推出新版ChatGPT,增加了兩項新功能:語音輸入和圖像輸入。使用語音輸入功能時,使用者隻需按下一個按鈕,說出自己的問題,ChatGPT就會将其轉換為文本,然後生成答案,再将答案轉換為語音,播放給使用者。使用圖像輸入功能時,使用者可以拍攝自己感興趣的事物,并上傳到ChatGPT中。ChatGPT會嘗試識别使用者想要詢問的内容,并給出相應的回答。使用者還可以用應用中的繪圖工具來幫助表達自己的問題,或者配合語音或文本輸入來進行交流。

機器人“接管”亞運會,AI算力70年增長6.8億

2、Meta釋出Llama 2 Long,支援3.2萬Tokens

Meta釋出Llama 2 Long,上下文長度達3.2萬Tokens,與GPT-4持平。性能上全面超越Llama 2,在指令微調MMLU(5-shot)等測試集上表現超過ChatGPT,在人類評估上優于10萬Tokens的Claude 2。據介紹,與Llama 2相比,Llama 2 Long的變化主要有兩個方面。一是訓練參數上,采用了高達4000億Tokens的資料源,而Llama 2最多的版本也隻有700億。二是架構上,與Llama 2保持不變,但對位置編碼進行了一個非常小的必要修改,以此完成高達3.2億Tokens的上下文視窗支援。

機器人“接管”亞運會,AI算力70年增長6.8億

3、阿裡雲通義千問140億參數Qwen-14B釋出

阿裡雲舉辦通義千問開源釋出會,正式釋出通義千問140億參數模型Qwen-14B及對話模型Qwen-14B-Chat,開源、免費。據介紹,Qwen-14B在衆多同尺寸20B以内開源模型中突出重圍,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12個權威測評集上都取得了最優成績,超越所有測評中的SOTA大模型。此外,通義千問團隊更新了Qwen模型對接外部系統的能力,開發者可以通過簡單的操作實作複雜的插件調用,也可以基于Qwen系列基座模型快速開發Agent等AI系統,利用Qwen的了解和規劃能力完成複雜的任務。同時,Qwen-7B也實作了全面更新,核心名額最高提升22.5%。

4、百川智能釋出Baichuan2-53B閉源大模型

百川智能釋出Baichuan2-53B閉源大模型,全面更新了Baichuan1-53B的各項能力。據介紹,Baichuan2-53B的數學和邏輯推理能力顯著提升,并通過高品質資料體系和搜尋增強大幅降低了模型幻覺,是目前國内幻覺問題最低的大模型。百川智能此次還開放了Baichuan2-53B API接口,宣布正式進軍To B領域。

5、開源可商用的中文版Llama 2釋出

現在,15小時、幾千塊錢、85億Tokens資料,即可訓出中文版Llama 2。Colossal-LLaMA-2近期把大模型門檻打下來了,同時開源團隊還提供了一個完整的評估體系架構ColossalEval,以實作低成本的可複現性。這一模型綜合性能達到開源社群同規模從頭預訓練SOTA模型水準。方案完全開源,包括全套訓練流程、代碼及權重;而且無商業限制,還可遷移應用到任意垂類領域和從頭預訓練大模型的低成本建構。

6、恒生電子大模型LightGPT開啟内測

恒生大模型産品已面向20家金融機構開啟内測。據悉,恒生金融行業大模型LightGPT是專為金融領域打造的大語言模型,它通過訓練海量金融資料,對金融相關問題有更好的了解能力。光子是基于LightGPT的智能應用服務,可以為金融機構的各個業務系統注入AI能力,包括投資合規、投顧、客服、營運、投研和交易等。

7、百度釋出首個量子領域大模型及兩大AI原生應用

2023量子産業大會在安徽合肥召開。會上,百度量子計算研究所所長段潤堯釋出首個量子領域大模型,及百度量子助手和量子寫作助手兩大AI原生應用。他還釋出了量子領域大模型白皮書,展望量子領域大模型的未來發展趨勢和技術潛力。據段潤堯介紹,該量子領域大模型是在文心一言基礎上,使用量子領域高品質資料進行更有針對性的訓練和優化而建構的量子領域大模型,能更好地了解量子知識,專業執行量子任務。

8、中國電信釋出“啟明”網絡大模型

中國電信網絡大模型技術研讨論壇在北京召開。論壇上,中國電信釋出資訊通信領域首個網絡大模型“啟明”。據介紹,該模型系中國電信自主研發,目前已在企業内部成熟應用。中國電信将在基礎研究、算力環境、應用部署等重要環節聯合攻堅,提供多種形式的MaaS服務,重點推動基礎通用大模型向垂直行業大模型的縱深演進,為上層行業應用開發和開源生态提供技術支撐。

9、電力行業首個自主可控電力大模型釋出

由南方電網公司主辦的電力行業人工智能創新平台及自主可控電力大模型釋出會在廣州召開。會上,南方電網公司釋出了自主研發的電力行業人工智能創新平台,以及電力行業首個自主可控電力大模型。據介紹,本次釋出的人工智能平台,既提供模型即服務(MaaS)解決方案,也支援模型快速疊代開發,并向全社會開放共享,平台建設有算力中心、樣本中心、模型中心,一體內建并能靈活排程華為、百度、商湯等算力資源,全面支援多種主流深度學習架構,能夠實作按需調用算力資源和快速微調。

10、商湯科技49篇論文入選ICCV 2023

國際人工智能頂級國際會議ICCV(International Conference on Computer Vision)在法國巴黎舉行。本屆ICCV投稿總數達8068篇,其中2160篇被接收,錄用率為26.8%,略高于上一屆ICCV 2021錄用率25.9%。商湯科技及聯合實驗室共49篇論文入選ICCV 2023,涵蓋文生圖、3D數字人、自動駕駛、目标檢測、視訊分割等多個與大模型和生成式AI相關的熱點方向。

11、特斯拉Optimus人形機器人再進化:可依靠視覺自主分類物體,還能做瑜伽

特斯拉Optimus的官方推特賬号上傳了一段新視訊:這種人形機器人已經獲得進化,現在能夠僅依靠視覺來對物體進行分類,還能完成瑜伽動作了。視訊内容顯示,Optimus人形機器人采用了類似于特斯拉自動駕駛技術FSD 12的端到端神經網絡控制:視訊輸入,控制輸出,并由此來控制各個部件和關節的移動。Optimus完成了一個簡單的按顔色分類物體的任務,将不同顔色的積木塊分别放入對應顔色的盒子中去。

機器人“接管”亞運會,AI算力70年增長6.8億

繼續閱讀