天天看點

大模型晚報|華為雲盤古大模型3.0正式釋出:重塑千行百業

作者:品玩

大模型資訊:

華為雲盤古大模型3.0正式釋出:重塑千行百業

華為雲開發者大會2023上,華為常務董事、華為雲CEO張平安宣布盤古大模型3.0正式釋出。

張平安表示,盤古大模型是一個完全面向行業的大模型 ,包括NLP大模型,多模态大模型,視覺大模型,預測大模型和科學計算大模型,針對政務、金融、制造、礦山等行業提供專用大模型,并可在各個垂直場景應用。

中國電信釋出TeleChat大模型

世界人工智能大會期間,在中國電信“算網一體·融創未來”分論壇上,中國電信數字智能科技分公司正式對外釋出中國電信大語言模型TeleChat,并展示了大模型賦能資料中台、智能客服和智慧政務三個方向的産品。此外,以TeleChat為底座的教育版大模型TeleChat-E在全球大模型綜合性考試評測榜單C-Eval上排名第七,前幾名包括GP4、ChatGPT等知名大模型。

MidJourney 将迎來第六版,增加場景擴充功能。

在7月6日下午舉行的2023世界人工智能大會産業發展論壇上,MidJourney創始人大衛·霍爾茨通過視訊在大會上發表演講。

霍爾茨表示,MidJourney 将會在即将釋出的第六版中實作場景擴充功能,讓圖檔展現出更豐富的内容。此外新版本還将加入新模式,将帶來4-5倍的制圖速度提升。

霍爾茨透露,自己最喜歡讀科幻書和中國古典文學,MidJourney的名字就來自莊子的莊周夢蝶,對應其中的“中道”。

大模型生态合作共同體正式發起,雲從科技、百度、阿裡雲等加入

在2023世界人工智能大會“聚焦·大模型時代AIGC新浪潮”論壇上,大模型生态合作共同體正式發起,雲從科技、騰訊雲、阿裡雲、百度、科大訊飛、清華大學、京東科技、九章雲極等國内代表性大模型機關成為首批創始成員機關。

據了解,大模型生态合作共同體是按照國家新一代人工智能發展規劃總體部署,為推動大模型研發、培育自主可控的産業生态而成立,旨在建構政府、産業、學術界和研究機構等各方共同參與的開放合作平台,助力中國人工智能大模型的研發和産業化程序,面向關鍵技術壁壘聯合攻關,提升中國在人工智能領域的國際競争力。

商湯日日新大模型體系全面更新

商湯科技今天在2023世界人工智能大會上召開“大愛無疆·日日新”人工智能論壇。

論壇中商湯公布商湯日日新SenseNova大模型體系的多方位全面更新,以及在該體系下的一系列大模型産品更新和落地成果。

據介紹,商湯商量SenseChat 2.0版本突破了大語言模型輸入長度的限制,并推出不同參數量級的模型版本,可完美适配移動端、雲端等不同終端及場景的應用需求,降低部署成本。商湯的自研生成式大模型商湯秒畫SenseMirage 3.0的模型參數從今年4月首次釋出以來的10億提升至70億量級,能夠實作專業攝影級的圖檔細節刻畫。

大模型測試驗證與協同創新中心正式成立

中國信通院官微消息,7月6日,2023世界人工智能大會在上海開幕。

開幕式上,中國資訊通信研究院與上海人工智能實驗室聯合發起的大模型測試驗證與協同創新中心正式成立。

該中心将圍繞大模型能力測評、大模型系列标準、生态服務、模型治理和軟硬體協同五方面開展工作,下設總體組、标準化與測評驗證組、資料工作組、創新研發組、軟硬體協同工作組、應用服務組共六個工作組。

奔馳正在測試 ChatGPT,幫助進行品質管理和流程優化等活動

據奔馳官方消息,奔馳目前已開始測試 ChatGPT,佳速其在 MO360 數字生産生态系統中的使用。

據悉,ChatGPT 将作為一個通用的、基于語音的界面支援生産員工,支援他們進行品質管理和流程優化等活動。

據悉,梅賽德斯-奔馳正在通過 Azure OpenAI 服務內建 ChatGPT,利用微軟雲和人工智能平台的企業級功能。

OpenAI 宣布向付費使用者開放 GPT-4 API

OpenAI 今天宣布,即日起GPT-4 API 向所有付費 OpenAI API 客戶開放。此外,OpenAI 還宣布部分版本将會在2024年退役。

OpenAI 表示,所有付費 OpenAI API 客戶現在都可以通路具有 8K tokens 上下文的 GPT-4 API ,此外 OpenAI 計劃在本月底前向新的開發人員開放通路權限,并根據計算資源開始調高速率限制。OpenAI 目前正在對 GPT-4 和 GPT-3.5 Turbo 進行微調功能測試,預計該功能會在今年晚些時候推出。

此外,OpenAI 宣布将會在6個月内淘汰一些使用Completions API 的舊模型。舊模型淘汰計劃将會從2024年1月4日開始施行。

新加坡科技設計大學推出大語言模型 FLACUNA

新加坡科技設計大學近日推出一款大語言模型産品FLACUNA。

據研究團隊表示,FLACUNA 基于VICUNA打造,通過在FLAN資料集上進行微調,提高了其問題解決能力。該資料集包括 FLAN 大型指令資料集和一些源自 ChatGPT/GPT-4 的代碼相關資料和對話資料,涵蓋了許多需要問題解決能力的任務。

AI熱度降溫又一迹象:散戶6月加速湧入美股

據财聯社報道,根據追蹤美國散戶交易流量的研究機構Vanda Research,今年6月,散戶平均每天向美股投入14億美元,接近3月份日均15億美元的曆史最高紀錄。

Vanda Research進階副總裁Marco Iachini表示,一直以來深受散戶喜愛的特斯拉汽車傳遞量創下曆史新高,幫助激發了散戶投資者對包括Rivian在内的其他電動汽車股票的興趣。

相比之下,散戶對包括C3.ai在内的AI股的需求較今年早些時候有所放緩,此前這類股票曾連漲數周,不過最近有所回調。

阿裡雲通義大模型新成員通義萬相正式上線

據界面新聞報道,阿裡雲通義大模型新成員通義萬相今天正式上線,據了解,這是一個AI繪畫創作模型。

阿裡雲智能集團首席技術官周靖人透露,通義千問已有累計超30的申請使用者,超過100家深度共創企業,而通義聽悟釋出首月已有36萬使用者。

會上,阿裡雲還釋出了ModelScopeGPT大小模型協同智能助手。

華為雲CEO張平安:華為盤古大模型深耕政務、金融、制造、煤礦等行業

華為雲開發者大會2023上,華為常務董事、華為雲CEO張平安表示,華為盤古大模型“不做詩,隻做事”,聚焦價值場景,深耕政務、金融、制造、煤礦等行業。張平安介紹,華為盤古大模型和山東能源集團雲頂科技深度合作,已經開發了7個系統和21個場景化應用,并在全國8個礦井複制在使用,覆寫1000+個細分場景。

華為雲昇騰AI雲服務在烏蘭察布和貴安上線

華為雲2000P Flops單叢集的昇騰AI雲服務在烏蘭察布和貴安同時上線。昇騰AI雲服務可以提供更長穩的AI算力服務,千卡訓練30天長穩率達到90%,斷點恢複時長不超過10分鐘。昇騰雲服務除了支援華為的AI架構Mindspore外,還支援Pytorch,Tensorflow等主流AI架構,架構中的90%算子,都可以通過華為的遷移工具從GPU平滑遷移到昇騰。

重點論文:

基礎模型的了解能力評估

研究團隊通過一項實驗評估了現有基礎模型在視訊了解方面的能力。他們進行了三項任務,包括動作識别、時間定位和時空定位,并采用八個受歡迎的資料集進行評估。針對這些任務,團隊嘗試了四種調整基礎模型的方法。

研究發現:首先,專門針對任務設計的模型比我們研究的六個基礎模型表現更好,這與在自然語言和圖像了解領域的情況形成鮮明對比。其次,預訓練資料中包含視訊模态的原生模型通常在分類視訊、定位動作以及了解多個動作方面優于隻包含圖像模态的模型。最後,在輕微調整下遊任務(例如固定基礎模型主幹)的情況下,原生視訊模型在視訊任務上表現出色,而圖像模型在進行全面微調時獲得更好的結果。

論文位址:點此前往

繼續閱讀