天天看點

OpenAI被曝秘密訓練 GPT-5,國内11家大模型産品通過備案,“360智腦” 大模型已創收近2000萬元|36氪GPT周報

作者:36氪

作者:子渝

編輯:沈筱

OpenAI 釋出 ChatGPT 企業版,提供更高的安全和隐私保障

8月28日,OpenAI宣布将推出ChatGPT企業版,專門針對企業使用者的需求,可提供更進階别的安全和隐私,對話資料不會用于模型訓練,其執行速度将是普通版GPT-4的兩倍。OpenAI 表示,ChatGPT 企業版不僅可以無限制地快速通路強大的 GPT-4模型,還可以進行更深入的資料分析,幫助企業快速了解資訊,并且可以向 ChatGPT 提出更複雜的問題。

https://www.ithome.com/0/715/406.htm

GitHub Copilot更新三大功能

8月28日,GitHub Copilot迎來三大更新,這些新功能有的隻在Visual Studio中享有,有的則隻支援VScode。全新互動體驗,代碼行中直接提問,無需切換聊天視窗,使用者可直接在代碼編輯器中使用Copilot Chat來優化代碼;官方已正式為所有代碼完成請求推出8k上下文視窗;斜杠指令改進、上下文擴充到終端,界面新加了對話曆史記錄,并支援快捷的斜杠指令。

https://www.qbitai.com/2023/08/80132.html

英偉達推出DLSS 3.5,利用全新AI模型建立更高品質光追圖像

8月28日,英偉達推出了NVIDIA DLSS 3.5,再次推動了渲染技術的發展。其創新之處在于,運用了一個增強版AI驅動的神經渲染器。即采用全新的AI模型,利用了光線重建(Ray Reconstruction)技術,為密集型光追遊戲和應用程式,建立更高品質的光追圖像。而且,因為其中的光線重建技術本身不依賴硬體,是以之前的RTX系列顯示卡也能享受該項技術更新。

https://36kr.com/p/2408488309203971

英偉達和Meta通路SK海力士尋求AI伺服器

8月29日消息,Meta高層日前通路SK海力士南韓利川總部,視察利川園區的DDR5、HBM生産設施及EUV裝置,并對DDR5進行品質稽核。Meta是SK海力士的主要客戶之一,如今已在AI伺服器上投入巨資,要求SK海力士也額外供應高性能、高效率的DDR伺服器DRAM。此外,英偉達有望在本周通路SK海力士的利川園區,預計将審查SK海力士的第五代HBM(即HBM3E)産線。報道指出,鑒于英偉達已考慮大幅提高AI晶片H100的産量,雙方或将讨論HBM的供應問題。

https://finance.ifeng.com/c/8Sdy5LrLHN2

谷歌在TPUv5上訓練下一代大模型Gemini

8月29日消息,據稱,谷歌大模型Gemini的訓練規模已達GPT-4的5倍。Gemini初代版本可能是在TPUv4上訓練,使用14個pod,訓練FLOPS達1e26,而GPT-4的FLOPS僅2e25左右。Gemini的下一代版本已經開始在TPUv5上訓練,算力高達1e26FLOPS,是GPT-4的5倍。Gemini一直在TPU上快速疊代,先是TPUv4,現已更新到TPUv5,性能表現也優于GPT-4。

https://www.chinaz.com/2023/0829/1554861.shtml

谷歌推出新超級計算機,搭載英偉達H100“Hopper”GPU

8月29日消息,谷歌雲在雲Next大會上宣布,将于下月上線A3虛拟機執行個體。這款執行個體最大的亮點是配備了英偉達H100 Tensor Core GPU,以滿足生成式AI和大語言模型的需求。 A3執行個體采用了第4代英特爾至強可擴充處理器、2TB DDR5-4800記憶體,以及8張英偉達H100“Hopper”GPU,通過NVLink 4.0和NVSwitch實作了3.6TBps的對分帶寬。這款超級計算機“專門用于訓練和服務要求最苛刻的人工智能模型,這些模型為當今的生成人工智能和大型語言模型創新提供動力”。

https://techcrunch.com/2023/08/29/googles-new-a3-gpu-supercomputer-with-nvidia-h100-gpus-will-be-generally-available-next-month/

華為雲将與同方知網共建知識服務行業AI大模型

8月30日,在華為雲盤古大模型主題論壇上,同方知網數字出版技術股份有限公司(以下簡稱“同方知網”)與華為雲計算技術有限公司(以下簡稱“華為雲”)正式簽署中華知識大模型(以下簡稱“華知大模型”)及人工智能聯合創新實驗室合作協定。雙方将基于華為雲盤古大模型打造知識服務行業的AI大模型。

https://news.sina.com.cn/sx/2023-08-30/detail-imziyppc7320069.shtml

360釋出2023年半年報,“360智腦”大模型已創收近2000萬元

8月30日消息,360釋出2023年半年報,總營收45.03億元,其中安全業務實作營收9.08億元。360安全大模型已在360内部及自有産品落地應用,并創造近2000萬元相關業務收入。360安全大模型是360自研的認知型通用人工智能大模型,具備多項核心能力,已推出企業級 AI 大模型解決方案,并與合作夥伴推出行業大模型,推動大模型産業發展。

https://finance.sina.com.cn/jjxw/2023-08-30/doc-imziytuz7224758.shtml

前谷歌CEO發起AI+Science登月計劃,以OpenAI為藍本

8月30日消息,谷歌前CEO Eric Schmidt正在建立一家大型的AI+Science非營利性創業公司,期望通過AI來應對科學研究中的挑戰。Schmidt聘請了弗朗西斯•克裡克研究所應用生物技術實驗室的創始人Samuel Rodriques,以及羅切斯特大學教授、在化學中使用AI的先驅Andrew White。知情人士透露,這項工作以OpenAI為藍本。Rodriques表示,公司将需要由核心AI研究人員和核心科學家組成的團隊一起工作,并采用快速疊代周期,以建構能夠利用前沿技術并為科學家帶來實際價值的工具。

https://36kr.com/p/2410198303040258

谷歌與通用汽車合作,将對話式 AI 引入旗下車機領域

8月30日消息,通用汽車在官網宣布,公司與科技巨頭谷歌展開合作,探索在汽車中使用 AI 的機會。據了解,通用汽車将與谷歌雲圍繞生成式 AI 進行“更廣泛的合作”,此前雙方已經針對通用汽車的 OnStar IVA通用汽車表示,IVA 系統将由谷歌提供的“意圖識别演算法”(intent-recognition algorithms)提供支援,進而為 OnStar 使用者提供常見查詢的響應,以及路線和導航幫助。

https://www.ithome.com/0/715/870.htm

谷歌推出 SynthID,在 AI 生成的圖像中嵌入隐形水印

8月30日消息,為了應對日益增長的 AI 生成圖像的問題,谷歌 DeepMind 團隊今日推出了一款名為 SynthID 的工具,可以在 AI 生成的圖像中嵌入人眼不可見的水印,但可以用專門的人工智能檢測工具檢測出來,以便于區分真實和虛假的内容。該工具已經在谷歌雲平台上向部分客戶開放。

https://www.ithome.com/0/715/671.htm

谷歌計劃将在印度和日本推廣人工智能搜尋

8月31日消息,谷歌計劃在印度和日本市場推廣其人工智能驅動的搜尋生成體驗(SGE)計劃,該功能目前仍處于邀請加入的階段。SGE 旨在為使用者提供策劃的答案,而不是傳統的網頁清單。谷歌的系統與微軟的不同之處在于,它将人工智能直接整合到現有的搜尋欄中。該功能将提供多語言版本和語音輸入功能,并在搜尋結果頁面上繼續顯示廣告。

https://www.chinaz.com/2023/0831/1555322.shtml

谷歌推出AlloyDB AI,幫助開發者建立生成式AI應用

8月31日消息,谷歌釋出新聞稿,宣布推出 AlloyDB AI 服務,允許開發者結合大語言模型的功能和實時操作資料,為向量嵌入提供全面支援。AlloyDB AI 使用簡單的 SQL 函數将資料轉換為向量嵌入,并且它可以執行向量查詢,速度比标準 PostgreSQL 快十倍。

https://www.ithome.com/0/715/950.htm

百度、商湯等國内11家大模型産品通過備案,将陸續開放上線

8月31日,國内11家通過《生成式人工智能服務管理暫行辦法》備案的AI大模型産品将陸續上線,面向全社會開放。首批名單中,包括百度的“文心一言”、抖音的“雲雀”、百川智能的“百川大模型”、智譜華章的“智譜清言”、中科院的“紫東太初”、商湯的“商量SenseChat”、MiniMax的“ABAB大模型”和上海人工智能實驗室的“書生通用大模型”。此外,華為、騰訊、科大訊飛也即将開放其大模型産品。阿裡的“通義千問”已完成備案,等待上線。

https://36kr.com/p/2411653492204549

華為盤古大模型版小藝開啟衆測招募

8月31日消息,華為開始招募全新小藝衆測體驗官。首批支援衆測的機型包括 Mate60/P60系列。全新小藝能夠更好地了解使用者并提供更精準的回報,包括本機數字内容搜尋、對話識别螢幕内容、幫助使用者快速摘要、文案内容輔助、圖檔二次創作等功能。

https://www.chinaz.com/2023/0831/1555383.shtml

“商量SenseChat”12項性能位列第一,疑接近GPT-4

8月31日,商湯科技日日新大模型旗下自然語言應用“商量SenseChat”正式面向廣大使用者開放服務。其基模型為商湯聯合多家國内頂級科研機構釋出的書生·浦語InternLM-123B,在全球51個知名評測集(包括MMLU, AGIEVAL, ARC, CEval, Race, GSM8K等)共計30萬道問題集合上測試成績整體排名全球第二,超過GPT-3.5-turbo以及Meta新釋出的LLaMA2-70B等模型,在主要評測中12項成績超越GPT-4,排名第一。

https://www.sensetime.com/cn/news-detail/51167247?categoryId=72

Meta可能正開發Llama 3,據稱比GPT-4強大、免費開源

8月31日消息,OpenAI 工程師、前 Google Brain 工程師 Jason Wei 在 Meta 組織的 Generative AI Group 社交活動中了解到,Meta可能正在開發比GPT-4更強大的AI大模型Llama3,并且保持開源免費。從 Llama2更新到 Llama3可能比簡單地通過更多訓練進行擴充更具挑戰性,并且可能比從 Llama1跳到 Llama2需要更長的時間。Llama2在某些應用程式中達到了GPT-3.5的水準,同時正在由開源社群通過微調和附加功能進行優化。

https://tech.ifeng.com/c/8ShQFq6NXdN

Meta釋出AI基準測試工具FACET ,用于評估 AI 模型的“公平性”

8月31日消息,Meta釋出了一個新的AI基準測試,名為FACET,旨在評估在照片和視訊中對人和物體進行分類和檢測的AI模型的“公平性”。FACET由32,000張包含50,000個人标簽的圖像組成,這些标簽由人類注釋者标注。除了與職業和活動相關的類别,如“籃球運動員”、“DJ”和“醫生”,還包括人口統計和身體屬性,使Meta能夠對針對這些類别的偏見進行“深度”評估。

https://techcrunch.com/2023/08/31/meta-releases-a-data-set-to-probe-computer-vision-models-for-biases/

百家雲釋出一站式 AIGC 場景化平台——百問大模型

8月31日,百家雲在戰略釋出會上釋出了一站式 AIGC 場景化平台「百問大模型」。該平台基于百家雲的技術積澱和研發實力,保證企業資料安全的同時,能夠低成本接入各類 AIGC 服務,解決企業應用模型技術的困難。該平台提供多種資料安全審計方式,支援零代碼快速生成應用,集中管控企業知識庫,滿足信創要求,并支援私有化部署自主可控。百家雲還展示了該平台在智能大模型 AI 客服、公文寫作、個人 AI 助理、數字人互動直播和營銷文案輔助等場景的應用案例。

https://baijiahao.baidu.com/s?id=1775736573951503811

英偉達推出FlexiCubes,利用生成式AI建立高品質3D網格

9月1日消息,Nvidia推出了一種全新使用AI生成3D網格的方式FlexiCubes,它可以為廣泛的3D應用生成3D網格。FlexiCubes可以與實體學引擎內建,并且可以輕松地在3D模型中建立柔軟的物體。這種網格生成的創新方法有望改變人工智能流水線,為各種應用提供高品質的網格。

https://www.chinaz.com/2023/0901/1555781.shtml

X(推特)調整隐私政策,可拿使用者釋出的資訊訓練 AI 模型

9月1日消息,埃隆・馬斯克旗下社交平台 X(推特)日前調整了隐私政策,允許 X 使用使用者釋出的資訊來訓練其人工智能(AI)模型。新的隐私政策将于9月29日生效。新政策規定,X 可能會使用所收集到的平台資訊和公開可用的資訊,來幫助訓練 X 的機器學習或人工智能模型。

https://www.ithome.com/0/716/397.htm

OpenAI釋出AI教學指南

9月1日消息,OpenAI釋出了一份名為“人工智能教學(Teaching with AI)”的官方指南,旨在幫助教師更有效地在課堂上使用ChatGPT。OpenAI的“人工智能教學”指南主要闡釋了ChatGPT的工作原理、局限性,并提出了檢測器的作用以及如何避免偏見,還提供了實用的指令集,友善教師與學生良好互動。

https://www.chinaz.com/2023/0901/1555747.shtml

港中文、清華等七所頂尖高校提出全新CSV方法,GPT-4 MATH準确率最高漲至84.3%

近期,GPT-4和PaLM-2等模型在數學推理上展現了卓越的性能。為了深入研究代碼生成對語言模型推理的影響,來自港中文、清華等七所頂尖高校的研究人員聯合發表了一篇論文,探讨了代碼使用頻率(Code Usage Frequency)對模型性能的影響。研究發現,GPT-4 Code Interpreter的成功部分歸功于其在代碼生成、評估和糾正方面的能力。基于此,研究者提出了基于代碼的自我驗證(CSV)方法,進一步提升了GPT-4的數學推理性能。通過結合Code Interpreter和CSV方法,GPT-4在MATH資料集上的準确率從53.9%提高到了84.3%。

https://36kr.com/p/2413040960136198

騰訊9月初将釋出混元大模型,騰訊文檔、騰訊遊戲已接入測試

9月2日消息,日前,中國證券報從騰訊方面獲悉,騰訊将在9月初舉行的2023年騰訊全球數字生态大會上正式釋出混元大模型,但并未提及是否面向公衆開放。騰訊此前表示,混元大模型已經進入公司内部應用測試階段,騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議、騰訊文檔等多個騰訊内部業務和産品,已經接入騰訊混元大模型測試并取得初步效果。

https://www.ithome.com/0/716/485.htm

國産中英雙語語音對話大模型曝光,李開複零一萬物參與研究

9月2日消息,一篇關于語音-文本多模态大模型的論文出現在arXiv上,這篇論文提出了一個中英雙語可商用對話模型LLaSM,同時支援錄音和文本輸入。這項研究來自LinkSoul.AI、北大和零一萬物,目前已經開源。LinkSoul.AI是一家AI初創公司,之前推出過首個開源Llama 2的中文語言大模型。據研究人員表示,LLaSM是第一個支援中英文雙語語音-文本多模态對話的開源可商用對話模型。

https://www.qbitai.com/2023/09/80972.html

百度輸入法上線“超會寫”AI 助手,基于文心一言大模型打造

9月3日消息,百度輸入法近日釋出了11.7.19.9 安卓版本,這是繼百度宣布“文心一言”首批獲批向全社會開放之後的重要更新。這次更新的亮點是百度輸入法新增了全場景 AI 創作助手“超會寫”,該功能基于文心大模型打造,可以幫助使用者在各種場合下進行高效、高質、高情商的文本創作。

https://k.sina.com.cn/article_6678407719_18e106a27001012ld8.html

DeepMind 聯合創始人稱 OpenAI 正秘密訓練 GPT-5

9月3日消息,DeepMind 聯合創始人 Mustafa Suleyman,現 Inflection AI 的 CEO 在采訪時透露,OpenAI 正在秘密訓練 GPT-5,比目前模型大100倍。而他的公司Inflection AI 正在建造世界上最大的超級計算機之一,并且他認為在接下來的18個月内,他們可能會進行一次比制造 GPT-4的語言模型訓練運作大10倍或100倍的訓練運作。

https://www.ithome.com/0/716/586.htm

繼續閱讀