天天看點

OpenAI釋出GPT-4o mini丨知名大模型迎戰2024聯考全科成績出爐

AI奇點網丨AI資訊丨AI工具推薦丨AI工具教程

提供1000+款AI效率工具丨AIEVA.CN丨歡迎通路

AI奇點網2024年7月19日報道丨AI資訊早報

OpenAI釋出GPT-4o mini,免費替代GPT-3.5

當地時間7月18日,OpenAI在官網釋出了最新的一款大模型GPT-4o mini,它是GPT-4o的小尺寸版本,具備文本、圖像、音頻、視訊的多模态推理能力。與GPT-4o保持一緻,GPT-4o mini也支援128K的上下文視窗Tokens。

OpenAI釋出GPT-4o mini丨知名大模型迎戰2024聯考全科成績出爐

根據官方釋出的測評報告顯示,GPT-4o mini的性能比GPT-4更好,大約有GPT-4o的80%能力。但API的價格卻大幅度下降了60%,每100萬tokens的輸入為15美分,每100萬tokens的輸出為60美分,是目前市面上成本效益最高、性能最佳的大語言模型,其API單價甚至可以與國内的大模型“價格戰”打得有來有往。

根據OpenAI公布的測試資料顯示,GPT-4o mini的數學、編碼、視覺等推理能力非常好,是目前最強的多模态小模型之一。

OpenAI釋出GPT-4o mini丨知名大模型迎戰2024聯考全科成績出爐

值得一提的是,從今天開始GPT-4o mini已經取代了GPT-3.5 Turbo,免費為注冊的ChatGPT使用者提供服務,而GPT-3.5則完成了其曆史使命從ChatGPT上下線。同時,這也是OpenAI釋出的第一個基于指令層級結構的模型。

微軟AI繪圖設計工具Designer登陸手機端應用

OpenAI釋出GPT-4o mini丨知名大模型迎戰2024聯考全科成績出爐

目前,微軟已經在 iOS / Android 平台上釋出了 AI 設計應用 Designer 的預覽版,該應用允許使用者通過模闆建立自定義圖像、貼紙、賀卡、邀請函等,還能實作 AI 編輯、重新設計圖像的進階功能,使用者可以免費使用 15 次進階功能,Copilot Pro 訂閱使用者可以獲得 100 次。

去年,基于 DALL·E 3 開發的 Designer 最初可以在網頁端和微軟自家 Edge 浏覽器上使用,現在擁有個人微軟賬戶的使用者都可以在 Windows 11、iOS 和 Android 平台使用其免費程式。

除了獨立應用,微軟也在 Word、PowerPoint 中的 Copilot 助手添加了 Designer 支援,Copilot Pro 訂閱者可以在 Office 内直接調用。

科大訊飛上線星火大模型Spark Pro-128K API調用

7月18日,科大訊飛對外釋出消息,訊飛星火API正式開放長文本上下文大模型——Spark Pro-128K,支援128K Tokens,價格最低0.21元/萬Tokens。

OpenAI釋出GPT-4o mini丨知名大模型迎戰2024聯考全科成績出爐

現如今,長文本能力越來越受到模型開發商的青睐,差別于傳統的文本處理模型,長文本模型具備更準确的文本了解和生成能力以及更強大的跨領域遷移能力,可以一次性了解和生成更多的資訊,适用于複雜的對話、長篇内容創作和詳細的資料分析等任務,能提升模型解決問題的邊界。

今年6月27日,科大訊飛釋出了星火大模型V4.0,并且宣布其長文本能力得到提升,針對長文檔知識問答的幻覺問題,業界首發「内容溯源」功能。具體來說,星火大模型的回複裡邊,會向使用者提供标注大模型的回複是參考了哪一段的内容,做到精準溯源,可以輕松掌握資訊采集來源的準确性。

OpenAI釋出GPT-4o mini丨知名大模型迎戰2024聯考全科成績出爐

據AI奇點網了解,星火大模型 Spark Pro -128K 目前已經在開發平台面向所有開發者開放 API 調用,價格為 0.21~ 0.30 元 / 萬 Tokens,個人使用者可直接免費領取 200 萬 Tokens 的嘗鮮免費體驗量。

知名大模型迎戰2024聯考全科成績出爐,理科僅能上二本

7月17日,上海人工智能實驗室對外釋出了 7 款主流的 AI 大模型的聯考全科目測試結果,據大模型開源開放評測體系“司南”相關負責人介紹,“目前大模型仍存在很大的局限性。組織 AI 大模型們參加聯考,目的是評測目前大模型的真實水準,找準問題,持續推進技術進步。”

OpenAI釋出GPT-4o mini丨知名大模型迎戰2024聯考全科成績出爐

繼上個月對外釋出了大模型們參與 2024 聯考「語數英」三科的成績後,上海人工智能實驗室聯合司南評測近日對 7 個 AI 大模型進行了全科目測試,成績已公布:書生·浦語 2.0 系列文曲星大模型(浦語·文曲星)、阿裡通義千問大模型 Qwen2-72B,以及 GPT-4o 包攬文科、理科的前三甲。

根據河南省分數線,前三名的「 AI考生」的成績分别超過了文科一本線和理科二本線。

其中,阿裡通義千問大模型 Qwen2-72B 以 546 分的成績獲 AI 聯考「文科狀元」,浦國文曲星則以 468.5 分成為理科第一名。總體上看,AI 考生的理科成績弱于文科,展現了大模型在數理推理能力上普遍存在短闆。

蘋果回應未經授權使用YouTube視訊訓練AI:僅用于研究

日前,彭博社爆料蘋果、英偉達等科技巨頭在未獲得授權的情況下使用了大量的 YouTube 上知名創作者的優質内容視訊,将該視訊的内容音頻轉成字幕文檔素材,用于訓練的自家的 AI 大模型。其中,我們了解到,蘋果公司向第三方采買了相關的資料訓練了開源模型 OpenELM。

OpenAI釋出GPT-4o mini丨知名大模型迎戰2024聯考全科成績出爐

現在進一步的追蹤進展來了,蘋果公關人員回應稱,OpenELM 作為一款開源模型,并不為任何的人工智能裝置或者機器學習功能提供技術支援,包括旗下最新釋出的蘋果AI智能服務 「Apple Intellegent」。

蘋果強調,OpenELM 模型的目的是為研究社群作出貢獻,推進大語言模型開發,僅用于研究目的。

按照蘋果的說法,由于 OpenELM 并非「Apple Intellegent」的一部分,是以蘋果從未使用未授權的 YouTube 視訊字幕作為訓練資料。蘋果曾經表示,「蘋果AI」使用的資料都是經過許可和網絡爬蟲收集的公開資料。

【本文來自丨AI奇點網丨全網賬号同名丨歡迎搜尋關注】

AI奇點網丨提供1000+款AI效率工具丨AIEVA.CN丨歡迎通路

繼續閱讀