天天看點

AI日報:複旦、百度新模型可生成1小時長視訊;全新ChatGPT Windows版本上線;NotebookLM又上2個新功能

歡迎來到【AI日報】欄目!這裡是你每天探索人工智能世界的指南,每天我們為你呈現AI領域的熱點内容,聚焦開發者,助你洞悉技術趨勢、了解創新AI産品應用。

新鮮AI産品點選了解:https://top.aibase.com/

1、面向付費使用者!全新ChatGPT Windows版本上線:快捷鍵即可召喚AI助手

OpenAI推出了全新的ChatGPT Windows應用早期版,為付費使用者提供便捷的AI助手體驗。使用者隻需按下Alt + Space組合鍵即可召喚ChatGPT,無需每次打開網頁。應用目前僅對付費使用者開放,但計劃在完善後也會讓免費使用者有機會體驗。雖然測試版應用功能暫不完善,但OpenAI承諾會持續更新以提升使用者體驗。

AI日報:複旦、百度新模型可生成1小時長視訊;全新ChatGPT Windows版本上線;NotebookLM又上2個新功能

【AiBase提要:】

🌟 ChatGPT Windows應用僅對付費使用者開放,支援多種付費賬号類型。

💡 按下Alt + Space組合鍵即可輕松召喚ChatGPT進行對話,友善快捷。

🔧 測試版應用暫時缺少一些複雜功能,但将持續更新以完善體驗。

2、OpenAI重磅釋出GPT-4O-Audio-Preview

OpenAI最新推出的GPT-4O-Audio-Preview模型在語音處理領域展現出驚人能力,不僅能生成自然流暢的語音響應,還具備情感分析和語音互動功能,開啟了新的人機互動可能性。該模型靈活支援多種模式組合,定價政策反映了音頻處理的複雜性。推出将在客戶服務、教育、娛樂和輔助技術領域帶來革新。

AI日報:複旦、百度新模型可生成1小時長視訊;全新ChatGPT Windows版本上線;NotebookLM又上2個新功能

【AiBase提要:】

🔊 模型具備生成自然流暢語音響應能力,支援語音助手和虛拟客服應用。

🎶 具備分析音頻情感、語調和音調的能力,适用于情感計算和使用者體驗分析領域。

🗣 支援語音到語音的互動,為全方位語音互動系統打下基礎。

詳情連結:https://platform.openai.com/docs/guides/audio/quickstart

3、Google更新AI筆記和研究助手NotebookLM

Google宣布對NotebookLM進行重大更新,增強音頻概覽功能,讓使用者更精準引導AI生成對話内容。更新包括自定義音頻概覽和背景收聽功能,提升使用者體驗。商業版試點計劃啟動,展望更廣泛的應用場景。

【AiBase提要:】

🔊 音頻概覽功能更新,使用者可自定義引導AI對話内容。

🎙️ 新增背景收聽功能,使用者可同時工作和收聽音頻。

💼 商業版試點計劃啟動,企業可提前體驗新功能并獲得支援。

4、複旦、百度聯手打造全新AI模型Hallo2可生成4K超高清+1小時超長視訊!

複旦大學和百度公司聯合開發的Hallo2AI模型将徹底改變人物動畫生成的現狀,為電影制作、虛拟助手、遊戲開發等領域帶來革命性變化。該模型結合了latent diffusion models、Patch-drop資料增強技術、高斯噪聲增強技術、VQGAN離散碼本預測技術和文本提示控制機制,在生成高品質、長序列人物動畫方面表現優異。

【AiBase提要:】

⚙️ Hallo2模型結合了多項創新技術,包括Patch-drop資料增強、高斯噪聲增強、VQGAN離散碼本預測和文本提示控制機制。

🌟 Hallo2在多個公開資料集上驗證,超越現有方法,在生成高品質、長序列人物動畫方面表現出色。

🚀 Hallo2模型的釋出标志着AI人物動畫生成技術邁上新的台階,未來将進一步優化效率和探索更多應用領域。

詳情連結:https://fudan-generative-vision.github.io/hallo2/#/

5、特斯拉Optimus機器人再進化:自主導航、爬樓梯、與人互動成現實

特斯拉最新釋出的Optimus機器人展示了令人矚目的新功能,從自主導航到與人類互動,彰顯人工智能和機器人技術的飛速進步。Optimus的自主導航能力、能源管理自主性、負載能力提升等方面都展現出巨大潛力。

【AiBase提要:】

🤖 自主導航能力:Optimus能在複雜環境中自如穿行,多台機器人可協同工作優化導航效率。

🔋 能源管理自主性:Optimus能自動定位充電站實作自主充電,提高工作持續性和效率。

🏋️‍♂️ 負載能力提升:Optimus能搬運重達11公斤的電池托盤,開拓工業和物流應用新可能性。

6、谷歌人事大調整:Gemini團隊并入DeepMind,搜尋上司層大變動

谷歌最近進行了重要的上司層變動和團隊結構調整,包括K&I團隊和Gemini團隊。新任上司人的接任和團隊整合将對公司的技術發展和AI項目合作産生重大影響。

【AiBase提要:】

🌟 Nick Fox接任谷歌K&I團隊新負責人,将繼續推動搜尋、廣告、地理和商務産品的發展。

🔧 Prabhakar Raghavan轉任谷歌首席技術官,緻力于為公司的技術發展提供方向和支援。

🤖 Gemini團隊與谷歌DeepMind整合,旨在加強應用團隊和Gemini模型團隊之間的合作。

7、上傳一段音樂秒變鋼琴曲!AMT-APC算法一鍵生成大師級鋼琴演奏

近日,武蔵野大學資料科學學院的研究人員開發了AMT-APC算法,通過結合AMT模型和微調技術,實作更精準生成接近原曲的鋼琴演奏版本。該算法突破了現有自動生成鋼琴曲技術的局限,提升了音質保真度和表現力。

【AiBase提要:】

⭐ AMT-APC算法利用AMT模型優勢,通過微調生成更接近原曲的鋼琴演奏版本。

🎵 核心政策包括預訓練和微調,使AMT模型能夠處理更長音樂片段并生成符合原曲風格的鋼琴演奏。

🎹 引入風格向量概念,學習不同演奏風格,提升生成鋼琴曲的表現力和音質保真度。

詳情連結:https://misya11p.github.io/amt-apc/

8、蘋果Siri AI新功能:ChatGPT 內建和圖像生成

蘋果正緻力于為iOS18、iPadOS18和macOS15添加新的Apple Intelligence功能,其中包括ChatGPT內建和圖像生成。ChatGPT将為Siri提供更先進的文本和圖像生成能力,而Visual Intelligence則将為iPhone16使用者提供相機控制按鈕功能。iOS18.1、iPadOS18.1和macOS Sequoia15.1預計将于10月28日釋出,而iOS18.2、iPadOS18.2和macOS Sequoia15.2的測試版也将很快推出。

AI日報:複旦、百度新模型可生成1小時長視訊;全新ChatGPT Windows版本上線;NotebookLM又上2個新功能

【AiBase提要:】

🔍 Siri将內建ChatGPT,提供更先進的文本和圖像生成能力。

📸 iPhone16将獲得Visual Intelligence功能,通過相機控制按鈕提供周圍物體資訊。

🚀 iOS18.2将支援Image Playground圖像生成、Genmoji和Image Wand。

9、僅十億參數!AI圖像生成模型Meissonic

Meissonic是一款僅用十億個參數就能生成高品質圖像的開源AI模型。其采用了并行疊代優化的訓練方法,使得在圖像生成速度上比傳統模型快99%。盡管參數量小,Meissonic在多項測試中表現超越更大模型,且能實作無訓練的圖像修補和擴充功能。

AI日報:複旦、百度新模型可生成1小時長視訊;全新ChatGPT Windows版本上線;NotebookLM又上2個新功能

【AiBase提要:】

🌟 緊湊設計的Meissonic适合普通遊戲PC和未來的移動裝置使用。

⚡ 采用并行疊代優化的訓練方法,Meissonic在圖像生成速度上比傳統模型快99%。

🏆 盡管參數量小,Meissonic在多項測試中表現超越更大模型,且能實作無訓練的圖像修補和擴充功能。

詳情連結:https://huggingface.co/spaces/MeissonFlow/meissonic

10、Perplexity推出内部知識搜尋功能,企業可同時查詢内外部資料

Perplexity公司推出了新功能“内部知識搜尋”,旨在提高企業工作效率,讓使用者更便捷擷取所需資訊。使用者上傳自選檔案,避免低價值資訊幹擾搜尋,提高效率。新增“空間”功能支援團隊檔案共享與AI助手定制。

AI日報:複旦、百度新模型可生成1小時長視訊;全新ChatGPT Windows版本上線;NotebookLM又上2個新功能

【AiBase提要:】

📁 使用者隻能上傳自選檔案,避免低價值資訊幹擾搜尋,提高效率。

🔍 Perplexity推出“内部知識搜尋”功能,支援使用者同時查詢内外部資料。

🤝 新增“空間”功能,支援團隊檔案共享與AI助手定制。

11、自動駕駛公司小馬智行拟赴美IPO 估值已超85億美元

小馬智行計劃赴美IPO,估值超過85億美元。公司成立于2016年,專注自動駕駛解決方案,已完成9輪融資超過10億美元。營收主要來自Robotaxi業務,2024年上半年同比增長86%。

【AiBase提要:】

🌍 小馬智行計劃赴美IPO,股票代碼為“PONY”,估值超過85億美元。

💰 公司成立于2016年,已完成9輪融資超過10億美元,估值達85億美元。

🚖 Robotaxi業務是主要收入來源,2024年上半年同比增長86%。

繼續閱讀