天天看點

AI革新翻天!上周最炙手可熱的人工智能新聞大揭秘

作者:老井愛生活愛科技

#夏日生活打卡季#

AI革新翻天!上周最炙手可熱的人工智能新聞大揭秘

在上周的AI新聞中,雖然沒有像GPT-5或Mid-Journey版本6這樣的重大公告,但AI領域有許多小的進步。Meta釋出了一個開源的AI音樂生成模型,任何人都可以在Hugging Face上使用。這個模型聽起來比Google的Riffusion或Music LM等其他模型要好。它可以在GitHub上擷取,如果你有至少16GB記憶體的顯示卡,可以在本地安裝。

Adobe對Adobe Express進行了更新,包括添加了Adobe Firefly Generative AI,這允許使用者在Adobe Express内部直接使用AI提示圖像并添加文本效果。他們還在Adobe Illustrator中添加了生成性AI工具,包括Generative Recolor,這允許使用者上傳黑白圖像并添加顔色,或上傳設計并以各種新的顔色變化重新生成。這些更新現在對Adobe Creative Cloud使用者可用。

像OpenAI、DeepMind和Google的AI部門這樣的AI公司已經同意向英國政府開放他們的模型,用于研究和安全目的。然而,他們還沒有向公衆提供源代碼。一些人注意到AI功能正在被內建到Google的産品中,比如Gmail和Google Docs中的"幫我寫"按鈕。文章建議AI正在改變世界,可以用來寫文章和郵件。

Google宣布釋出了一個新的AI模型,可以拿一小部分圖像,然後使用它的訓練資料來填充圖像的其餘部分。這個模型基于Yann LeCun對更像人類的AI的願景,并正在開源。這個模型更像人類的思考方式,它可以識别圖像的一小部分,然後使用它對主題的知識來填充空白。這與其他試圖在像素級别重新建立圖像的AI生成模型不同。

AMD開發了一個像人類一樣訓練的AI模型,可以根據其資料集和它對看到的小資訊片段的了解來填充上下文的其餘部分。這個模型可以在GitHub上擷取,AMD已經與Hugging Face合作,為他們的機器學習産品提供計算能力。這是一個大事情,因為AMD而不是Nvidia提供了計算能力。AMD宣布他們正在建造專門為AI定制的硬體,目标是優化硬體和軟體的組合。他們也試圖通過建立比Nvidia更強大的晶片來與Nvidia競争。AMD的新晶片,Mi 300x,專為生成性AI設計,提供的記憶體是競争對手的2.4倍,記憶體帶寬是競争對手的1.6倍。文章讨論了Nvidia和AMD在為大型語言模型建立更好晶片方面的競争。

OpenAI的公告,他們對GPT語言模型進行了更新,包括一個新的16,000上下文版本,這比之前的版本大四倍。這個新版本允許chat GPT的輸入和輸出之間有大約12,000個單詞。使用GPT 3.5 API的開發者将看到成本降低,但不清楚公司是否會将這些節省下來的錢傳遞給最終消費者。

Microsoft和OpenAI有一個"驚人的合作關系",但在他們一起工作并在AI特性上競争時出現了緊張關系。據報道,OpenAI警告Microsoft在将GPT 4內建到Bing搜尋引擎時要慢行,以避免不準确和不可預測的反應,但Microsoft還是繼續前進了。人們擔心,如果他們可以免費使用内置了GPT的Bing,為什麼還要購買chat GPT。Microsoft和OpenAI有一個獨特的合作關系,這導緻了兩家公司在支援和競争對方的同時,幕後出現了一些沖突。兩家公司都有聊天模型,GPT+和Bing Chat,都内置了GPT。

有消息稱,保羅·麥卡特尼爵士說人工智能已經使最後一首Beatles的歌曲得以完成。Google也宣布了一個新的用于虛拟試穿的生成性AI模型,允許使用者使用AI生成試穿圖像。該模型是使用Google的購物圖和擴散模型建立的。Google購物圖已經推出了一個虛拟試穿功能,适用于Anthropologie、Loft、H&M和Everlane等品牌的女士上衣。這個功能将随着時間的推移變得更加精确,并擴充到更多的品牌。

Google購物圖與Shopify合作,Shopify是一個商務平台,允許任何人設定自己的商店來銷售實物産品。Shopify簡化了經營業務的複雜性,使得任何人、任何地方的人都可以成為企業家。文章讨論了使用Shopify設定線上商店的便利性,Shopify正在為企業家民主化技術,幫助建設明天的經濟。

一個新的趨勢,使用控制網和穩定擴散與QR碼(QR 碼是二維條碼的一種)建立驚人的圖像,這最近在Twitter上引起了熱潮。文章提供了如何設定這個趨勢的教程連結。Twitter上有一個新的趨勢,建立3D模型,可以從Hugging Face下載下傳并在家中制作。Rowan Chung制作了一個教程,有130萬次觀看,教你如何制作這些模型。這個趨勢産生的圖像看起來很酷,但生成它們很困難。一些QR碼可以工作,但其他的則不能。

一種名為"re-render"的新技術,可以提高視訊品質,解決閃爍和人工制品的問題。文本讨論了一個新的視訊模型,它沒有其他模型中看到的閃爍效果。在一個視訊中示範了這個模型,并與其他模型進行了比較。新模型被說成是清晰的,沒有連貫性問題。作者對這個模型在各種工具和平台中的潛在用途感到興奮。這個模型是否可以供公衆使用還不确定。

文本讨論了最近的Mid Journey辦公時間電話會議,以及可以從即将釋出的5.2版本中期待什麼。這個版本預計會在任何一天釋出,将有限的Discord相容性和改變縮放和長寬比的新功能。也讨論了提示分析器,目前通過輸入"描述"和上傳圖像來使用。版本6最初預計在6-8周内準備好,但現在預計将在7月釋出。文章讨論了開發一個網頁和移動獨立版本以減少Discord中的詞語提示。團隊正在努力改進審查,并減少被拒絕的提示。

此外,11 Labs引入的一個語音分類器工具,可以确定一個音頻是否是由AI生成的。這個工具的目标是對抗深度僞造,這在AI世界中越來越普遍。作者興奮地宣布了一個新的認證工具,使用AI語音分類來識别一個音頻樣本是否包含AI生成的音頻。他們讨論了對AI的惡意使用采取主動立場的重要性,以及深度僞造和假資訊的影響。

繼續閱讀