歡迎來到站長之家的[每周AI大事件],這裡記錄了過去一周值得關注的AI領域熱點内容,幫助大家更好地了解人工智能領域的動态和發展風向。
Part1動态
[國内要聞]
1.騰訊混元大模型開始應用内測 多個業務線已接入
騰訊自研的“騰訊混元大模型”已經進入應用内測階段。多位騰訊員工表示,他們最近收到了内部郵件邀請,可以通過網頁或小程式體驗混元大模型。騰訊内部多個業務也已經接入混元大模型進行測試。
2.美圖自研視覺大模型MiracleVision已疊代至1.5版本
吳欣鴻透露,目前美圖自研視覺大模型已疊代到1.5版本,并應用于美圖旗下多款産品。目前,美圖在AI層面有多個成功實踐案例。“AI繪畫”系列涵蓋文生圖、文字融合、圖生圖、塗鴉生圖、線稿上色、頭像制作、寵物頭像等功能。
3.北大團隊提出Dragon Diffusion,可一鍵拖拽編輯圖像
DragonDiffusion 是一款基于擴散模型的圖像編輯工具,旨在實作對圖像進行精細化編輯。通過設計分類器引導的方法,DragonDiffusion 能夠将編輯信号轉化為梯度,通過特征對齊損失修改擴散模型的中間表示。
4.餘承東“劇透”鴻蒙4.0:或搭載AI大模型
餘承東在社交平台展示了一項新技術:他利用華為手機内置的小藝語音助手,寫了一段釋出會宣傳文案。從該視訊可以看出,小藝可以根據使用者需求,自動生成文案等内容。而在小藝的回答下方有一行提示——“資料來源:由AI模型自動生成,可能存在疏漏,僅供參考”。華為鴻蒙4.0或将融入AI大模型的能力,使得小藝語音助手具備生成式AI的功能。
5.阿裡雲開源通義千問70億參數模型
阿裡雲宣布開源通義千問70億參數模型,包括通用模型Qwen-7B和對話模型Qwen-7B-Chat,兩款模型均已上線魔搭社群,開源、免費、可商用。
6.多個AIGC應用在蘋果應用商店下架
多個AI相關App在蘋果應用商店下架。據七麥監控資料顯示,本次共有658款應用被下架,其中包含 Chat、AI、GPT 等關鍵詞的應用較多。根據蘋果官方通知,中國區的蘋果應用商店不允許提供 ChatGPT 相關的服務。同時,相關開發者需提供專門的許可證,且需要向監管部門申請。
7.百度文心千帆大模型平台接入LLaMA2等33個模型
百度智能雲千帆大模型平台已經完成了新一輪的更新,全面接入了包括LLaMA2全系列、ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon等33個大模型,成為了國内擁有大模型最多的平台。
8.百度Apollo官宣文心大模型首批智艙應用夥伴
百度Apollo宣布長城汽車、億咖通科技成為首批文心大模型智艙應用探索夥伴。百度Apollo已分别與長城汽車、億咖通科技基于大模型能力圍繞車載互動場景開展探索和實踐,完成多項創新功能在量産車型平台上的驗證,部分功能有望在長城、領克、smart等量産車型上率先落地。
9.百度将大型語言模型ERNIE應用于汽車,實作文字轉圖像功能
網際網路大廠百度已經實作了将其大型語言模型 ERNIE 應用于汽車領域的承諾,并與汽車制造商長城汽車和數字駕駛艙創造者 ECARX 展開合作。
10.淘寶AI裝修功能“真能造”将全面上線
淘寶于7月下旬内測的AI裝修功能“真能造”将于8月14日的家裝家居生态峰會上正式對外釋出,屆時功能将更加完善,并且在樣闆間UGC分享和使用者互動功能等方面進一步疊代更新。
11.阿裡雲通義聽悟上線三大新功能
阿裡雲通義聽悟近期上線了三大新功能,其中包括視訊自動提取PPT、浏覽器插件、釘釘和微信小程式。這些功能旨在幫助使用者在PC和移動端随時随地聽懂、了解、閱讀各類音視訊内容,進而提高職場人士和學生的工作學習效率。
12.訊飛星火APP重新上架 将釋出星火認知大模型2.0版本
:科大訊飛在投資者平台回應稱,訊飛星火認知大模型V2.0更新釋出會将于8月15日舉辦,屆時會釋出多模态生成、代碼生成能力及行業産品等多項能力及應用。
13. 8月AI新規将施行:使用AI生成内容不得侵害他人肖像權
《生成式人工智能服務管理暫行辦法》将在8月15日起施行,《辦法》明确,提供和使用生成式人工智能服務應當尊重他人合法權益,不得危害他人身心健康,不得侵害他人肖像權、名譽權、榮譽權、隐私權和個人資訊權益。
14.AI遊戲教育與産業聯盟專委會正式成立
AI遊戲教育與産業聯盟專委會正式成立。浦東将在産業政策、營運規範、國際交流等方面,為AI和遊戲産業的發展提供大力支援。
[國際要聞]
1. 蘋果已研究所學生成式AI多年
蘋果公司在2023年度的研發上花費了226.1億美元,首席執行官蒂姆·庫克明确表示其中一部分支出是因為該公司正在開發生成式人工智能。庫克表示:「多年來,我們一直在進行廣泛的人工智能技術研究,包括生成式人工智能。我們将繼續投資、創新,并以負責任的方式推進這些技術,以幫助豐富人們的生活。顯然,我們在大量投資,并且這一點在你所看到的研發支出中得到了展現。」
2. Medium禁止完全由AI生成的内容 需标記AI生成部分
國外知名部落格門戶網站Medium.com 最近宣布,他們将禁止100% 由人工智能(AI)生成内容的釋出,堅稱平台為 “人類寫作的家園”。Medium要求所有 AI 生成的文本都必須在 Medium 上進行标注,否則将不會被展示
3.馬斯克疑似從OpenAI手中買下域名Ai.com
Elon Musk 疑似已經從 OpenAI 手中購買了域名 AI.com,将其用于他即将成立的 AI 公司 xAI。分析認為,此舉可能是為了讓自己的公司成為 AI 領域的中心,與 OpenAI 競争。
4.澳洲新聞集團利用AI每周生成3000篇當地新聞報道
澳洲新聞集團(News Corp Australia)執行主席Michael Miller透露,該公司每周使用生成式人工智能制作3000篇文章,生成數千個有關天氣、燃油價格和交通狀況的當地報道。最近,該新聞集團釋出公告招聘生成式AI資料記者,要求會使用AI自動建立新聞内容。這在新聞領域屬于比較新鮮的職位,同時新聞媒體的内容創作将迎來轉型時期。
5. OpenAI送出GPT-5商标申請 此前稱目前沒有訓練GPT-5計劃
ChatGPT的開發者OpenAI已經向美國專利商标局(USPTO)送出了“GPT-5”的商标申請。這一消息是由商标律師Josh Gerben在推特上分享的。GPT-5被推測是OpenAI進階語言模型的下一個疊代,可能會代表自然語言處理和人工智能能力的重大進步。但是,GPT-5的具體功能和改進尚未得到OpenAI的正式确認。
6.YouTube在最新測試中使用人工智能總結視訊
谷歌正在嘗試使用人工智能自動生成 YouTube 視訊摘要。這些摘要隻會出現在有限數量的英語視訊旁邊,并且隻能由有限數量的使用者觀看。它們将出現在 YouTube 的觀看和搜尋頁面上,旨在簡要概述視訊内容,而不取代人工編寫的現有描述。
7.消息稱OpenAI測試DALL-E3.0版本
OpenAI 可能正在準備下一版本的 DALL-E AI 文本到圖像生成器(稱為 DALL-E3),并進行一系列 alpha 測試,這些測試現已向公衆洩露 。雖然測試版本顯示了模型的潛力,但也暴露了一些潛在的問題,例如生成不适宜内容的風險。然而,這些問題有望在正式釋出之前得到解決。
8.矽谷知名風投公司釋出建立人工智能女友的說明
矽谷風投公司 Andreessen Horowitz 最近在開發者網站 GitHub 上釋出了一份詳細的指南,教人們如何從零開始建構一個 AI 伴侶機器人。Andreessen Horowitz在描述中寫道:這些伴侶有很多可能的用例——浪漫(人工智能女朋友/男朋友)、友誼、娛樂、輔導等。該項目純粹是為了成為開發者教程和入門堆棧那些對聊天機器人是如何建構感到好奇的人。
9.衆籌網站Kickstarter要求生成式AI項目披露更多資訊
Kickstarter 近日宣布,對于使用生成式人工智能(AI)工具創作圖像、文本或其他作品的項目,将要求其在項目頁面上披露更多與 AI 相關的資訊。
10.南韓AI大模型Upstage的LLM擊敗ChatGPT
南韓人工智能創業公司 Upstage 的最新人工智能模型Upstage在一項全球認可的開源語言模型評估中超過了全球知名的 AI 巨頭 OpenAI 的 ChatGPT。Upstage 的其采用 Meta 的 LLaMA270B 模型訓練的新 AI 模型在最新的 HuggingFace Open LLM Leaderboard 排行榜上獲得了平均得分72.3。
11. AI打敗AI!谷歌科學家用GPT-4擊敗AI防篡改系統
谷歌科學家使用 GPT-4聊天機器人來欺騙 AI-Guardian 圖像分類器的防禦措施,并提供了相應的代碼。GPT-4成功擊敗了 AI-Guardian 的防禦,并降低了其穩健性從98% 到8%。
12. Instagram 開發新的 AI 功能,包括 AI 生成的圖像檢測器
Instagram正在開發新的AI功能,包括一個AI生成的圖像檢測器。這些新的生成式AI功能不僅可以提升使用者在 Instagram 上的體驗,還可以幫助打擊虛假資訊。
13.Stack Overflow 推出 OverflowAI
Stack Overflow 在開發者社群和人工智能之間進行了整合,推出了 OverflowAI。OverflowAI 引入了語義搜尋,通過矢量資料庫提供智能的響應,為開發者提供準确的問題解決方案。
14.英語的人工智能使用費比其他語言便宜15倍
研究表明,對于類似 OpenAI 的服務,由于計算成本的計量和計費方式,英語輸入和輸出比其他語言要便宜得多,其中簡體中文的成本約為英語的兩倍,西班牙語為英語的1.5倍,而撣語則要貴15倍。
15.谷歌推AI控制機器人 RT-2模型:将文本和圖像轉化為機器人動作
谷歌推出了 Robotics Transformer2(RT2),這是一個視覺-語言-動作(VLA)模型,可以将文本和圖像輸出為機器人動作。谷歌表示,RT-2「讓我們更接近機器人的未來。」「就像語言模型通過從網絡上的文本進行訓練來學習一般的思想和概念一樣,RT-2通過從網絡資料中傳輸知識,以指導機器人行為,」谷歌 DeepMind 的機器人主管 Vincent Vanhoucke 在一篇博文中解釋道。「換句話說,RT-2能夠與機器人交流。」
16. Photoshop beta 版添加Firefly驅動的AI畫布擴充功能
Adobe 正在建構 Firefly,其生成式 AI 模型系列,在 Photoshop 中加入了一個功能,正如該公司所描述的:「将圖像擴充到原始邊界之外」。這個名為「生成式擴充(Generative Expand)」的功能,在 Photoshop 的 beta 版本中可用,使用者可以通過單擊和拖動裁剪工具來擴充和調整圖像,進而擴充畫布。
Part2産品
1. Meta釋出AudioCraft,可幫助使用者創作音樂和音頻
Meta釋出了一款開源人工智能(AI)工具AudioCraft(直譯為音頻技藝),該工具可以幫助使用者根據文本提示創作音樂和音頻。Meta表示,這款人工智能工具将AudioGen、EnCodec和MusicGen三種模型或技術融為一爐,可用文本内容生成高品質、逼真的音頻和音樂。
2.圖像編輯工具EditAnything:可編輯圖像中的任何元素
EditAnything 是一款基于 Segment-Anything、ControlNet、StableDiffusion 等技術的圖像編輯工具。它能夠編輯和生成圖像中的任何内容,包括對圖像中的物體進行修改、添加、删除等操作,通過調整細節和布局來生成不同風格的圖像。
3.Faceswap.dev:一個免費開源的AI換臉工具 高效且安全
Faceswap.dev 是一個免費開源的AI 換臉軟體,可以在視訊或圖檔中進行人臉替換。該軟體旨在提供易于使用、高效、安全的 Deepfakes 工具,并緻力于提高使用者的道德和法律意識,防止濫用 AI 換臉技術。
4.給自動駕駛AI上“外挂”!港大&TCL開源輕量級模型MarS3D
香港大學計算機視覺與機器智能實驗室(CVMI Lab)和 TCL AI Lab 的研究人員共同開發了一種名為 MarS3D 的輕量級模型,可以顯著提升自動駕駛 AI 的物體運動狀态判别能力。
5.英偉達新AI圖像生成器Perfusion :大小僅100KB、訓練隻需4分鐘
Nvidia 研究人員推出了一種創新的文本到圖像個性化方法,稱為Perfusion。與大AI圖檔生成模型不同的是,Perfusion 隻有100KB大小,訓練時間短,隻需要4分鐘。
6.Deep Nostalgia:通過AI技術讓老照片動起來
Deep Nostalgia 是一項使用機器學習來動畫靜态圖像的技術,能夠給照片中的人臉添加動畫效果,讓家族曆史更生動。使用者隻需上傳照片,Deep Nostalgia 就會應用預設的動作模闆,建立高品質逼真的視訊。目前該工具已完成超過1.06億個動畫,并持續增加。
7.免費線上AI繪畫工具Playground AI 無需注冊
Playground AI 是一款免費線上的繪畫工具,不需要注冊。使用者可以每天繪制1000張作品。
8.Skybox AI:随手塗鴉即可一鍵生成360度全景圖像
Skybox AI 是一款由 Blockade Labs 開發的免費工具,可以一鍵生成360度全景圖像。使用者可以通過關鍵詞描述來生成完整的3D 場景,包括建築物、天空、地面、植被等。生成的場景逼真,并且使用者可以通過手勢工具在360度内切換視角,并免費下載下傳圖檔到本地。
9.開發惡意軟體、僞造信用卡,AI機器人FraudGPT在暗網風靡
FraudGPT 是一種不受監管的聊天機器人,在暗網上流通,并被犯罪分子用來編寫網絡釣魚電子郵件和開發惡意軟體。這個軟體是由名為 "CanadianKingpin" 的開發者提供,在多個暗網市場上銷售。它的定價為每月200美元,但購買三個或六個月的訂閱可以獲得折扣,購買一年的通路權限需要1700美元。據稱,稱其已在地下平台上處理了3000多筆銷售。
10. AI律師“Do Not Pay” 幫使用者推翻了16萬多張停車罰單
Do Not Pay 是由 GPT4支援的人工智能律師機器人,可以通過為停車罰單辯解、協商交易退款和分析财務交易來幫助使用者節省金錢。其接受了西方主要國家消費者法律和法規的教育訓練,可以撰寫引用具體立法的有說服力的信件,并代表使用者通過電子郵件發送給公司,進而為他們節省金錢。該機器人已在紐約和倫敦推翻了16萬多張停車罰單。
11. 80%代碼秒生成!AI神器Copilot大更新
Github官宣,Copilot模型更新,5年内80%的代碼将自動生成。GitHub Copilot釋出還不到兩年, 就已經為100多萬的開發者,編寫了46%的代碼,并提高了55%的編碼速度。
Part 3觀點
1.盡管巴菲特對ChatGPT感到驚歎,但他對AI投資仍持謹慎态度
沃倫·巴菲特在接受 CNBC 采訪時表達了對人工智能和 ChatGPT 的謹慎而又驚歎的态度。他承認自己對人工智能的了解還不足以對其進行投資,但他仍然看到了它在日常應用中的潛力。
2.調查:63%的人擔心使用生成式AI導緻侵版問題
根據調查,63% 的人擔心使用生成式人工智能時侵犯版權問題,而41% 的人擔心這些工具存在固有偏見。另外,83% 的人對需要跟上的工具數量感到困惑,92% 的人不相信科技公司能夠進行自我監管。
3.郭明錤:蘋果的生成式AI技術明年也不會推出
蘋果分析師郭明錤在新報告中指出,目前沒有任何迹象顯示蘋果會在2024年推出生成式AI技術或将其結合至硬體。郭明錤預測,蘋果不會在即将到來的财報電話會議上花太多時間去讨論 AI 相關事項。蘋果内部已經在做類似GPT的産品,但對于如何将生成式AI技術應用至消費者産品,蘋果仍未有清晰的政策。
4.IBM報告:證明投資人工智能可降低資料洩露成本
IBM安全部門的2023年資料洩露成本報告提供了有力證據,證明投資人工智能、自動化和威脅情報可以縮短資料洩露的生命周期,降低資料洩露的成本,并在整個公司範圍内建立更強大、更有韌性的安全姿态。
5.皮尤研究中心:人工智能可能取代舊崗位 也能帶來新職業
皮尤研究中心的一項發現顯示,19% 的美國勞工從事與人工智能高度「暴露」的工作,該研究使用了暴露一詞,因為尚不清楚人工智能的影響是積極的還是消極的。最受影響的群體包括預算分析師、資料錄入員、稅務編制員、技術作家和網絡開發人員等職業。但23% 的美國勞工卻幾乎不受影響,這些崗位是人工智能無法輕易複制的一般體力勞動,比如理發師、洗碗工、消防員、管道工、保姆等。
6.超過75% 的投資者因人工智能而熱捧科技股
在最新的 Markets Live Pulse 調查中,514位受訪者中的77% 計劃在未來六個月内增加對科技股的投資或保持現狀。與此同時,不到10% 的人認為科技領域的泡沫很快就會破裂。一半的人不願意自掏腰包購買 AI 工具來幫助他們的個人或業務生活,而大多數公司也沒有計劃在交易或投資中使用這些工具。
7.Gartner:對話式 AI功能将推動全球客服中心市場在2023年增長16%
Gartner 最新的報告,2023年全球在客服中心技術、對話式人工智能和虛拟助手方面的支出預計将達到186億美元,這與上一年相比的大幅增長16.2%。
8.研究顯示:全球AI晶片組市場規模預計将超過7000億美元
研究顯示,2021年全球人工智能晶片組市場估值約為455億美元,該市場2022年至2031年,複合年增長率可能高達31.8%,到2031年,市場規模可能達到7174億美元。
Part4深度
1.每月200美元便可 AI“刀”人?無技術門檻的黑客版 ChatGPT 風靡暗網
近日,一款名為 FraudGPT 的惡意 AI 工具在暗網上流通,被黑客用于編寫釣魚郵件和開發惡意軟體。與傳統黑客工具相比,FraudGPT 更簡單、直接、高效,無論專業開發人員還是小白都能使用。它可以生成看似真實的釣魚郵件和網站,誘騙使用者洩露敏感資訊,還能模仿人類對話,與使用者建立信任,引誘他們洩露資訊或執行有害操作。FraudGPT 基于 GPT-3的大型語言模型,在訓練後可以生成合乎邏輯且與事實相符的欺詐性文本。
2.被AI大牛押注的智能體,國内發展得怎樣了?
前特斯拉總監、OpenAI 大牛 Karpathy 表示,AI 智能體是未來發展的方向。智能體是大模型的 "身體",能在各個領域施展身手。國内團隊也在發展智能體,聯彙科技推出了基于大模型自主智能體 OmBot。智慧店長、文檔處理、視訊剪輯是智能體的主要應用場景。然而,智能體的商業化落地仍面臨挑戰,包括技術壁壘和 “松耦合” 路線。國内團隊需要攻克這些難題,才能實作真正意義上的智能體。
3.被賣家追着跑,這一波AI商拍真香了?
2022年年末,OpenAI 推出 ChatGPT,引爆了 AI 商拍領域的熱潮。AI 商拍工具通過利用 AI 技術幫助品牌生成高品質産品圖檔,節省了拍攝成本和時間。在靜态産品圖生成功能上,各産品的使用路徑和功能相似,但還需在細節上做更多優化。AI 商拍工具的技術壁壘并不高,不同廠商采用不同的底層模型,如 WeShop 采用了開源的 Stable Diffusion。目前主要使用者是中小賣家和檔口賣家,大企業在融合 AI 産品方面還面臨一些難題。
4. 9.9元的AI芭比寫真,會搶走攝影師的飯碗?
電影《芭比》票房飙升後,“芭比 AI 寫真” 成為熱門周邊。通過名為 “45AI” 的小程式,使用者上傳照片後,花9.9元即可得到金發芭比寫真。雖然有排隊時間和成片效果等問題,但仍有很多人追捧。AI 寫真小程式在社交媒體迅速走紅,但也引發了争議,如使用者隐私等問題。AI 寫真被稱為搶走攝影師飯碗,但攝影師認為 AI 寫真還不能威脅到他們的生意,因為 AI 隻能修圖,而攝影師還有溝通和引導客人等重要環節。
5.AI生成視訊有哪些新玩法?
AI初創公司Runway宣布,AI視訊生成産品Gen-1和Gen-2已全面開放,任何人都可以注冊一個賬号免費嘗試。通過使用 Gen-2和 Midjourney,創作者可以快速生成各種類型的短片,包括科幻、恐怖、以及對熱門 IP 的二創等。具體玩法可閱讀原文。
6.矽谷“砸錢”造神,中國式AI能複制麼?
矽谷在人工智能領域獲得了大量融資,但與中國的 AI 創業環境存在差異。矽谷重視技術創新和大模型能力,而中國更注重商業模式。目前矽谷投資熱點主要集中在基礎大模型層、中間層和垂直應用層。然而,矽谷的大模型公司主要以 OpenAI 為首,其他創業公司很少涉足該領域。相比之下,中國的 AI 創業者和投資人面臨迷茫,且 “Copy to China” 的政策逐漸失靈。矽谷投資人更注重 OpenAI 和 B 端行業整合的 AI 公司,而中國的創業者和投資人應該注重發展中間層和獨特的商業模式。
7.大模型狂飙半年:第一波裁員潮來了,AI「大餅」要提前結束了?
上半年市場熱炒的人工智能主題受到懷疑,大模型的炒作勢頭或将結束。國内外初代 AIGC 企業開始裁員,部分公司經營不善導緻停擺。雖然市面上推出了超過100款大模型産品,但行業泡沫混雜,未來隻有少數企業能夠成為市場赢家。