天天看點

谷歌搜尋引擎問世 25 年最大更新之一,“AI Overviews”體驗正式上線|懂點AI

作者:動點科技
谷歌搜尋引擎問世 25 年最大更新之一,“AI Overviews”體驗正式上線|懂點AI

掌握AIGC脈動,把握科技脈搏。動點科技每天收集彙總全球AIGC進展與熱點,每天5分鐘帶您了解AIGC,希望與您共同玩轉 AIGC,解碼行業發展新風向,開啟智慧新時代!

文 |動點科技排版|高竹本文預計閱讀時長5分鐘

01

文生圖技能再進化,谷歌推出 Imagen 3:更準确、更具創造性谷歌公司在今天召開的 I / O 2024 開發者大會上,宣布推出了 Imagen 3,進一步增強了文本生成圖檔的技術能力。與前代産品 Imagen 2 相比,Imagen 3 能更準确地了解文字提示,并将其轉化為圖像,而且其生成的圖像更具“創造性和細節”,且模型産生的幹擾元素和錯誤也更少。為了打消人們對 Deepfake 可能性的擔憂,谷歌表示,Imagen 3 将使用 DeepMind 開發的 SynthID 方法,在媒體上應用隐形加密水印。使用者可以在谷歌的 ImageFX 工具中可以注冊 Imagen 3 的私人預覽版,谷歌表示,該模型将很快提供給使用谷歌企業生成式人工智能開發平台 Vertex AI 的開發人員和企業客戶。

02

谷歌搜尋引擎問世 25 年最大更新之一,“AI Overviews”體驗正式上線谷歌公司在今天召開的 2024 年 I / O 開發者大會上,正式推出了“AI Overviews”搜尋體驗,将于本周開始向美國地區開放,後續會推廣到更多國家和地區。該功能此前稱之為Search Generative Experiences,主要是讓使用者通過提問、聊天的方式進行 AI 搜尋。在美國地區,谷歌主要通過和 Reddit 社群合作,解答使用者的提問。谷歌表示,它将為美國使用者的線上查詢提供人工智能生成的答案,這是其搜尋引擎 25 年來最大的更新之一。

03

劍指 Sora,谷歌推出 Veo 文生視訊模型:時長超 1 分鐘、最高 1080P,支援電影手法OpenAI 三個月前推出文本轉視訊 Sora,引發了網友、媒體以及圈内人士的廣泛讨論。谷歌在今天召開的 2024 I / O 開發者大會上,也推出了對标産品-- Veo,可以生成長度超過 1 分鐘,分辨率最高 1080P 的“高品質”視訊,并具有多種視覺和電影風格。根據谷歌官方新聞稿,Veo 具備對自然語言有先進的了解能力,能夠了解“延時攝影”、“航拍風景”等電影術語。使用者可以使用文本、圖像或視訊提示來指導他們所需的輸出,谷歌表示,這樣産生的視訊“更加連貫一緻”,在整個鏡頭中人物、動物和物體的動作也更加逼真。

04

對轟 GPT-4o,谷歌推出 Astra 項目:手機鏡頭内低延遲聊天互動谷歌公司在今天召開的 2024 年 I / O 開發者大會上,推出了全新的 Project Astra 項目,基于 Gemini,可以本地運作在 Pixel 手機上,可以說是對标 OpenAI GPT-4o 的最新模型。谷歌表示 Project Astra 是最新的多模态 AI 項目,使用者打開攝像頭,該多模态項目可以直接解釋使用者畫面中物品。

05

位元組跳動正式釋出“豆包大模型”家族,含通用模型、角色扮演模型、聲音複刻模型、語音識别模型、文生圖模型等今天上午,位元組跳動在 2024 春季火山引擎 Force 原動力大會上正式宣布自家豆包大模型正式開啟對外服務。據介紹,豆包大模型包含豆包通用模型 Pro、豆包通用模型 liti、豆包・角色扮演模型、豆包・語音合成模型、豆包・聲音複刻模型、豆包・語音識别模型、豆包・文生圖模型、豆包・Function Call 模型。除釋出位元組跳動自研大模型外,位元組跳動還宣布火山引擎大模型服務平台——火山方舟也将迎來重大更新。

06

谷歌預告安卓新功能:AI 檢測詐騙電話谷歌公司在今天召開的 I / O 2024 開發者大會上,宣布為安卓系統引入 AI 詐騙電話檢測功能,在通話中提醒可能存在的詐騙行為,并鼓勵使用者結束此類通話。谷歌表示該功能基于本地運作的 Gemini Nano 模型,在通話中比對查找欺詐性語言和其他通常與詐騙有關的對話模式,如果遇到疑似詐騙的電話,就會發出警報提醒使用者。安全方面,谷歌表示,這些新的保護措施完全是在裝置上實施的,是以 Gemini Nano 監控的對話将保持私密性。

07

谷歌 Workspace 辦公套件整合 Gemini:可總結郵件内容、梳理會議要點等谷歌公司在今天召開的 I / O 2024 開發者大會上,宣布 Google Workspace 将進一步整合 Gemini,在側面闆中将推出基于 Gemini 1.5 Pro 的諸多技能。谷歌表示 Workspace 整合 Gemini 的作用,是為使用者節省從多個應用程式中挖掘檔案、電子郵件和其他資料的時間和精力。谷歌 Workspace 的 Gmail、Docs、Sheet、Slides 和 Drive 将率先推出 Gemini 側面闆,可以不在離開應用的情況下,組織、了解應用中的資料,可以總結郵件内容、摘要會議記錄等等。

08

谷歌 Gmail 深度整合 Gemini:彙總郵件内容、生成更好回複谷歌在今天召開的 I / O 2024 開發者大會上,宣布将于下月邀請 Workspace 和 Google One AI Premium 使用者,體驗新版 Gmail,可以讓 Gemini 總結電子郵件内容。谷歌表示使用者可以在移動應用和網頁版 Gmail 中使用 Gemini,針對目前電子郵件内容提問,或者讓 Gemini 根據電子郵件的上下文撰寫回複。谷歌目前已經在 Gmail 中引入了 Smart Reply 功能,不過新版中更新帶來了“Contextual Smart Reply”,可以基于上下文帶來更細緻、更優秀的回複。谷歌表示還将會為 Gmail 應用帶來全新的 Gemini 按鈕,使用者點選之後會看到“總結這封郵件”或“建議回複”等建議,使用者還可以輸入提示來詢問有關電子郵件的問題。

09

谷歌 Gemini 解鎖旅行規劃技能,幾秒内幫你妥當安排行程

谷歌公司在今天召開的 I / O 2024 開發者大會上,宣布為 Gemini 引入旅行規劃功能,結合個人資訊和公共出行資訊,幫使用者規劃預訂航班、酒店等等。谷歌表示 Gemini 可以基于使用者的提示,挖掘航班時間和酒店預訂等具體細節,在幾秒鐘内制定出合适的度假行程。Gemini 會根據使用者電子郵件中包含的航班和酒店詳細資訊制定行程。該模式還将利用谷歌地圖查找附近的餐館和文化景點,并根據特定提示(如飲食限制或應避免的事項)過濾出各種選擇。谷歌表示,新的旅行計劃功能将在未來幾個月内登陸 Gemini Advanced。

10

iOS 版 ChatGPT 更新支援 App 首選語言設定中文iOS 版本 ChatGPT 今日淩晨釋出 1.2024.129 版本更新,新增支援 App 首選語言設定中文,此前為其他語言。首次啟動 iOS 版 ChatGPT 會出現中文展示頁,App 内支援應用語言設定,點選後将跳轉至系統設定中 ChatGPT 應用設定,再次點選首選語言,即可設定軟體語言。

11

百度釋出全球首個 L4 級自動駕駛大模型 Apollo ADFM,稱比人類駕駛更安全

百度 Apollo 今天在武漢百度蘿蔔快跑汽車機器人智行谷舉辦 Apollo Day 2024,釋出了全球首個支援 L4 級自動駕駛的大模型 Apollo ADFM(Autonomous Driving Foundation Model)。百度稱,Apollo ADFM 基于大模型技術重構自動駕駛,可以兼顧技術的安全性和泛化性,做到安全性高于人類駕駛員 10 倍以上,實作城市級全域複雜場景覆寫。依靠自動駕駛大模型的應用實踐️,百度蘿蔔快跑已經攻克了武漢的複雜道路場景,實作了武漢城市全域、全時空場景覆寫。同時在 L2 + 智能駕駛領域,目前國内唯一的純視覺城市領航輔助駕駛産品 ANP3 也将全面應用自動駕駛大模型 Apollo ADFM,更新為 ASD(Apollo Self-Driving),即将在極越全系車型量産首發,率先實作“智駕全國都能開、有百度地圖的地方都能開”。

本文為動點科技整理,未經授權不得轉載,如需轉載或開白請在背景回複“轉載”。

- - - - - - - - END - - - - - - - -

*想要擷取行業資訊、和志同道合的科技愛好者們分享心得,那就趕快掃碼添加“動點君”加入群聊吧!群裡更有不定期福利發放!

精彩好文值得推薦!

一鍵轉發,戳個在看!

谷歌搜尋引擎問世 25 年最大更新之一,“AI Overviews”體驗正式上線|懂點AI