天天看點

人工智能現在能有多“聰明”?

作者:星星飛翔
人工智能現在能有多“聰明”?

全尺寸人形仿生機器人,其身高達1.77米,重量為52公斤 攝影/本報記者 李娜

正在召開的2023中關村論壇上,“人工智能”無疑是最熱門的關鍵詞。無論是自動駕駛還是智能穿戴,是量子計算還是5G通信,甚至碳中和,衆多前沿科技的背後都離不開人工智能技術的支援。可以說,未來十年,人工智能将繼續改變各行各業以及普通人的生活。在本次論壇國際技術交易大會闆塊、科博會展覽闆塊,以及人工智能相關平行論壇上,北京青年報記者注意到,各大公司都帶來了最新人工智能科技成果,包括視覺通用分割模型SegGPT、5G音視訊互動應用、雙語數智人等等。

5G通信新應用

可視自助服務帶來互動新體驗

最新資料顯示,大陸5G使用者已達5.61億,大陸累計建成開通5G基站231.2萬個,全球占比均超過60%。而一季度全國平均5G下載下傳網速為334.98Mbps,峰值下載下傳速率為472.92Mbps。如此快的網速,再加上人工智能的支援,除了用來刷社交網絡、日常辦公學習,還可以用來做什麼?

中國聯通此次展出的“5G新通信智能互動平台”,就應用了5G“大帶寬、低延遲時間、泛連接配接”的特點,運用5G音視訊互動與AI原子能力,結合AR&VR、三維模組化、智能互動等先進技術,做到了5G内生服務下的音視訊互動應用。平台運用多媒體、三維模組化、實時跟蹤、傳感、智能互動等技術,實作端到端的可視化、智能化新通信服務,為企業、政府等提供5G音視訊互動、智慧虛拟形象等功能。

如金融行業應用版平台,使用者可以遠端接入銀行櫃台服務,享受與現場辦理同等的體驗及個人隐私保護;能源行業應用版平台則重構了井場智能關聯系統應用體系,實作了井場資源數字化管理、井場巡護數字化編制。交通行業版平台以5G新通信為基礎提供無障礙智能通信服務,為老年乘客提供可視化互動的智慧助老服務。

值得一提的是,該平台在國産化适配與自主可控方面實作了平台與國産手機晶片适配;平台端支援國産化系統,手機側适配華為麒麟晶片、聯發科天玑晶片,支援華為、小米、OPPO、VIVO、魅族系列國産手機。

“數智人”更聰明

與大模型融合能“聽懂你的話”

數智人,簡單來說就是虛拟人,借助拟人化的外表、人工智能的核心,數智人已經開始在衆多行業中商業化落地,輔助人工服務,提升企業運作效率。例如,數智人在金融、文旅、傳媒、公共服務、醫療、零售等行業場景中,可擔任坐席客服、理财顧問、播報主持、導遊導覽角色;在文化娛樂場景,可以作為虛拟偶像、虛拟歌手等形成IP資産;在智能車載、智能交通、智能家居等場景,可以通過與智能裝置結合,為使用者提供智能化服務。

騰訊雲智能小樣本數智人生産平台近日首次對外釋出,隻需要3分鐘真人口播視訊、100句語音素材,平台便可通過音頻、文本多模态資料輸入,實時模組化并生成高清人像,在24小時内制作出與真人近似的“數智人”。相較于照片生成、僅能呈現面部形态的數字人,小樣本數智人可根據文本設計手勢,唇動、口型、表情複現真人風格。

本屆中關村論壇,北青報記者也嘗試用數智人虛拟主播,代替真人主播出鏡,進行7×24小時的直播服務,吸引了諸多觀衆關注。

不過,以往的數智人,比起真人來,他們的思考能力明顯更弱。此次中關村論壇上,由智譜AI推出的“智譜AI腦數智人”則更加聰明,它不再拘泥于固定的互動方式,而是初具了解人類指令意圖的能力。智譜AI由清華大學計算機系的技術成果轉化而來,公司于2022年合作研發了雙語千億級超大規模預訓練模型GLM-130B,并主導建構了高精度通用知識圖譜,把兩者有機融合為資料與知識雙輪驅動的認知引擎,并基于此千億基座模型打造ChatGLM。通過認知大模型連結實體世界的億級使用者、賦能元宇宙數字人、成為具身機器人的基座,賦予機器像人一樣“思考”的能力。此外,它還是一個既會中文又會英文的雙語數智人。

“無人駕駛”上街

最新行人預測模型呼之欲出

如今在亦莊等地,已經可以打到百度自動駕駛的車輛。未來,随着技術發展和政策準許後,車上的安全員将會撤出,自動駕駛車輛會實作真正的無人化。

據百度公司介紹,無人駕駛技術核心是“百度汽車大腦Apollo平台”,包括高精度地圖、定位、感覺、智能決策與控制四大子產品。最新的Apollo已經進化到引入多個基于深度學習的模型、釋出了基于語義地圖的低速行人預測模型、引入了基于語義地圖的模仿學習。

在本次中關村論壇上,曠視科技釋出了自研智能托盤四向穿梭車系統。曠視智能托盤四向車作為柔性物流系統中的離散型裝置,可以實作“一車跑全倉”。為什麼說是“柔性物流”?曠視表示,主要是因為它具有離散型裝置、分布式控制兩大特點,使用者企業可以像搭積木一樣,根據需要靈活組合,柔性部署。其次,柔性則展現在整個系統的“動态可擴充”,使用者企業可以根據淡旺季以及業務增長等變化,随時增減四向車數量,提升系統承載能力。

智慧城市更低碳

AI“管家”水電空調全都管

在智慧城市建設中,AI扮演着越來越重要的角色。例如,AI可以用于城市的基礎設施管理,例如自動監測道路、橋梁和建築物的結構健康狀況,以及檢測和修複道路上的裂縫和坑窪;AI可以幫助城市管理能源,例如通過分析能源使用資料來實作更高效的能源使用,以及優化城市的能源系統;AI也可以幫助城市保護環境,例如通過空氣品質監測、垃圾處理和水資源管理等方面,提高城市的環境品質。

那麼,如何利用AI給樓宇減碳來實作碳中和碳達峰的目标呢?恒華數元展示的基于樓宇大腦神經網絡系統碳管理平台,從充分利用清潔能源的角度出發,集中引用成本效益較高的技術産品應用,遍及樓宇末端傳感感覺節點和主要用能裝置傳感感覺節點,通過樓宇大腦邊緣計算伺服器統一協調管理,使樓宇用能裝置高效運轉,盡可能排除不必要的能源浪費,根據邊緣計算模型分析,樓宇各用能子系統能耗曲線處于平穩運作狀态下,整體能耗是最低的。

其中,樓宇電力能耗應該占樓宇能耗的首位,針對樓宇弱電系統的特點,在不增加裝修施工的基礎上,研發出體積更小、計量準确、安裝便捷的一套弱電監測及AI控制系統,可以對樓宇的電力系統進行動态的監控,確定無人區及時斷電,避免不必要的電力浪費。而樓宇空調系統耗能占到樓宇總能耗的40%,恒華數元通過和高校成立産學研基地深度合作研發出針對樓宇冷、熱源系統調優的政策算法,形成了成熟的資料算法模型,使得空調系統節能率達到10%以上。目前,這一項目已在廣東、天津、江西、四川、湖北、安徽等省份落地。未來,居住小區、寫字樓、商場等,都将向着綠色低碳的方向“進化”。

AR眼鏡“同聲傳譯”

智能穿戴裝置助力無障礙

随着人工智能融入生活的方方面面,搭載人工智能的裝置也趨于小型化,如智能手表可接聽電話、回微信、監測運動情況等;智能眼鏡外形如普通眼鏡,戴上後可以接打電話、聽音樂等。

不過,中關村論壇上展示的這一智能眼鏡,則更實用。這款名為“亮亮聽語者智能眼鏡”是一款雙目光波導AR智能眼鏡。

VR眼鏡戴上後會沉浸在虛拟世界,AR眼鏡則不會阻擋視線,其将現實世界與虛拟世界進行融合,進而實作一些在現實世界中無法做到的功能。如聽力受損人群常常因“聽不清”、“聽不見”聲音而在工作、社交、學習過程中遇到困難,這款眼鏡可以将聲音資訊轉換成文字在眼前顯示出來。它還具有同聲傳譯功能,可以識别不同國家的語言,同時轉換成漢字或者其他國家的文字呈現前,幫助使用者在國際語言交流的環境中友善了解。這款眼鏡輕巧便攜,機身僅重79g,相比于目前市面上200-300g的AR眼鏡,其自重非常适合長時間佩戴;還可以适配近視、遠視、散光、老花眼等情況的鏡片;眼鏡外側不漏光,保護隐私,内容僅自己可見;這款眼鏡還搭載了毫秒級實時字幕,降噪算法,5米内精準收音,轉譯準确率最高可達95%以上。據悉,該款産品目前已經具備量産能力。

隐私保護計算技術開源

應用于金融醫療保險等領域

隐私計算,也叫隐私保護計算,是指在保證資料提供方不洩露原始資料的前提下,對資料進行分析計算的一系列資訊技術,實作資料在流通與融合過程中的“可用不可見”,進而實作資料價值的轉化和釋放。隐私保護計算對隐私資料提供了未來行業亟須的保護能力。本次中關村論壇展覽(科博會)上,螞蟻集團首次公布以關鍵基礎軟體為核心的開源完整版圖,9大核心技術全部開源,其中就包括隐私計算技術“隐語”。也就是說,這一技術平台面向全球使用者開放,可無需調用和開發代碼,直接使用産品功能,幫助使用者低成本探索隐私計算應用場景。

據介紹,隐語目前已經在金融、醫療、保險等場景應用。如浦發銀行聯合螞蟻集團隐語平台,識别出超過14.5萬名高風險使用者,阻止了數十億人民币的高風險貸款的發放。在醫療方面,螞蟻隐私計算平台和阿裡雲數字醫療團隊合作,為醫院搭建了面向醫院營運管理的資料融合平台,為管理者提供數字化績效管理分析,幫助醫院建立精細化營運管理體系,減少醫院的經濟風險或臨床風險。此外,過往保險機構在理賠過程中,通過向醫療機構明文(即資料不加密)查詢被保險人的診療情況,将會獲得不必要的原始資料。而螞蟻的解決方案通過設定資料邏輯查詢,利用多方安全計算等隐私計算技術,使得保險公司隻獲得是否理賠的查詢結果,不會獲得各種原始資料,保護理賠使用者隐私。

聲音

大模型将改變世界開發的同時應研究控制技術

ChatGPT是2023年最引人關注的科技界新事物之一,它的釋出也引發了語言大模型狂潮,百度、阿裡、知乎、商湯、京東等多個公司紛紛推出了其大模型。AI另一個重大領域——視覺GPT也亮相本屆中關村論壇:智源研究院視覺團隊正式推出通用分割模型SegGPT,這是首個利用視覺提示完成任意分割任務的通用視覺模型。

據介紹,SegGPT使用時,擯棄語言類大模型的傳統思維,與機器互動時不使用文字而是使用圖像。比如使用者給出SegGPT一張圖并在上面将“彩虹”圈了起來,當使用者再給許多張包含有彩虹的圖檔時,SegGPT就能自動識别上面的彩虹,并将這些部分圈出來。可以說,SegGPT“一通百通”:給出一個或幾個示例圖像和意圖掩碼,模型就能get使用者意圖,“有樣學樣”地完成類似分割任務。此外,SegGPT還“一觸即通”:通過一個點或邊界框,在待預測圖檔上給出互動提示,識别分割畫面上的指定物體。利用這個特性,可以實作諸多功能,比如機器人機械手去拿蕃茄等物件時,機器人就可以迅速知道蕃茄的邊緣在哪裡,既能拿起蕃茄,又不會捏碎,十分精準。

目前,國内大模型處在百花齊放、百家争鳴的狀态下。百度創始人、董事長兼CEO李彥宏在中關村論壇上表示,人工智能再次成為人類創新的焦點,越來越多的人認可第四次産業革命正在到來。他強調:“大模型改變了人工智能,大模型即将改變世界。”中國工程院院士、中國人工智能學會理事長戴瓊海也表示,人工智能将帶來多個方面的應用變革:面向科學研究新範式(宇宙起源、自然規律、生命奧秘);面向人民生命健康(AI藥物研發、遠端虛拟手術);面向經濟主戰場(虛拟創造、工業制造、靈境互動);面向國防重大需求(多源态勢分析、AI地空戰線部署)等等。

值得關注的是,面對新變化,也有人提出了警示。創新工場董事長、首席執行官李開複表示,“AI仍會出錯,會一本正經地胡說八道,它隻能被應用于生成内容初稿、開拓想法,而不能作為最終版本,AI需要持續的人工幹預,避免謬誤或災難發生。此外,AI可能還存在一些法律及倫理問題,是以,AI并非适合所有的領域,隻能應用于容錯度較高的應用中。”李開複強調,“AI可能制造虛假資訊,可能被不法分子利用來做針對性的欺騙使用者,是以,開發時,需要同時研究控制AI的技術和管理的法律法規。”本版文/本報記者溫婧

統籌/餘美英

繼續閱讀