天天看點

探索大模型研發應用新路徑,青年先鋒論壇共話人工智能新圖景

作者:钛媒體APP

7月20日下午,由北京市委網信辦指導、首都網際網路協會主辦、品玩承辦的首屆“青年思享會”青年先鋒論壇活動在京成功舉辦。論壇以“人工智能的機遇和挑戰”為主題,邀請了來自中國科學院的專家學者,以及百度、奇安信、科大訊飛、向量資料庫Zilliz、雲測資料、映宇宙、易觀分析、中科聞歌等企業的青年先鋒,共同探讨在人工智能的背景下,大語言模型的技術路徑、商業化落地、産業化發展和生态系統建設,力求“全景式”解鎖大模型的真實面貌,“立體式”呈現大模型未來圖景。百餘家網際網路企業及相關機關代表,近300人參加活動。

探索大模型研發應用新路徑,青年先鋒論壇共話人工智能新圖景

北京市委網信辦相關負責人表示,“我們要以《生成式人工智能服務管理暫行辦法》為準繩,明确生成式人工智能服務安全要求,認真做好申報安全評估、加強資料安全和隐私保護等工作,規範操作、劃好底線、守住安全。希望大家在企業的發展過程中強化主體責任,既要把握人工智能等新技術、新應用帶來的機遇,營造創新生态;又要保持正确的大局觀、發展觀、安全觀,重視防範風險。”

如今人工智能技術和應用還面臨哪些挑戰,又有哪些創新發展方向以及需要防範的風險?各企業代表和專家學者就上述問題做了精彩的分享。

企業轉型更新,大模型帶來三大核心價值

AI技術已經賦能到千行百業,也為企業的數智化更新帶來突破。易觀分析進階分析師陳晨在《中國通用人工智能的現狀、前瞻、機遇和挑戰》的主題演講中表示,大模型能夠給企業帶來的核心價值主要有三個層面: 第一,可以以業務驅動的方式來擁抱AI;另外是可以降低AI開發上手的門檻;第三,使用者體驗的層面不僅僅是面向客戶使用者的層面,也可以幫助提升企業員工的體驗,有助于中背景的賦能。她指出,“原本的資訊化數字化時代,做企業轉型更新的時候,可能會出現一些數字化的窪地,但大模型有了之後,能夠解決我們原本需要用資料化的力量去動用解決的問題。”

探索大模型研發應用新路徑,青年先鋒論壇共話人工智能新圖景

對于如何規劃大模型和AIGC的應用,陳晨認為主要有四個方面:第一個是以業務為核心,圍繞業務規劃AI大模型的應用推廣;第二,是資料資産的沉澱跟管理,用自身的專有的資料與大模型的能力更好的結合實作,從通才到專才的過程;第三是建立相應的風險的管控的機制和安全合規的應用AI能力的規範;第四是做好組協同進化,保障企業的人工可以擁抱AI。

突破創新,探索大模型訓練新思路

大模型的研發面臨多重技術挑戰,百度AI技術生态總經理馬豔軍在其分享《知識增強大語言模型:走向通用人工智能的突破與創新》中提到了大模型研發過程中的三大挑戰:第一是模型體積大,訓練難度高;第二是算力要求非常高;第三是資料的規模非常大,并且常常品質參差不齊。以大語言模型為例,在研發過程中需要靠監督精調、檢索增強、知識增強等技術來確定整個大語言模型的品質、客觀性等一系列能力。

探索大模型研發應用新路徑,青年先鋒論壇共話人工智能新圖景

中國科學院計算機所多語言大模型“百聆”負責人馮洋在題為《在語料和模型之外,如何有效訓練大模型?》的分享中也提到了大模型訓練面臨的問題。她表示大模型的訓練成本和部署成本巨大,許多公司無法承擔。同時模型規模的擴大還面臨兩大挑戰,一個是算力上的挑戰,根據摩爾定律,大模型算力的增長速度遠高于半導體的增長速度。另一個是模型的能力并不是和模型的參數量是呈線性關系,是以與付出不見得成正比,馮洋表示調查發現低品質的語料到2030年差不多用完,高品質預料和部分類型的資料也将耗盡。

探索大模型研發應用新路徑,青年先鋒論壇共話人工智能新圖景

為此她探索了新的解決方案 ——多語言大模型“百聆”,在指令微調階段将英語與其他語言對齊,以互動式翻譯任務為核心進行指令微調訓練。她表示,“我們要提升大模型中文生成能力,需要分兩步。首先需要收集大量的語料,去提升基座模型的能力,接下來還需要建構一些中文的指令,來提升大模型在中文上和人類對齊的能力,以及完成任務的能力。”

合理監管為重要前提,AI浪潮下需守護資料安全

合理的監管也是保障人工智能技術健康發展的重要前提,同時也是保護資料安全、避免資訊濫用和引導行業良性競争的關鍵措施。奇安信、映宇宙等參會企業分享了各自在大語言模型網絡安全方面的實踐,提出了一些值得借鑒的方法和政策。

探索大模型研發應用新路徑,青年先鋒論壇共話人工智能新圖景

奇安信集團首席安全專家翟勝軍在《關于人工智能2.0對網絡攻防格局影響的讨論》的主題演講中提到,“把以前整個安全的基礎做成,健全符合資料安全的基礎安全設施,把制度、管理體系到位,保證整個安全落到實處。我希望我們發展新技術,不應該因噎廢食,但在使用新技術帶來更高效果和好處的同時,也應該關注新技術帶來的負面作用,盡量地減少負面作用。”

探索大模型研發應用新路徑,青年先鋒論壇共話人工智能新圖景

映宇宙集團進階合規專家遊濤發表了《人工智能與企業合規的賦能與邊界》的主題分享,他表示,“對于AI失控的管理才是最重要的。要加強對人工的教育訓練,怎麼樣讓更多的人員了解到AI的問題,做資料的标簽将是核心。同時要建立内容舉報機制,讓我們一起監督人工智能的語言和内容,比較重要的是要關注内部的教育訓練,适應AI環境下的人文的素養。”

共建生态,推動中國大模型邁向高品質發展之路

高端對話環節,嘉賓們以“打破壁壘,打造中國大模型健康發展的生态系統”為主題展開讨論,品玩創始人兼CEO駱轶航擔任對話主持人,科大訊飛開放平台AI服務市場部總經理陳賢華、向量資料庫Zilliz聯合創始人郭人通、中國科學院自動化研究所副研究員、“中科聞歌-中科院自動化所”聯合實驗室主任孔慶超、雲測資料總經理賈宇航分享了精彩觀點。

探索大模型研發應用新路徑,青年先鋒論壇共話人工智能新圖景

品玩創始人兼CEO駱轶航表示,“中國大語言模型的生态,我們是全球開源生态最積極的推動者,我們每個人都是這個生态的建構者。”

科大訊飛開放平台AI服務市場部總經理陳賢華表示,“我們在大模型的時代,除了訊飛這樣的平台,把平台裡面有的技術給到大家之外,對于大家更多的借鑒的意義還是需要從場景的落地、務實的角度出發。所有的創意需要有人去用,需要對自己的切身的體驗和學習工作有提升,或是起到降本增效的作用,這非常關鍵。”

向量資料庫Zilliz聯合創始人郭人通提出,“我們要把大模型的生态做好,把模型作為核心,圍繞周邊的系統做建設,特别是系統的基礎軟體這塊,在行業我們才能夠真正的落地創造價值。”

雲測資料總經理賈宇航表示,“資料實際上是資料的品質決定了大模型的最終的結果的好壞的一個非常重要的作用。我們做的事情是以資料标注為核心,以标準化資料接口的方式,跟任何的企業的資料庫打通,完成原始資料到标注資料中的快速積累,包括模型訓練、模型仿真。”

中國科學院自動化研究所副研究員、“中科聞歌-中科院自動化所”聯合實驗室主任孔慶超分享道,“我們的定位是以人工智能的技術去驅動認知決策,希望用內建各種各樣大模型的能力,去繼承各種各樣的行業,去發揮大模型的真實的行業的效應。”

首屆“青年思享會”青年先鋒論壇活動的圓滿落幕,也預示着AI大模型正朝向健康合規的方向發展。AI大模型正在成為賦能千行百業、引領産業變革的關鍵力量。未來,随着人工智能加速發展,行業企業将通過系統創新、堅持開源開放,加速産業生态繁榮發展。(本文首發于钛媒體APP,作者 | 李簡)

繼續閱讀