天天看點

中關村論壇探索中國大模型發展:發展初期鼓勵開源開放,基礎研究仍需創新強化

作者:王琦 785

21世紀經濟報道記者 繳翼飛 北京報道

當下,人工智能發展正迎來新拐點。ChatGPT的爆火引發“千模大戰”,“中國企業如何在大模型研發的競争中不落于人後”也成為最近2023中關村論壇上的熱門話題。

目前,中國大模型技術正沿各技術路線迅速發展,在自然語言處理、機器視覺和多模态等領域湧現出盤古、悟道、文心一言、通義千問、星火認知等多個具有行業影響力的預訓練大模型,未來也将有更多大模型為各行各業帶來新的效率革命和體驗更新。

多名業内專家在中關村論壇期間表示,目前正處于發展AI大模型的曆史機遇期,大模型應用已經逐漸走向實體經濟,為了不斷尋求在通用人工智能技術方面的突破,補齊底層算法、關鍵軟硬體和生态體系建設短闆,大陸人工智能産業仍需進一步加強産學研合作,鼓勵大模型開源開放的同時,加強自主創新研發。

大模型即将帶來産業應用新變革

“當下我們正處在一個全新的起點,這是一個以大模型為核心的人工智能新時代,大模型改變了人工智能,也即将改變世界。”在2023中關村論壇全體會議上,百度CEO李彥宏表示,越來越多的人認可第四次産業革命正在到來,革命的标志就是人工智能,因為大模型成功地壓縮了人類對于整個世界的認知,讓人們看到了實作通用人工智能的路徑。

創新工場董事長、首席執行官李開複也表示,“AI大模型是一個絕對不能錯過的曆史機遇,是有史以來最大的一個平台”。通過發展 AI 大模型,中國可以推動創新産業的發展,帶動經濟增長,實作科技與經濟的雙重紅利。

李開複表示,大模型已經慢慢走向實體經濟,随之而來的AI 2.0時代将推動AI-first應用的發展,從生産力和娛樂領域開始,颠覆如搜尋引擎、電商、金融、教育、影視娛樂、醫療、遊戲等諸多行業,重構人類的工作,很多重複性的勞動會被取代。

21世紀經濟報道記者在會上了解到,大模型産業化應用正逐漸适配各行各業的實際需求,基本上沿着兩條路徑發展。

第一種是通用類大模型持續拓展應用領域,文心一言、通義千問、紫東太初、星火認知等中國一批通用化大模型正在快速發展,打造跨行業通用化人工智能能力平台,其應用行業正在從辦公、生活、娛樂向醫療、工業、教育等加速滲透。

第二種是垂直領域專業類大模型不斷深化落地,一批針對生物醫藥、遙感氣象等垂直領域的專業大模型發揮其領域縱深優勢,提供針對特定業務場景的高品質專業化解決方案。

新一代人工智能産業技術創新戰略聯盟秘書長、北京智源人工智能研究院院長黃鐵軍在接受21世紀經濟報道記者采訪時指出,未來三年,模型一定會從語言擴散到視覺、聽覺、具身、行動、機器人、自動駕駛等方向。“此前預期的純無人駕駛還有包括機器人進入制造業、家庭有可能在幾十年内發生,人和AI互相融合來降低以往産品的生産成本,也會發展全新的産品和服務,這會是一段和諧共生的好日子”。

14省已開展大模型研發

本次論壇上,科技部新一代人工智能發展研究中心釋出了《中國人工智能大模型地圖研究報告》(下稱《報告》)。據不完全統計,到目前為止,中國10億參數規模以上的大模型已釋出79個,14個省市/地區都在開展大模型研發,主要集中在北京、廣東兩地,其中北京38個,廣東20個。

“北京、廣東、浙江、上海等地的大模型數量最多,這4地也是近三年人工智能伺服器采購數量最高的地區。各地也在通過提供公共算力的方式補充快速增長的人工智能算力需求,為大模型研發提供更多算力支援。”中國科學技術資訊研究所所長、科技部新一代人工智能發展研究中心主任趙志耘建議,後續應當加強智算中心、超算中心、雲計算中心等計算資源的統籌,制定公共資料共享目錄和共享規則,推動資料分級分類有序開放。

值得注意的是,北京市已經在5月份啟動“北京市通用人工智能産業創新夥伴計劃”,以推進人工智能大模型研發和應用,賦能千行百業數智化轉型,同時還釋出了《北京市促進通用人工智能創新發展的若幹措施(2023-2025年)(征求意見稿)》,從算力、資料、算法、應用、監管五大方向,對北京大模型發展提出了21項措施。這或将成為國内首個地方政府緊貼AI大模型産業化發展提出的專項措施。

“北京發展AI的優勢在于要素最全,能夠有效整合資源,但這也不是北京一個城市的事情,而是全國乃至全球性的龐大産業生态。”黃鐵軍表示,各地在支援人工智能産業的過程中一定要注意産業協同,企業也不能用原來的産品思維方式來謀劃大模型研發,創新需要差異化,不宜一哄而上。

李開複表示,AI 2.0市場預計将是移動網際網路規模的10倍,容納得下巨頭、中小企業、初創公司在三個層級的賽馬,期待形成巨頭、中小微創新企業一起發展的“創新綜合體”。

《報告》顯示,在研發主體分布上,大學、科研機構、企業等不同創新主體都在參與大模型研發,學術界和産業界之間的聯合研發仍不足。在模型領域分布上,自然語言處理仍是目前大模型研發最活躍的重點領域,其次是多模态領域,在計算機視覺和智能語音等領域的大模型還較少。

趙志耘表示,大模型技術仍處于發展初期,潛在的基礎理論和技術創新空間巨大,通過蒸餾、量化等小型化技術實作模型“瘦身”,為大模型小型化、綠色化發展提供技術支撐,進一步加強産學研合作,鼓勵大模型開源開放,也将加速大模型技術進步。

開源開放與自主創新并進

縱觀全球,打造人工智能生态,有開源和閉源兩種路線。中國科學院院士、中國計算機學會開源發展委員會主任王懷民介紹,大模型因其不确定性形成開源模式和預研模式同時推進的基本格局。

對于人工智能生态建設,科技部副部長吳朝晖在2023中關村論壇上表示,中國堅持開源協作,加強大模型技術持續創新,協同解決透明性、穩定性等共性問題,進一步推動算力資源和數字資源開放共享,加快形成大模型的産業生态。

黃鐵軍表示,開源是大模型的未來,需要不斷加強協同創新。近期大模型熱潮席卷全球之後,開源開放的活力被進一步激發,開源開放正在成為塑造人工智能未來發展的主導力量。中國的開源經過30多年的發展也一定進入了蓄勢發展的新階段。

從政策層面看,2017年,中國釋出《新一代人工智能發展規劃》,将開源、開放作為基本原則寫入了規劃。科技創新2030——“新一代人工智能”重大項目也提出引導鼓勵國家項目支援研發成果開放共享,依托人工智能頭部企業建設國家新一代人工智能開放創新平台,建構開放生态、推動行業發展。

《報告》顯示,從開源創新生态上看,大模型中,已有半數以上大模型開源,北京、廣東、上海三地開源數量和開源影響力均居國内前三。高校/科研機構是開源主力。清華大學的ChatGLM-6B、複旦大學的MOSS以及百度的文心系列大模型開源影響力最高。

目前,百度、華為、阿裡、科大訊飛等中國科技企業在開放人工智能的架構和模型方面積極參與工作。百度首席技術官王海峰在論壇期間表示,得益于百度在人工智能技術領域的全面布局和技術積累,尤其是飛槳深度學習平台和文心大模型的聯合優化,文心一言在一個多月時間内推理性能提升了近10倍,效率更高,效果更好。

不過,此前在全球大火的ChatGPT,在ChatGPT2釋出之後,OpenAI對其實行閉源發展。會上也有不少業内人士強調,開源開放的同時仍要堅持自主創新。

“支援開源,但不能過度依賴開源模型”,李開複在接受媒體共同采訪時指出,開源模型無法達到國外大廠自研模型的性能,開源模型的能力會成為“天花闆”。海外大廠的開源技術也存在關閉風險,另外由于國内外文化、使用者習慣和法律法規不同,将國外訓練好的模型帶到國内進行微調是存在風險的。

“中國大模型公司不應再依賴于他人的開源模型,需要盡快建立自己的IP和技術優勢,形成護城河。”李開複說。

中國工程院院士、中國人工智能學會理事長戴瓊海指出,中國已成為全球最大的人工智能應用市場,人工智能應用技術整體水準與美國相當,但也需要注意人工智能頭部企業與美國仍存在差距,大部分人才集中于應用層,而在基礎性技術上則明顯處于弱勢。未來應從政策、機制和投入上深化人工智能的人才培養和基礎研究,強化原始創新,避免陷入“無源之水”困境。

更多内容請下載下傳21财經APP

繼續閱讀