天天看點

AIGC将促進嵌入式人工智能發展

作者:芯思維

AIGC 簡介

AIGC(Artificial Intelligence Generated Content),又稱為“生成式AI”(Generative AI),是人工智能生成内容的意思。從内容創作的方式來看,AIGC被認為是繼專業生成内容(Professional Generated Content, PGC)和使用者生成内容(User Generated Content,UGC)之後,利用人工智能技術一種新型的内容創作方式。目前,AIGC已了廣泛應用于文字創作、圖像創作、視訊創作、音樂創作 、代碼生成等領域。

AIGC的模态

生成式人工智能系統是通過對資料集進行無監督或自監督的機器學習來建構的,其功能或能力取決于所用資料集的模态或類型。目前,AIGC的主要的模态有以下幾種:

文本:基于單詞或單詞标注訓練的生成式人工智能系統能夠進行自然語言處理、機器翻譯和自然語言自動生成,也可以用作其他任務的基礎模型。這類人工智能系統包括GPT-3、LaMDA、LLaMA、BLOOM、GPT-4等。

代碼:大規模模型在程式設計語言文本上進行訓練,進而生成新的計算機程式源代碼,例如:OpenAI、Codex、Copilot等。

圖像:在帶有文本說明的圖像集上訓練的生成式人工智能系統,通常用于文本到圖像的生成和神經風格轉換。主要包括Imagen、DALL-E、Midjourney、Stable Diffusion等。

分子:生成式人工智能系統還可以在氨基酸序列或分子表征上進行訓練,用于蛋白質結構預測和藥物研發。例如代表DNA或蛋白質的SMILES(Simplified molecular input line entry system),SMILES是一種用ASCII字元串明确描述分子結構的規範。

音樂:基于錄制音樂的音頻波形以及文本注釋進行訓練的生成式人工智能系統,根據文本描述生成新的音樂樣本,如MusicLM等。

視訊:在帶有注釋的視訊上訓練的生成式人工智能可以生成時間相幹的視訊剪輯。如RunwayML的Gen1和Meta Platforms的 Make-A-Video等。

多模态:生成式人工智能系統可以由多個生成模型建構,或者一個模型在多種類型的資料上訓練。例如OpenAI的GPT-4的一個版本可以同時接受文本和圖像輸入。

内容的創作方式

随着網際網路及技術的發展,網際網路内容産生的方式也在不斷地發展,從PGC發展到UGC,再發展到了AIGC。

PGC (Professionally Generated Content),也稱為PPC(Professionally-produced Content),即專業生産内容,由傳統廣電業者按照與電視節目的方式進行内容制作。PGC内容制作專業,内容品質有保證。

UGC(User Generated Content),即使用者生産内容,使用者可以自由上傳内容,内容豐富,但内容品質參差不齊。

AIGC(Artificial Intelligence Generated Content),即人工智能生成内容,又稱為“生成式AI”(Generative AI),一種人工智能 (AI) 系統,内容由AI自動生産。AIGC能夠根據提示生成文本、圖像或其他媒體。

AIGC技術的應用大大提升了人類内容創作的生産力,湧現出了各種各樣新的産品和服務。人與機器的互動方式發生了重要的變化,計算的機器具有了人類大腦的功能,可以“思考”生成更符合人類思考邏輯的内容,内容的創作不再依賴于人類,而是由機器自動産生,内容創作者由人轉變成了機器。

AIGC如同嬰兒一樣,在成長,在發展,開始像人類一樣”思考”了,具有了人類大腦思考能力的基本雛形。在某些方面,超過了個人的知識和認知。假以時日,AIGC會變得越來越智能。

AIGC系統

AIGC系統大緻可分為幾個部分:計算平台、網絡、資料集、大模型算法等。

計算平台:大模型訓練需要大量的計算資源,計算平台為大模型的訓練提供了硬體和軟體支援。随着硬體裝置的不斷更新,計算平台的算力會不斷提升。根據資料顯示,ChatGPT的總算力消耗約為3640PF-days(即假如每秒計算一千萬億次,需要計算3640天),需要7至8個投資規模30億、算力500P的資料中心才能支撐運作。

網絡:網際網路源自計算機間的聯網。一方面,大模型算法可以分成多個部分,通過網絡,分别在不同的計算機節點上進行計算,進而提高模型的訓練和推理效率;另一方面,網際網路以及蜂窩移動網絡的普及和發展,個人電腦(PC)、筆記本電腦(NB)以及智能手機和平闆電腦等終端裝置拓展了大模型算法的應用。

資料集:大模型算法需要使用大量的資料來訓練,資料集規模越來越大。随着應用的不斷發展,資料将扮演着越來越重要的角色,成為人工智能應用的核心要素,并推動人工智能應用資料驅動發展新模式。

大模型算法:大模型算法是指使用大規模資料集訓練的深度學習模型。目前,一些大規模的預訓練語言模型的參數規模已經達到了數百萬甚至數十億級别。

嵌入式人工智能

随着生成式人工智能的發展和應用的不斷拓展延伸,這将會進一步促進嵌入式人工智能的應用和發展。與生成式人工智能系統類似,嵌入式人工智能系統也可以分為:計算、網絡、資料集、小規模人工智能算法等。

計算。微控制器(MCU)或微處理器(MPU)是嵌入式人工智能基礎核心的電腦件。MCU/MPU性能不斷地提升,成本不斷地降低,為嵌入式人工智能提供了執行複雜任務的計算能力。由于MCU/MPU具有低功耗、低成本,并且具有豐富的外設接口,還可以友善地與傳感器、執行器等外部裝置進行連接配接,大大拓展了小規模人工智能的應用。

網絡。物聯網不斷持續地發展為人工智能應用提供了契機。物聯網的應用使得越來越多的終端裝置接入了網絡,産生了大量資料,并非将全部資料都上傳雲計算伺服器,可以在本地執行一些資料處理任務,處理結果再上傳,這樣優化了網絡應用,降低了資源消耗。這些應用可以更好地利用人工智能技術實作更加高效、精準和智能的應用,為人工智能技術的發展和應用帶來了更多的可能性。物聯網絡也友善了微控制器(MCU)或微處理器(MPU)固件更新,使得嵌入式人工智能算法持續疊代更新。

資料集。資料集是嵌入式人工智能訓練重要的資料資源,需要大量的資料來訓練嵌入式人工智能算法。不同的行業不同的應用具有不同的特征資料集,嵌入式人工智能應用展現出了專用性的特點。

小規模人工智能算法。小規模人工智能算法是一種用于深度學習的架構,隻有一個或有限的輸入特征,适用于一些簡單的任務,如語音識别、圖像分類等以及需要限制模型複雜度的場景等。目前,常見的小規模人工智能有:TensorFlow Lite、Keras、ONNX、PyTorch、scikit-Learn等。

裝置終端或邊緣裝置通過網絡與計算中心進行分布式協同計算、會形成更為廣泛的智能化計算網絡,賦予應用更強大的能力。

小結

人工智能為内容生成提供了多模态化的工具,機器具有了一定的人類思考能力,内容創作者也由人變成了機器。從Web 1.0 到 Web 2.0,再發展到Web 3.0,網絡呈現出了智能化、分布式等特點。物聯網、區塊鍊、數字孿生等新技術的不斷應用,為人工智能應用提供了新的應用場景。

AIGC将會促進嵌入式人工智能的應用發展。成本效益越來越高的微控制(MCU)或微處理器(MPU),為嵌入式人工智能提供了核心的計算動力。嵌入式人工智能将會大大提升自主計算的智能化水準,借由網路進行更好的分布式計算資源管理。嵌入式人工智能應用将會更加普遍,更加普适智能的産品将會賦能千行百業。

繼續閱讀