天天看點

秒懂:圖解人工智能訓練及工作過程(中文流程圖)

作者:AI新動力

為了友善大家從整體了解人工智能訓練的過程,避免因為過多的概念影響對整體的了解,我們繪制了這張流程圖。

秒懂:圖解人工智能訓練及工作過程(中文流程圖)

人工智能訓練過程圖

  1. 資料收集:收集用于訓練的資料,輸出原始資料(未經處理的資料集)
  2. 資料預處理:清洗和格式化資料,輸出預處理資料(适合模型訓練的資料)
  3. 模型初始化:設定模型的初始參數,輸出初始化模型(設定初始參數的模型)
  4. 模型訓練:使用資料訓練模型,輸出訓練模型(經過一輪訓練的模型)
  5. 模型評估:評估模型的性能,輸出評估結果(模型的性能名額)
  6. 模型優化:根據評估結果優化模型,輸出優化模型(經過優化的模型)
  7. 模型部署:将模型應用于實際環境,輸出最終模型(滿足要求的模型)

下圖是ChatGPT的工作流程簡圖:

秒懂:圖解人工智能訓練及工作過程(中文流程圖)

ChatGPT工作流程簡圖

一、使用者輸入:使用者提供的原始輸入。

二、輸入處理:處理使用者的輸入,準備送入模型。

  1. 分詞器:将輸入的文本分解為可以被模型了解的小塊(token)。
  2. Tokenization:将輸入的文本轉換為token的過程。

三、ChatGPT模型:接收處理後的輸入,開始生成回複。

  1. Transformer模型:ChatGPT模型的核心部分,用于了解輸入和生成回複。
  2. 自注意力機制:Transformer模型的關鍵部分,用于了解輸入中的各個部分之間的關系。
  3. 多頭注意力:自注意力機制的一部分,允許模型同時關注輸入的多個部分。
  4. 縮放點積注意力:多頭注意力的一部分,計算輸入部分之間的關系。
  5. 生成回複:根據了解的輸入和學習到的模式,生成回複。

四、輸出處理:處理模型生成的輸出,準備展示給使用者。

  1. 反分詞器:将模型生成的token重新組合成人類可讀的文本。
  2. Detokenization:将token轉換回文本的過程。

五、使用者看到回複:使用者看到最終的回複。

秒懂:圖解人工智能訓練及工作過程(中文流程圖)

Token樣例

繼續閱讀