最近剛開始做RLHF（從人類回報中做強化學習），訓練的最終的模型總是一團糟，這幾個訓練名額到底是不是正常的啊😥，網上能找

作者：長三角彭于晏 2023-08-29 19:09:00

最近剛開始做RLHF（從人類回報中做強化學習），訓練的最終的模型總是一團糟，這幾個訓練名額到底是不是正常的啊😥，網上能找的資訊太少了。#大語言模型 #RLHF

最近剛開始做RLHF（從人類回報中做強化學習），訓練的最終的模型總是一團糟，這幾個訓練名額到底是不是正常的啊😥，網上能找

最近剛開始做RLHF（從人類回報中做強化學習），訓練的最終的模型總是一團糟，這幾個訓練名額到底是不是正常的啊😥，網上能找

最近剛開始做RLHF（從人類回報中做強化學習），訓練的最終的模型總是一團糟，這幾個訓練名額到底是不是正常的啊😥，網上能找

大語言模型語言模型

上一篇: 日本新自由主義與勞工階級的結構性分化

下一篇: “不穿内衣，活該被偷拍”刻闆印象下女性需要的不僅是穿衣自由

繼續閱讀