BGD批量梯度下降,每一輪疊代所有的樣本,對于樣本數過多的情況,時間會比較長,準确度比較高 SGD随機梯度下降,每次疊代,隻選取一部分樣本,得到的可能不是最優解 MBGD小批量梯度下降算法,選取樣本為一個固定值B(一般b=10 ),