深度学习基础-回归问题及正则化

下列关于梯度下降(Gradient descent )法的描述错误的是?

?A.通常会先初始化一组参数值, 在这个值之上,用梯度下降法去求出下一组的值。由于是梯度下降的,所以损失函数的值在下降。当迭代到一定程度, 损失函数取值趋于稳定,此时的参数取值即为要求得的值

?B.其中的学习速率是模型参数,而不是超参数

?C.学习速率的选取很关键,如果学习速率取值过大,容易达不到极值点甚至会发散,学习速率太小容易导致收敛时间过长

?D.梯度下降是利用一阶的梯度信息找到代价函数局部最优解的一种方法