深度学习 – 梁笔记

深度学习基础-回归问题及正则化

下列关于梯度下降（Gradient descent ）法的描述错误的是?

?A.通常会先初始化一组参数值, 在这个值之上，用梯度下降法去求出下一组的值。由于是梯度下降的，所以损失函数的值在下降。当迭代到一定程度，损失函数取值趋于稳定，此时的参数取值即为要求得的值

?B.其中的学习速率是模型参数，而不是超参数

?C.学习速率的选取很关键，如果学习速率取值过大，容易达不到极值点甚至会发散，学习速率太小容易导致收敛时间过长

?D.梯度下降是利用一阶的梯度信息找到代价函数局部最优解的一种方法

为了在python程序中进行英文自然语言的处理，如词语切分（Tokenization）词干提取（Stemming）等工作，需要使用的导入模块语句通常为：?

?A.import nltk

?B.import matplotlib.pyplot as plt

?C.import numpy as np

?D.from sklearn import svm, datasets

机器学习（深度学习）系统中通常将数据集划分为训练集和测试集，其中被用来学习得到系统的参数取值的是

?A.测试集(testing set)

?B.训练集(training set)和测试集(testing set)

?C.训练集(training set)

?D.其它答案都不对