从零开始机器学习-基础参数
基础参数
learning rate: 学习率
步长,用来控制参数更新的幅度。
每次训练更新参数时,参数的更新幅度为:learning rate * gradient
。
学习率用于控制参数更新的幅度,如果学习率过大,可能会导致参数更新过大,导致模型无法收敛;如果学习率过小,可能会导致参数更新过小,导致模型收敛速度过慢。
例如:有3个点 A, B, C。之间间隔是0.01, B点为最优解,但是如果学习率太高,步长太长,可能会直接跳过B,直接到达C。
gradient: 梯度
目标函数的偏导数,用来表示参数更新的方向。
iteration: 迭代次数
epoch: epoch
周期,一次完整的训练过程,包括前向传播、反向传播、参数更新。
batch size: batch size
每次训练的样本数。
weight: 权重
矩阵中的每个元素,用来表示输入和输出之间的关系。