有些开发者在训练神经网络模型的时候,会出现这样以下的情况:
模型在训练数据上的准确度非常的高,近乎100%的准确率,但在测试集上的准确率,在接近280次迭代的位置就不再明显上升,在82.25%周围不断波动,我们的网络在280次迭代后就不再能够推广到测试数据上了,所以这不是一个有用的学习,我们说网络在280次迭代后就过度拟合了,因为学习到的超参数过于符合训练数据的特征,不能有效泛化到其他的数据集合上。
有些开发者在训练神经网络模型的时候,会出现这样以下的情况:
模型在训练数据上的准确度非常的高,近乎100%的准确率,但在测试集上的准确率,在接近280次迭代的位置就不再明显上升,在82.25%周围不断波动,我们的网络在280次迭代后就不再能够推广到测试数据上了,所以这不是一个有用的学习,我们说网络在280次迭代后就过度拟合了,因为学习到的超参数过于符合训练数据的特征,不能有效泛化到其他的数据集合上。