1.用于逻辑回归的梯度学习算法
2.过拟合问题
我们用以下三张图来说明这个概念。
第一张图看起来像是一个线性回归问题,我们训练之后的线条与数据拟合性很差,这就叫做欠拟合;
第二张看起来与数据拟合的刚刚好,即使有一个新的数据,好像也可以预测出比较准确的答案。
第三张图的线条则穿过了所有的数据,好像是为了连接数据而连接,这种就叫做过拟合,就是过于针对于训练数据而拟合,而如果有一个新的数据进来很可能导致训练出来的数据与之前相差较大。
下面是三个例子,更加说明和展示了三种不同拟合形态的情况。
3.解决过拟合问题
3.1 通过加入更多的数据来验证训练
但是存在一个问题,假如你没有更多的数据就没办法了
3.2 减少一些特征
问题: 你无法精确的判断哪些特征是完全没用的,假如有些特征是对结果有影响的,那么减少的是这些重要的特征,那么结果当然就不对了。