1、如何得到好的预测效果或者分类效果,除了尝试如下图所示的方法外,下面还有降到其他方法
2、不论是预测还是分类问题,大都是通过以下过程来评价假设函数的(即计算测试集的误差平方和)
3、没听懂model selection这节课中,多项式中最高次数的选择时用测试集来你和参数d这块儿,为什么说是测试集来拟合的d(多项式次数)???
哦,明白了,此处过程是这样的:首先用各个多项式的训练集的代价函数值最小得到各自的theta参数(theta1、theta2...),然后把得到的相应的theta参数带入到测试集代价函数中,以值最小的来确定假设函数的次数应该是几。但是具体来说,这个过程是通拟合测试集来确定d的。但是这样的话并不公平,在遇到新的样本时并不一定有很好的预测效果,故此处要把数据分为三部分:训练集、(交叉)验证集、测试集,用验证集代替刚刚测试集的作用,测试集仅仅是测试集的作用
4、没理解diagnosing Bias vs. Varience这节课
哦,明白了:由第一个图可知什么是高偏差、什么是高方差
d值较小时会出现高偏差问题,此时交叉验证集和训练集的代价函数值都会很高;而d值过大时,训练集代价函数值会很低,而交叉验证集会相对于训练集误差大很多,正如第三个图所示