机器学习算法A会看资料D和假设集合H,然后在H里面选一个g。现在我们来看机器是如何处理是非题。(二分类)
What hypothesis can we use?
那么我们的来看一个模型,看看这个H长什么样。
x = (x1,x2,...,xd),这些是features of customer, 乘上一个权重w,来计算score。
y:{+1(good),-1(bad)}。
通过将右边的threshold移到左边就可以知道,如果左边项 > 0,那么 y=1;如果左边项 < 0,那么y=-1。这也可以用sign函数来表示。(这里如果左边项 = 0,其实这个不重要,y可以随便等于1或者-1)
上面的这个公式叫做感知机Perceptron,h与w和threshold有关,不同的w与threshold取值就可以确定不同的h。(w是一个矩阵)
下面进行一个符号上的简化。
具体来看一下h。
x:在平面上的点(这个点在d维空间里)
y:O(+1),X(-1)
h:lines(或者是在d维空间里的超平面)
h的一边是预测成+1,另一边是预测成-1。
(问题:这里的h是H吗?这里的d维空间或者d+1维空间需要分得很清楚吗,因为前面刚才提到过x0和w0)
习题:
答案是2。+1代表的spam。如果想要很大的权重,说明这些单词在spam里面经常出现的。