我感觉用logistic回归的思想来解释神经网络比较切合。以二分类为例:
X表示样本;C表示类别,表示概率。
已知如下:
当时属于类,
当时属于类.
由于是二分类问题,可以将上式继续简化
时属于类,
时属于类,
上述公式是分类问题的描述,但是这个公式还有一个问题需要处理,由函数图像可知,在0和1附近的值太小和太大将函数图像的波动掩盖了,所以需要加上对数,。
下面引入logitic regression(LR)和神经网络。
-
LR(欢迎讨论,根据自己理解定义的)
经过上述的讨论我们知道了要拟合的目标即:,使用来拟合的话就是LR模型,推导如下:
由二分类可知,
以上也可与推广到多分类。
-
神经网络
神经网络也是在拟合,只不过神经网络表示的函数要复杂的多,加个星号表示的是广义的。