鸟语天空
感知机
post by:追风剑情 2026-3-16 10:25

内积

感知机是一种二分类方法,找出一条能将数据分割开的直线,如下图。

1111.png

基本思路:通过寻找法线来得到直线。设权重向量 w (英文单词weight的首字母),并且使权重向量成为法线。权重向量就是我们想要知道的未知参数。将每组训练数据看作向量 x。那么直线可表示为w与x的内积形式:

$$ \mathbf{w} \cdot \mathbf{x} = |\mathbf{w}| \cdot |\mathbf{x}| \cdot \cos\theta = 0 $$

实向量空间的内积是各相应元素乘积之和,所以上面的表达式也可以写成这样:

$$ \mathbf{w} \cdot \mathbf{x} = \displaystyle\sum_{i=1}^{n}w_ix_i = 0 $$

内积是衡量向量之间相似程度的指标。结果为正,说明二者相似;为0则二者垂直;为负则说明二者不相似。

总结:通过训练找到权重向量,然后得到与这个向量垂直的直线,最后根据这条直线就可以对数据进行分类了。

222.png

感知机

感知机是接受多个输入后将每个值与各自的权重相乘,最后输出总和的模型。如下图所示。

333.png

从上图可以看出感知机的原理就是向量内积。

感知机是非常简单的模型,基本不会应用在实际的问题中。但它是神经网络和深度学习的基础模型。

感知机的判别函数

$$ f_w(x)= \left\{ \begin{aligned} 1 \quad (\mathbf{w} \cdot \mathbf{x} \ge 0)\\ -1 \quad (\mathbf{w} \cdot \mathbf{x} < 0) \end{aligned} \right. $$

权重向量的更新表达式。

$$ \mathbf{w}:= \left\{ \begin{aligned} \mathbf{w} + y^{(i)}\mathbf{x}^{(i)} \quad (f_w(x^{(i)}) \neq y^{(i)})\\ \mathbf{w} \quad (f_w(x^{(i)}) = y^{(i)}) \end{aligned} \right. $$

i 指训练数据的索引。$y^{(i)}$ 指实际值,$f_w(x^{(i)})$ 指预测值。用这个表达式重复处理所有训练数据,更新权重向量。

评论:
发表评论:
昵称

邮件地址 (选填)

个人主页 (选填)

内容