畅想小说网

第二节 单层感知器与线性分类(第1页)

天才一秒记住【畅想小说网】地址:http://www.cxtra.net

第二节单层感知器与线性分类

banner"

>

单层感知器适用于解决线性可分问题,这是前文反复提到的分类问题的一种。

简单地说,当平面上的两类数据可以用一条直线(称为决策边界)分开时,就称其为线性可分的,如图6-3所示。

在这一节,将以一个简单的线性分类问题为例,介绍感知器的学习算法。

图6-3

这个实例所采用的数据集来自机器学习领域的经典数据集——鸢尾花数据集(Iris数据集)。

在各种分类问题中,经常会采用这个数据集作为训练数据和测试数据。

相应的数据可从教材的资源平台下载。

下载数据后打开,会发现该数据集包括3类共150条数据,其中每类各含50条数据。

这3类数据描述了山鸢尾(irissetosa)、杂色鸢尾(irisversicolour)和弗吉尼亚鸢尾(irisvirginica)3种鸢尾花的4个特征属性,分别是花萼长度(SepalLength)、花萼宽度(SepalWidth)、花瓣长度(PetalLength)和花瓣宽度(PetalWidth)。

数据形式如表6-1所示。

表6-1

接下来的目标是使用感知器,通过在这个数据集上进行训练,给出一个分类器。

分类器根据一个未知类型的鸢尾花数据可以自动识别出它所属的鸢尾种类。

神经网络的学习过程,就是根据训练数据学习合适的连接权重,从而可以使用合适的连接权重来提取正确的类别特征。

什么叫作合适的连接权重呢?当然是当一组连接权重可以通过特征属性输出正确的类别时,就是合适的。

为了更简单地说明神经网络的学习法则,接下来只考虑两类鸢尾——山鸢尾和杂色鸢尾,把问题变成一个二分类问题。

用-1表示山鸢尾,用1表示杂色鸢尾。

每一个输入信息(即每一条数据)包含4个特征属性值和1个类别值。

两类数据一共有100条,可以写成

Χ={(x1,C1),(x2,C2),…,(x100,C100)}

其中表示这两个向量的内积。

使用上一节定义的函数作为激活函数,则感知器的输出为

此时输出的结果与这条数据对应的真实类别值不一定相符,这是因为初始的连接权重并不合适,所以需要对它进行调整。

接下来通过比较ci与y0来调整连接权重。

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

重生八八从木匠开始怪谈作者拖更日记这个修士很危险江山美人志从呆毛王开始公开处刑大道朝天洪荒:我,龙族老祖,绝不出关!英雄联盟之灾变时代我家可能有位大佬我家世显赫,躺平不过分吧!猎人:我真不是除念师万道成神藏锋皇兄万岁崇祯大明:从煤山开始齐天大圣之无限吞噬暗夜通灵王妃每天都想和离反贼平天下官途,搭上女领导之后!老中医的美满生活我家老婆可能是圣女直播写纯爱文的我在虫族封神傲世九重天掌门人不高兴