畅想小说网

第一节 分类问题及其评价(第1页)

天才一秒记住【畅想小说网】地址:http://www.cxtra.net

第一节分类问题及其评价

banner"

>

分类是具有一定智力水平的动物在进化过程中普遍掌握的一项技能。

例如,非洲草原上的狮子,可以在奔跑的猎物中辨别出其中体弱而不善于奔跑的,优先进行捕杀;天空自由翱翔的鸟儿回巢时可以在空中准确地区分出众多鸟巢中哪个是自己的家;作为万物之灵的人类,分类能力就更加强大,识别不同类的食物、选择不同的衣服、区分性格后和喜欢的人交友、工作中将各种事务分门别类进行处理等都是在进行分类。

尝试让计算机学习人类的“分类”

能力,使得机器能够对特定数据实现分类,这就是分类问题。

人工智能领域的大量问题最后都归结为某种形式的分类问题,所以分类问题是人工智能领域中最重要的一类问题。

关于它的研究历史很长,在此过程中,各种基础的分类算法不断改进旧版本的不足,提升分类效率,演化出众多新的算法。

本教材将着重介绍其中几种原理简单,但是依然很流行、很有效的基本分类算法。

追本溯源,众多分类算法的核心思想其实并不复杂,掌握了其中的基本想法,今后学习基于此演化出的新算法也就不难了。

首先以电商客户数据为例,介绍描述分类问题需要的基本概念。

(1)特征属性

通常特征属性有很多个,也称为变量或者维度,每个特征属性相当于示例表格中的一列,特征属性的取值称为属性值,属性值可以是具体数字,也可以是描述性的文字。

(2)样本

样本相当于表格中的一行,包含很多属性值。

(3)类别标记

类别标记是对包含属性值的样本进行鉴别后给出的这个样本所属的类别。

类别标记在表格中也是一列,表明各个样本属于哪一类。

(4)训练数据

通常分类问题是通过具有类别标记的数据来解决的,这样的数据称为训练数据。

在训练数据中除了记录每个样本的属性值,还标明了每个样本所属的类别,训练数据是对未知数据进行分类的数据基础。

(5)分类

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

大国航空我的人生可以无限模拟浴火焚神我在末日文字游戏里救世仙父重生八八从木匠开始灵气复苏:签到终极修炼天赋直播:艾泽拉斯远东1628天医出狱道君人生交换游戏大魏霸主修罗天帝星际:炎黄崛起神级天才修仙,从长生不死开始崩坏星河斗罗大陆之弑神斗罗重生朱允熥,打造大明巅峰半岛检察官【快穿】满级祸水成了小可怜重生七十年代:勒少,强势宠吞天帝尊真千金她是全能大佬