畅想小说网

第一节 分类问题及其评价(第3页)

天才一秒记住【畅想小说网】地址:http://www.cxtra.net

真负例(Tives):负类样本(称为负例)被正确预测为负例;

假正例(FP,FalsePositives):负例被错误预测为正例;

假负例(Fives):正例被错误预测为负例。

例如,在客户分类问题中,以优质客户为正,那么如果优质客户被错误预测为非优质客户就是一个假负例。

混淆矩阵中的数值之间显然存在如下关系。

TP+FN+FP+TN=P+N=P'+N'=样本总数

建立了混淆矩阵后,就可以使用它来计算一些分类器的评价指标了。

(1)准确率

准确率是最常用的评价指标,指分类正确的样本数占样本总数的比例。

通常情况下,当然是正确率越高的分类器,分类性能越好。

(2)错误率

错误率是对应于准确率的另一个常用指标,指分类错误的样本数占样本总数的比例,显然正确率和错误率的和等于1,即

错误率越高的分类器,当然性能越差。

(3)精度

精度(pre)又叫查准率,表示预测为正例的样本中真正例所占的比例。

一般认为查准率越高,模型的性能越好。

(4)灵敏度

灵敏度又叫查全率、召回率(recall)、真正率(TPR),表示所有正例中被正确预测为正例的比例。

灵敏度越高,模型性能越好。

(5)假正率

假正率表示被错误预测为正例的样本(实际为负例)占所有负例的比例。

假正率越高,模型性能越差。

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

重生八八从木匠开始怪谈作者拖更日记这个修士很危险江山美人志从呆毛王开始公开处刑大道朝天洪荒:我,龙族老祖,绝不出关!英雄联盟之灾变时代我家可能有位大佬我家世显赫,躺平不过分吧!猎人:我真不是除念师万道成神藏锋皇兄万岁崇祯大明:从煤山开始齐天大圣之无限吞噬暗夜通灵王妃每天都想和离反贼平天下官途,搭上女领导之后!老中医的美满生活我家老婆可能是圣女直播写纯爱文的我在虫族封神傲世九重天掌门人不高兴