天才一秒记住【畅想小说网】地址:http://www.cxtra.net
真负例(Tives):负类样本(称为负例)被正确预测为负例;
假正例(FP,FalsePositives):负例被错误预测为正例;
假负例(Fives):正例被错误预测为负例。
例如,在客户分类问题中,以优质客户为正,那么如果优质客户被错误预测为非优质客户就是一个假负例。
混淆矩阵中的数值之间显然存在如下关系。
TP+FN+FP+TN=P+N=P'+N'=样本总数
建立了混淆矩阵后,就可以使用它来计算一些分类器的评价指标了。
(1)准确率
准确率是最常用的评价指标,指分类正确的样本数占样本总数的比例。
即
通常情况下,当然是正确率越高的分类器,分类性能越好。
(2)错误率
错误率是对应于准确率的另一个常用指标,指分类错误的样本数占样本总数的比例,显然正确率和错误率的和等于1,即
错误率越高的分类器,当然性能越差。
(3)精度
精度(pre)又叫查准率,表示预测为正例的样本中真正例所占的比例。
一般认为查准率越高,模型的性能越好。
(4)灵敏度
灵敏度又叫查全率、召回率(recall)、真正率(TPR),表示所有正例中被正确预测为正例的比例。
灵敏度越高,模型性能越好。
(5)假正率
假正率表示被错误预测为正例的样本(实际为负例)占所有负例的比例。
假正率越高,模型性能越差。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!