第一节分类问题及其评价（第3页）

天才一秒记住【畅想小说网】地址：http://www.cxtra.net

真负例（Tives）：负类样本（称为负例）被正确预测为负例；

假正例（FP，FalsePositives）：负例被错误预测为正例；

假负例（Fives）：正例被错误预测为负例。

例如，在客户分类问题中，以优质客户为正，那么如果优质客户被错误预测为非优质客户就是一个假负例。

混淆矩阵中的数值之间显然存在如下关系。

TP+FN+FP+TN=P+N=P'+N'=样本总数

建立了混淆矩阵后，就可以使用它来计算一些分类器的评价指标了。

（1）准确率

准确率是最常用的评价指标，指分类正确的样本数占样本总数的比例。

即

通常情况下，当然是正确率越高的分类器，分类性能越好。

（2）错误率

错误率是对应于准确率的另一个常用指标，指分类错误的样本数占样本总数的比例，显然正确率和错误率的和等于1，即

错误率越高的分类器，当然性能越差。

（3）精度

精度（pre）又叫查准率，表示预测为正例的样本中真正例所占的比例。

一般认为查准率越高，模型的性能越好。

（4）灵敏度

灵敏度又叫查全率、召回率（recall）、真正率（TPR），表示所有正例中被正确预测为正例的比例。

灵敏度越高，模型性能越好。

（5）假正率

假正率表示被错误预测为正例的样本（实际为负例）占所有负例的比例。

假正率越高，模型性能越差。

本章未完，请点击下一章继续阅读！若浏览器显示没有新章节了，请尝试点击右上角↗️或右下角↘️的菜单，退出阅读模式即可，谢谢！

第一节 分类问题及其评价（第3页）