《python机器学习》6.5.1 读取混淆矩阵_python机器学习全本免费在线阅读

在我们详细讨论不同评分标准之前，先绘制一个所谓的混淆矩阵（confusion matrix）：即展示学习算法性能的一种矩阵。混淆矩阵是一个简单的方阵，用于展示一个分类器预测结果——真正（true positive）、真负（false negative）、假正（false positive）及假负（false negative）——的数量，如下图所示：

虽然这指标的数据可以通过人工比较真实类标与预测类标来获得，不过scikit-learn提供了一个方便使用的confusion_matrix函数，其使用方法如下：

在执行上述代码后，返回的数组提供了分类器在测试数据集上生成的不同错误信息，我们可以使用matplotlib中的matshow函数将它们表示为上图所示的混淆矩阵形式：

下图所示的混淆矩阵使得预测结果更易于解释：

在本例中，假定类别1（恶性）为正类，模型正确地预测了71个属于类别0的样本（真负），以及40个属于类别1的样本（真正）。不过，我们的模型也错误地将两个属于类别0的样本划分到了类别1（假负），另外还将一个恶性肿瘤误判为良性的（假正）。在下一节中，我们将使用这些信息计算不同的误差度量。