解析ROC曲线绘制(python+sklearn+多分类)

更新时间：2022年11月24日 09:54:58 作者：sinysama

这篇文章主要介绍了解析ROC曲线绘制(python+sklearn+多分类)，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教

ROC曲线绘制要点（仅记录）

1、ROC用于度量模型性能

2、用于二分类问题，如若遇到多分类也以二分类的思想进行操作。

3、二分类问题代码实现（至于实现，文档说的很清楚了:官方文档）

原理看懂就好，实现直接调用API即可

提取数据（标签值和模型预测值）

from sklearn.metrics import roc_curve, auc
fpr, tpr, thresholds = roc_curve(y_true,y_sore)
roc_auc = auc(fpr, tpr)
plt.title('Receiver Operating Characteristic')
plt.plot(fpr, tpr, '#9400D3',label=u'AUC = %0.3f'% roc_auc)

plt.legend(loc='lower right')
plt.plot([0,1],[0,1],'r--')
plt.xlim([-0.1,1.1])
plt.ylim([-0.1,1.1])
plt.ylabel('True Positive Rate')
plt.xlabel('False Positive Rate')
plt.grid(linestyle='-.')  
plt.grid(True)
plt.show()
print(roc_auc)

4、多分类问题代码实现

对于两个以上类的分类问题，

这里就有ROC的宏观平均（macro-average）和微观平均（micro-average）的做法了（具体查阅机器学习）

在这之前，我想肯定会有人想把每个类别的ROC的都绘制出来，实现起来，无非就是获得每个单类的标签值和模型预测值数据

不过你怎么解释呢？有什么意义呢？其实这个问题我也想了很久，查阅了很多文献，也没有个所以然。

PS：（如果有人知道，麻烦告知下~）

多分类的ROC曲线画出来并不难

具体如下

import numpy as np
import matplotlib.pyplot as plt
from scipy import interp
from sklearn.preprocessing import label_binarize
from sklearn.metrics import confusion_matrix,classification_report
from sklearn.metrics import roc_curve, auc
from sklearn.metrics import cohen_kappa_score, accuracy_score

fpr0, tpr0, thresholds0 = roc_curve(y_true0,y_sore0)
fpr1, tpr1, thresholds1 = roc_curve(y_true1,y_sore1)
fpr2, tpr2, thresholds2 = roc_curve(y_true2,y_sore2)
fpr3, tpr3, thresholds3 = roc_curve(y_true3,y_sore3)
fpr4, tpr4, thresholds4 = roc_curve(y_true4,y_sore4)


roc_auc0 = auc(fpr0, tpr0)
roc_auc1 = auc(fpr1, tpr1)
roc_auc2 = auc(fpr2, tpr2)
roc_auc3 = auc(fpr3, tpr3)
roc_auc4 = auc(fpr4, tpr4)

plt.title('Receiver Operating Characteristic')
plt.rcParams['figure.figsize'] = (10.0, 10.0) 
plt.rcParams['image.interpolation'] = 'nearest'
plt.rcParams['image.cmap'] = 'gray'
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False     
# 设置标题大小
plt.rcParams['font.size'] = '16'
plt.plot(fpr0, tpr0, 'k-',color='k',linestyle='-.',linewidth=3,markerfacecolor='none',label=u'AA_AUC = %0.5f'% roc_auc0)
plt.plot(fpr1, tpr1, 'k-',color='grey',linestyle='-.',linewidth=3,label=u'A_AUC = %0.5f'% roc_auc1)
plt.plot(fpr2, tpr2, 'k-',color='r',linestyle='-.',linewidth=3,markerfacecolor='none',label=u'B_AUC = %0.5f'% roc_auc2)
plt.plot(fpr3, tpr3, 'k-',color='red',linestyle='-.',linewidth=3,markerfacecolor='none',label=u'C_AUC = %0.5f'% roc_auc3)
plt.plot(fpr4, tpr4, 'k-',color='y',linestyle='-.',linewidth=3,markerfacecolor='none',label=u'D_AUC = %0.5f'% roc_auc4)

plt.legend(loc='lower right')
plt.plot([0,1],[0,1],'r--')
plt.xlim([-0.1,1.1])
plt.ylim([-0.1,1.1])
plt.ylabel('True Positive Rate')
plt.xlabel('False Positive Rate')
plt.grid(linestyle='-.')  
plt.grid(True)
plt.show()

在上面的基础上，我们将标签二值化

（如果你不使用二分类思想去画ROC曲线，大概率会出现报错：ValueError: multilabel-indicator format is not supported）

y_test_all = label_binarize(true_labels_i, classes=[0,1,2,3,4])

y_score_all=test_Y_i_hat
fpr = dict()
tpr = dict()
roc_auc = dict()
for i in range(len(classes)):
    fpr[i], tpr[i], thresholds = roc_curve(y_test_all[:, i],y_score_all[:, i])
    roc_auc[i] = auc(fpr[i], tpr[i])

注意看，宏观平均（macro-average）和微观平均（micro-average）的处理方式

(y_test_all（真实标签值）和y_score_all（与真实标签值维度匹配，如果十个类就对应十个值，↓行代表数据序号，列代表每个类别的预测值）

# micro-average ROC curve（方法一）
fpr["micro"], tpr["micro"], thresholds = roc_curve(y_test_all.ravel(),y_score_all.ravel())
roc_auc["micro"] = auc(fpr["micro"], tpr["micro"])

# macro-average ROC curve 方法二）

all_fpr = np.unique(np.concatenate([fpr[i] for i in range(len(classes))]))

mean_tpr = np.zeros_like(all_fpr)
for i in range(len(classes)):
    mean_tpr += interp(all_fpr, fpr[i], tpr[i])
# 求平均计算ROC包围的面积AUC
mean_tpr /= len(classes)
fpr["macro"] = all_fpr
tpr["macro"] = mean_tpr
roc_auc["macro"] = auc(fpr["macro"], tpr["macro"])

#画图部分
plt.figure()
plt.plot(fpr["micro"], tpr["micro"],'k-',color='y',
         label='XXXX ROC curve micro-average(AUC = {0:0.4f})'
               ''.format(roc_auc["micro"]),
          linestyle='-.', linewidth=3)

plt.plot(fpr["macro"], tpr["macro"],'k-',color='k',
         label='XXXX ROC curve macro-average(AUC = {0:0.4f})'
               ''.format(roc_auc["macro"]),
          linestyle='-.', linewidth=3)
plt.plot([0,1],[0,1],'r--')
plt.xlim([-0.1,1.1])
plt.ylim([-0.1,1.1])
plt.ylabel('True Positive Rate')
plt.xlabel('False Positive Rate')
plt.legend(loc="lower right")
plt.grid(linestyle='-.')  
plt.grid(True)
plt.show()

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

浅谈Python_Openpyxl使用（最全总结）
这篇文章主要介绍了浅谈Python_Openpyxl使用（最全总结），文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-09-09
Python简单定义与使用字典dict的方法示例
这篇文章主要介绍了Python简单定义与使用字典的方法,结合简单实例形式分析了Python字典的原理、组成、定义及使用方法,需要的朋友可以参考下
2017-07-07
利用Python的Twisted框架实现webshell密码扫描器的教程
这篇文章主要介绍了利用Python的Twisted框架实现webshell密码扫描器的教程,用到了Twisted框架的异步通信机制,需要的朋友可以参考下
2015-04-04
python使用urlparse分析网址中域名的方法
这篇文章主要介绍了python使用urlparse分析网址中域名的方法,涉及Python使用urlparse模块操作URL的技巧,需要的朋友可以参考下
2015-04-04
python eval()函数使用详情
这篇文章主要来来聊聊python eval()函数使用方法本文将以python eval()函数使用方法来展开内容,需要的小伙伴可以参考以下文章的内容，希望对你有所帮助
2021-10-10
在Python中使用Mako模版库的简单教程
这篇文章主要介绍了在Python中使用Mako模版库的简单教程,包括在Django或者Tornado框架中集成Mako的方法,需要的朋友可以参考下
2015-04-04
Python中反射和描述器总结
这篇文章主要介绍了Python中的反射和描述器一些知识的汇总，非常的详细，有需要的小伙伴可以参考下
2018-09-09
pyqt弹出新对话框,以及关闭对话框获取数据的实例
今天小编就为大家分享一篇pyqt弹出新对话框,以及关闭对话框获取数据的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-06-06
Pytorch实现tensor序列化和并行化的示例详解
这篇文章主要介绍了Pytorch实现tensor序列化和并行化,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,感兴趣的同学们下面随着小编来一起学习学习吧
2023-12-12
Python爬虫与反爬虫大战
这篇文章主要介绍了Python爬虫与反爬虫的相关资料，文中讲解非常细致，帮助大家更好的理解Python爬虫与反爬虫的关系，感兴趣的朋友可以了解下
2020-07-07