机器学习领域三个最基本指标是召回率(Recall Rate)、准确率(Precision Rate)及综合评价指标(F-Score)。(召回率也称为查全率,准确率也称为查准率)
准确率(Precision)
即:在所有预测为正例中有多少是真实的正例。
召回率(Recall)
即:在所有真实的正例中有多少被正确预测到。
单一的准确率或者召回率在一些情况下不一定会有意义,譬如当结果都预测为正例,$FN=0$,$Recall=1$,无意义。
综合评价指标(F-Score)
准确率或者召回率指标有时候会出现的矛盾的情况,这样就需要综合考虑他们,最常见的方法就是F-Score(又称为F-Measure)。
F-Score是Precision和Recall加权调和平均:
当参数$\alpha=1$时,就是最常见的$F_1$,也即
P-R(Precision-Recall)曲线
P-R曲线以召回率(Recall Rate)为横坐标,以准确率(Precision Rate)为纵坐标。