Оценка качества классификации

Применяются общеупотребительные метрики:

Доля правильных ответов;
Точность;
Полнота;
F-мера.

Все метрики – вычисляются из комбинации значений:

P – количество правильно классифицированных объектов;
N – количество объектов в обучающей выборке;
TP – количество истинно положительных решений;
NP – количество ложно положительных решений;
FN – количество ложно отрицательных решений.

Доля правильных ответов (Accuracy) – отношение количества правильно классифицированных ответов к количеству ответов в обучающей выборке:
$$Accuracy = {P \over N}.$$

Точность (Precision) – отношение количества истинно положительных решений к сумме истинно положительных и ложно положительных. Точность показывает, насколько можно доверять классификатору в случае срабатывания.
$$Precision = {TP \over TP+NP}.$$

Полнота (Recall) – отношение количества истинно положительных решений к сумме истинно положительных и ложно отрицательных решений. Полнота показывает какая доля объектов определяется.
$$Recall = {TP \over TP+FN}.$$

F-мера рассчитывается как гармоническое среднее между точностью и полнотой.
$$F = (b^2 + 1) * {Precision * Recall \over Precision + Recall}.$$ где b – параметр показывающий приоритет точности или полноты должна отражать F-мера, при b=1 точность и полнота учитываются равноправно, при 0<b<1 приоритет за точностью, при b>1 приоритет за полнотой.

В случае многоклассовой классификации расчет производится по «Матрице неточностей» (строки – значения классов по классификатору, столбцы – значения классов по тестовому набору данных).

Матрица неточностей

Тест

Классифи-
кация Решения А Б В Precision

А 2 1 0 0,67 = 2/3

Б 1 3 1 0,60 = 3/5

В 0 0 1 1,00 = 1/1

Recall 0,67 = 2/3 0,75 = 3/4 0,50 = 1/2

Accuracy = 0,67 (=6/9)
Точность – отношение диагональной ячейки к сумме по строке.
Полнота – отношение диагональной ячейки к сумме по столбцу.
Доля правильных ответов – отношение суммы диагональных элементов к сумме всей матрицы.

Тест
Классифи- кация	Решения	А	Б	В	Precision
	А	2	1	0	0,67 = 2/3
	Б	1	3	1	0,60 = 3/5
	В	0	0	1	1,00 = 1/1
	Recall	0,67 = 2/3	0,75 = 3/4	0,50 = 1/2