Оценка качества классификации

Применяются общеупотребительные метрики:

  • Доля правильных ответов;
  • Точность;
  • Полнота;
  • F-мера.

Все метрики – вычисляются из комбинации значений:

  • P – количество правильно классифицированных объектов;
  • N – количество объектов в обучающей выборке;
  • TP – количество истинно положительных решений;
  • NP – количество ложно положительных решений;
  • FN – количество ложно отрицательных решений.

Доля правильных ответов (Accuracy) – отношение количества правильно классифицированных ответов к количеству ответов в обучающей выборке:
$$Accuracy = {P \over N}.$$

Точность (Precision) – отношение количества истинно положительных решений к сумме истинно положительных и ложно положительных. Точность показывает, насколько можно доверять классификатору в случае срабатывания.
$$Precision = {TP \over TP+NP}.$$

Полнота (Recall) – отношение количества истинно положительных решений к сумме истинно положительных и ложно отрицательных решений. Полнота показывает какая доля объектов определяется.
$$Recall = {TP \over TP+FN}.$$

F-мера рассчитывается как гармоническое среднее между точностью и полнотой.
$$F = (b^2 + 1) * {Precision * Recall \over Precision + Recall}.$$ где b – параметр показывающий приоритет точности или полноты должна отражать F-мера, при b=1 точность и полнота учитываются равноправно, при 0<b<1 приоритет за точностью, при b>1 приоритет за полнотой.

В случае многоклассовой классификации расчет производится по «Матрице неточностей» (строки – значения классов по классификатору, столбцы – значения классов по тестовому набору данных).
Матрица неточностей
Тест
Классифи-
кация
Решения А Б В Precision
А 2 1 0 0,67 = 2/3
Б 1 3 1 0,60 = 3/5
В 0 0 1 1,00 = 1/1
Recall 0,67 = 2/3 0,75 = 3/4 0,50 = 1/2
Accuracy = 0,67 (=6/9)
Точность – отношение диагональной ячейки к сумме по строке.
Полнота – отношение диагональной ячейки к сумме по столбцу.
Доля правильных ответов – отношение суммы диагональных элементов к сумме всей матрицы.