Оценка качества классификации
Применяются общеупотребительные метрики:
- Доля правильных ответов;
- Точность;
- Полнота;
- F-мера.
Все метрики – вычисляются из комбинации значений:
- P – количество правильно классифицированных объектов;
- N – количество объектов в обучающей выборке;
- TP – количество истинно положительных решений;
- NP – количество ложно положительных решений;
- FN – количество ложно отрицательных решений.
Доля правильных ответов (Accuracy) – отношение количества правильно классифицированных ответов к количеству ответов в обучающей выборке:
$$Accuracy = {P \over N}.$$
Точность (Precision) – отношение количества истинно положительных решений к сумме истинно положительных и ложно положительных. Точность показывает, насколько можно доверять классификатору в случае срабатывания.
$$Precision = {TP \over TP+NP}.$$
Полнота (Recall) – отношение количества истинно положительных решений к сумме истинно положительных и ложно отрицательных решений. Полнота показывает какая доля объектов определяется.
$$Recall = {TP \over TP+FN}.$$
F-мера рассчитывается как гармоническое среднее между точностью и полнотой.
$$F = (b^2 + 1) * {Precision * Recall \over Precision + Recall}.$$
где b – параметр показывающий приоритет точности или полноты должна отражать F-мера, при b=1 точность и полнота учитываются равноправно, при 0<b<1 приоритет за точностью, при b>1 приоритет за полнотой.
В случае многоклассовой классификации расчет производится по «Матрице неточностей» (строки – значения классов по классификатору, столбцы – значения классов по тестовому набору данных).
Тест | |||||
---|---|---|---|---|---|
Классифи- кация |
Решения | А | Б | В | Precision |
А | 2 | 1 | 0 | 0,67 = 2/3 | |
Б | 1 | 3 | 1 | 0,60 = 3/5 | |
В | 0 | 0 | 1 | 1,00 = 1/1 | |
Recall | 0,67 = 2/3 | 0,75 = 3/4 | 0,50 = 1/2 |
Точность – отношение диагональной ячейки к сумме по строке.
Полнота – отношение диагональной ячейки к сумме по столбцу.
Доля правильных ответов – отношение суммы диагональных элементов к сумме всей матрицы.