数据分类的过程是怎么样的,用什么指标来评价分类过程是否合适


数据分类的过程是怎么样的,用什么指标来评价分类过程是否合适

正确答案:数据分类的过程:1.完成敏感数据的风险评估;2.制定合理的分类规范;3.对数据类型进行分类;4.发现数据存储的位置;5.数据的识别与分类;6.启动安全控制措施;7.监控与维护。评价指标有:1)正确率(accuracy),正确率是我们最常见的评价指标,accuracy=(TP+TN)/(P+N),这个很容易理解,就是被分对的样本数除以所有的样本数,通常来说,正确率越高,分类器越好;2)错误率(errorrate)。错误率则与正确率相反,描述被分类器错分的比例,errorrate=(FP+FN)/(P+N),对某一个实例来说,分对与分错是互斥事件,所以accuracy=1–errorrate;3)灵敏度(sensitive)。sensitive=TP/P,表示的是所有正例中被分对的比例,衡量了分类器对正例的识别能力;4)特效度(specificity)。specificity=TN/N,表示的是所有负例中被分对的比例,衡量了分类器对负例的识别能力;5)精度(precision)。精度是精确性的度量,表示被分为正例的示例中实际为正例的比例,precision=TP/(TP+FP);6)召回率(recall)。召回率是覆盖面的度量,度量有多个正例被分为正例,recall=TP/(TP+FN)=TP/P=sensitive,可以看到召回率与灵敏度是一样的。7)其他评价指标。


Tag:正确率 度量 错误率 时间:2023-11-24 14:37:13