GroupBlog

这里写图片描述
1.评估方法
留出法：分层采样，全部样本的x%用来作为训练样本，1-x%用来作为测试样本

交叉验证：K折交叉验证，样本分成k份，每次按顺序取k-1份训练样本，生另一分作为测试样本。

自助法：随机取样，每次随机挑出样品一个放入样品级，重复m次，得到训练集合，剩下没有被抽中的样品作为测试。

2.性能度量
A.

错误率	精度
x/m	1-x/m

x :预测错误的样本数量
m:样本的全部数量

B.
查准率和查全率

真实	预测的正例	预测的反例
正例	TP（真正例）	FN（假反例子）
反例	FP（假正例）	TN（真反例）

P（查准率） = TP / (TP+FP)
R（查全率） = TP/(TP+FN)

C.
ROC 和AUC
ROC ：以FPR 和 TPR 为x,和y轴绘制的曲线，下方的面积是AUC。
FPR：FP/（TN+FP）
TPR：TP/（TP+FN）
绘制ROC:这里写链接内容

D.
敏感代价错误率
P = (F(cost01) +F(cost10))/m

F(cost01):把0认成1的样品代价总和
F(cost10):把1认成0的样品代价总和

3.偏差，泛化误差和方差