跳到主要内容

交叉验证和网格搜索

交叉验证和网格搜索
1.交叉验证
1.定义:
将拿到的训练数据,分为训练和验证集
*折交叉验证
2.分割方式:
训练集:训练集+验证集
测试集:测试集
3.为什么需要交叉验证
为了让被评估的模型更加准确可信
注意:交叉验证不能提高模型的准确率
2.网格搜索
超参数: sklearn中,需要手动指定的参数,叫做超参数
网格搜索就是把这些超参数的值,通过字典的形式传递进去,然后进行选择最优值
api:
sklearn.model selection.GridSearchCV (estimator,
param grid-None, cv=None)
estimator -- 选择了哪个训练模型
param grid -- 需要传递的超参数
CV -- 几折交叉验证