实验五、分类预测基本流程演示
一、实验目的
1.了解在流水线上进行数据分类预测的方法。
二、实验内容
1.调用 pipeline 进行整个数据处理流程的调用。
2.调用 train_test_split 进行数据集的分割。
三、实验步骤
使用 train_test_split 可拆分数据,保留一部分数据进行测试,以尽量避免过 拟合,保留一部分数据做测试训练模型用,改变 random_state 还可以改变分离 数据的位置,test_size 默认是 0.25,可通过这个变量改变分离的数据量比例; 把常用的可重复的操作放进流水线 pipeline 上以方便训练模型。由于 sklearn 的...