💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖
本博客的精华专栏: 【自动化测试】 【测试经验】 【人工智能】 【Python】
Sklearn 机器学习:决策树 + 网格搜索获得最优参数
决策树(Decision Tree)是一种直观、易于理解的机器学习模型,广泛应用于分类与回归任务中。其关键在于超参数设置,不同的配置对模型效果有显著影响。
本文将使用 Sklearn 提供的 GridSearchCV 网格搜索交叉验证工具,系统性地寻找最优参数组合,并在经典的 Iris 鸢尾花数据集 上演示完整流程。
🌱 一、准备工作:加载数据与库
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import classification_report, accuracy_score
import pandas as pd
加载数据并切分训练集与测试集:
# 加载 Iris 数据集
iris = load_iris()
X = iris.data
y = iris.target
# 分层抽样划分训练集与测试集(保持类别分布一致)
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.2, stratify=y, random_state=42)
# 打印数据概况
print
评论前必须登录!
注册