云计算百科
云计算领域专业知识百科平台

Sklearn 机器学习 决策树 网格搜索获得最优参数

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖

在这里插入图片描述

本博客的精华专栏: 【自动化测试】 【测试经验】 【人工智能】 【Python】


在这里插入图片描述

Sklearn 机器学习:决策树 + 网格搜索获得最优参数

决策树(Decision Tree)是一种直观、易于理解的机器学习模型,广泛应用于分类与回归任务中。其关键在于超参数设置,不同的配置对模型效果有显著影响。

本文将使用 Sklearn 提供的 GridSearchCV 网格搜索交叉验证工具,系统性地寻找最优参数组合,并在经典的 Iris 鸢尾花数据集 上演示完整流程。


🌱 一、准备工作:加载数据与库

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import classification_report, accuracy_score
import pandas as pd

加载数据并切分训练集与测试集:

# 加载 Iris 数据集
iris = load_iris()
X = iris.data
y = iris.target

# 分层抽样划分训练集与测试集(保持类别分布一致)
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.2, stratify=y, random_state=42)

# 打印数据概况
print

赞(0)
未经允许不得转载:网硕互联帮助中心 » Sklearn 机器学习 决策树 网格搜索获得最优参数
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!