代码随想录算法训练营刷题复习5 : 贪心算法 1/2-CFANZ编程社区

第1关：逻辑回归如何实现分类

任务描述

本关任务：编写一个使用逻辑回归实现分类的程序

编程要求

根据提示，在右侧编辑器补充代码，完善代码，

测试说明

平台会对你编写的代码进行测试：

预期输出： 0.9

`第1关任务——代码题`

from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
import numpy as np

np.random.seed(10)

if __name__ == '__main__':
    # ********** Begin ********** #
    # 使用sklearn中的make_classification函数构建二分类的数据，样本数量为100
    X, y = make_classification(n_samples=100, n_features=20, n_informative=2, n_redundant=10, random_state=42, flip_y=0.1)

    # 将数据集拆分成测试集与训练集，训练集占所有数据的80%
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

    # 进行模型训练并评估模型
    model = LogisticRegression(max_iter=1000, random_state=42)
    model.fit(X_train, y_train)

    # 预测测试集结果
    y_pred = model.predict(X_test)

    # 评估模型的准确率
    accuracy = accuracy_score(y_test, y_pred)
    print(round(accuracy, 1))
    # ********** End ********** #

第2关：超参数

任务描述

本关任务：编写一个使用网格搜索进行最佳参数寻找的程序

编程要求

根据提示，在右侧编辑器补充代码，完善代码，使得代码能够通过测试

测试说明

平台会对你编写的代码进行测试：

预期输出： 测试通过

`第2关任务——代码题`

from sklearn.linear_model import LogisticRegressionCV
from sklearn.model_selection import GridSearchCV,train_test_split
from sklearn.datasets import load_iris


def model_train(x_train, x_test, y_train, y_test):
    # ********** Begin ********** #
    # 设置param进行网格搜索参数设置
    param_dict = {'Cs': [0.1, 1, 10], 'penalty': ['l1', 'l2']}
    # {参数名1：[参数值1， 参数值2]，...}
    # 参数说明：
    # logistic 逻辑回归分类器
    logistic = LogisticRegressionCV(cv=5)
    # param_dict 超参字典
    # 使用网格搜索进行模型训练找出最佳参数
    grid_search = GridSearchCV(logistic, param_grid=param_dict, cv=5)
    grid_search.fit(x_train, y_train)
    # 计算模型在测试集上的准确率
    score = grid_search.score(x_test, y_test)
    # ********* End ********** #
    return score

if __name__ == '__main__':
    iris = load_iris()
    x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2)
    score = model_train(x_train, x_test, y_train, y_test)
    if score >= 0.8:
        print("测试通过")
    else:
        print("测试失败")