一、前言
二、实现
步骤 1: 准备数据
% 假设X是特征矩阵,y是目标变量
X = [randn(100,1)*10+50; randn(100,1)*15+80]; % 两个特征,每个特征100个样本
X = [ones(100,1) X]; % 添加一列1s以用于截距项
y = X(:,1)*0.1 + X(:,2)*0.2 + randn(100,1)*2; % 真实模型:y = 0.1*x1 + 0.2*x2 + 噪声
% 为了模拟真实情况,我们可以将数据集分为训练集和测试集
idx = randperm(100, 80); % 随机选择80个样本作为训练集
X_train = X(idx, :);
y_train = y(idx);
X_test = X(~ismember(1:100, idx), :);
y_test = y(~ismember(1:100, idx));
步骤 2: 训练模型
% 训练线性模型
model = fitlm(X_train, y_train);
步骤 3: 评估模型
% 显示模型的统计信息
disp(model)
% 使用测试集进行预测
y_pred = predict(model, X_test);
% 计算并显示测试集上的均方误差
mse = mean((y_pred - y_test).^2);
fprintf('Test MSE: %.4f\n', mse);
步骤 4: 使用模型进行预测
% 新的数据点
X_new = [1; 60; 90]; % 注意:新数据点也需要包含截距项
y_new_pred = predict(model, X_new);
fprintf('Predicted value for new data point: %.4f\n', y_new_pred);
三、注意事项
结语