R语言统计分析——自编函数-CFANZ编程社区

R语言统计分析——自编函数

一、前言

二、实现

步骤 1: 准备数据

% 假设X是特征矩阵，y是目标变量  
X = [randn(100,1)*10+50; randn(100,1)*15+80]; % 两个特征，每个特征100个样本  
X = [ones(100,1) X]; % 添加一列1s以用于截距项  
y = X(:,1)*0.1 + X(:,2)*0.2 + randn(100,1)*2; % 真实模型：y = 0.1*x1 + 0.2*x2 + 噪声  
  
% 为了模拟真实情况，我们可以将数据集分为训练集和测试集  
idx = randperm(100, 80); % 随机选择80个样本作为训练集  
X_train = X(idx, :);  
y_train = y(idx);  
X_test = X(~ismember(1:100, idx), :);  
y_test = y(~ismember(1:100, idx));

步骤 2: 训练模型

% 训练线性模型  
model = fitlm(X_train, y_train);

步骤 3: 评估模型

% 显示模型的统计信息  
disp(model)  
  
% 使用测试集进行预测  
y_pred = predict(model, X_test);  
  
% 计算并显示测试集上的均方误差  
mse = mean((y_pred - y_test).^2);  
fprintf('Test MSE: %.4f\n', mse);

步骤 4: 使用模型进行预测

% 新的数据点  
X_new = [1; 60; 90]; % 注意：新数据点也需要包含截距项  
y_new_pred = predict(model, X_new);  
fprintf('Predicted value for new data point: %.4f\n', y_new_pred);

三、注意事项

结语

0 条评论