0
点赞
收藏
分享

微信扫一扫

详解使用sklearn实现一元线性回归和多元线性回归

邯唐情感 2023-10-20 阅读 35

目录

第1关:什么是机器学习

相关知识

题目答案 

第2关:机器学习的常见术语

相关知识

假设空间

归纳偏好

题目答案

第3关:机器学习的主要任务

相关知识

分类

回归

聚类

题目答案


第1关:什么是机器学习

相关知识

上面对经验的利用是靠我们人类自身来完成的,计算机能帮忙吗?

题目答案 

第2关:机器学习的常见术语

相关知识

我们已经知道了,机器学习是利用数据,从数据中归纳出规律,并用来对新事物进行预测。所以,机器学习首先要有数据,假设我们收集了一份关于西瓜的数据:

一般地,令 D={x1​,x2​,..,xm​} 表示包含 m 个示例的数据集,每个示例由 d 个属性描述(例如上面的西瓜数据使用了三个属性),则每个示例:

从数据中学得模型的过程称为“学习”或“训练,这个过程通过执行某个学习算法来完成。训练过程中使用的数据称为“训练数据”,其中每个样本称为一个“训练样本”,训练样本组成的集合称为“训练集”,学习过程就是为了找出或逼近真相。

假设空间

接下来举个例子来说明什么是假设空间。在选择配偶时我们可能有以下几个指标:

  • 体型 : 肥胖,匀称,过瘦;

  • 财富 : 富有,一般,贫穷;

  • 性子 : 急,不急不慢,慢。

现在我们要构建一个合适的假设空间来构建一个择偶观:

所以假设空间的规模大小为4*4*4+1=65。 

归纳偏好

以韦小宝的 7 个老婆为例,这 7 个老婆均满足小宝的要求,因此构成了大小为 7 的假设空间。(实际上,假设空间的大小一定是无穷大的。为了说明问题,我们暂时以 7 为大小)。那么,如何衡量哪一个假设空间中哪一个假设函数(老婆)最好呢?如果以温柔体贴为偏好来选,当然是小双;如果以小宝的迷恋为偏好来讲,假设函数就是阿珂。说白了,归纳偏好就是一个用于挑选假设函数的基准。

而在具体的现实问题中,学习算法本身所做的假设是否成立,也即算法的归纳偏好是否与问题本身匹配,大多数时候直接决定了算法能否取得好的性能。

题目答案

第3关:机器学习的主要任务

相关知识

分类

这是一系列关于西瓜的数据,这里的每个实体,或者每一行被称为一个样本或数据点,而每一列(用来描述这些实体的属性)则被称为特征。假如说,我们现在想通过色泽、根蒂、敲声这几个特征来区分一个西瓜是好瓜与不是好瓜,这就是一个分类问题。分类问题的目标是预测类别标签。在这个例子中,“是”与“否”则是预测类别的两个不同的标签。分类问题有时可分为二分类和多分类,西瓜的例子则是一个二分类问题,多分类指的是数据不止两个类别,它有多个类别。

回归

回归任务的目标是预测一个连续值,编程术语叫作浮点数。假如我们现在手里得到的是如下数据:

我们要通过色泽、根蒂、敲声来预测西瓜的价格,这就是一个回归问题。区分分类任务和回归任务有一个简单方法,就是看输出是否具有某种连续性。如果在可能的结果之间具有连续性,那么它就是一个回归问题,比如说价格。

聚类

聚类属于无监督学习,它是指我们的数据只有输入,没有输出,并需要从这些数据中提取知识。聚类算法将数据划分成不同的组,每组包含相似的样本。比如说:

我们现在手里的数据只有色泽、根蒂、敲声这几个特征,我们通过这三个特征,把性状相似的西瓜分到一个组,这就是一个聚类问题。聚类问题与分类问题的本质区别就是有没有标签

题目答案

举报

相关推荐

0 条评论