0
点赞
收藏
分享

微信扫一扫

吴恩达机器学习笔记1

Introduction

1-1 welcome to machine learning

机器学习很重要,IT界10大热门技术排第一

1-2 what’s machine learning

Samuel:在没有明确设置的情况下,使计算机具有学习能力的研究领域
成名于1950年代, a checkers playing program.
Tom Mitchell: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measure by P, improves with experience E.
一个适当的学习问题定义如下,计算机从经验E中学习,解决某一任务T并且进行某一性能度量P,通过P测定的,在E上的表现,这个表现由经验E来提高。
task T是什么

1-3 Supervised Learning

Housing price prediction

逻辑回归问题-房价预测
在逻辑回归问题-房价预测中,我们设法预测连续值的趋势

Breast cancer (malignant, benign)

分类问题-恶性肿瘤预测
在分类问题-恶性肿瘤预测中,只用到肿瘤大小这一个特征值来预测肿瘤是良性还是恶性,事实上特征值可以有更多,分类结果也可以有更多。《黑神话:悟空》的四足动捕系统就用到了一百多万个特征值,并且还在不断增加中。
如下图,
更多特征值
我们可以新增病人年龄、肿瘤厚度、肿瘤细胞的均匀性、肿瘤细胞形状的均匀性等。学习算法是能够处理无穷多特征的算法。一般算力越强,能够处理的特征数上限也越多。

习题

逻辑回归还是分类
第一个逻辑回归问题是预测某一商品在接下来三个月里的销量走势,直到卖完,是一个连续值的预测问题。
第二个二分类问题,很明显,将邮箱分类为没有被入侵、已经被入侵两类。

1-4 Unsupervised Learning

无监督学习
无监督学习所用的数据跟有监督学习不同,无监督学习的数据没有任何标签,或者都具有相同的标签,我们不知道拿这个数据集来做什么,也不知道每个数据点究竟是什么,我们只知道这里有一个数据集,你能在其中找到某种结构吗?

Clustering algorithm

聚类算法
无监督学习算法可能判断,该数据集包含两个不同的簇(cluster),这就是聚类算法(clustering algorithm)。

聚类算法的应用:谷歌新闻。

谷歌新闻每天去网络上收集几万条甚至几十万条新闻,然后将他们组成一个个新闻专题。
在这里插入图片描述

聚类算法应用:基因组学中的应用

给定一组不同的个体,对于每个个体,检测他们是否拥有某个特定的基因。也就是要检测特定基因的表达程度。
目的:把不同的个体归入不同的类,或归为不同类型的人。
我们只告诉算法,这儿有一堆数据,我不知道这些数据是什么,我不知道谁是什么类型,我甚至不知道都有哪些类型,但你能自动找出这些数据的结构吗?
不把正确的答案给它,这就是无监督学习。

聚类算法应用:组织大型的计算机集群

找出哪些机器趋向于协同工作,把这些机器放在一起可以让数据中心更高效的工作。

聚类算法应用:社交网络的分析

得知你email最频繁的联系人,或者知道你的Facebook好友,或者你的Google+圈。自动识别同属一个圈子的朋友,判断哪些人相互认识

聚类算法应用:市场细分

对于一个客户数据集,自动找出不同的市场分割,并自动将你的客户分到不同的细分市场,从而能够自动高效的在不同的细分市场中进行销售。
我们有全部的客户数据,但我们预先并不知道有哪些细分市场,我们也不知道谁属于细分市场一,谁属于细分市场二,但我们必须让算法自己去从数据中发现这一切。

聚类算法应用:天文数据分析

星系形成理论
在这里插入图片描述

Cocktail party problem

在这里插入图片描述
大受震撼,通过两个不同位置的麦克风就能分离出不同声源的声音

哪些是无监督学习(2、3)

在这里插入图片描述

举报

相关推荐

0 条评论