判别式模型和生成式模型区别——生成式是直接对数据本身的概率分布建模，判别式就是学习一个分类边界将不同类别区分开，前者是单刀直入、后者是曲线救国-CFANZ编程社区

在机器学习中，对于有监督学习可以将其分为两类模型：判别式模型和生成式模型。简单地说，判别式模型是针对条件分布建模，而生成式模型则针对联合分布进行建模。

1. 基本概念

判别式模型和生成式模型区别——生成式是直接对数据本身的概率分布建模，判别式就是学习一个分类边界将不同类别区分开，前者是单刀直入、后者是曲线救国_建模

补充：

　　本材料参考Andrew Ng大神的机器学习课程 http://cs229.stanford.edu

　　在上一篇有监督学习回归模型中，我们利用训练集直接对条件概率p(y|x;θ)建模，例如logistic回归就利用h_θ(x) = g(θ^Tx)对p(y|x;θ)建模（其中g(z)是sigmoid函数）。假设现在有一个分类问题，要根据一些动物的特征来区分大象(y = 1)和狗(y = 0)。给定这样的一种数据集，回归模型比如logistic回归会试图找到一条直线也就是决策边界，来区分大象与狗这两类，然后对于新来的样本，回归模型会根据这个新样本的特征计算这个样本会落在决策边界的哪一边，从而得到相应的分类结果。

　　现在我们考虑另外一种建模方式：首先，根据训练集中的大象样本，我们可以建立大象模型，根据训练集中的狗样本，我们可以建立狗模型。然后，对于新来的动物样本，我们可以让它与大象模型匹配看概率有多少，与狗模型匹配看概率有多少，哪一个概率大就是那个分类。

是直接对条件概率p(y|x;θ)建模。常见的判别式模型有线性回归模型、线性判别分析、支持向量机SVM、神经网络等。

则会对x和y的联合分布p(x,y)建模，然后通过贝叶斯公式来求得p(y_i|x)，然后选取使得p(y_i|x)最大的y_i，即：

判别式模型和生成式模型区别——生成式是直接对数据本身的概率分布建模，判别式就是学习一个分类边界将不同类别区分开，前者是单刀直入、后者是曲线救国_生成式_02

常见的生成式模型有隐马尔可夫模型HMM、朴素贝叶斯模型、高斯混合模型GMM、LDA等。

判别式模型和生成式模型区别——生成式是直接对数据本身的概率分布建模，判别式就是学习一个分类边界将不同类别区分开，前者是单刀直入、后者是曲线救国

1. 基本概念

Hadoop是什么？ Hadoop是一个由Apache开发的开源分布式计算框架，它能够处理大规模数据并行处理任务，支持大规模数据存储和处理。Hadoop的核心组件包括分布式文件系统HDFS和分布式计算

Facebook的实时流处理技术——Scuba是Facebook的一个非常快速、分布式的内存数据库，用于实时分析和查询