Python深度学习技术教程-CFANZ编程社区

原文链接：Python深度学习技术教程https://mp.weixin.qq.com/s?__biz=MzUzNTczMDMxMg==&mid=2247597949&idx=4&sn=65c0d353d02b060fec98ec799f217ae1&chksm=fa823e9acdf5b78cd71cfcb060e3b60125b17afbe3e19ef423d4709d2df7fc93d90ce3097253&token=1478784511&lang=zh_CN#rd

前言

近年来，伴随着以卷积神经网络（CNN）为代表的深度学习的快速发展，人工智能迈入了第三次发展浪潮，AI技术在各个领域中的应用越来越广泛。

第一注意力（Attention）机制

1、注意力机制的背景和动机（为什么需要注意力机制？注意力机制的起源和发展）。

2、注意力机制的基本原理：用机器翻译任务带你了解Attention机制、如何计算注意力权重？

3、注意力机制的一些变体（硬性注意力机制、软性注意力机制、键值对注意力机制、多头注意力机制、多头注意力机制、……）。

4、注意力机制的可解释性（如何使用注意力机制进行模型解释？注意力机制的可视化技术？）

第二Transformer模型

1、Transformer模型拓扑结构

2、Transformer模型工作原理（为什么Transformer模型需要位置信息？位置编码的计算方法？Transformer模型的损失函数？）

3、自然语言处理（NLP）领域的Transformer模型：BERT、GPT-1 / GPT-2 / GPT-3 / GPT-3.5 / GPT-4（模型的总体架构、输入和输出形式、预训练目标、预训练数据的选择和处理、词嵌入方法、GPT系列模型的改进与演化、……）。

4、计算视觉（CV）领域的Transformer模型：DETR / ViT / Swin Transformer（DERT：基于Transformer的检测头设计、双向匹配损失；ViT：图像如何被分割为固定大小的patches？如何将图像patches线性嵌入到向量中？Transformer在处理图像上的作用？Swin：窗口化自注意力机制、层次化的Transformer结构、如何利用位移窗口实现长范围的依赖？）

第三生成式模型

1、变分自编码器VAE（自编码器的基本结构与工作原理、变分推断的基本概念及其与传统贝叶斯推断的区别、VAE的编码器和解码器结构及工作原理）。

2、生成式对抗网络GAN（GAN提出的背景和动机、GAN的拓扑结构和工作原理、生成器与判别器的角色、GAN的目标函数）。

3、扩散模型Diffusion Model（扩散模型的核心概念？如何使用随机过程模拟数据生成？扩散模型的工作原理）。

4、跨模态图像生成DALL.E（什么是跨模态学习？DALL.E模型的基本架构、模型训练过程）。

第四目标检测算法

1. 目标检测任务与图像分类识别任务的区别与联系。

2. 两阶段（Two-stage）目标检测算法：R-CNN、Fast R-CNN、Faster R-CNN（RCNN的工作原理、Fast R-CNN和Faster R-CNN的改进之处）。

3. 一阶段（One-stage）目标检测算法：YOLO模型、SDD模型（拓扑结构及工作原理）。

第五图神经网络

1. 图神经网络的背景和基础知识（什么是图神经网络？图神经网络的发展历程？为什么需要图神经网络？）

2. 图的基本概念和表示（图的基本组成：节点、边、属性；图的表示方法：邻接矩阵；图的类型：无向图、有向图、加权图）。