0
点赞
收藏
分享

微信扫一扫

微调实操三:人类反馈对语言模型进行强化学习(RLHF)

推荐一本日本网友Kenji Hiranabe写的《线性代数的艺术》。这本书是基于MIT大牛Gilbert Strang教授的《每个人的线性代数》制作的,通过可视化的、图形化的方式理解和学习线性代数。

全书内容不长,算上封面再带图一共也就12页。书中内容都是图解形式呈现,尤其矩阵这一块,描述很清楚,小白也能轻松看懂。

书中内容是从理解矩阵开始的,在这一环节一共展示了4个视角。

img

有了矩阵的概念之后,作者接着由浅入深地介绍了一些运算方式。

  • 向量乘向量
  • 矩阵乘向量
  • 矩阵乘矩阵

img

img

img

img

img

img

img

笔记的最后,作者还附上了一张矩阵的特征值映射图。

img

原文内容干货很多,这里只是节选了其中一部分,完整版PDF已整理好了,感兴趣的小伙伴可以去看看。

举报

相关推荐

深度学习对模型进行微调

0 条评论