0

点赞

收藏

分享

微调实操三:人类反馈对语言模型进行强化学习(RLHF)

左小米z 2024-02-25 阅读 22

标签: 线性代数机器学习人工智能

推荐一本日本网友Kenji Hiranabe写的《线性代数的艺术》。这本书是基于MIT大牛Gilbert Strang教授的《每个人的线性代数》制作的，通过可视化的、图形化的方式理解和学习线性代数。

全书内容不长，算上封面再带图一共也就12页。书中内容都是图解形式呈现，尤其矩阵这一块，描述很清楚，小白也能轻松看懂。

书中内容是从理解矩阵开始的，在这一环节一共展示了4个视角。

有了矩阵的概念之后，作者接着由浅入深地介绍了一些运算方式。

向量乘向量
矩阵乘向量
矩阵乘矩阵

笔记的最后，作者还附上了一张矩阵的特征值映射图。

原文内容干货很多，这里只是节选了其中一部分，完整版PDF已整理好了，感兴趣的小伙伴可以去看看。

0 条评论

关注