0
点赞
收藏
分享

微信扫一扫

大语言模型的超参数含义: Top-P 采样; Top-P 采样;logit_bias:

仲秋花似锦 2024-09-05 阅读 25

目录

大语言模型的超参数含义

 Top-P 采样

频率惩罚(Frequency Penalty)

top_k:

logit_bias:

top_logprobs:

max_tokens:


大语言模型的超参数含义

 Top-P 采样

  • 含义:一种采样替代方法,称为核采样。模型考虑top_p概率质量的token结果。例如,0.1表示仅考虑组成前10%概率质量的token。
  • 作用:这种方法可以限制输出序列的长度,并仍然保持样本的一定多样性。

频率惩罚(Frequency Penalty)

  • 含义:该参数的值范围为-2.0到2.0。正值会对新token进行惩罚,基于其在当前文本中的出现
举报

相关推荐

0 条评论