0
点赞
收藏
分享

微信扫一扫

MyBatis 的架构

Aliven888 2023-07-19 阅读 80

文本特征提取

「文本」进行特征提取时,一般会用「单词」作为特征,即特征词。

TfidfVectorizer会计算特征词的「权重」,帮我们发现哪个词是最重要的。

比如,某个词在这篇文章中出现的频率很高,但在其他文章中出现的频率很低,那么这个词对于这篇文章的权重就高。

而 CountVectorizer 则只是单纯的计算特征词出现的「次数」,对于多篇文章的特征提取,就

举报

相关推荐

0 条评论