0
点赞
收藏
分享

微信扫一扫

余弦相似度Cosine Similarity相关计算公式

余弦相似度,又称为余弦相似性,是通过测量两个向量的夹角的余弦值来度量它们之间的相似性。

余弦相似度Cosine Similarity相关计算公式_参考资料

两个方向完全相同的向量的余弦相似度为1,而两个彼此相对的向量的相似度为-1。 注意,它们的大小并不重要,因为这是方向的度量。

如何计算

余弦定理

余弦定理是三角形中三边长度与一个角的余弦值(cos)的数学式。

余弦相似度Cosine Similarity相关计算公式_机器学习_02

余弦定理指的是:

余弦相似度Cosine Similarity相关计算公式_余弦相似度_03


余弦相似度Cosine Similarity相关计算公式_机器学习_04


余弦相似度Cosine Similarity相关计算公式_欧氏距离_05

勾股定理则是余弦定理的特殊情况,当角为直角时,即:

余弦相似度Cosine Similarity相关计算公式_余弦相似度_06

时,公式简化为

余弦相似度Cosine Similarity相关计算公式_机器学习_07

余弦的计算公式

所以余弦的计算公式如下:

余弦相似度Cosine Similarity相关计算公式_余弦相似度_08


a,b,c 是三个边的长度。

余弦相似度Cosine Similarity相关计算公式_余弦相似度_09

假定a向量是[x1, y1],b向量是[x2, y2],那么可以将余弦定理改写成下面的形式:

余弦相似度Cosine Similarity相关计算公式_余弦相似度_10


根据下面带入可以得上面公式

余弦相似度Cosine Similarity相关计算公式_参考资料_11

余弦相似度Cosine Similarity相关计算公式_参考资料_12

数学家已经证明,余弦的这种计算方法对n维向量也成立。假定A和B是两个n维向量,A是 [A1, A2, ..., An] ,B是 [B1, B2, ..., Bn] ,则A与B的夹角θ的余弦等于:

余弦相似度Cosine Similarity相关计算公式_机器学习_13

参考资料

  • 9个数据科学中常见距离度量总结以及优缺点概述
  • TF-IDF与余弦相似性的应用(一):自动提取关键词
  • TF-IDF与余弦相似性的应用(二):找出相似文章
  • AI产品经理需要了解的数据知识:余弦相似度
  • 白话总结《余弦相似度vs欧式距离&缺陷》
  • 算法工程师面试备战笔记4_余弦相似与欧氏距离有什么区别和联系
举报

相关推荐

0 条评论