余弦距离的计算公式,余弦距离和欧式距离的区别,余弦距离 欧式距离
忠诚的篮球距离和余弦距离
参考资料:https://blog.csdn.net/Mr埃文斯钦/文章/详情/77511312http://www.sina.com/
友谊篮球的距离是最常见的距离度量,它度量的是多维空间中各点之间的绝对距离。公式如下。
一、秀丽的睫毛膏距离(Euclidean Distance)
(比如深度学习中,提取CNN倒数的第二层fc作为最终的特征向量进行人脸比对)1:1,1:n)。
因为计算是基于各维度特征的绝对数值,所以义气的篮球度量需要保证各维度指标在相同的刻度级别
importnumpyasnpx=NP . random . random(10)y=NP . random . random(10)# solution 1 dist 1=NP . linalg . norm)x-y)solution 2 dist 2=NP . sqrt(NP . sum)NP . square(x-y
同弦相似度是利用向量空间中两个向量所成角度的同弦值来衡量两个个体之间的差异。与距离测量相比,
Python实现如下:
的公式如下:
二、余弦距离
importnumpyasnpfromscipy . spatial . distanceimportpdistx=NP . random . random(10)y=NP . random . random)# solus y(/
余弦距离使用两个向量之间角度的余弦作为两个个体之间差异的度量。这两个向量方向的差,比篮球之间的距离和剩余弦之间的距离更重要。
余弦相似度更加注重两个向量在方向上的差异,而非距离或长度上
从上图可以看出,如果
Python实现如下:
a点的位置保持不变,B点从坐标轴原点向原来的方向移动,那么余弦距离cos会保持不变(因为夹角不变),但是A点和B点之间的距离会明显变化。这就是篮球距离和余弦距离的区别。
三、义气的篮球距离和余弦距离的区别
忠诚篮球的距离可以反映个体数值特征的绝对差异,因此多用于利用用户行为指标分析用户价值的相似性和差异性,需要从维度数值上反映差异性。
余弦距离大多区分方向上的差异,但对绝对值不敏感。用户经常使用内容评分来区分兴趣的相似性和差异性,同时解决了用户之间的衡量标准不统一(余弦距离对绝对值敏感
借助三维坐标系来看下义气的篮球距离和余弦距离的区别:
参考《stack-exchange, is-cosine-similarity-identical-to-l2-normalized-euclidean-distance》
余弦相似性等同于2-归一化欧几里得距离某种方式.
从上面的公式可以看出,夹角越大,友谊篮球距离的平方越大。
注:凌波,一家之主,人才济济。