当前位置:   article > 正文

距离(distance)、相似性(similarity)、向量范数(norm)_xnx

xnx

距离

      对函数 dist(,),若它是一个“距离度量”(distance measure),则需满足一些基本性质[1]
      非负性(Positive):dist(x,y)0
      同一性(Reflexive):dist(x,y)=0 当且仅当 x=y
      对称性(Symmetric):dist(x,y)=dist(y,x)
      直递性(Triangular inequation):dist(x,y)dist(x,z)+dist(z,y)

相似性

      对函数 sim(,),若它是一个归一化“相似性度量”(similarity measure),则有以下一些基本性质[1]
      sim(x,y)[0,1]
      sim(x,y)=1 当且仅当 x=y
      sim(x,y)=0 当且仅当 xy 完全不一样

      通常可以通过距离来定义相似性:

sim(x,y)=1dist(x,y)

sim(x,y)=1dist(x,y)

向量范数

定义 如果 V 是数域 K 上的线性空间,且对于V 的任一向量 χ,对应一个实值函数 χ,它满足以下三个条件[2]
      非负性:当 χ0χ∥>0;当 χ=0χ∥=0
      齐次性:αχ∥=|α|χχV
      三角不等式:χ+ζ∥≤∥χ+ζχζV
则称 χVχ范数(norm)。

常用范数

假设向量 χ=(ξ1,ξ2,,ξn),则有[2]
      1范数:

χ∥=i=1n|ξi|

      2范数(欧式范数):
χ2=|ξ1|2+|ξ2|2++|ξn|2

       范数:
χ=max_i|ξi|

      p范数:
χp=(i=1n|ξi|p)1p1p<+

      从上面定义及特性可以看出,距离、相似性、向量范数在很多种情况下是可以互相转化的。

常用的距离/相似性测度公式

  • 下面按照句法相似性(syntactic similarities)介绍一些距离测度、相似性测度家族[3]
          假设 P=(P1,P2,,Pd),Q=(Q1,Q2,,Qd)

    • Lp Minkowski family (闵可夫斯基距离测度家族)
      • Euclidean L2     
        dEuc=i=1d|PiQi|2
      • City block L1     
        dCB=i=1d|PiQi|
      • Minkowski Lp     
        dMK=(i=1d|PiQi|p)1p
      • Chebyshev L     
        dCheb=maxi|PiQi|
    • L1 family (L1范数测度家族)
      • Sorensen     
本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
  

闽ICP备14008679号