主成分:找方差最大的平面作为分布
X=[x1,x2,…,xn]⊤,Y=[y1,y2,…,yn]⊤
(X−Y)⊤(X−Y)=[x1−y1,…xn−yn][x1−y1,…xn−yn]⊤=i=1∑n(xi−yi)2
Σ=σ(x1,x1)⋮σ(xd,x1)⋯⋱⋯σ(x1,xd)⋮σ(xd,xd)∈Rd×d
如果协方差矩阵是单位阵,则只有 σ(xi,xi) 为 1,其他为 0
余弦相似度
cosθ=∥A∥∥B∥A⋅B
归一化后的向量,余弦相似度和欧氏距离的关系
看二维情况,单位圆上有两个点 A(x1,y1),B(x2,y2)
dcosθ=(x1−x2)2+(y1−y2)2=x12+y12+x22+y22−2x1x2−2y1y2=2−2cosθ=x1x2+y1y2