天天看點

Python求向量的餘弦值

1、餘弦相似度

餘弦相似度衡量的是2個向量間的夾角大小,通過夾角的餘弦值表示結果,是以2個向量的餘弦相似度為:

Python求向量的餘弦值

cosθ=A⋅B||A||∗||B||(1)       

Python求向量的餘弦值

餘弦相似度的取值為[-1,1],值越大表示越相似。

向量夾角的餘弦公式很簡單,不在此贅述,直接上代碼:

def cosVector(x,y):
    if(len(x)!=len(y)):
        print('error input,x and y is not in the same space')
        return;
    result1=0.0;
    result2=0.0;
    result3=0.0;
    for i in range(len(x)):
        result1+=x[i]*y[i]   #sum(X*Y)
        result2+=x[i]**2     #sum(X*X)
        result3+=y[i]**2     #sum(Y*Y)
    #print(result1)
    #print(result2)
    #print(result3)
    print("result is "+str(result1/((result2*result3)**0.5))) #結果顯示
cosVector([2,1],[1,1])
           

一個計算二維數組餘弦值的例子:

#求餘弦函數
def cosVector(x,y):
    if(len(x)!=len(y)):
        print('error input,x and y is not in the same space')
        return;
    result1=0.0;
    result2=0.0;
    result3=0.0;
    for i in range(len(x)):
        result1+=x[i]*y[i]   #sum(X*Y)
        result2+=x[i]**2     #sum(X*X)
        result3+=y[i]**2     #sum(Y*Y)
    #print("result is "+str(result1/((result2*result3)**0.5))) #結果顯示
    return result1/((result2*result3)**0.5)
#print("result is ",cosVector([2,1],[1,1]))

#計算query_output(60,20)和db_output(60,20)的餘弦值,用60*1的向量存儲

cosResult= [[0]*1 for i in range(60)]


for i in range(60):
    cosResult[i][0]=cosVector(query_output[i], db_output[i])

print(cosResult)
--------------------------------------------------------------------------------------------
#計算query_output和db_output的餘弦值,用60*1的向量存儲
rows=query_output.shape[0] #行數
cols=query_output.shape[1] #列數
cosResult= [[0]*1 for i in range(rows)]


for i in range(rows):
    cosResult[i][0]=cosVector(query_output[i], db_output[i])

#print(cosResult)
#将結果存入檔案中,并且一行一個數字
file=open('cosResult.txt','w')
for i in cosResult:
  file.write(str(i).replace('[','').replace(']','')+'\n')  #\r\n為換行符

file.close()