歡迎來(lái)到 常識(shí)詞典網(wǎng) , 一個(gè)專(zhuān)業(yè)的常識(shí)知識(shí)學(xué)習(xí)網(wǎng)站!
[ Ctrl + D 鍵 ]收藏本站
答案 1:
從幾何意義上來(lái)說(shuō),n維向量空間的一條線(xiàn)段作為底邊和-組成的三角形,其頂角大小是不確定的。也就是說(shuō)對(duì)于兩條空間向量,即使兩點(diǎn)距離一定,他們的夾角余弦值也可以隨意變化。感性的認(rèn)識(shí),當(dāng)兩用戶(hù)評(píng)分趨勢(shì)一致時(shí),但是評(píng)分值差距很大,余弦相似度傾向給出更優(yōu)解。舉個(gè)極端的例子,兩用戶(hù)只對(duì)兩件商品評(píng)分,向量分別為(3,3)和(5,5),這兩位用戶(hù)的認(rèn)知其實(shí)是一樣的,但是歐式距離給出的解顯然沒(méi)有余弦值合理。答案 2:
貌似有點(diǎn)明白了,余弦?jiàn)A角可以有效規(guī)避個(gè)體相同認(rèn)知中不同程度的差異表現(xiàn),更注重維度之間的差異,而不注重?cái)?shù)值上的差異;反過(guò)來(lái)思考,當(dāng)向量夾角的余弦值較小(差異很大)時(shí),歐氏距離可以很?。ú町惡苄。?0,1)和(1,0)兩個(gè)點(diǎn),所以如果要對(duì)電子商務(wù)用戶(hù)做聚類(lèi),區(qū)分高價(jià)值用戶(hù)和低價(jià)值用戶(hù),用消費(fèi)次數(shù)和平均消費(fèi)額,這個(gè)時(shí)候用余弦?jiàn)A角是不恰當(dāng)?shù)?,因?yàn)樗鼤?huì)將(2,10)和(10,50)的用戶(hù)算成相似用戶(hù),但顯然后者的價(jià)值高得多,因?yàn)檫@個(gè)時(shí)候需要注重?cái)?shù)值上的差異,而不是維度之間的差異。所以余弦相似度衡量的是維度間相對(duì)層面的差異,歐氏度量衡量數(shù)值上差異的絕對(duì)值,不知道這樣理解對(duì)不對(duì)。答案 3:
我覺(jué)得你在這里所提應(yīng)該是指馬氏距離[1],因?yàn)樵诙嘣闆r下是應(yīng)該除以協(xié)差陣來(lái)進(jìn)行標(biāo)準(zhǔn)化的。關(guān)于馬氏距離與余弦相似度的區(qū)別,個(gè)人以為這是一種長(zhǎng)度與方向的度量所造成的不同。馬氏距離度量的是長(zhǎng)度,它只有遠(yuǎn)近之分。而余弦相似度是度量方向的,余弦相似度為1,你不可以說(shuō)這兩個(gè)向量一樣,只能說(shuō)他們是相似的,因?yàn)樗麄兪峭较虻模秃孟螅?,3)與(5,5)。但是馬氏距離度量的是長(zhǎng)度,長(zhǎng)度為0就可以認(rèn)為他們是一樣的。余弦相似度只在[0,1]之間,有準(zhǔn)則,而馬氏距離在[0,無(wú)窮)之間,無(wú)判別準(zhǔn)則.余弦相似度為0(即直交)就可以說(shuō)他們很不相似,就算他們之間距離小,但是他們方向完全不一致。而馬氏距離就需要另找判別準(zhǔn)則來(lái)定義怎么算大,怎么算小。于是相對(duì)應(yīng)的應(yīng)用也就出來(lái),如果你所想應(yīng)用的是對(duì)應(yīng)方向上,例如@劉一丁中的感性認(rèn)識(shí),這是一種對(duì)于用戶(hù)思考方向的研究,則應(yīng)該用余弦相似度。但是若要用來(lái)區(qū)分價(jià)值大小,例如@joeg-中的高低價(jià)值用戶(hù)聚類(lèi),則應(yīng)該用馬氏距離[1]en.-.org/wiki...答案 4:
強(qiáng)烈贊同劉一丁的從直覺(jué)上的感性認(rèn)識(shí) 再舉個(gè)余弦相似度的例子:歌手大賽,兩個(gè)評(píng)委給四個(gè)歌手打分,第一個(gè)評(píng)委的打分(10,8,9,7) 第二個(gè)評(píng)委的打分(9,7.2,8.1,6.3),雖然每個(gè)評(píng)委對(duì)同一個(gè)選手的評(píng)分不一樣,但反映出一種趨勢(shì),兩個(gè)評(píng)委對(duì)這四位歌手實(shí)力的了解程度是一樣的,只是第二個(gè)評(píng)委對(duì)滿(mǎn)分有更高的評(píng)判標(biāo)準(zhǔn)。答案 5:
簡(jiǎn)而言之,需要考慮scaling區(qū)別的用Euclidean Distance,否則Cosine Similarity得到的相似度度量更穩(wěn)定,實(shí)際應(yīng)用場(chǎng)景下后者適用的居多。答案 6:
直觀(guān)來(lái)說(shuō),歐式距離衡量空間點(diǎn)的直線(xiàn)距離,余弦距離衡量點(diǎn)在空間的方向差異。答案 7:
這個(gè)也是具體情況具體分析的,看你關(guān)注的是絕對(duì)距離還是相對(duì)距離啦。 歸根結(jié)底是個(gè)相異度的問(wèn)題,也就是說(shuō)你說(shuō)一個(gè)大的照片和一個(gè)小的照片相異么?雖然照片的內(nèi)容一樣。你要用歐氏距離,那差別就大了,要是用余弦?jiàn)A角就小啦下一篇:女人最討厭男人怎么穿衣服? 下一篇 【方向鍵 ( → )下一篇】
上一篇:現(xiàn)在中國(guó)-主流的人不用繁體字? 上一篇 【方向鍵 ( ← )上一篇】
快搜