歡迎來到 常識詞典網(wǎng) , 一個專業(yè)的常識知識學習網(wǎng)站!
[ Ctrl + D 鍵 ]收藏本站
答案 1:
傳統(tǒng)的聚類方法比如k-means對于高維數(shù)據(jù)的效果是很差的。因為在高維度下距離的度量包含了大量隨機擾動的結(jié)果。用PCA(或者LSI)降維以后那些隨機擾動所在的分量都被濾掉了,所以聚類會有提高??偟膩碚f引入很多沒有信息量又帶來噪聲的維度總是會讓聚類變差的。 另外統(tǒng)計工具經(jīng)過發(fā)展之后已經(jīng)能夠處理高維的聚類問題了,比如LDA或者人工神經(jīng)網(wǎng)絡(luò)一類的方法。答案 2:
同意勞兄的看法,鄙人一點淺顯的看法是在高維空間中任何兩點間的距離都是很遠的,那么即便聚類后作為特征仍然未必很好。而SVD類的工具要有效地多。下一篇:HR 們?nèi)绾慰创龖獙蒙@的獎學金? 下一篇 【方向鍵 ( → )下一篇】
上一篇:1900 年之前有用分數(shù)表述地震震級的方法嗎?如果有,是怎樣表述的? 上一篇 【方向鍵 ( ← )上一篇】
快搜