歡迎來到 常識詞典網(wǎng) , 一個專業(yè)的常識知識學(xué)習(xí)網(wǎng)站!
[ Ctrl + D 鍵 ]收藏本站
答案 1:
謝謝你的邀請。你的問題我沒有完全看懂,我是這樣去理解你的問題的:用樸素貝葉斯方法如何對高維數(shù)據(jù)進(jìn)行分類。樸素貝葉斯分類器本身并不能降維,它是一個分類器。你提供的數(shù)據(jù)應(yīng)該在進(jìn)行分類之前就已經(jīng)做好了特征降維,特征降維的方法很多,你可以依據(jù)你的具體問題來選擇合適的降維方法。樸素貝葉斯要求各特征之間條件統(tǒng)計獨立,所以對高維數(shù)據(jù)降維后必須保證各特征之間的獨立性,這可以采用一組具有正交基特征的降維方法,如PCA。以兩分類為例,樸素貝葉斯分類器實際執(zhí)行的一個線性判別函數(shù),它是根據(jù)待判斷向量分屬于各個類別概率比值推演過來的,所以要做到概率為0理論上就不成立。另外,采用樸素貝葉斯分類需要知道各類別的先驗概率、各特征的類條件概率,所以實際操作起來基本上不可能,它更多的是一種理論指導(dǎo)??赡懿]有完全解決你的問題,希望有人完善,謝謝……答案 2:
實際上,維度高并不表示效果會差。原因可能是:一,對于機(jī)器學(xué)習(xí)而言,泛化性能收到樣本數(shù)量和代表性的影響,如果特征維度高,則訓(xùn)練樣本的數(shù)量必須比較大,關(guān)于樣本數(shù)量和維度有個VC維的理論約束。二,對于樸素貝葉斯而言,需要假設(shè)各維度相互獨立,維度高的一個可能問題就是維度之間的獨立性會變差,造成樸素貝葉斯的假設(shè)不成立,從而效果不好;解決的辦法:一,從特征定義的物理意義出發(fā),重新定義,減少特征之間的相關(guān)性;二,按照駱威所提到的,降維并進(jìn)行特征挑選,但需要注意保持獨立性。三,增加具有代表性的訓(xùn)練樣本。答案 3:
不大懂,沒學(xué)過模式識別下一篇:有哪些好方法可以說服盲從的人? 下一篇 【方向鍵 ( → )下一篇】
上一篇:關(guān)于自動化測試,包括頁面和客戶端,大家有什么更好的解決方案嗎? 上一篇 【方向鍵 ( ← )上一篇】
快搜