歡迎來到 常識詞典網(wǎng) , 一個專業(yè)的常識知識學(xué)習(xí)網(wǎng)站!
[ Ctrl + D 鍵 ]收藏本站
答案 1:
在摩爾定律尚成立的時代,出現(xiàn)晚的處理器正應(yīng)該對應(yīng)更高的FLOPS(原因是更高的運(yùn)算電路密度 更高的時鐘頻率和更多的處理器內(nèi)核)。02年GPU出現(xiàn)伊始,其浮點(diǎn)運(yùn)算性能和當(dāng)時的CPU差別并不大,之后的將近十年,CPU處理器的發(fā)展遇到了瓶頸(電路密度由于制造工藝而無法大幅優(yōu)化 時鐘頻率由于高功耗也無法進(jìn)一步提升 多核由于其他方面的消耗 并未使運(yùn)算效率線形提升),摩爾定律逐漸開始失效,然而計算機(jī)圖形學(xué)這個應(yīng)用領(lǐng)域卻非常適合單指令多數(shù)據(jù)/線程(SIMD/SIMT)的并行化。因此,GPU在圖形及通用并行計算方面都取得了飛速的發(fā)展。相對于傳統(tǒng)CPU中單處理器支持單個硬件線程的架構(gòu),基于眾核架構(gòu)的GPU采用一個處理器支持多個硬件線程的做法,這方面的介紹在Berkeley和Stanford的有關(guān)并行計算的課程上都有講到(.cs.berkeley.edu/~demmel/cs267_Spr11/ code.google/p/stanfo...)。NV自2007年開始推出CUDA至今,已經(jīng)發(fā)展出了一套完整的二級并行架構(gòu)。其中一簇執(zhí)行同樣指令的線程組成一個kernel,kernel又組合成一個block,在block級別有共享內(nèi)存和其他的供線程間通信合作的機(jī)制。形象地說,這里的線程就是一個虛擬的向量處理器,其中包括自己的寄存器,程序計數(shù)器(PC)等,而一個block就是一個虛擬的多核處理器,其中包含多個線程和共享內(nèi)存等。造成GPU和CPU根本差別的原因在于不同的目標(biāo)需求:GPU假設(shè)運(yùn)行其上的工作都是高度可并行的,而CPU需要同時很好的支持并行和順序操作。于是,CPU需要大的片上緩存和復(fù)雜的控制邏輯,GPU則利用多線程并行運(yùn)行節(jié)省了片上的大緩存,同時針對一簇線程執(zhí)行同一套控制邏輯。因此,在高度并行化且數(shù)據(jù)規(guī)模巨大的應(yīng)用下,GPU可以獲得很高的浮點(diǎn)運(yùn)算性能,然而如果問題無法良好映射到某個合適的并行模型或當(dāng)數(shù)據(jù)規(guī)模較小時,SIMT就無法發(fā)揮并行的優(yōu)勢,CPU與GPU之間的數(shù)據(jù)交換也會大大降低運(yùn)算效率。不過,后一個問題在剛剛發(fā)布的CUDA4.0中已經(jīng)通過GPUDirect2.0得到了改進(jìn))。答案 2:
樓上王洋子豪已經(jīng)講的很詳細(xì)了,這里我補(bǔ)充一點(diǎn),就是如果硬件用于計算規(guī)整的,并行度高的算法,那么很容易針對算法進(jìn)行優(yōu)化,而通用算法則因?yàn)槠漤樞驁?zhí)行,而執(zhí)行順序的高度不確定性,無法有效的進(jìn)行優(yōu)化。在現(xiàn)代處理器工藝上,處理器比內(nèi)存的速度高3個數(shù)量級是很正常的事情。由于程序和數(shù)據(jù)主要存在內(nèi)存,因此CPU很多時候是在等待內(nèi)存提供下一步需要的數(shù)據(jù)和代碼。另外,因?yàn)镃PU的工作主要是順序執(zhí)行,在某一步的結(jié)果沒有計算出來之前,下一步計算就很難繼續(xù),缺乏并行性是限制CPU性能的重要因素。因此GPU的浮點(diǎn)性能高于CPU,主要是得益于其所處理的算法和數(shù)據(jù)的特性。答案 3:
晚出來的架構(gòu)方面也會更有優(yōu)勢啊,沒記錯的話,GPU是并行計算,流水線短,并且GPU專門對圖形計算做了優(yōu)化答案 4:
CPU除了負(fù)責(zé)浮點(diǎn)整形運(yùn)算外,還有很多其他指令集的負(fù)載,比如多媒體-,硬件-等,所以CPU是個多才多藝的東東,而GPU基本上就是只做浮點(diǎn)運(yùn)算的,因?yàn)樗蛔龈↑c(diǎn)運(yùn)算,設(shè)計結(jié)構(gòu)簡單,所以可以做的更快另外顯卡的GPU和單純?yōu)榱伺芨↑c(diǎn)高性能運(yùn)算的GPU還不是太一樣,顯卡的GPU還要考慮配合圖形輸出顯示等方面,而有些專用GPU設(shè)備就是一個PCI卡上面有一個強(qiáng)力浮點(diǎn)運(yùn)算GPU,沒有顯示輸出的,就是為了加快某些程序的浮點(diǎn)計算性能答案 5:
我也想說一點(diǎn)題外引申的,就好比城市交通里,有公交線、有地鐵線、有人行道、有天橋,交通的方式越是多樣,管理越是復(fù)雜,東京是以地鐵線復(fù)雜出名,歐洲是軌道交通,美國是公路交通,它們都是GPU,而-是個CPU答案 6:
一般而言GPU的浮點(diǎn)計算精度是不行的,另外GPU通常采用超長指令級和超寬的內(nèi)存總線實(shí)現(xiàn)在一個時鐘周期之內(nèi)完成多個并發(fā)計算,以此換取性能。答案 7:
一個面團(tuán) 加了豆沙變成豆包 加了肉餡變成肉包 需求不同答案 8:
應(yīng)用的側(cè)重點(diǎn)不同..答案 9:
導(dǎo)致GPU在某些運(yùn)算上比CPU快的因素有很多,一種簡單的理解方式:CPU上大量的晶體管被用來做Cac-e,而GPU上絕大部分晶體管被用來做ALU。用來做運(yùn)算的晶體管多了,自然速度會快。但不是所有的并行運(yùn)算在GPU上都快。需要滿足一些限制條件才能充分發(fā)揮GPU的處理能力,比如內(nèi)存訪問的Pattern / Branc-的類型和數(shù)量。答案 10:
技術(shù)上大家都介紹的差不多了,不過你問的很搞笑,出現(xiàn)的晚為啥不能比早的好或快??? 飛機(jī)汽車出現(xiàn)的晚,多快??!答案 11:
對不起,看到這個題目,實(shí)在忍不住,實(shí)在忍不住,要水一下:余華《許三觀-記》里的一句話,「-毛出得比眉毛晚,長得倒比眉毛長」我爽了,大家「沒有幫助」我吧。下一篇:什么樣的產(chǎn)品是京東、當(dāng)當(dāng)、1號店不會賣的? 下一篇 【方向鍵 ( → )下一篇】
上一篇:你剛?cè)胨瘯r有感覺到耳朵里有點(diǎn)嗡嗡的噪音嗎? 上一篇 【方向鍵 ( ← )上一篇】
快搜