蜜桃无码视频,欧美日韩一=三道夲,国产精品午夜AV电影网免费看,aaa.www

歡迎來到 常識詞典網(wǎng) , 一個專業(yè)的常識知識學(xué)習(xí)網(wǎng)站!

[ Ctrl + D 鍵 ]收藏本站

您所在的位置:首頁 > 教育學(xué)習(xí) > 問答

問答

GPU 出現(xiàn)得遠(yuǎn)比 CPU 晚,其浮點(diǎn)運(yùn)算性能卻遠(yuǎn)遠(yuǎn)強(qiáng)于 CPU?

分類: 問答 常識詞典 編輯 : 常識 發(fā)布 : 11-08

閱讀 :591

為什么 GPU 出現(xiàn)得遠(yuǎn)比 CPU 晚,其浮點(diǎn)運(yùn)算性能卻遠(yuǎn)遠(yuǎn)強(qiáng)于 CPU?GTX295峰值極限浮點(diǎn)性能測試 - 實(shí)測823GFlops11 個答案

答案 1:

在摩爾定律尚成立的時代,出現(xiàn)晚的處理器正應(yīng)該對應(yīng)更高的FLOPS(原因是更高的運(yùn)算電路密度 更高的時鐘頻率和更多的處理器內(nèi)核)。02年GPU出現(xiàn)伊始,其浮點(diǎn)運(yùn)算性能和當(dāng)時的CPU差別并不大,之后的將近十年,CPU處理器的發(fā)展遇到了瓶頸(電路密度由于制造工藝而無法大幅優(yōu)化 時鐘頻率由于高功耗也無法進(jìn)一步提升 多核由于其他方面的消耗 并未使運(yùn)算效率線形提升),摩爾定律逐漸開始失效,然而計算機(jī)圖形學(xué)這個應(yīng)用領(lǐng)域卻非常適合單指令多數(shù)據(jù)/線程(SIMD/SIMT)的并行化。因此,GPU在圖形及通用并行計算方面都取得了飛速的發(fā)展。相對于傳統(tǒng)CPU中單處理器支持單個硬件線程的架構(gòu),基于眾核架構(gòu)的GPU采用一個處理器支持多個硬件線程的做法,這方面的介紹在Berkeley和Stanford的有關(guān)并行計算的課程上都有講到(.cs.berkeley.edu/~demmel/cs267_Spr11/ code.google/p/stanfo...)。NV自2007年開始推出CUDA至今,已經(jīng)發(fā)展出了一套完整的二級并行架構(gòu)。其中一簇執(zhí)行同樣指令的線程組成一個kernel,kernel又組合成一個block,在block級別有共享內(nèi)存和其他的供線程間通信合作的機(jī)制。形象地說,這里的線程就是一個虛擬的向量處理器,其中包括自己的寄存器,程序計數(shù)器(PC)等,而一個block就是一個虛擬的多核處理器,其中包含多個線程和共享內(nèi)存等。造成GPU和CPU根本差別的原因在于不同的目標(biāo)需求:GPU假設(shè)運(yùn)行其上的工作都是高度可并行的,而CPU需要同時很好的支持并行和順序操作。于是,CPU需要大的片上緩存和復(fù)雜的控制邏輯,GPU則利用多線程并行運(yùn)行節(jié)省了片上的大緩存,同時針對一簇線程執(zhí)行同一套控制邏輯。因此,在高度并行化且數(shù)據(jù)規(guī)模巨大的應(yīng)用下,GPU可以獲得很高的浮點(diǎn)運(yùn)算性能,然而如果問題無法良好映射到某個合適的并行模型或當(dāng)數(shù)據(jù)規(guī)模較小時,SIMT就無法發(fā)揮并行的優(yōu)勢,CPU與GPU之間的數(shù)據(jù)交換也會大大降低運(yùn)算效率。不過,后一個問題在剛剛發(fā)布的CUDA4.0中已經(jīng)通過GPUDirect2.0得到了改進(jìn))。

答案 2:

樓上王洋子豪已經(jīng)講的很詳細(xì)了,這里我補(bǔ)充一點(diǎn),就是如果硬件用于計算規(guī)整的,并行度高的算法,那么很容易針對算法進(jìn)行優(yōu)化,而通用算法則因?yàn)槠漤樞驁?zhí)行,而執(zhí)行順序的高度不確定性,無法有效的進(jìn)行優(yōu)化。在現(xiàn)代處理器工藝上,處理器比內(nèi)存的速度高3個數(shù)量級是很正常的事情。由于程序和數(shù)據(jù)主要存在內(nèi)存,因此CPU很多時候是在等待內(nèi)存提供下一步需要的數(shù)據(jù)和代碼。另外,因?yàn)镃PU的工作主要是順序執(zhí)行,在某一步的結(jié)果沒有計算出來之前,下一步計算就很難繼續(xù),缺乏并行性是限制CPU性能的重要因素。因此GPU的浮點(diǎn)性能高于CPU,主要是得益于其所處理的算法和數(shù)據(jù)的特性。

答案 3:

晚出來的架構(gòu)方面也會更有優(yōu)勢啊,沒記錯的話,GPU是并行計算,流水線短,并且GPU專門對圖形計算做了優(yōu)化

答案 4:

CPU除了負(fù)責(zé)浮點(diǎn)整形運(yùn)算外,還有很多其他指令集的負(fù)載,比如多媒體-,硬件-等,所以CPU是個多才多藝的東東,而GPU基本上就是只做浮點(diǎn)運(yùn)算的,因?yàn)樗蛔龈↑c(diǎn)運(yùn)算,設(shè)計結(jié)構(gòu)簡單,所以可以做的更快另外顯卡的GPU和單純?yōu)榱伺芨↑c(diǎn)高性能運(yùn)算的GPU還不是太一樣,顯卡的GPU還要考慮配合圖形輸出顯示等方面,而有些專用GPU設(shè)備就是一個PCI卡上面有一個強(qiáng)力浮點(diǎn)運(yùn)算GPU,沒有顯示輸出的,就是為了加快某些程序的浮點(diǎn)計算性能

答案 5:

我也想說一點(diǎn)題外引申的,就好比城市交通里,有公交線、有地鐵線、有人行道、有天橋,交通的方式越是多樣,管理越是復(fù)雜,東京是以地鐵線復(fù)雜出名,歐洲是軌道交通,美國是公路交通,它們都是GPU,而-是個CPU

答案 6:

一般而言GPU的浮點(diǎn)計算精度是不行的,另外GPU通常采用超長指令級和超寬的內(nèi)存總線實(shí)現(xiàn)在一個時鐘周期之內(nèi)完成多個并發(fā)計算,以此換取性能。

答案 7:

一個面團(tuán) 加了豆沙變成豆包 加了肉餡變成肉包 需求不同

答案 8:

應(yīng)用的側(cè)重點(diǎn)不同..

答案 9:

導(dǎo)致GPU在某些運(yùn)算上比CPU快的因素有很多,一種簡單的理解方式:CPU上大量的晶體管被用來做Cac-e,而GPU上絕大部分晶體管被用來做ALU。用來做運(yùn)算的晶體管多了,自然速度會快。但不是所有的并行運(yùn)算在GPU上都快。需要滿足一些限制條件才能充分發(fā)揮GPU的處理能力,比如內(nèi)存訪問的Pattern / Branc-的類型和數(shù)量。

答案 10:

技術(shù)上大家都介紹的差不多了,不過你問的很搞笑,出現(xiàn)的晚為啥不能比早的好或快??? 飛機(jī)汽車出現(xiàn)的晚,多快??!

答案 11:

對不起,看到這個題目,實(shí)在忍不住,實(shí)在忍不住,要水一下:余華《許三觀-記》里的一句話,「-毛出得比眉毛晚,長得倒比眉毛長」我爽了,大家「沒有幫助」我吧。

下一篇:什么樣的產(chǎn)品是京東、當(dāng)當(dāng)、1號店不會賣的? 下一篇 【方向鍵 ( → )下一篇】

上一篇:你剛?cè)胨瘯r有感覺到耳朵里有點(diǎn)嗡嗡的噪音嗎? 上一篇 【方向鍵 ( ← )上一篇】

国产亚洲精品精品2020| 色婷婷在线播放| 日韩天堂无码AV| 五月婷婷综合在线国产| 99在线这里只有精品| 在线观看网友自拍日韩| 九九综合色| 国产成人精品亚洲午夜| 久久久永久久久人妻精品麻豆| 性色国产AV| 久久综合给合久久97色| 国语自产精品视频在线观看 | 天天草狠狠| 熟夫视频| 人妻在线视频xxx| 精品一区二区三区不卡无码| 被黑人巨大的进入| 日本精品二区视频| 国内精品视频一区国产| 亚洲永久精品一区二区三区高清| 色综合视频小说| 国产精品一区二区三区涩爱av | 在线看片免费人成视频免费大片| a视频在线看| 欧美淫秽网免费观看| 亚洲熟妇无码自拍区| 视色在线视频| 无码福利一区| 色噜噜2016在线视频| 色呦呦视频自| 日本黄色91大片| 久久精品。| 全椒县| 性无码免费一区二区三区| 全免费一级毛片免费观看| 99热这里精品| 黑人与亚洲熟妇色xxxxx| 精品国产美女| 欧美国产中文在线字幕视频| 色老头影视AV| 超碰188|