蜜桃无码视频,欧美日韩一=三道夲,国产精品午夜AV电影网免费看,aaa.www

歡迎來到 常識詞典網 , 一個專業(yè)的常識知識學習網站!

[ Ctrl + D 鍵 ]收藏本站

您所在的位置:首頁 > 教育學習 > 問答

問答

GPU 出現(xiàn)得遠比 CPU 晚,其浮點運算性能卻遠遠強于 CPU?

分類: 問答 常識詞典 編輯 : 常識 發(fā)布 : 11-17

閱讀 :548

為什么 GPU 出現(xiàn)得遠比 CPU 晚,其浮點運算性能卻遠遠強于 CPU?GTX295峰值極限浮點性能測試 - 實測823GFlops11 個答案

答案 1:

在摩爾定律尚成立的時代,出現(xiàn)晚的處理器正應該對應更高的FLOPS(原因是更高的運算電路密度 更高的時鐘頻率和更多的處理器內核)。02年GPU出現(xiàn)伊始,其浮點運算性能和當時的CPU差別并不大,之后的將近十年,CPU處理器的發(fā)展遇到了瓶頸(電路密度由于制造工藝而無法大幅優(yōu)化 時鐘頻率由于高功耗也無法進一步提升 多核由于其他方面的消耗 并未使運算效率線形提升),摩爾定律逐漸開始失效,然而計算機圖形學這個應用領域卻非常適合單指令多數據/線程(SIMD/SIMT)的并行化。因此,GPU在圖形及通用并行計算方面都取得了飛速的發(fā)展。相對于傳統(tǒng)CPU中單處理器支持單個硬件線程的架構,基于眾核架構的GPU采用一個處理器支持多個硬件線程的做法,這方面的介紹在Berkeley和Stanford的有關并行計算的課程上都有講到(.cs.berkeley.edu/~demmel/cs267_Spr11/ code.google/p/stanfo...)。NV自2007年開始推出CUDA至今,已經發(fā)展出了一套完整的二級并行架構。其中一簇執(zhí)行同樣指令的線程組成一個kernel,kernel又組合成一個block,在block級別有共享內存和其他的供線程間通信合作的機制。形象地說,這里的線程就是一個虛擬的向量處理器,其中包括自己的寄存器,程序計數器(PC)等,而一個block就是一個虛擬的多核處理器,其中包含多個線程和共享內存等。造成GPU和CPU根本差別的原因在于不同的目標需求:GPU假設運行其上的工作都是高度可并行的,而CPU需要同時很好的支持并行和順序操作。于是,CPU需要大的片上緩存和復雜的控制邏輯,GPU則利用多線程并行運行節(jié)省了片上的大緩存,同時針對一簇線程執(zhí)行同一套控制邏輯。因此,在高度并行化且數據規(guī)模巨大的應用下,GPU可以獲得很高的浮點運算性能,然而如果問題無法良好映射到某個合適的并行模型或當數據規(guī)模較小時,SIMT就無法發(fā)揮并行的優(yōu)勢,CPU與GPU之間的數據交換也會大大降低運算效率。不過,后一個問題在剛剛發(fā)布的CUDA4.0中已經通過GPUDirect2.0得到了改進)。

答案 2:

樓上王洋子豪已經講的很詳細了,這里我補充一點,就是如果硬件用于計算規(guī)整的,并行度高的算法,那么很容易針對算法進行優(yōu)化,而通用算法則因為其順序執(zhí)行,而執(zhí)行順序的高度不確定性,無法有效的進行優(yōu)化。在現(xiàn)代處理器工藝上,處理器比內存的速度高3個數量級是很正常的事情。由于程序和數據主要存在內存,因此CPU很多時候是在等待內存提供下一步需要的數據和代碼。另外,因為CPU的工作主要是順序執(zhí)行,在某一步的結果沒有計算出來之前,下一步計算就很難繼續(xù),缺乏并行性是限制CPU性能的重要因素。因此GPU的浮點性能高于CPU,主要是得益于其所處理的算法和數據的特性。

答案 3:

晚出來的架構方面也會更有優(yōu)勢啊,沒記錯的話,GPU是并行計算,流水線短,并且GPU專門對圖形計算做了優(yōu)化

答案 4:

CPU除了負責浮點整形運算外,還有很多其他指令集的負載,比如多媒體-,硬件-等,所以CPU是個多才多藝的東東,而GPU基本上就是只做浮點運算的,因為他只做浮點運算,設計結構簡單,所以可以做的更快另外顯卡的GPU和單純?yōu)榱伺芨↑c高性能運算的GPU還不是太一樣,顯卡的GPU還要考慮配合圖形輸出顯示等方面,而有些專用GPU設備就是一個PCI卡上面有一個強力浮點運算GPU,沒有顯示輸出的,就是為了加快某些程序的浮點計算性能

答案 5:

我也想說一點題外引申的,就好比城市交通里,有公交線、有地鐵線、有人行道、有天橋,交通的方式越是多樣,管理越是復雜,東京是以地鐵線復雜出名,歐洲是軌道交通,美國是公路交通,它們都是GPU,而-是個CPU

答案 6:

一般而言GPU的浮點計算精度是不行的,另外GPU通常采用超長指令級和超寬的內存總線實現(xiàn)在一個時鐘周期之內完成多個并發(fā)計算,以此換取性能。

答案 7:

一個面團 加了豆沙變成豆包 加了肉餡變成肉包 需求不同

答案 8:

應用的側重點不同..

答案 9:

導致GPU在某些運算上比CPU快的因素有很多,一種簡單的理解方式:CPU上大量的晶體管被用來做Cac-e,而GPU上絕大部分晶體管被用來做ALU。用來做運算的晶體管多了,自然速度會快。但不是所有的并行運算在GPU上都快。需要滿足一些限制條件才能充分發(fā)揮GPU的處理能力,比如內存訪問的Pattern / Branc-的類型和數量。

答案 10:

技術上大家都介紹的差不多了,不過你問的很搞笑,出現(xiàn)的晚為啥不能比早的好或快??? 飛機汽車出現(xiàn)的晚,多快啊!

答案 11:

對不起,看到這個題目,實在忍不住,實在忍不住,要水一下:余華《許三觀-記》里的一句話,「-毛出得比眉毛晚,長得倒比眉毛長」我爽了,大家「沒有幫助」我吧。

下一篇:電視劇要播片頭曲、片尾曲? 下一篇 【方向鍵 ( → )下一篇】

上一篇:新浪微博的-詞庫是由自己整理編寫,還是由某些部門下發(fā)? 上一篇 【方向鍵 ( ← )上一篇】

动漫涩涩免费网站在线看| 五月亚洲国产中文婷婷| 国产自偷在线拍精品热乐播AV| 国产人妖久久久| 国产精品一区二区三三| 人人爽欧美一区二区三区| av大全网| 白嫩丰满人妻| 亚洲A∨国产AV综合AV| 国产三香港三韩国三级高清| av免费成人好看| 亚洲AV综合色区无码一二三区| 全部av―极品视觉盛宴| 国产AV高清久久久精品| 国产精品久久久污污污| 亚洲av永久无码精品牛牛影视| 色欲天综合久久久无码网中文| 深夜精品久久久久| 人妻丰满熟AV无码区HD| 日韩精品人妻中文字幕有码无码| 伊甸园每日更新| 日木毛片| 你懂的国产精品永久在线| 亚洲黄色网址在线播放| 自拍偷拍中文字幕| 东京热免费福利影院| 欧美日韩国产精品一区二区在线观看 | av母乳在线观看| 无码毛片一区二区三区| 欧盟美女裸体久久久久| 久久中文字幕色伊伊| 国产在线码超清无码视频| a级片香蕉| 色欲久久久天天天综合精品网站| 人人做人人爽人人爱AV| 亚洲一区二区三| 一本无码在线视频| 亚洲一区波多野结衣在线app| 无码一区二区日日骚| 玩弄JAPAN白嫩少妇HD| 久在线视频在线看|