蜜桃无码视频,欧美日韩一=三道夲,国产精品午夜AV电影网免费看,aaa.www

歡迎來到常識詞典網，一個專業(yè)的常識知識學習網站！

[ Ctrl + D 鍵 ]收藏本站

您所在的位置：首頁 > 教育學習 > 問答

問答

GPU 出現(xiàn)得遠比 CPU 晚，其浮點運算性能卻遠遠強于 CPU？

分類: 問答 常識詞典 編輯 : 常識發(fā)布 : 11-17

閱讀 :548

為什么 GPU 出現(xiàn)得遠比 CPU 晚，其浮點運算性能卻遠遠強于 CPU？GTX295峰值極限浮點性能測試 - 實測823GFlops11 個答案

答案 1：

在摩爾定律尚成立的時代，出現(xiàn)晚的處理器正應該對應更高的FLOPS(原因是更高的運算電路密度更高的時鐘頻率和更多的處理器內核)。02年GPU出現(xiàn)伊始，其浮點運算性能和當時的CPU差別并不大，之后的將近十年，CPU處理器的發(fā)展遇到了瓶頸(電路密度由于制造工藝而無法大幅優(yōu)化時鐘頻率由于高功耗也無法進一步提升多核由于其他方面的消耗并未使運算效率線形提升)，摩爾定律逐漸開始失效，然而計算機圖形學這個應用領域卻非常適合單指令多數據/線程(SIMD/SIMT)的并行化。因此，GPU在圖形及通用并行計算方面都取得了飛速的發(fā)展。相對于傳統(tǒng)CPU中單處理器支持單個硬件線程的架構，基于眾核架構的GPU采用一個處理器支持多個硬件線程的做法，這方面的介紹在Berkeley和Stanford的有關并行計算的課程上都有講到(.cs.berkeley.edu/~demmel/cs267_Spr11/ code.google/p/stanfo...)。NV自2007年開始推出CUDA至今，已經發(fā)展出了一套完整的二級并行架構。其中一簇執(zhí)行同樣指令的線程組成一個kernel，kernel又組合成一個block，在block級別有共享內存和其他的供線程間通信合作的機制。形象地說，這里的線程就是一個虛擬的向量處理器，其中包括自己的寄存器，程序計數器(PC)等，而一個block就是一個虛擬的多核處理器，其中包含多個線程和共享內存等。造成GPU和CPU根本差別的原因在于不同的目標需求：GPU假設運行其上的工作都是高度可并行的，而CPU需要同時很好的支持并行和順序操作。于是，CPU需要大的片上緩存和復雜的控制邏輯，GPU則利用多線程并行運行節(jié)省了片上的大緩存，同時針對一簇線程執(zhí)行同一套控制邏輯。因此，在高度并行化且數據規(guī)模巨大的應用下，GPU可以獲得很高的浮點運算性能，然而如果問題無法良好映射到某個合適的并行模型或當數據規(guī)模較小時，SIMT就無法發(fā)揮并行的優(yōu)勢，CPU與GPU之間的數據交換也會大大降低運算效率。不過，后一個問題在剛剛發(fā)布的CUDA4.0中已經通過GPUDirect2.0得到了改進)。

答案 2：

樓上王洋子豪已經講的很詳細了，這里我補充一點，就是如果硬件用于計算規(guī)整的，并行度高的算法，那么很容易針對算法進行優(yōu)化，而通用算法則因為其順序執(zhí)行，而執(zhí)行順序的高度不確定性，無法有效的進行優(yōu)化。在現(xiàn)代處理器工藝上，處理器比內存的速度高3個數量級是很正常的事情。由于程序和數據主要存在內存，因此CPU很多時候是在等待內存提供下一步需要的數據和代碼。另外，因為CPU的工作主要是順序執(zhí)行，在某一步的結果沒有計算出來之前，下一步計算就很難繼續(xù)，缺乏并行性是限制CPU性能的重要因素。因此GPU的浮點性能高于CPU，主要是得益于其所處理的算法和數據的特性。

答案 3：

晚出來的架構方面也會更有優(yōu)勢啊，沒記錯的話，GPU是并行計算，流水線短，并且GPU專門對圖形計算做了優(yōu)化

答案 4：

CPU除了負責浮點整形運算外，還有很多其他指令集的負載，比如多媒體-，硬件-等，所以CPU是個多才多藝的東東，而GPU基本上就是只做浮點運算的，因為他只做浮點運算，設計結構簡單，所以可以做的更快另外顯卡的GPU和單純?yōu)榱伺芨↑c高性能運算的GPU還不是太一樣，顯卡的GPU還要考慮配合圖形輸出顯示等方面，而有些專用GPU設備就是一個PCI卡上面有一個強力浮點運算GPU,沒有顯示輸出的，就是為了加快某些程序的浮點計算性能

答案 5：

我也想說一點題外引申的，就好比城市交通里，有公交線、有地鐵線、有人行道、有天橋，交通的方式越是多樣，管理越是復雜，東京是以地鐵線復雜出名，歐洲是軌道交通，美國是公路交通，它們都是GPU，而-是個CPU

答案 6：

一般而言GPU的浮點計算精度是不行的，另外GPU通常采用超長指令級和超寬的內存總線實現(xiàn)在一個時鐘周期之內完成多個并發(fā)計算，以此換取性能。

答案 7：

一個面團加了豆沙變成豆包加了肉餡變成肉包需求不同

答案 8：

應用的側重點不同..

答案 9：

導致GPU在某些運算上比CPU快的因素有很多，一種簡單的理解方式：CPU上大量的晶體管被用來做Cac-e，而GPU上絕大部分晶體管被用來做ALU。用來做運算的晶體管多了，自然速度會快。但不是所有的并行運算在GPU上都快。需要滿足一些限制條件才能充分發(fā)揮GPU的處理能力，比如內存訪問的Pattern / Branc-的類型和數量。

答案 10：

技術上大家都介紹的差不多了，不過你問的很搞笑，出現(xiàn)的晚為啥不能比早的好或快??？飛機汽車出現(xiàn)的晚，多快啊！

答案 11：

對不起，看到這個題目，實在忍不住，實在忍不住，要水一下：余華《許三觀-記》里的一句話，「-毛出得比眉毛晚，長得倒比眉毛長」我爽了，大家「沒有幫助」我吧。

標簽 : 問答 11-17

下一篇:電視劇要播片頭曲、片尾曲？下一篇 【方向鍵 ( → )下一篇】

上一篇:新浪微博的-詞庫是由自己整理編寫，還是由某些部門下發(fā)？上一篇 【方向鍵 ( ← )上一篇】

欄目列表

外語學校認證考試高考研究生留學百科為什么知道問答百科知識校園安全職場

相關文章

GPU 出現(xiàn)得遠比 CPU 晚，其浮點運算性能卻

最新文章

你怎么-銀聯(lián)在線支付和支付的競爭力？如果微博做成思維導圖形式好不好？中小板和創(chuàng)業(yè)板的區(qū)別是什么，2019創(chuàng)業(yè)板基百度搜索營銷怎么樣，盤點2019搜索引擎市場如何用 UC 瀏覽器上 Facebook？有關法國大革命的歷史有什么好書推薦嗎？實行保密工資制需要什么條件，帶你揭秘工資建設一個網站需要多少錢，開發(fā)個網站費用及手機如何打開eml格式文件，教你兩個方法立怎樣做電子商務掙錢，分享電商的入門知識與

快搜

首頁
網站導航
快速搜索
頂部

动漫涩涩免费网站在线看| 五月亚洲国产中文婷婷| 国产自偷在线拍精品热乐播AV| 国产人妖久久久| 国产精品一区二区三三| 人人爽欧美一区二区三区| av大全网| 白嫩丰满人妻| 亚洲A∨国产AV综合AV| 国产三香港三韩国三级高清| av免费成人好看| 亚洲AV综合色区无码一二三区| 全部av―极品视觉盛宴| 国产AV高清久久久精品| 国产精品久久久污污污| 亚洲av永久无码精品牛牛影视| 色欲天综合久久久无码网中文| 深夜精品久久久久| 人妻丰满熟AV无码区HD| 日韩精品人妻中文字幕有码无码| 伊甸园每日更新| 日木毛片| 你懂的国产精品永久在线| 亚洲黄色网址在线播放| 自拍偷拍中文字幕| 东京热免费福利影院| 欧美日韩国产精品一区二区在线观看 | av母乳在线观看| 无码毛片一区二区三区| 欧盟美女裸体久久久久| 久久中文字幕色伊伊| 国产在线码超清无码视频| a级片香蕉| 色欲久久久天天天综合精品网站| 人人做人人爽人人爱AV| 亚洲一区二区三| 一本无码在线视频| 亚洲一区波多野结衣在线app| 无码一区二区日日骚| 玩弄JAPAN白嫩少妇HD| 久在线视频在线看|

<span id="l598d"><noframes id="l598d">