熊蓋站 - 首頁

  Plurk Twitter    

» 您尚未 登入註冊 | 說明 | 娛樂中心 | 點歌 | 聊天留言 | 最新 | 精華 | 論壇 | 資訊 | 首頁 | 影音模式

熊蓋站  -> 硬體資訊  -> 【資訊】NVIDIA:不是GPU加速太強而是原始代碼太爛

--> 本頁主題: 【資訊】NVIDIA:不是GPU加速太強而是原始代碼太爛 加為IE收藏 | 收藏主題 | 上一主題 | 下一主題 | 可列印版本
andy6989


終身成就獎
頭銜:論壇執行長論壇執行長

∷ 職務: 站長 該帥哥目前不在線
∷ 編號: 1
∷ 級別: 天使會員
∷ 發帖: 8098
∷ 威望: 6189
∷ 財富: 36813 蓋幣
∷ 貢獻: 173
∷ 配偶: 單身
∷ 家族: 無門無派
∷ 註冊: 2005-01-30
∷ 上次: 2019-03-27
鮮花(55)
寵物資料

寵物狀態:生存
寵物級別:287 -最終進化-
寵物PK:開(接受挑戰)
HP:7275/7275
MP:674/674
SP:4800/5000
EXP:86%
  【字體: Plurk Twitter 
【本站推薦】:
 【資訊】NVIDIA:不是GPU加速太強而是原始代碼太爛

GPGPU通用計算發展的現在早已過了萌芽期,新一代TOP500超級計算機狀元「Titan」使用的就是NVIDIA的Tesla K20加速卡作為運算主力。專業領域離消費者很遠,而我們之前做過的測試也顯示GPU通用計算也能在圖像處理、視頻編碼這樣的日常應用中給消費者帶來性能提升。


GPU編程性能確實有提高,但是沒有這麼神奇

如今的顯卡一年半左右升級一次,Tesla K20相比上一代Fermi有三倍雙精度浮點性能提升,使用GPU加速的代碼也有100或者200倍的性能提升,NVIDIA以及AMD展示的代碼已經證明了這一前景,不過理念是好的,但是GPU加速真的有這麼強大的加速效果嗎?

NVIDIA Tesla事業部總監Sumit Gupta在接受INQ採訪時稱GPU帶來的上百倍性能提升是被現實中未優化的代碼打敗了。他說:「我們見到的100倍、200倍甚至更高的代碼性能提升主要來自大學,NVIDIA已經跟許多大學合作,展示了GPU加速代碼有100倍的性能提升。」
  「他們主要來自學術研究機構,如果你仔細看一下為什麼這些代碼有100倍的性能提升,你就會發現主要原因是他們編寫的CPU代碼太爛,因為他們中很多並不是專業的計算機科學家,而是生物學家、化學家以及物理學家,他們寫的C代碼對CPU來說也不夠好,所以他們發現在GPU上使用CUDA或者CUDA Fortran編程要比在多核CPU上使用MPI或者多線程編程要容易的多。」
  按照Gupta的說法,其實很多人在GPU編程環境下獲得上百倍或更高的代碼性能提升的原因並不是GPU編程性能太強大了,而是因為原始的代碼太爛,對多核CPU支持都不夠好,所以一旦用在了超多核心的GPU上性能就會大幅提升。
  Gupta稱在HPC領域中如果代碼對多核CPU優化的足夠好,那麼在GPU加速環境中代碼性能提升也就只有5-10倍了,有些情況下還會更少,甚至只有2倍。不過2倍代碼加速也很不錯了,因為這樣的情況下CPU優化已經沒有空間了。
  NVIDIA早前在宣傳GPGPU通用計算時曾經舉過例子,PPT上展示的通常都是使用GPU編程性能可以提升數百倍,令人興奮不已。如今他們自己也公佈實情了,這樣的情況通常是因為原始的代碼對多核優化不足,連CPU性能也不能充分發揮,所以在GPU上表現出更多的性能提升。
  如果原始的代碼已經優化到位,那麼在GPU加速環境下性能提升通常只有幾倍,甚至只有2倍。不過2倍的提升也算是一個滿意的結果了,因為CPU核心數量有限,此時已經沒有太多的優化空間了。


※ ※ ※ 本文為 andy6989 與 熊蓋站 共同所有,未經同意,請勿轉載 ※ ※ ※

 



≡熊蓋站管理團隊≡--共勉之--



[樓 主] |
發表於:2012-11-26 05:19

  熊蓋站 -> 硬體資訊

v 最新文章        熊蓋站為自由討論論壇,所有個人行為或言論不代表本站立場。文章內容如有涉及侵權請聯絡我們,將立即刪除相關文章資料        v 精華文章

               

奇摩搜尋
完全比對 模糊比對

線上收看: 景點即時影像 | 線上查詢: 火車時刻表最上方

    Powered by 熊蓋站  Code © 2005-2017 Plurk Twitter 
讀取秒數Time 0.011132 second(s),query:4 Gzip enabled
   現在時間是 2024-11-27 22:28