熊蓋站 - 首頁

  Plurk Twitter    

» 您尚未 登入註冊 | 說明 | 娛樂中心 | 點歌 | 聊天留言 | 最新 | 精華 | 論壇 | 資訊 | 首頁 | 影音模式

熊蓋站  -> 硬體資訊  -> 【資訊】NVIDIA:Maxwell使用統一尋址,Volta集成堆棧式內存

--> 本頁主題: 【資訊】NVIDIA:Maxwell使用統一尋址,Volta集成堆棧式內存 加為IE收藏 | 收藏主題 | 上一主題 | 下一主題 | 可列印版本
andy6989


終身成就獎
頭銜:論壇執行長論壇執行長

∷ 職務: 站長 該帥哥目前不在線
∷ 編號: 1
∷ 級別: 天使會員
∷ 發帖: 8098
∷ 威望: 6189
∷ 財富: 36813 蓋幣
∷ 貢獻: 173
∷ 配偶: 單身
∷ 家族: 無門無派
∷ 註冊: 2005-01-30
∷ 上次: 2019-03-27
鮮花(55)
寵物資料

寵物狀態:生存
寵物級別:287 -最終進化-
寵物PK:開(接受挑戰)
HP:7275/7275
MP:674/674
SP:4800/5000
EXP:86%
  【字體: Plurk Twitter 
【本站推薦】:
 【資訊】NVIDIA:Maxwell使用統一尋址,Volta集成堆棧式內存

  在看過了Tegra處理器的路線圖之後,我們再來看看GTC 2013大會上公佈的GPU路線圖。在此之前我們只知道2013年依然是Kepler架構,不過核心會從去年的GK104變成現在的GK110,再下一代就是原本預計在2013年發佈的Maxwell麥克斯韋爾,現在推到了2014年。NVIDIA現在又給出了Maxwell的繼任者—— Alessandro Volta(亞歷山德羅·伏特,維基鏈接),他是一位意大利物理學家,電池的發明者。

  現在Volta還只是一個代號,詳細的架構信息不得而知,不過NVIDIA此次公佈的路線圖中給出了每代GPU架構的技術進步,我們可以從中一窺Volta的設計。



  Volta的特點是集成了堆棧式內存(Stacked DRAM),這意味著DRAM電路與GPU核心非常接近,二者通過TSVs(using through-silicon vias,硅通孔)技術連接起來。高帶寬的板載DRAM設計並非什麼新技術,但是這個設計依然非常獨特。

  以往的一個例子是索尼的PS Vita,它的GPU就有128MB的RAM內存,不過並沒有使用TSVs設計。Intel的Haswell處理器中新增了GT3級別的核心,還記得以前的新聞嗎,GT3核心就具備128MB的嵌入式緩存。

  使用堆棧式內存設計的好處不僅在於極大地提高了帶寬,而且延遲也會很低,相比外置式內存,它在速度及寬度上都有優勢,當然具體如何還要看實際配置。如果內存離GPU核心很近,那麼好處不僅是帶寬高,而且運行頻率也可以很高。

  對Volta來說,NVIDIA的目標是為其提供1TB/s的帶寬,這個數據是目前帶寬最高的GTX Titan的3倍,後者使用的是384bit位寬,1502MHz的GDDR5顯存,帶寬也只有288GB/s,那麼Volta有可能搭配的是1024bit位寬、速率8Gbps,也有可能是2048bit位寬、4Gbps速率,現在來看實現的難度頗大,不過Volta依然有好幾年的時間才能面世,技術進步的速度誰又能說清呢。



  更讓人感興趣的是NVIDIA如何解決芯載DRAM的容量問題。目前的DRAM(面積)還是相當大的,特別是GDDR顯存,顯卡要想完全使用這種設計不太可能,因為目前的消費級顯卡的顯存容量已經達到了6GB。

  NVIDIA更可能的做法是使用分離式DRAM設計,芯片內集成的DRAM主要用作緩存及共享內存的交換池(pool),而外部總線依然會搭配大容量顯存,雖然速度會比堆棧式集成的慢一些。

  Volta在NVIDIA的路線圖時並沒有時間表,因此我們不知道它什麼時候才能發佈。Maxwell原本預計在2013年發佈,但是也推遲到明年了,Kepler原本也是在2011年發佈的,結果也是在去年才發佈。雖然NVIDIA沒有說明為什麼,但是看起來NVIDIA的產品還是與TSMC的工藝緊密連接在一起,發佈新架構時往往需要使用新工藝,Volta的開發需要搭載某個特定的工藝,只不過目前這一切都是未知數。

  TSMC還在努力追趕製程工藝最先進的Intel,不過很難預計未來會發生什麼,所以(Volta)缺少時間表一點也不奇怪。NVIDIA在演講中提到了他們會在未來的Parker SoC(Logan之後的Tegra處理器,蜘蛛俠名字)處理器上使用FinFET(鰭式晶體管,也就是3D晶體管)工藝,但是沒有提到Volta也會使用FinFET工藝,因此具體如何還真不好說。

  NVIDIA也給出了有關Volta GPU性能的粗略估計,以單位瓦特的FP64雙精度性能為例,K20X大約是5.5GFLOPS/W,Volta大約是24ish,由於NVIDIA還要考慮功耗因素,因此同等TDP下我們可以認為Volta的性能是K20X的四倍左右,其FP64雙精度性能大約在5TFLOPS左右。當然,現在的估計只是一個早期預測,Volta離問世還有段距離。

  最後,Volta作為最新披露的GPU架構成功吸引住了媒體的眼光,以致於很多人都忽略了Maxwell的存在。Maxwell的設計要點其實也值得一看,它將是NVIDIA第一個使用「統一虛擬尋址(unified virtual address)」技術的GPU架構,這種設計對同時集成CPU和GPU的設備也非常重要,AMD的HSA異構計算要解決的一個問題就是統一尋址問題。

  還有Parker SoC處理器的問題,這是Logan(Tegra 5)之後的處理器代號,它將使用Maxwell架構,CPU架構則是Denver,NVIDIA的Project Denver就是為GPU開發基於ARM指令的CPU核心,意味著Parker及類似的處理器已經可以集成NVIDIA自己的CPU核心了。



※ ※ ※ 本文為 andy6989 與 熊蓋站 共同所有,未經同意,請勿轉載 ※ ※ ※

 



≡熊蓋站管理團隊≡--共勉之--



[樓 主] |
發表於:2013-03-20 06:01

  熊蓋站 -> 硬體資訊

v 最新文章        熊蓋站為自由討論論壇,所有個人行為或言論不代表本站立場。文章內容如有涉及侵權請聯絡我們,將立即刪除相關文章資料        v 精華文章

               

奇摩搜尋
完全比對 模糊比對

線上收看: 景點即時影像 | 線上查詢: 火車時刻表最上方

    Powered by 熊蓋站  Code © 2005-2017 Plurk Twitter 
讀取秒數Time 0.017237 second(s),query:4 Gzip enabled
   現在時間是 2024-11-27 22:54