熊蓋站 - 首頁

  Plurk Twitter    

» 您尚未 登入註冊 | 說明 | 娛樂中心 | 點歌 | 聊天留言 | 最新 | 精華 | 論壇 | 資訊 | 首頁 | 影音模式

熊蓋站  -> 硬體資訊  -> 【資訊】Maxwell架構曝光:6144個CUDA核心, 8GB 512bit

--> 本頁主題: 【資訊】Maxwell架構曝光:6144個CUDA核心, 8GB 512bit 加為IE收藏 | 收藏主題 | 上一主題 | 下一主題 | 可列印版本
andy6989


終身成就獎
頭銜:論壇執行長論壇執行長

∷ 職務: 站長 該帥哥目前不在線
∷ 編號: 1
∷ 級別: 天使會員
∷ 發帖: 8098
∷ 威望: 6189
∷ 財富: 36813 蓋幣
∷ 貢獻: 173
∷ 配偶: 單身
∷ 家族: 無門無派
∷ 註冊: 2005-01-30
∷ 上次: 2019-03-27
鮮花(55)
寵物資料

寵物狀態:生存
寵物級別:287 -最終進化-
寵物PK:開(接受挑戰)
HP:7275/7275
MP:674/674
SP:4800/5000
EXP:86%
  【字體: Plurk Twitter 
【本站推薦】:
 【資訊】Maxwell架構曝光:6144個CUDA核心, 8GB 512bit

NVIDIA目前一代的顯卡有GK104和GK110兩大分支,它們的側重點不同,但都是基於Kepler(開普勒,天文學家)架構的,下一代架構名為Maxwell(麥克斯韋爾,物理學家),根據之前的傳聞Maxwell最快將在明年Q1季度問世,製程有可能繼續使用TSMC的28nm製程。現在網上又流傳開Maxwell的架構設計了,旗艦GM100將有6144個​​CUDA核心,512bit頻寬記憶體,記憶體容量達到了更誇張的8GB。

據WCCFTech報導,Maxwell架構也會同時推向遊戲及計算兩大市場,NVIDIA計劃推出四款Maxwell架構GPU晶片——GM100、GM104、GM106和GM108。與Kepler架構相比,Maxwell將進一步增強SMX單元設計,優化雙精度邏輯單元。



目前Kepler架構中每組SMX單元有192個CUDA核心,Maxwell的SMX單元將進一步提升CUDA核心數到256個,不過DP雙精度浮點單元的比例會從目前的1:3降低到1:4,算起來DP單元總數是保持不變的。256個CUDA核心的SMX單元將大幅增加Maxwell的CUDA總數,而DP雙精度單元不用時是可以關閉的,這樣也能降低能耗。

紋理單元方面,每組SMX單元會繼續維持16個TMU單元,跟Kepler是一樣的。

Maxwell的緩存設計也會進一步增強,每組SMX單元會額外增加2個寄存器,大量寄存器線程現在也可以並行運行了。L1緩存從Kepler架構的64kb增加到了128kb,而且可以作為共享內存使用,並且可以32/96、64/64、96/32的比例分配成緩存、共享內存。

L1緩存之外,每個GPC單元還會獨享768kb L2緩存作為指令緩存。

具體的四款Maxwell晶片的詳細架構如下所示:
GM110核心
目前的GK104核心有4組GPC單元,GK110是5組GPC單元,而GM110擁有8組GPC單元,每個GPC單元有三組SMX單元,每組SMX單元又有256個CUDA核心,這樣總計有6144個CUDA核心,384個紋理單元,8MB L3緩存,64個ROP單元,512bit記憶體頻寬,記憶體容量則達到誇張的8GB。

GM100無疑將取代GK110的旗艦地位,同時用於Tesla和GeForce高端產品線,不過這兩個市場的GM100核心也有所不同:GeForce領域中的GM110核心頻率在930MHz左右,加速頻率1GHz左右,而Tesla中的GM110核心頻率約為850MHz,雙精度浮點性能達到了2.61TFLOPS。(作為對比的是GTX Titan目前的單精度性能是4.5FLOPS,雙精度是1.3TFLOPS)

GM104核心
GM104核心將取代目前的GK104核心,後者的代表產品是GTX 680和GTX 770。

GM104的GPC單元數量降低到5組,擁有3840個CUDA核心,240個TMU紋理單元,40個ROP光柵單元,記憶體頻寬降低到320bit,記憶體容量3GB,也可能是跟Fermi一樣的2.5GB,不過記憶體頻寬降低也使得頻率可以更高,記憶體頻率在7GHz左右,核心頻率1GHz左右。

GM106核心
GM106核心將取代目前249美元以內的GK106核心的顯卡,比如GTX 660、GTX 650 Ti、GTX 650 Ti Boost等。

不過GM106相對來說提升也是非常大的,CUDA核心將從目前的960個暴增到2304個,4MB L3緩存,144個紋理單元,24個ROP單元,記憶體頻寬192bit,容量3GB,頻率也能達到7GHz。

GM108核心
GM108之前其實還有GM107核心,目前後者的架構未知,不過驅動信息中已經有GM107存在的暗示了。

目前的ES樣品顯示GM108有576個CUDA核心,48個紋理單元,8個ROP單元,64bit記憶體頻寬,核心面積跟GF117差不多。

丹佛計劃將從Maxwell升級版時代開始?
在NVIDIA最神秘的計劃中,Preject Denver丹佛計劃最為引人注目,因為它將整合NVIDIA的GPU和ARM的CPU,有關這個處理器的進度一直沒有明確消息。最新洩露的消息顯示NIVIDIA在Maxwell升級版階(GM11x)段推出丹佛計劃,因為NVIDIA一直在等新的FinFET製程成熟。這個說法跟NVIDIA在之前的GTC 2013大會上公佈的進度有些相符。



丹佛處理器將整合64位ARM CPU核心,其中只有GM110會搭配8核丹佛處理器,GM110實際上應該被成為GM110 SoC處理器,已經不是單一的GPU或者CPU了。消費級的GM110將有4個CPU核心,整合的GPU則是GM114。整合GM116圖形核心的丹佛則只會搭配2個CPU核心。洩露的報告沒提到GM118核心整合什麼丹佛核心,因此它很可能並不會使用新的架構。

丹佛處理器將有一致性總線(coherent link )用於連接CPU和GPU核心,並會在二者之間分配不同負載。爆料者稱NVIDIA認為丹佛計劃及相應的驅動優化會使他們的顯卡比AMD為GCN架構優化的私有Mantle API更強。

目前最重要但是還不能確認的就是這些晶片是否能在2014年上半年發布,因為TSMC預計在2014年2月份才能量產20nm製程,而且AMD預計在未來兩個季度內使用14nm FinFET製程流片新處理器,不過真正發布要等到2014年底甚至2015年初。這意味著2014年上半年最可能發布的還是他們的移動晶片,AMD是Crystal系列,NVIDIA是GTX 800M系列,而桌面版有可能到2014年下半年才能發布了。



2016年,NVIDIA會進入Vlota架構時代,根據之前在GTC 2013大會上公佈的官方消息,Volta架構的帶寬可達1TB/s。


※ ※ ※ 本文為 andy6989 與 熊蓋站 共同所有,未經同意,請勿轉載 ※ ※ ※

 



≡熊蓋站管理團隊≡--共勉之--



[樓 主] |
發表於:2013-10-23 15:02

  熊蓋站 -> 硬體資訊

v 最新文章        熊蓋站為自由討論論壇,所有個人行為或言論不代表本站立場。文章內容如有涉及侵權請聯絡我們,將立即刪除相關文章資料        v 精華文章

               

奇摩搜尋
完全比對 模糊比對

線上收看: 景點即時影像 | 線上查詢: 火車時刻表最上方

    Powered by 熊蓋站  Code © 2005-2017 Plurk Twitter 
讀取秒數Time 0.011363 second(s),query:4 Gzip enabled
   現在時間是 2024-11-27 13:00