熊蓋站 - 首頁

  Plurk Twitter    

» 您尚未 登入註冊 | 說明 | 娛樂中心 | 點歌 | 聊天留言 | 最新 | 精華 | 論壇 | 資訊 | 首頁 | 影音模式

以文本方式查看主題

-  熊蓋站 (http://localhost/phpwind//index.php)
--  硬體資訊 (http://localhost/phpwind//thread.php?fid=20&page=22)
--  【資訊】NVIDIA GTX 680&GK104詳細規格曝光 (http://localhost/phpwind//read.php?fid=20&tid=33225)


--  作者:andy6989
--  發佈時間:2012 02 12 5:20 AM

--  【資訊】NVIDIA GTX 680&GK104詳細規格曝光


一貫還算靠譜的德國3DCenter.org又放出了NVIDIA那邊開普勒家族中端核心「GK104」的諸多參數,比之前任何一次都要詳盡。
首先,有可靠消息來源稱,開普勒架構會使用和目前費米架構截然不同的流處理器設計,但同時又保留類似的「等級制度」,從而確保更高的並行度,強化通用計算能力。看來,NVIDIA的確是認準了並行計算這條路,準備堅定不移地走下去。
根據目前的說法,GK104 SIMD體系設計中有4個圖形處理集群(GPC),每個集群內劃分為4個流式處理器陣列(SM),然後每個陣列內包含96個流處理器(SP),這就是總共96×4×4=1536個流處理器。
紋理和幾何方面,每個SM陣列中配備8個紋理單元,總計128個,ROP光柵單元則是整個核心32個。
顯存方面和之前說的一樣,256-bit位寬,2GB GDDR5容量。
再看頻率,核心與流處理器同步定在950MHz,不再像這麼多年來那樣非同步運行,而顯存頻率比費米時代有所改進但還是沒AMD那麼快,等效為5000MHz,頻寬160GB/s——相比於Radeon HD 7970 264GB/s差了不少。
浮點性能上,GK104單精度最高2.9TFlops,雙精度最高486GFlops,二者比例大約為6:1。相比之下,Radeon HD 7970的單雙精度浮點性能分別為3.79TFlops、947GFlops,基本上是4:1。
最後,同樣採用28nm工藝的GK104核心面積估計約為340平方毫米,但具體晶體管數量未知(傳聞多達60億個但太離譜了)——AMD Tahiti核心晶體管43.1億個,面積365平方毫米。

繼昨天3DCenter.org後,一向善於深度分析的BSN網站也於今日放出了關於NVIDIA 28nm工藝Kepler架構GK104核心的消息:部分和本站昨日報導的大體相同,不過還有一些細微之處值得玩味。(關於昨日的傳聞PCINLIFE管理員cho此次一反常態沒有扔出一句"Fake"或者「瞎編」就走,此外多方來源已經間接暗示多數細節為真)
首先關於NVIDIA將核心頻率和Shader頻率統一這個早有相關報導。Kepler架構中一組SM的CUDA Core數量對比Fermi翻倍,由32升為96個。顯存控制器為256bit界面,這些都與昨天3DCenter的消息相同。
接下來讓我們來看看GK104的核心示意圖:

大眼一看和GF110類似,不過仔細看就能發現SP數量由512暴增至1536。BSN稱,起初NVIDIA考慮GK104上市初的名稱是GeForce GTX 660,但現在有99%的可能正式上市名稱為GeForce GTX 680,剩下1%為GTX 660/670。價格方面也和之前大嘴查理所說的不同:GeForce GTX 680定位於GeForce GTX 560 Ti 2GB/GeForce GTX 560 Ti 448 Core/GeForce GTX 570的替代者,初步定價為349-399美元。性能方面當然要比上代旗艦GeForce GTX 580要高很多,最重要的是GK104不僅能幹掉449美元的Radeon HD 7950 3GB,549美元的Radeon HD 7970也不在話下,有消息稱3DMark 11 X模式得分可能會在3000左右,一夜爆降千元看來即將出現……(提示:1536/1024或768/512)
接下來是GK104的架構分析,Kepler時代一組SM以96個CUDA Core為基準,1個GPC(Graphics Processing Clusters)含4組SM共384個CUDA Core。GK104含1536個(4GPC),不難推測頂級的GK110可能含6GPC即2304個CUDA Core。顯存控制器方面可能仍為低端入門級64bit,中端主流128bit,中高端256bit,頂級384/512bit——應先用在HPC上,或者採用GK110的GeForce GTX 690。而Kepler的移動圖形核心其實已經早已流片完成,CES上三星已經展示了搭載最低端(96CUDA Core)的筆記本電腦。(驅動程序對頻率/規格識別有誤)


和AMD的Tahiti XT對比,GK104在ROP和TMU數量上一樣——均為32個和128個,但顯存控制器指標仍然延續不如AMD的「傳統」,2GB 256bit GDDR5顯存對上Raeon HD 7970/7950的3GB。不過價格和性能上的優勢相信屆時也會迫使對手產品降價。
和GF110一樣,GK104其實也有兩個版本——生產Quadro和Tesla的雙精度浮點性能為單精度的一半,而生產GeForce的理論上為四分之一。
目前GK104的核心頻率暫定為950MHz,但BSN稱消息來源表示在NVIDIA的實驗室中起初有兩個版本:772MHz用來和相同的GeForce GTX 580比較,925MHz用來和相同的Tahiti XT做比較,實際出貨版本核心頻率可能會在950-1000MHz之間。當然,類似AMD的藍色小藥丸,NVIDIA目前也在加緊調整BIOS,爭取使公版的GK104核心頻率屆時站上1GHz。如果NVIDIA無法完成這一目標,那麼將第一時間開放非公版/AIC超頻版。
顯存方面,目前暫定的頻率為1.25GHz等效5GHz,相對GF100/110的提升了25%。這方面AMD在GDDR5顯存/控制器上算是標準制訂者之一,因此AMD的GPU工程師在提高GDDR5顯存方面具有優勢也就不稀奇。 由前面所述的頻率計算,GK104擁有160GB/s的顯存頻寬,對比GTX 580的192.4GB/s略有下降,但比起預計替代的產品GTX 560 Ti和GTX 560 Ti GF110核心版本/GTX 570的128.27GB/s和152GB/s均有提升。
所有這些規格帶來的單精度浮點運算能力為2.9-3.05TFLOPS,雙精度浮點為486-500GFLOPS。Quadro和Tesla版本會擁有解鎖的雙精度浮點運算能力——也就是1.5-1.6TFLOPS左右,和GTX 580的單精度浮點運算能力相當,顯著高於Fermi核心的Quadro和Tesla。
BSN最後稱,用戶們不會等待太長時間,NVIDIA已經準備開始Kepler的預售/鋪貨等行動(包括中端的GK107——GeForce GTX 650等),在市場行動上用來反擊AMD將於2月15日發佈的"Cape Verde"Radeon HD 7700系列和3月6日德國漢諾威CeBIT展會上發佈的"Pitcairn"Radeon HD 7800系列。或許下個月市場上就能見到Kepler的實體。


v 最新文章        熊蓋站為自由討論論壇,所有個人行為或言論不代表本站立場。文章內容如有涉及侵權請聯絡我們,將立即刪除相關文章資料        v 精華文章

               

奇摩搜尋
完全比對 模糊比對

線上收看: 景點即時影像 | 線上查詢: 火車時刻表最上方

    Powered by 熊蓋站  Code © 2005-2017 Plurk Twitter 
讀取秒數Time 0.014669 second(s),query:2 Gzip enabled
   現在時間是 2024-11-27 23:39