【資訊】NVIDIA GTX 680&GK104詳細規格曝光熊蓋站 - 論壇【我的網路入口網址導航讓您的網路生活更方便快捷】上網~從熊蓋站開始

《》

» 您尚未登入 | 註冊 | 說明 | 娛樂中心 | 點歌 | 聊天留言 | 最新 | 精華 | 論壇 | 資訊 | 首頁 | 影音模式

以文本方式查看主題

- 熊蓋站 (http://localhost/phpwind//index.php)
-- 硬體資訊 (http://localhost/phpwind//thread.php?fid=20&page=22)
-- 【資訊】NVIDIA GTX 680&GK104詳細規格曝光 (http://localhost/phpwind//read.php?fid=20&tid=33225)

-- 作者：andy6989
-- 發佈時間：2012 02 12 5:20 AM

-- 【資訊】NVIDIA GTX 680&GK104詳細規格曝光

一貫還算靠譜的德國3DCenter.org又放出了NVIDIA那邊開普勒家族中端核心「GK104」的諸多參數，比之前任何一次都要詳盡。
首先，有可靠消息來源稱，開普勒架構會使用和目前費米架構截然不同的流處理器設計，但同時又保留類似的「等級制度」，從而確保更高的並行度，強化通用計算能力。看來，NVIDIA的確是認準了並行計算這條路，準備堅定不移地走下去。
根據目前的說法，GK104 SIMD體系設計中有4個圖形處理集群(GPC)，每個集群內劃分為4個流式處理器陣列(SM)，然後每個陣列內包含96個流處理器(SP)，這就是總共96×4×4＝1536個流處理器。
紋理和幾何方面，每個SM陣列中配備8個紋理單元，總計128個，ROP光柵單元則是整個核心32個。
顯存方面和之前說的一樣，256-bit位寬，2GB GDDR5容量。
再看頻率，核心與流處理器同步定在950MHz，不再像這麼多年來那樣非同步運行，而顯存頻率比費米時代有所改進但還是沒AMD那麼快，等效為5000MHz，頻寬160GB/s——相比於Radeon HD 7970 264GB/s差了不少。
浮點性能上，GK104單精度最高2.9TFlops，雙精度最高486GFlops，二者比例大約為6:1。相比之下，Radeon HD 7970的單雙精度浮點性能分別為3.79TFlops、947GFlops，基本上是4:1。
最後，同樣採用28nm工藝的GK104核心面積估計約為340平方毫米，但具體晶體管數量未知(傳聞多達60億個但太離譜了)——AMD Tahiti核心晶體管43.1億個，面積365平方毫米。

繼昨天3DCenter.org後，一向善於深度分析的BSN網站也於今日放出了關於NVIDIA 28nm工藝Kepler架構GK104核心的消息：部分和本站昨日報導的大體相同，不過還有一些細微之處值得玩味。（關於昨日的傳聞PCINLIFE管理員cho此次一反常態沒有扔出一句"Fake"或者「瞎編」就走，此外多方來源已經間接暗示多數細節為真）
首先關於NVIDIA將核心頻率和Shader頻率統一這個早有相關報導。Kepler架構中一組SM的CUDA Core數量對比Fermi翻倍，由32升為96個。顯存控制器為256bit界面，這些都與昨天3DCenter的消息相同。
接下來讓我們來看看GK104的核心示意圖：

大眼一看和GF110類似，不過仔細看就能發現SP數量由512暴增至1536。BSN稱，起初NVIDIA考慮GK104上市初的名稱是GeForce GTX 660，但現在有99%的可能正式上市名稱為GeForce GTX 680，剩下1%為GTX 660/670。價格方面也和之前大嘴查理所說的不同：GeForce GTX 680定位於GeForce GTX 560 Ti 2GB/GeForce GTX 560 Ti 448 Core/GeForce GTX 570的替代者，初步定價為349-399美元。性能方面當然要比上代旗艦GeForce GTX 580要高很多，最重要的是GK104不僅能幹掉449美元的Radeon HD 7950 3GB，549美元的Radeon HD 7970也不在話下，有消息稱3DMark 11 X模式得分可能會在3000左右，一夜爆降千元看來即將出現……（提示：1536/1024或768/512）
接下來是GK104的架構分析，Kepler時代一組SM以96個CUDA Core為基準，1個GPC（Graphics Processing Clusters）含4組SM共384個CUDA Core。GK104含1536個（4GPC），不難推測頂級的GK110可能含6GPC即2304個CUDA Core。顯存控制器方面可能仍為低端入門級64bit，中端主流128bit，中高端256bit，頂級384/512bit——應先用在HPC上，或者採用GK110的GeForce GTX 690。而Kepler的移動圖形核心其實已經早已流片完成，CES上三星已經展示了搭載最低端（96CUDA Core）的筆記本電腦。（驅動程序對頻率/規格識別有誤）

和AMD的Tahiti XT對比，GK104在ROP和TMU數量上一樣——均為32個和128個，但顯存控制器指標仍然延續不如AMD的「傳統」，2GB 256bit GDDR5顯存對上Raeon HD 7970/7950的3GB。不過價格和性能上的優勢相信屆時也會迫使對手產品降價。
和GF110一樣，GK104其實也有兩個版本——生產Quadro和Tesla的雙精度浮點性能為單精度的一半，而生產GeForce的理論上為四分之一。
目前GK104的核心頻率暫定為950MHz，但BSN稱消息來源表示在NVIDIA的實驗室中起初有兩個版本：772MHz用來和相同的GeForce GTX 580比較，925MHz用來和相同的Tahiti XT做比較，實際出貨版本核心頻率可能會在950-1000MHz之間。當然，類似AMD的藍色小藥丸，NVIDIA目前也在加緊調整BIOS，爭取使公版的GK104核心頻率屆時站上1GHz。如果NVIDIA無法完成這一目標，那麼將第一時間開放非公版/AIC超頻版。
顯存方面，目前暫定的頻率為1.25GHz等效5GHz，相對GF100/110的提升了25%。這方面AMD在GDDR5顯存/控制器上算是標準制訂者之一，因此AMD的GPU工程師在提高GDDR5顯存方面具有優勢也就不稀奇。由前面所述的頻率計算，GK104擁有160GB/s的顯存頻寬，對比GTX 580的192.4GB/s略有下降，但比起預計替代的產品GTX 560 Ti和GTX 560 Ti GF110核心版本/GTX 570的128.27GB/s和152GB/s均有提升。
所有這些規格帶來的單精度浮點運算能力為2.9-3.05TFLOPS，雙精度浮點為486-500GFLOPS。Quadro和Tesla版本會擁有解鎖的雙精度浮點運算能力——也就是1.5-1.6TFLOPS左右，和GTX 580的單精度浮點運算能力相當，顯著高於Fermi核心的Quadro和Tesla。
BSN最後稱，用戶們不會等待太長時間，NVIDIA已經準備開始Kepler的預售/鋪貨等行動（包括中端的GK107——GeForce GTX 650等），在市場行動上用來反擊AMD將於2月15日發佈的"Cape Verde"Radeon HD 7700系列和3月6日德國漢諾威CeBIT展會上發佈的"Pitcairn"Radeon HD 7800系列。或許下個月市場上就能見到Kepler的實體。

v 最新文章 熊蓋站為自由討論論壇，所有個人行為或言論不代表本站立場。文章內容如有涉及侵權請聯絡我們，將立即刪除相關文章資料 v 精華文章

完全比對或模糊比對

線上收看： 景點即時影像 | 線上查詢： 火車時刻表

Powered by 熊蓋站 Code © 2005-2017	讀取秒數Time 0.014669 second(s),query:2 Gzip enabled
現在時間是 2024-11-27 23:39	廣告刊登、聯絡我們