熊蓋站 - 首頁

  Plurk Twitter    

» 您尚未 登入註冊 | 說明 | 娛樂中心 | 點歌 | 聊天留言 | 最新 | 精華 | 論壇 | 資訊 | 首頁 | 影音模式

熊蓋站  -> 硬體資訊  -> 【資訊】「開普勒」的望遠鏡 從傳聞看GK104的真實架構

--> 本頁主題: 【資訊】「開普勒」的望遠鏡 從傳聞看GK104的真實架構 加為IE收藏 | 收藏主題 | 上一主題 | 下一主題 | 可列印版本
andy6989


終身成就獎
頭銜:論壇執行長論壇執行長

∷ 職務: 站長 該帥哥目前不在線
∷ 編號: 1
∷ 級別: 天使會員
∷ 發帖: 8098
∷ 威望: 6189
∷ 財富: 36813 蓋幣
∷ 貢獻: 173
∷ 配偶: 單身
∷ 家族: 無門無派
∷ 註冊: 2005-01-30
∷ 上次: 2019-03-27
鮮花(55)
寵物資料

寵物狀態:生存
寵物級別:287 -最終進化-
寵物PK:開(接受挑戰)
HP:7275/7275
MP:674/674
SP:4800/5000
EXP:86%
  【字體: Plurk Twitter 
【本站推薦】:
 【資訊】「開普勒」的望遠鏡 從傳聞看GK104的真實架構

「Fermi」快要走了,「Kepler」還會遠嗎?

NVIDIA兩年前公佈的這張路線圖應該還有人記得吧,按照當時的規劃,Fermi架構之後NVIDIA顯卡將進入Kepler時代,原本預計是在2011年底發佈的,不過受限於TSMC台積電28nm工藝進展不利等多方面因素,Kepler一直拖到這個月才能發佈。
早在Fermi顯卡未發佈之前,NVIDIA就公佈了大量有關顯卡架構的信息,有關Fermi的PDF資料非常詳盡,NVIDIA樂此不疲地在多個場合公開展示Fermi顯卡,即便黃總手中拿的只是個模型。那時NVIDIA的表現很高調,因為Fermi確實是劃時代的變化,無論是遊戲還是計算都讓人刮目相看。
當然,首發的GTX 480/470作為顯卡的表現是低於預期的,並非性能有問題,而是顯卡的功耗和發熱太高了,還好NVIDIA後續優化了工藝,微調了GF110架構推出的GTX 580/570,這種兩款顯卡的表現就好多了,可以為市場和消費者接受了。

面對HD 7970的進攻GTX 580的性能還是略輸一點,NVIDIA也要升級架構了
時光荏苒,現在又到了架構升級的時刻了。只是與Fermi時代相比,NVIDIA的表現顯得低調了許多,Kepler直到這個月才在GDC 2012大會上展出,現場演示了EPIC的《Samaritan》demo,不過還是封閉系統,看不到實卡。
官方閉口不言,我們能獲得有關Kepler顯卡的來源就只有媒體傳聞以及各路「大神」的私下爆料了,有關Kepler的新聞大都是「傳xxxxx」,簡單來說就是只能在各種傳聞和洩露中捕捉有關Kepler的信息。
傳聞不一定是可靠的,不過IT媒體的傳聞並非簡單的謠言,除了一部分譁眾取寵的臆造(比如Kepler的PhysX模塊)之外,很多傳聞應該是空穴來風,是廠商或者知情人士放出來探口風,裡面當然有真有假,只要多多對比、小心分析還是能從中得到一些準確信息的。
現在裡Kepler正式發佈只有一周的時間了,不過有關Kepler的性能、架構、核心以及價格等方面的信息還沒有準確的消息,今天我們就從各種傳聞中摸清Kepler顯卡的底細,看看NVIDIA低調的背後是驚人的爆發還是真的技不如人。

Kepler能否重新奪回世界最快的顯卡稱號?
命名:諜戰劇一般精彩
顯卡的名字就跟人名一樣,名字好壞給人的第一印象也會大相逕庭,同一個人叫「高富帥」還是「高二狗」是有明顯區別的。當然,顯卡的命名更簡單了一些,一般就是字母+數字的形式,但是在GK104身上,顯卡命名的跌宕迴腸足以媲美國產諜戰劇。
我們都知道這一代NVIDIA顯卡屬於「Kepler」家族,架構代號也不再是GF開頭,而是代之以GK。按照慣例,首先出的應該是旗艦級的GK110架構,據傳它有1024個CUDA核心,60億個晶體管,512bit顯存,規格基本是GTX 580的翻倍,甚至還洩露了它的GPU-Z信息圖。

早期流傳的GK110核心GPU-Z規格圖
早期都認為NVIDIA將跳過GTX 600命名,GK110將直接進入GTX 700序列,不過GTX 700的流言只存在了很短時間,因為NVIDIA並沒有打算跳過GTX 600系列,而且初期發佈的並非GK110核心,它將讓位於中端的核心GK104。除了NVIDIA自己,沒人知道他們為什麼要先發GK104,GK110難度太大還是TSMC工藝不給力,或許兩者兼有。
既然首發的是GK104,那麼它又叫什麼呢?對比當前的核心以及顯卡命名,有人稱GK104將命名為GTX 660 Ti,並有衍生版本GTX 660,這個流言既貼近現實,又符合傳統,按理來說應該是最可能的,遺憾的是你猜中了開頭,卻猜不到結尾。
進入2月之後,GK104的具體名稱鎖定在了GTX 670 Ti以及GTX 680身上,SA網站也報道過說GK104將有兩種核心,完整版的為GK104-400,擁有8組SM單元,將命名為GTX 680,而次階的為GK104-335,擁有7組SM單元,將成為GTX 670(當時沒說帶Ti後綴),關係有點類似目前的GTX 580以及GTX 570。
再往後,Sweclockers援引台灣某顯卡廠商的消息稱GK104將以GTX 670 Ti的名義在CeBIT展會之後發佈。

從本月初開始曝光的實物圖開始增多,首先是RedQUASAR論壇曝光了GTX 670 Ti顯卡實物照片,從上面的印記來看,顯卡確實是GTX 670 Ti,既然官方都寫上名字了,看來GTX 670 Ti確有其事。

不幸的是,GTX 670 Ti沒活幾天,各路達人又爆料說GTX 670 Ti只是NVIDIA的煙霧彈,刷BIOS之後就會變成GTX 680,性能暴增40%,而這才是它的正式身份和能力。(現在來看顯卡上雕刻GTX 670 Ti字樣的做法也太明顯了,之前的N卡上只有貼紙,沒有這樣的字樣)
這麼多名稱到底哪個是對的?該到揭曉答案的時刻了,GK104發佈時的名字確實就是FeForce GTX 680,GTX 670 Ti只是NVIDIA迷惑對手的工具。當然後續可能還是有GTX 670 Ti這個型號的顯卡的,不過首發時沒有GTX 670 Ti的份。
回顧有關Kepler顯卡的命名一事,你會發現這裡面謀略重重,一環扣一環。從早期的GTX 700若隱若現到GTX 600浮出水面,從GTX 660 Ti的合理推斷到GTX 670 Ti的出其不意,最後又到了GTX 680塵埃落定,NVIDIA、現場廠商、媒體以及爆料達人把三十六計用得出神入化,故弄玄虛、聲東擊西、無中生有、渾水摸魚等等一一呈現,除了迷惑對手之外,也吸引了大批「不明真相的群眾」圍觀,鬧得用戶心神不定,到底是買已上市的HD 7000系列還是等待GK104上市呢。
當然這還只是顯卡名稱上的風波,如果再算上規格、性能、價格以及發佈日期等方面的消息,這齣戲還要精彩的多,要比《潛伏》、《竊聽風雲》這樣的諜戰劇還要刺激,這都是後話了。
規格:像霧像風又像雨
在命名上做文章頂多是障眼法,規格上的洩露才有實質性意義,因為規格可以透露很多秘密,內容遠比名稱更豐富。在這一點上,GK104的規格洩密也像是擠牙膏一樣,一點點爆料,但是各方來源又是欲說還休,最終也是像霧像風又像雨。
核心面積
也許是對前兩代大核心戰略顯卡忍夠了,Kepler最為人關注的一個問題就是核心面積,是繼續Fermi那樣的巨核高性能還是類似AMD這樣的Smart Die呢?NVIDIA公開做的回應是選擇了前者,依然是追求性能第一,不過這也不代表Kepler的核心會更大。
以GK104為例,核心面積一直秘而不宣,之前的爆料稱其核心長寬約為18-19mm,面積在324-321mm2之間,比GTX 580的530mm2大大降低,而且低於HD 7970的365mm2。

GK104的PCB曝光之後,有人根據它與HD 7970顯卡的PCB對比計算出其核心面積約為320mm2,符合之前的猜測。
前兩天我們獲得了GK104的核心圖,顯示GK104核心呈正方形,長寬都在17mm左右,核心面積大約是300mm2,比之前提到過的都要小。
現在可以確定的是GK104是小核心,比HD 7970還要低很多。同時,伴隨核心面積降低的還有TDP功耗,3Dcenter的報道顯示其TDP功耗只有190W左右,低於HD 7970的210W(最大功耗為250W),更低於GTX 580的244W。
核心頻率:低頻or高頻?還有動態加速
小核心確定了,那麼GK104的頻率有多高?這一點有兩個版本,首先是高頻版,GK104的功耗和發熱解決之後,顯卡可以工作在更高頻率,核心頻率將超過900MHz甚至1GHz,而且shader頻率也不再是原來的2:1分頻模式,將會同頻運行。

之前PCI論壇爆料GK104性能時顯示頻率達到1050MHz
另一種觀點是GK104的核心頻率不會太高,只有705MHz,但是Shader頻率繼續2:1模式從而達到1411MHz,VR-Zone報道過GK104的詳細規格,而洩露的筆記本型號上使用的GK107架構也確實是原來的2:1分頻模式。

NBR論壇上放出的GK107架構顯示Kepler依然是2:1分頻模式
顯存的規格是NVIDIA早就確認了的,256bit位寬,2GB GDDR5顯存容量,但是頻率相比Fermi時代徘徊在1000MHz而言大幅提升,達到了1500MHz(等效6.0GHz)。
此外,NVIDIA並不滿足固定的核心頻率,GTX 680將支持動態超頻技術(dynamic clocking),因為多數遊戲中顯卡並非滿負載運行,距離TDP功耗還有一點空間,顯卡頻率還有提升的空間。這一技術類似CPU中的Turbo Boost加速,BIOS可以根據顯卡負載動態調整頻率,進而自動超頻5%以提高性能。

洩露的NVIDIA官方文檔顯示核心頻率確實過1G(來源:太平洋電腦網)
最後隔壁網站洩露了完整的GTX 680規格,頻率確實達到了1GHz以上,動態加速還能繼續提高5%左右。
PCB設計:使用均熱板,橫向排列的供電?
PCI論壇很快有人洩露了GK104的散熱以及供電電路設計,顯示GTX 680顯卡的散熱器與目前的GTX 580大有不同,首次使用類似均熱板那樣的嵌入式熱管,散熱鰭片也是單獨定制的,排列更緊密。風扇還是渦輪式,但是經過噪音抑制處理,靜音水平比前代要好。

隨同曝光的還有顯卡的PCB以及供電接口。

供電分為5+2相,5相GPU核心,2相顯存,最奇特的是5相PCB供電電路改成橫向排列,這幾年的顯卡裡非常少見。

垂直排列的供電接口比傳統方式佔用空間更少
架構:源自GF104還是GF110?
顯卡的規格參數也確定了,核心架構也有了準確的消息。Kepler的流處理器單元(NVIDIA也叫CUDA核心,以下統稱CUDA核心)也大幅攀升,GK104將擁有1536個CUDA核心,相比GTX 580提高了2倍,NVIDIA如何在芯片面積大降的同時塞入更多的核心呢
回想前兩年的情況,對NVIDIA來說開發Fermi架構的過程無疑是艱難的,它太龐大了,但拋開難產的過程不談,Fermi架構是NVIDIA的得意之作,無論是遊戲還是通用計算上都能左右逢源,Kepler顯卡的架構不可能重起爐灶,必然是在Fermi架構基礎上修改而來。
眾所周知,Fermi家族衍生出兩大核心,一個是完整版的GF100以及後續的改進型GF110,另外一個就是GF104以及後續優化的GF114(其實GF114=GF104),Kepler更像哪一個架構呢?
GF110架構:高性能、高代價

GF100/GF100架構示意圖
首先來看GF110,它分為4組GPC,每組下轄4組SM單元,每組SM單元又有32個CUDA核心,總計有512個CUDA核心,64個紋理單元,48個ROP單元,16個曲面細分單元,搭配6組64bit顯存控制器,總計384bit位寬,1536MB顯存。

GF110架構中的每組SM單元設計
這些是看得見的參數,實際上Fermi之所以這麼設計主要是為了HPC高性能計算,具體到每組SM單元中又是由32個CUDA內核為基礎運算單元,每個內核又包括完整功能的整數單元和浮點單元,配備64KB L1緩存,16個LD/ST存儲單元以及四個SFU多功能單元。
GF100架構用在通用計算方面的確是最合適的,16組SM意味著16個運算單元(OpenCL計算中是以SM單元數量為計算單位的,GPLBench或者Luxmark中都要看SM單元數量,AMD的現在稱為CU單元),GPU通用計算上比前代GT200架構有著質的提高。
當然,GF100的代價也是巨大的,核心面積達到530mm2,發熱也很恐怖,第一代GTX 480顯卡甚至需要閹割部分CUDA核心才能控制住功耗和發熱。
實際上遊戲運算跟GPU通用計算並不是一條路,Fermi架構的為了提高數據吞吐量配置了大容量L1、L2緩存對3D遊戲用處並不大,所以NVIDIA為Fermi架構準備了B計劃,精簡規格,提高效率,推出了GF104架構。
GF104:精簡,高效

GF114架構示意圖
GF104架構首先應用與GTX 460顯卡上,GPC只有2組,SM單元數量也從16組減少到8組,但是每組SM單元的CUDA核心數提高到48個,看起來是增加了,不過在其他單元如調度器、寄存器、L1緩存沒有增加的情況這意味著資源爭搶的情況也多了,對數據計算來說意味著削弱,但是對圖形運算來說是增強。
除了CUDA數量變化之外,GF104的L2緩存也減少了,內存控制器減少到4組,位寬256bit,曲面細分單元也減少到8組,但是紋理單元依然維持在64個,ROP單元還有32個,圖形性能受損不如規格精簡幅度那樣大,而功耗與核心面積卻大大降低了,無論是GTX 460還是之後的GTX 560 Ti、GTX 560在溫度與功耗上反倒比高端顯卡還要好。

網上流傳的一張GK104架構圖,明顯更像GF100架構一些
那麼Kepler的架構應該源自哪一個?GK104架構確信有1536個流處理器,恰好是GF110的3倍,浴室上個月就有人PS了上面這張圖,顯示GK104將有16組SM單元,每組SM單元變成96個CUDA核心,恰好符合1536個流處理器的特徵。
初看一下似乎也很合理,不過實際情況卻不是這樣。這麼說似乎有些馬後炮的感覺,但是GK104並非GF110那樣的旗艦定位,而是類似GF114這樣的中高端顯卡,而且有GF104成功的先例在前,NVIDIA沒理由去複製GF110架構設計。

實際上GK104的架構更像GF114
最終的結果就是GK104的架構更像GF104,它的每組SM單元中塞下了192個CUDA核心,是GF110架構的6倍,是GF104架構的4倍,SM單元總數也不是16組,還是8組,這樣總計有1536個CUDA核心,1536的數值是這麼算出來的,而非GF110乘以3那樣。
目前知道的架構設計就是這些,紋理單元未知,不過紋理單元是跟SM中的SFU單元對應的,GF100架構中每組SM單元有4個TA紋理尋址單元、16個TF紋理過濾單元,GF104中每組SM提高到8個TA、32個TF,GK104的紋理單元有說是128個,也有說160個,目前還沒有確切消息,需要等到GK104的架構完全公佈才能知曉。 
兩個未解之謎,GK104的後續等等
從這兩三個月的各種流言蜚語以及爆料之中我們已經可以為GTX 680畫像了,它使用TSMC 28nm工藝製造,核心面積約300mm2,TDP功耗195W。核心頻率超過1GHz,顯存頻率達到1500MHz,標準2GB/256bit GDDR5顯存。
其顯卡為封閉式內排方案,使用了嵌入式熱管設計,渦輪風扇做了噪音抑制改進,不過具體效果未知。顯卡供電為5相GPU,2相顯存,主供電搭配1上2下MOSFET,其他的還芯片還不太清楚,而供電接口只需要兩個6pin,一改以往旗艦單卡的6+8pin標準配置。
只是我們還有兩個最主要的謎題沒能揭開,Kepler的性能和售價還沒有準確消息。有人說NVIDIA凡是以80命名的顯卡在性能上就沒輸過,從最早的DX10顯卡GTX 8800 算起,在GTX 280、GTX 480、GTX580身上確實如此,這話還是蠻準的。由於HD 7970已經發佈了三個月了,NVIDIA對其性能也是心知肚明,在這種情況下還把GK104命名為GTX 680說明他們還是有信心的。
具體的性能數據上小編沒有,而且就算有也不能洩露,不過根據廠商的反饋,GTX 680輕鬆超過HD 7970是沒問題的,至於能否達到40%的領先就不好說了,而且NVIDIA內部測試的驅動更新頻繁,每次更新都有性能提升,尚不知測試時是哪個版本的驅動。
另一個關鍵問題是價格,看了前面的分析連小編也覺得GTX 680將是接近完美的一張卡,低發熱、低功耗的同時高性能,這種情況下只有傻子才會制定出比HD 7970更便宜的價格,SA炮製出的299美元已成泡影,3DCenter給出的價格是549美元(人民幣3500左右),與HD 7970同一水平,後者的國內定價是4299-4699元,GTX 680的國內售價就自己想吧。

Kepler一來,GTX 580已經開始降價了,支持4屏的影馳HOF GTX 580顯卡只有3999元
當然,Kepler的消息一確定,最讓消費者受益的還是當前的顯卡大降價,歐洲市場上公版GTX 580的售價降到了339歐元(人民幣2800元),非公版也有10-15%的降價。
GK104的問題到現在就算終結了,談下一話題:那就是GK104的後續是什麼?(先無視低端的GK107)
很多人會說這不明擺著呢嗎,編號x04的核心只不過是中端定位,旗艦級的還是留給GK110核心,規格也都曝光過多次了,2304個CUDA核心,160個紋理單元,48個R0P單元,顯存位寬、容量分別為384bit、3GB,將在今年8月份發佈。
是的,很多消息都是這麼說,但是誰說一定會有更高級別的核心?NVIDIA既然能在顯卡命名上放煙霧彈,為什麼GK110不是煙霧彈?仔細想下,GK104已經把旗艦級的GTX 680命名佔用了,更高階的顯卡如何命名?GTX 685,這個也有可能,畢竟GTX 280以及GTX 285就同時存在過,但是GTX 680顯卡在性能、功耗控制上表現都會比HD 7970要好,NVIDIA還有必要再出一款更高級別的核心嗎?
囉嗦了這麼多,個人的觀點就是如果GTX 680的表現確實非常給力,那麼GK110就沒有理由這麼快出現,而GK110很可能只是接下來的雙芯卡的代號(你可以注意一下目前的新聞中提到GK104的雙芯卡時從來就沒有提到過它的架構代號),目前有關GK110規格的消息依然是煙霧彈。
這裡並不否認更強的核心的存在,不過它應該是為了對付AMD HD 8000系列而來的,GTX 600系列已經被NVIDIA用完了,那麼它很可能命名為GTX 700系列,類似NVIDIA之前對待GTX 480以及GTX 580一樣,不同的是GTX 680不會有GTX 480那麼杯具的功耗和發熱。
PS:以上觀點為個人猜想,沒有內幕消息支持,至於實際情況會不會是這樣我也先立貼為證,也歡迎大家提出自己的看法。
NVIDIA現在喜歡用物理學家的名字命名顯卡架構,Kepler除了是物理學家之外還是天文學家。面對這個「浩瀚的宇宙「,我們目前只瞭解了一部分,還有更多的未知之謎需要等待實際評測才能解開。
Kepler家族將在3月22日太平洋時間早上6點、本地時間22日晚上9點解禁,到時超能網也會奉上詳細的評測,為你揭秘最真實的GTX 680顯卡。


※ ※ ※ 本文為 andy6989 與 熊蓋站 共同所有,未經同意,請勿轉載 ※ ※ ※

 



≡熊蓋站管理團隊≡--共勉之--



[樓 主] |
發表於:2012-03-15 16:27

  熊蓋站 -> 硬體資訊

v 最新文章        熊蓋站為自由討論論壇,所有個人行為或言論不代表本站立場。文章內容如有涉及侵權請聯絡我們,將立即刪除相關文章資料        v 精華文章

               

奇摩搜尋
完全比對 模糊比對

線上收看: 景點即時影像 | 線上查詢: 火車時刻表最上方

    Powered by 熊蓋站  Code © 2005-2017 Plurk Twitter 
讀取秒數Time 0.012745 second(s),query:4 Gzip enabled
   現在時間是 2024-11-27 22:34