熊蓋站 - 首頁

  Plurk Twitter    

» 您尚未 登入註冊 | 說明 | 娛樂中心 | 點歌 | 聊天留言 | 最新 | 精華 | 論壇 | 資訊 | 首頁 | 影音模式

以文本方式查看主題

-  熊蓋站 (http://localhost/phpwind//index.php)
--  硬體資訊 (http://localhost/phpwind//thread.php?fid=20&page=)
--  【資訊】AMD ARM之路前景幾何? (http://localhost/phpwind//read.php?fid=20&tid=35970)


--  作者:andy6989
--  發佈時間:2012 11 6 6:17 PM

--  【資訊】AMD ARM之路前景幾何?


AMD將於2014年推出基於ARM架構的Opteron(皓龍)處理器,應該是最近一段時間在IT產業影響最重大的事件之一。由於AMD此前並沒有明顯的徵兆要推出ARM處理器(只是在6月份AMD曾表示會在明年的APU中引入基於ARM Cortex-A5架構的TrustZone硬件安全技術),所以AMD的這一表態,無疑為近期甚囂塵上的ARM與x86之爭再加一把火。ZDNet近日特別梳理了一下AMD的構想,並以此為引子,就ARM與x86面向數據中心領域的攻守戰進行了分析。
回顧:AMD的表態與想法
對於AMD為什麼選擇ARM架構開發面向數據中心級的處理器的原因,按照AMD的說法,很簡單,那就是為在那些需要密集與大規模並行計算的環境中追求更高的能效表現。有關ARM架構處理器的低功耗優勢,關注手機與平板電腦市場的讀者並不陌生。隨著個人信息平台逐漸向智能手機與移動終端傾斜,業界也逐漸看到了ARM處理器逆襲後端平台的潛力,而這方面嗅覺最靈敏的無疑是在IT市場打拼的硬件廠商。但ARM的逆襲在不斷吸引用戶注意的同時,也必然引發了當前數據中心處理器霸主——x86陣營的警覺,AMD就是其中的一員,當然也包括它從誕生既有的對手——Intel。
作為x86市場僅有的兩家主力廠商之一的AMD,一直都是x86架構的堅定支持者,雖然與Intel始終保持著激烈的競爭關係,但在x86架構的生存與發展方面,雙方的大方向是一致的。不過,這次AMD的動作宣佈了兩家公司至少在低功耗、高密度服務器市場的分道揚鑣。Intel將死守x86架構,並艱辛地向ARM的優勢區域靠近,不僅要守住數據中心,甚至還要反擊ARM的老家——移動終端市場,而AMD則與ARM走上了另一條,同樣艱苦而未知的ARM架構在數據中心的開拓之路。
AMD將在2014年推出採用ARM64bit架構的皓龍處理器,同時將AMD的ARM處理器技術與AMD於2012年2月收購的、主攻微服務器(MicroServer)的SeaMicro公司的Freedom網格架構相整合,推出相應的新品,而傳統的x86業務不變。

為什麼選擇ARM?AMD給出了兩個需求——新的業務模型(隨著移動計算的普及,基於Web的Internet互聯經濟將至關重要)和與這對應的大規模並行處理,為此ARM的每W電力的計算能力與單位計算成本則是AMD選擇ARM的最主要原因。

AMD擁有著ARM目前所欠缺的,面向數據中心的處理器應用經驗,因此AMD會將自己的企業級自有知識產權(IP)的組合,與ARM架構相結合,以求獲得更好的綜合表現,AMD的專業技能覆蓋了內存、I/O、設計方法論、工具、平台以及收購而來的Freedom網格架構。

Freedom網格架構是AMD在微服務器平台方面的一個重要優勢,它解決了高密度計算節點高效互聯與I/O的問題。
AMD一直強調其Freedom網格架構的優勢,這種非處理器級的集群化組網架構是微服務器所必需的,也是當前ARM處理器所欠缺的,即使是Intel也沒有類似的技術。其主要解決了兩個問題,一個是處理節點之前高效互聯,另一個是處理集群的對外聯網,從而保證了微服務器內部節點集群的處理效率與對外互聯的平衡,是AMD進軍微服務器市場重要的技術砝碼。

Freedom網格架構的核心在於一顆專用的ASIC芯片(原來由SeaMicro研發),它為處理節點模塊(含處理器與內存)提供了模塊間的互聯和對外的I/O架構,簡單來說它先將處理模塊互聯組網,再將外部的存儲與I/O鏈路進行整合,再共享給每個處理模塊。

SeaMicro微服務器的處理器模塊(皓龍版),金手指就是Freedom對外互聯的引腳。

Freedom網格架構由於採用了專用的ASIC組網,獨立於CPU平台之外,你可以將其看成是更底層的互聯平台,並可進行以太網與存儲網絡的聚合,因此可做到處理器指令集的無關性,為異構的服務器形態提供了可能。
Freedom網格架構的CPU平台無關特性使得AMD在採用ARM架構後處於一個始無前例的地位——它同時具有ARM與x86兩種處理器核心架構,並能同時運用於數據中心的負載平台,從而為服務器平台的設計者提供了一個異構融合的可能性。未來在一台服務器內,可以做到眾多的ARM處理模塊與若干傳統x86處理器模塊相整合,根據負載需求進行分流,從而為數據中心的架構者提供了更為靈活的想像空間。因此,AMD強調它的ARM處理器將獲得獨一無二的競爭優勢是有道理的。

未來的AMD產品陣營劃分
對於老本行x86,AMD很清楚它的優勢仍然明顯,那就是對於重負載應用,它的性能表現ARM處理器在相當長的時間內都難以望其項背,所以對於未來的產品線規劃也沒有因為ARM架構的進駐而厚此薄彼。ARM架構的皓龍處理器將主要面對低功耗高效能的領域,而傳統的企業應用仍然由x86皓龍負責,而APU架構未來也將視需求與ARM相融合。
在介紹完AMD的想法與重點的發展內容之後,我不禁仍然會回想本文開頭的話題——AMD的這次發佈在此前並沒有明顯的徵兆,這不由得讓我對AMD的真實想法產生了深厚的興趣。
猜測:AMD的真實動機與想法
前文講過,作為x86市場僅有的兩家主力廠商之一的AMD,在對於x86未來發展方面,此前與其老對手Intel的態度是基本一致的,那就是x86完全也可以適用於低功耗領域,並不次於ARM。AMD大中華區總裁鄧元鋆在今年4月接受媒體採訪時就明確表示:「X86架構功耗並不一定比ARM高,目前低功耗已經成了AMD產品設計與研發的核心,公司在這方面已經積累不少專利,有信心做到不比ARM差。」而在今年8月27日召開的第24屆HotChips處理器研討會(HC24)上,AMD還詳細介紹了下一代低功耗處理器Jaguar(美洲虎),即使是AMD首席技術官MarkPapermaster的HC24開場講演中,也並沒有ARM方面的身影,因此可以說在其正式宣佈採用ARM架構研發新一代皓龍之前,其對外給人的印象仍然是對x86低功耗領域有著強烈的信心。

在HC24上,AMD展示Jaguar處理器設計
不過,HC24的詳細介紹,讓業界發現Jaguar相對於上一代產品Bobcat(山貓)並沒有明顯的革新,基於屬於同級改良產品,多少有些讓人失望,這多少體現出AMD在多低功耗處理器方面的設計後繼乏力。

當前SeaMicro的主力產品SM1500微服務器,其處理模塊目前有4種選擇,三種Intel的,一種AMD的,值得注意的是Intel的選項中有Atom,但沒有AMD同級低功耗處理器(如Z系列和C系列)的選擇,即使在被AMD收購之後。
另一個有意思的現象在於,在今年2月即被AMD收購的SeaMicro公司,它的微服務器產品線中除了8核皓龍,不見其他與Intel Atom同級的AMD低功耗處理器,這多少有些不可思議。可能有人會說,AMD也有低功耗的APU呀,在市場上也頗受歡迎,但是APU更多的是面向GPU性能起較大作用的消費市場,而在數據中心裡,APU在幾年內還無用武之地,就CPU核心處理性能來講,不能不說AMD的核心性能較同級的Intel處理器是有差距的(僅就主頻來說,當Atom的主頻快接近2GHz之時,Z和C系列還沒有超過1.33GHz)。所以我認為,多條產品線的同時出擊(低功耗產品、嵌入式產品、移動平台產品、數據中心產品、APU家族……),已經給AMD的架構設計團隊帶來了前所未有的壓力。
AMD當前的重點無疑是APU,所以在低功耗領域已經有力不從心的感覺,也許在消費終端領域可以借APU的GPU性能吸引市場,但在數據中心裡,需要的是實打實的CPU核心性能與能耗表現。另一方面,賣了工廠之後的AMD,在半導體製程上的控制能力也大不如前,與Intel的差距越來越遠,而這方面的進步也直接關係到能耗的表現,所以AMD向低功耗的轉型面臨著全方位的困難。
將AMD此前的表態與動作與宣佈ARM合作的新聞相對比,再仔細看看AMD低功耗處理器向數據中心滲透的情況,匯總分析之後,我認為AMD選擇ARM的動機與原因也就相對清楚了——借ARM的架構設計,迅速填補自己在微服務器市場的短板,以在新產品研發與快速上市方面保證後續的競爭力。
AMD顯然清楚微服務器市場的發展潛力,但其皓龍家族在數據中心市場長期處於守勢,市場份額不斷萎縮,而新興的微服務器市場將是AMD在企業級復興涅槃的一個重要機會。AMD肯定希望能好好利用這一機會,但自身設計實力已經無法支撐這一復興計劃,因此選擇ARM的成熟設計,在此基礎上融入自己的IP組合,以迅速推出產品的想法,也就是情理之中了。
背景:ARM與x86的數據中心之戰
有關ARM與x86的爭論由來已久,但以往主要是架構上探討與切磋,更多的屬於「紙上談兵」,可隨著雙方各自的逐漸發展與成熟,也都具備了越來越大的野心,從而開始擴展領地,擦槍起火乃至正面交鋒也就再所難免了。
ARM在將MIPS擠向邊緣之後,其處理器的性能提升,結合功耗方面的優勢,開始讓業界有了將其帶入數據中心的想法,而x86在佔據數據中心主流地位之後,為了尋求更大的發展也看上了ARM固有的低功耗平台領地。在經過相互試探之後,雙方也正式亮劍。

ARM公司在10月30日正式宣佈了新一代Cortex-A50架構系列(也是AMD將授權採用的),其新增的一些特性明顯是為數據中心環境所準備的,目前包含兩種核心設設計——Cortex-A57與Cortex-A53。而Intel也不甘試弱,近期也聯合眾多OEM夥伴展示基於Atom Z2760處理器平台的Windows8平板電腦。而就本文所關注的數據中心領域,可以預見,當初x86與傳統企業級RISC處理器的一戰,必將在ARM與x86之間重演。

ARM與x86之爭可以看作是RISC(精簡指令集計算,Reduced Instruction Set Computing)處理器架構與CISC(複雜指令集計算,Complex Instruction Set Computing)處理器架構的又一次重量級對決。上一次在數據中心裡,x86戰勝了RISC系統,成為了市場的主流。

從傳統的理念來講,RISC的處理器由於指令簡化,長度統一,在核心設計上相對簡單,它的核心理念是通過一系列的指令組合完成一項複雜的工作,並且簡單的核心也於主頻的提升,但對於應用的編譯有著更高的要求(多條指令的高效運用)。CISC則正好相反,它的指令集本身就可以完成一系列的操作,所以一條指令的作用相當於RISC的多條指令,長度也不統一,從而讓處理器內部的核心設計相對複雜,提升主頻也較為困難。

其實x86處理器的設計者早就認識到了CISC的不足,所以也最大限度地借鑒了RISC的理念。現在的x86處理器其實是一個CISC指令解碼器+RISC執行架構的混合體,前者負責將x86指令轉換為長度統一的若干微操作指令,再交由執行單元,因此這已經有了RISC的影子,但由於x86的歷史長達30餘年,為了保證向前的兼容性,要保留大量的歷史指令集,這對於指令解譯器是一個巨大的負擔,而且由於x86指令集更複雜,為其亂序執行(為提高效率必須要做的)增加了不小的難度,這直接影響的就是處理器面對亂序執行時對處理單元開啟與關閉的能耗控制(你不知道亂序的指令會用到哪個單元),而這對於ARM的影響要小得多。
完全可以說,ARM與x86當前的表現差異,基本都是源自於RISC與CISC架構和ARM與x86指令集的本質區別,不過這並不是一個絕對的好與壞的評價標準。比如IBM,其UNIX服務器PowerSystem所採用的POWER處理器就是RISC架構,但是比其更高端的Systemz大型主機的處理器則是CISC架構。事實上,RISC與CISC在信息處理領域只是走了兩條不同的路,可謂「殊路同歸」,雙方都會面對相應的困難,並運用自己的智慧予以解決,從本質上講,並沒有絕對的優劣之分。
ARM由於架構與市場定位的先天原因,使其在面向輕量級簡單應用方面有著明顯的優勢,比如手機、平板電腦等,而x86核心更多的是為複雜操作任務所準備的,並且從一開始就沒有對能耗有太多的關注。因為在x86誕生之日,移動設備基本上還是實驗室中的玩具,而ARM當初的著眼點就是低功耗平台。
這就好比,ARM一直在做摩托車,x86一直在做轎車,當人口數量越來越多,交通越來越擁擠之時,人們越來越喜歡交通便利且省油的摩托車,此時x86覺得可能會影響到自己轎車的銷路,才開始研究摩托車,反過來ARM也想做高端人群的生意,除了做更豪華的摩托車之外,也開始研究起如何做轎車了……數據中心市場顯然就是「轎車市場」,ARM處於攻勢,而x86處於守勢。但可以肯定,摩托車與轎車所需的技能是有很大不同的。
那麼,現實中的數據中心領域又是怎樣的發展態勢呢?隨著互聯網與移動終端的興起,人們越來越依靠互聯網從事各種活動,與之相對應的就是企業互聯網化趨勢愈加明顯——不管你是不是互聯網公司,互聯網都將是絕大多數企業進行商務經營的必要途徑,比如電商的興起、SNS平台的誕生、比如傳統企業、政府的互聯網經營(電子政務,網上辦公,甚至鐵道部都開始網上售票了),所以我們能看到未來的企業在IT架構上日趨統一,都是標準三層架構,即互聯網Web接入——企業應用——核心數據庫。而ARM也將在這其中找到自己新的戰場。

當前企業典型的IT運轉模型,與各層的主要處理器平台組成,從左至右,對於處理器的負載能力也由低到高
ARM目前相對於x86最大的優勢就在於單位能耗的性能表現,這仍然與其架構設計有著密切關係,它非常適合那種操作較為單一、簡單的應用,如果從企業IT環境的三層架構入手,很明顯就是Web門戶端將是ARM首先的登陸領域。
Web門戶是企業接受用戶需求,並反饋給用戶結果的重要平台,但凡一家擁有一定互聯網訪問規模的企業,都會非常重視前端的Web平台的建設,其中一個典型就是CDN(內容分發網絡),它對於平衡Web訪問負載、保證響應速度有著重要意義。不過它本身的處理操作是相對單一的,更多的是考驗I/O的能力,因此它需要大量的分發節點,每個節點有自己的I/O通道,但這個節點本身對處理能力的要求並不高——由此就引發了新的思考與需求。傳統的x86服務器性能強大,但在CDN應用中,有點大炮打蚊子的感受,因為CDN的能力視節點數量而定,單節點的性能再強,I/O能力也是有限的,所以CDN講究集群作戰,並不需要個人英雄。而x86服務器單機的I/O能力是固定的,可CPU的能耗擺在那,為了獲得更高的I/O吞吐能力而配更多的服務器節點,也就意味著能耗的成倍上升。這就是一個典型的客戶習慣的改變(移動化),進而引發企業的IT環境的應對(前端Web化)所帶來的新問題,所以越來越多的大型數據中心的主管,都在尋找性能夠用、能耗更低的I/O節點來組建CDN,畢竟一個大型網絡平台(如百度、騰訊、Facebook等),這方面的投入將是成千上萬台服務器的級別,對於廠商來說就意味著「真金百銀」,這必然引發了ARM與x86陣營的遐想,變革也隨之而來。
其實,ARM陣營中早就有廠商就此發力,Calxeda公司就是其中的典型,EnergyCoreECX-1000是它的代表性產品,在面對相對簡單的Web請求處理方面,輕量級的ARM核心在能效比方面顯示出強大的實力。

EnergyCoreECX-1000採用4個ARMCortex-A9(A15的上一代)核心,加上內存的處理模塊的總功耗也就是6W

EnergyCoreECX-1000與IntelXeonE3-1240(32nmSandyBridge核心)在Web請求負載方面的性能與功耗比較,雖然性能略低,但功耗更低,能效比是後者的15倍
而Calxeda的野心並不僅限於此,它的目標是從Web端進軍企業應用平台,比如高性能計算。在一個典型的EnergyCoreECX-1000服務器設計中,可以在一個2U的機箱中放置24個計算節點,總能耗最高也不過200多W,這是一個相當誘人的表現,從一個集群的架構講,光從能耗上看,較傳統x86服務器的優勢只要有小學數學程度的人都能明白。

24節點EnergyCoreECX-1000服務器在一些企業應用與基礎測試中的能耗表現
與之相呼應,服務器廠商也蠢蠢欲動,準備將ARM解決方案帶入數據中心,這其中惠普的「登月計劃」(MoonShot)就是典型的例子。在這一計劃中,我們可從惠普採用EnergyCoreECX-1000節點模塊,面向開發者設計的Redstone服務器平台上,看到這類服務器未來的面貌與能力。

利用現有的ProLiantSL6500機箱,Redstone可裝入4個服務器集群框架,每個框架有72個計算節點(微服務器),總共可以在一個4U的機箱內放入288個節點,機架密度達到了72/U,遠遠高於現有的刀片服務器。
在一台基於ProLiantSL6500機箱的Redstone平台中,總共有288個計算節點,每個節點有4顆EnergyCoreECX-1000處理器,每個處理器有4個Cortex-A9核心,所以一台服務器就有4608個核心,這種密度在當前的數據中心裡是不可想像的。為此惠普也專門將其與傳統的x86服務器解決方案做了綜合比較,在滿足應用需求的情況下,能耗降低89%,機架佔用空間減少94%,成本降低63%,而複雜度也降低了97%。

基於Redstone服務器的解決方案相較傳統x86服務器方案的比較
作為x86世界的領袖——Intel當然也注意到了這個傾向與趨勢,不過Intel其實在早前也是ARM陣營中的一員,以ARMv5架構設計了自己的XScale處理器核心,並開發出了PXA25/26/27系列處理器,應用於當時的PDA與嵌入式市場。後來,Intel的戰略發生了改變,全面轉向x86平台,最終在2006年將XScale出售給了Marvell。其實,Intel與微軟在這方面的表現是相似的,作為x86生態圈裡的靈魂組合,它們的一舉一動對於x86世界都有著深遠的影響。微軟希望用Windows統一移動、桌面與數據中心平台,而Intel也希望用x86平台覆蓋這三個市場。
Intel面對大規模Web接入與密集集群應用市場的主要應對平台就是Atom與單路至強服務器(目前是E3系列),不過目前來看,重要的競爭壓力落在了Atom身上,因為它的性能在單路至強之下,也就將率先面對ARM平台的衝擊。不過,Atom進入數據中心多少有點「無心插柳」的感覺。Atom最早並不是按數據中心應用設計的,而是面向輕客戶端設備,最知名的莫過於風行一時的上網本,但很快,Atom的性能表現在x86主流市場被一片詬病,但其相對低得多的能耗表現又成為搶食自家兄弟市場的一大亮點(為此Intel甚至為Atom的外圍配置,如屏幕尺寸等進行了嚴格的限制)。在某種程度上,它成為了筆記本電腦市場上一款比較尷尬的產品,但OEM廠商的創造性發揮也讓Intel看到了在其眼中「低能低耗」的Atom產品家族的一個新用處——構建高密度低能耗的微服務器,同時Intel在半導體生產工藝方面的強大優勢,也使得Atom有更多的低能耗挖掘潛力。
需要指出的是,到目前為止,Atom在微型服務器方面的採用率要明顯好於ARM平台,即使是惠普的登月計劃也沒有忽略Atom。究其原因,除了ARM本身是新來乍到之外,還有其他因素,這方面下文再說。而再往上一層,x86則有更強大的單路至強E3平台與皓龍3000系列,但它們功耗更高,在面對輕負載重I/O(CDN就是典型的一種)應用時,明顯是殺雞用牛刀,不過在傳統的應用領域,E3的性能仍然是ARM平台不可比的。
在E3與皓龍3000之後,還有E5與E7和皓龍6000系列,以目前它們的主管的領地來看,ARM在很長的時間裡都不可能威脅到它們的地位,這也是為什麼AMD仍然會堅守x86數據中心市場的原因。
至此我們已經清楚了ARM與x86在數據中心市場交火的背後原因與基本的範圍。那麼,ARM處理器在數據中心裡的征途將會如何呢?它無疑會關係到AMD這一步棋的後繼效果,反過來說,AMD對ARM的幫助又將給這場數據中心的前端爭奪戰帶來怎樣的變數呢?
展望:AMD的ARM之路前景幾何?
AMD進入ARM大家庭,在2014年推出基於Cortex-A50架構的皓龍處理器,所將面對的競爭仍然複雜,所以現在判斷它的前景並不清晰。就我個人觀點,這一條路肯定走得不輕鬆,甚至還會相當艱苦。Cortex-A50解決了AMD在架構設計方面捉襟見肘的問題,但這只是起步,未來它將面對的是更多的對手與幾乎白手起家的生態環境。
先說說對手。在x86市場,AMD只有一個Intel,但進入ARM領域,雖然也是主打數據中心前端,但ARM裡面向數據中心的玩家不僅僅是AMD,還有不少硬角色,上文談到的Calxeda就是一個,此外還有AMD的老冤家NVIDIA,所以AMD的對手實際上是增多了。其實,它原來的對手Intel也沒有閒著,從Pentium 4失誤隨後的Core系列奮起直追,再到Nehalem系列在架構先進性全面反超AMD的歷史,讓我們對Intel這家公司的應變與修正能力有了清醒的認識,它會根據市場的變化迅速調整自己的失誤,而不是一味的唯我獨尊,這種對手在某種角度上講是最可怕的。現在它已經清楚的看到自己在能效比方面的不足,並全力以赴的改良與革新,很難說不會重演Pentium 4之後的那一幕。所以,拋開ARM陣營內部的競爭不談,我們可以先看看ARM陣營與Intel未來的對決會是怎樣(Web前端x86市場也只有Intel在玩了)。

Cortex-A50系列的第一批授權廠商——AMD、博通、Calxed、海思(華為)、三星與意法半導體,它們為ARM在處理器平台方面創造了強大的生態系統,但AMD潛在的競爭對手也明顯更多了。
Cortex-A57與A53核心分別擴展於當前的Cortex-A15與A7核心(兩者的一個重要的差別在於A57是亂序執行,而A53是順序執行)。根據ARM給出的信息,未來面向數據中心應用的功能設計在Cortex-A57/53上全面具備,比如64bit指令集(ARMv8)、高級虛擬化支持等等,具體詳情在此我們不做詳細介紹,有興趣的讀者可以尋找相關的介紹文檔。我們在此只是著重於它在服務器端的架構設想,並推測一下它的性能表現。

在Cortex-A50系列中,A57屬於「大核」,A53屬於「小核」,分別替代現有的A15與A7,生產工藝將進化至14nm。

ARM給出的Cortex-A57與A53的未來應用構想,它們將橫跨智能手機、平板電腦與服務器領域,根據big.LITTLE理念,在一顆芯片中,A57與A53核心可以混搭。

對於企業級應用,ARM認為A57與A53均有用武之地。A57可以做到16個核心集成,並可選配GPGPU單元進行加速計算,主攻宏基站、服務器與高性能計算市場,而A53也可以做到16核心,面向蜂巢基站、數據平面方案、超低功耗Web服務器等市場,但似乎沒有給出A57與A53的企業級big.LITTLE的混搭設計方案。
對於基於Cortex-A50的ARM處理器設計,值得一提的是ARM所提出的big.LITTLE架構理念,即將大核(big)與小核(LITTLE)混搭,通過判斷負載的輕重來選擇所適合的核心,以進一步提高能效比,不過在服務器端A57與A53分工明確,似乎也沒有必要混搭了。在ARM構想中,未來基於A50架構核心的CPU,將可以達到最多16核心的配置,而生產工藝的目標是採用14nm(目前的A15核心採用的是32/28nm),芯片總功耗估計最高不會超過20W(A57核心,無GPGPU模塊)。所以,2014年AMD的ARM-Base的皓龍芯片的核心數量也應該會達到16個。
那麼A57核心的性能將會達到什麼水平呢?根據ARM給出的資料,Cortex-A57核心(1.7GHz)在32位代碼的性能方面比Cortex-A15核心(1.5GHz)提高了25%,是Atom N570(1.66GHz)的2.66倍,從這裡似乎可以看出它的實力。

ARM給出的Cortex-A57較A15的性能比較,按圖中來看A15的性能是N570的兩倍

不過不久前有關基於A15架構的三星Exynos 5250處理器的評測,似乎更能反應出它們的差別。Anandtech網站對採用Exynos 5250(1.7GHz雙核)的Chrome筆記本進行了測試,並與Atom N570平台進行了比較,通過對比分析,我們似乎能分析出更準確的Cortex-A57核心的性能。


A15架構的三星Exynos5250處理器與Atom N570的性能對比

三星Exynos 5250筆記本與Atom N570筆記本的能耗對比
拋開圖形性能不談,單看處理性能,5250領先N570的幅度在30-50%左右,而能耗方面則也降低了30-50%左右,如果按滿負載一檔計算,5250平台降低25%的能耗,同時獲得了31%的性能提升。但是在ARM的資料中,1.5G的A15核心性能已經是N570的兩倍,Exynos5250的主頻是1.7G,但性能領先幅度也沒有達到2倍。所以,Cortex-A15核心的真實效能還有待進一步檢驗。
另一方面,參與比較的Atom N570是2011年第一季度的產品,採用的是45nm工藝(5250是32nm),距今已經一年半多了,而在Intel的產品陣營中,還有一系列新品,比如2011年第四季度上市的N2600,採用32nm工藝,雖然主頻降低了600MHz,但TDP也下降到了3.8W,比N570低55%。

Intel的AtomN570與N2600對比

而到今年年底的時候,新一代代號為Centerton的Atom S系列將會上市,較N2600相比,明顯是為數據中心設計的。除了仍採用32nm工藝製造外,它採用了兩個SaltwellCPU核心,支持超線程,每個核心都有32KB一級指令緩存、24KB一級數據緩存、512KB二級緩存;內存方面支持支持單通道低壓DDR3-1333,最高容量8GB(雙DIMM),且支持ECC(N2600不支持);集成4個 PCI-E2.0控制器共八條鏈路,這是N2600所不具備的,對於服務器設計的好處不言而喻,不過它並沒有集成SATA與以太網控制器。此外,Atom S系列支持VT-x虛擬化,這也是N2600沒有的能力,明顯為數據中心應用所準備。在能耗方面,Atom S系列支持C1/C1E、C6等多種電源管理狀態,並支持EIST技術,最大TDP值為8.5W,主頻也達到了2.0GHz。

Atom S系列目前已經透露的有3個型號,均為雙核心四線程,二級緩存1MB,包括Atom S12201.6GHz/8.1W、Atom S12401.6GHz/6.1W、Atom S12602.0GHz/8.5W。

惠普的「登月計劃」中就準備在年底推出採用Centerton的x86版微服務器,與Redstone的設計非常相似。

當然,Cortex-A57處理器將於2014年面世,AMD基於它設計的處理器與Freedom架構的整合產品也將在那一年推出,那麼在未來一年裡Intel又將有何動作呢?這就是基於22nm 3D晶體管生產工藝的Atom Avoton處理器。


在2013年是22nm的普及之年,Intel的AtomAvoton處理器的表現將會奠定其2014年迎戰ARM新一代平台的基礎
相較Centerton,Avoton有了全面增強。除了工藝升級外,核心數量也最多升級至8個(配合HT,可達16線程,與16核心的A57處理器有一拼了),每對核心對應1MB二級緩存,最多4MB。同時,Avoton將會支持亂序執行,雖然有可能是部分支持,但這對於提高性能是非常有幫助的。要知道,Centerton及以前的Atom都不支持亂序執行,這對於x86指令集來說本身就是吃虧的。而Cortex-A15和57都有亂序執行的功能,現在也終於在Avoton這一代予以彌補。另外,它還會引入類似Turbo Boost的動態加速技術,預計原始主頻最高可達2.4GHz,加速則能達到2.7GHz。內存方面,加入了雙通道的支持,內存規格包括DDR3-1600與DDR3L-1600。在外圍集成方面,Avoton將集成以太網、SATA、USB,據稱具備4個GbE、4個USB2.0、兩個SATA6Gbps、4個SATA3Gbps,以及4個PCI-E2.0控制器共16條通道。
在能耗方面,Avoton的TDP範圍在5-20W,跨度比較大,相信也給用戶提供了更多的選擇。

Intel微服務器市場2013年產品路線圖
綜觀Intel的微服務器領域的產品線,在2013年,除了Avoton之外,還有新一代基於Haswell核心的第三代至強E3處理器(同為22nm3D晶體管),其中最低配置為雙核心/4線程,TDP只有15-20W,與Avoton形成了平滑的對接。
可以看出,在未來的一年裡Intel的佈局相當緊密,從架構與製程方面,最大限度利用了Intel自身的實力(ARM處理器明年能順利將28nm製程變成主流就不錯了),從指標與配置上來看,到Cortex-A57處理器發佈之時,兩者可以說已經是旗鼓相當了。而從當前來看,Atom首先要接觸的就是基於Cortex-A9架構的ARM服務器,這其中CalxedaECX-1000是其中的典型。早前openbenchmarking.org曾做過一次ECX-1000與AtomD525平台的對比測試。雖然D525是2010年上半年的產物,現在已經停產,但還是可以從它們的性能對比中看出一些有用的信息。

openbenchmarking.org公佈的AtomD525與CalxedaECX-1000處理器平台性能測試結果
從測試結果來看,AtomD525較ECX-1000在性能上仍有一定優勢,但當ECX-1000達到1.4GHz主頻時,則不再明顯,而且能耗方面仍然是ECX-1000領先,但D525(45nm工藝)的TDP達13W,所以若換成Centerton則會有明顯的改觀。因此,就總體而言,ARM平台在數據中心裡並沒有表現出絕對的優勝實力。
而在另一方面,除了性能與能耗之外還有一個重要的因素左右著用戶的選擇,那就是生態環境,說白了就是買了你ARM平台有多少數據中心級的應用可以使用?即使是ARM最合適的Web應用領域也不見樂觀。國內某著名網站曾經就在CDN設備選型時,對ARM平台和Atom平台進行了比較,結果與openbenchmarking.org的測試差不多,ARM平台的綜合性能功耗比佔優,但是如果採用ARM平台的話,就意味著網站要重新以ARM指令重新編寫CDN框架,可網站並沒有這方面的人才,最終衡量下來,用戶還是選擇了Atom平台。

AMD公佈的ARM64bit平台的業界支持者,它們將帶動ARM在數據中心領域裡的生態環境建設,但不得不說與現有的x86生態系統相比太過薄弱了,不過除了AMD列出的廠商,開源組織也是一個不可忽視的力量,這方面Apache Tomcat Web服務器已經走在了前面,未來相信越來越多的Apache項目會推出ARM平台版本.
我相信,應用環境成熟度與相關人才的配套是ARM想在數據中心普及的一個必須要跨越的鴻溝。在這個領域,x86相較而言已經非常成熟,無論是平台的多樣性,還是軟件應用、開發平台與人才儲備等方面,都是ARM無法比擬的。因此,當綜合性能比較優勢並不絕對明顯的時候,用戶遷移自己的x86平台至ARM的阻力也就可想而知了。同理,Intel的手機端x86處理器表現也中規中矩,完全說得過去,但x86在移動應用開發領域又是什麼待遇呢?
從目前來看,以ECX-1000為代表的ARM平台並沒有建立起相對Atom的明顯優勢,而在2013年,單靠Cortex-A15平台恐怕也很難全面超越Avoton(Avoton也開始支持性能更好的亂序執行,而且是8核設計,外圍整合度也更高),甚至被後者反超也說不準。
所以,綜合分析下來,ARM陣營與Intel的前端對決並不想某些人想像的那麼簡單。關鍵的一點就在於大家都在變化,也都在進步,只不過Intel在努力做合適減法,將x86架構在Atom平台上盡量的簡化,以應對輕負載低能耗之需(甚至為此從亂序執行回歸古老的順序執行體系),ARM則在做合適加法,不斷的為應對數據中心的需求增加新的功能,比如64位技術、虛擬化技術以及更多的核心、密算加速器等等,並也會像x86那樣,還要照顧一代代積累的ARM指令集,以做到向上兼容。如今到Cortex-A15這一代,其能耗已經提升了不少,而Atom的能耗則一代比一代低。在指令集上,x86為了提高自己的效率,降低CISC缺陷所引起的弊病,一直在針對相關應用開發新的指令集(如SSE、AVX),這一點也在被ARM所採納(如NEON),所以說大家是在「殊路同歸」,在相互借鑒中共同成長,不斷進化著自己的技術、架構與最終的產品。因此,以ARM在手機端的成就預測其在低功耗數據中心前端市場必然成功有點一廂情願,同理也不能因為x86的強大與Atom的進步就認為x86在移動端的市場會一帆風順,它同樣要面對應用生態環境的嚴峻考驗。
AMD的加盟肯定會加強ARM在數據中心市場的生態建設,但遠不足夠,以它的實力還不足以起到Intel在x86領域一呼百應的效果。不過,現在有一些好的苗頭,比如WindowsRT的出現,表明微軟願意在ARM方面上嘗試,未來出現Server版RT也說不準,而操作系統是第一步,再往上則是應用開發平台與應用。企業級應用如ERP、CRM等,先別想在ARM平台上運行,把前端Web市場佔住了就不錯,現在看來,ARM在數據中心裡的應用生態建設將主要取決於開源的方案,然而它對於用戶的開發能力有著不小的挑戰,這又涉及到人才的培養,畢竟它與移動端的應用開發完全是兩碼事……這一圈思考下來,你就能感覺到ARM建立起一個數據中心生態環境的複雜程度,AMD的ARM征程有多難走也就不言而喻了。
有人會用x86當初戰勝RISC企業級處理平台的歷史來預測未來的ARM與x86在數據中心裡的競爭,認為將會歷史重演——ARM取代x86的地位。不過歷史的環境與當前不太一樣,雖然x86是以PC起家,再向數據中心擴展,如今ARM是以移動終端起家向後端擴展,路數相似,但大環境還是有明顯的不同。我並不是說ARM戰勝x86的可能性為零,不過難度要比當初x86進軍數據中心大得多,因為PC應用與數據中心應用相似度更大,可移動終端與數據中心應用有較大的不同,況且當時還是IT發展的初期,RISC當時在數據中心裡也不算有多成熟。但是,現在的數據中心已經相對成熟得多,各自的生態環境都非常完善,x86想進軍移動端有多費勁大家已經很清楚了,ARM進軍數據中心端也同樣如此。所以歷史是否會重演,真的很難說,我個人認為ARM肯定會在數據中心前端佔據一席之地(地盤大小另說),但再往應用與數據庫層的進展將會非常緩慢。
而且,除了ARM與x86,還有其他方勢力也在關注著數據中心的前端市場,以及ARM可能涉及的領域,如大規模並行密集計算等。這方面的典型代表就是Tilera公司的「眾核處理器」架構與解決方案。

Tilera的TILE Pro64處理器架構,單芯片64核心
Tilera的方案有點像把Freedom網格架構放在了CPU內部,將眾多的輕量級核心互聯在一起,再將內存、I/O等整合在一起,共享給所有核心。在2011年Facebook所做的一次Memcache測試中,TILEPro64的表現不俗,與至強和皓龍處理器平台相比,能效比也相當出色,在同等功耗下,雙路TILE Pro64性能基本上是雙路至強5600的3倍多。

Facebook所做的Memcache對比測試
因此我們要說窺視數據中心市場的不僅僅是ARM,還有其他的玩家,而且實力也不容小視,雖然它們也缺乏生態系統的支持,但ARM不也是一樣嗎?所以除了Intel之外,AMD面臨的潛在對手還有很多。我甚至覺得,AMD應該不僅僅只會在數據中心裡採用ARM,它完全有理由也有實力(尤其是GPU方面)借助ARM殺手移動端市場,不過這都是後話了,讓我們走著瞧。
總而言之,AMD選擇ARM的理由我們已經可以基本猜到,也能理解——與其在x86領域繼續被壓制,不如豁出去闖出一條新路。但是,從另一個角度講,這條路並不見得比繼續開發與Atom同級的x86產品更好走。加盟ARM,AMD在不費多大力氣得到一個出色的處理器架構之外,將面對更多的競爭對手,將會失去x86領域既有的成熟環境,並還要努力開拓新的生態環境。在此,我祝願AMD的ARM之路能盡量好走些,也希望數據中心市場能在ARM與x86的對攻中,走向新的境界……


v 最新文章        熊蓋站為自由討論論壇,所有個人行為或言論不代表本站立場。文章內容如有涉及侵權請聯絡我們,將立即刪除相關文章資料        v 精華文章

               

奇摩搜尋
完全比對 模糊比對

線上收看: 景點即時影像 | 線上查詢: 火車時刻表最上方

    Powered by 熊蓋站  Code © 2005-2017 Plurk Twitter 
讀取秒數Time 0.011782 second(s),query:2 Gzip enabled
   現在時間是 2024-11-27 23:31