編/王丁
在過去的幾年裡,盡管PC産業一直面臨下滑的困境,但技術進步是止不住的,越是在困難的情況下,技術發展就越重要,新技術不僅能為企業打開新的大門,也能給消費者帶來全新的應用體驗,創造全新的需求,從而推動産品升級換代。作為PC核心技術的CPU、GPU等領域,會有哪些值得關注的技術進步呢?
半導體技術是整個PC産業的根基,半導體工藝沒進步,核心PC産品就無法繼續發展。在過去的50年中“摩爾定律”成了主導半導體工藝進展的金科玉律,Intel不僅是摩爾定律的提出者,也是摩爾定律最堅定的捍衛者,Intel也靠着摩爾定律成就了一方霸業。
但是業界對摩爾定律的質疑也從來沒斷過,特别是最近幾年,很多人都認為矽基半導體技術很快就要面臨極限了,Intel自己的“Tick-Tock”鐘擺戰略在Haswell架構之後也失效了,14nm工藝延期了一年多,以緻于到了2016年14nm依然會是主流。
按照目前的形勢來看,14/16nmFinFET工藝已經成熟,除了Intel之外,TSMC、三星已經在去年分别量産了14nm、16nmFinFET工藝,今年開始量産第二代高性能工藝了,GlobalFoundries今年也會量産14nm工藝。下一步是10nm節點,雖然進度比預期的晚,不過10nm工藝現在也渡過研發階段了,目前正在準備量産,Intel預計是在2017年下半年推出10nmCannonLake處理器,TSMC與三星在10nm工藝上更積極,對宣稱今年下半年就會量産10nm工藝。
10nm之後就是7nm節點了,但它離量産還有段距離,因為工藝越先進,晶體管間距越小,漏電流也愈加嚴重,導緻晶體管功耗過高。除此之外,先進的生産工藝還要依賴半導體制造裝備的進步,原本在10nm工藝就準備啟用的EUV光刻機一直不夠成熟,ASML公司為了研發EUV設備投入了相當多的資源,但EUV光刻機的産量及光照強度還是上不去,離規模化工業生産還有很長的距離,以緻于Intel等公司并不看好7nm節點啟用EUV的前景,有可能要拖到5nm節點。矽基半導體受挫,科研人員很早就開始尋找新的半導體材料,包括砷化镓、碳納米管甚至量子阱晶體管。2015年IBM及合作夥伴三星、GlobalFoundries率先展示了7nm工藝芯片,使用的就是矽鍺材料,使用這種材料的晶體管開關速度更快,功耗更低,而且密度更高,可以輕松實現200億晶體管,晶體管密度比目前的矽基半導體高出一個量級。
英特爾公司雖然沒有展示過7nm工藝,但他們對此一直很自信,此前表态稱即便沒有EUV工藝,他們也懂得如何制造7nm芯片,但願這沒有在吹牛,因為Intel能否即時推出7nm工藝,關系着摩爾定律還能否再戰二十年。
半導體工藝發展雖然很重大,但并不急迫,AMD、Intel新一代處理器至少還有14nm、10nm兩代工藝可用。2016年這兩家都會推出新一代處理器,其中AMD推的是嘔心瀝血研發多年的改頭換面之作——Zen處理器,Intel今年則會有Broadwell-E及Kabylake處理器。
先說領跑者Intel,今年的2代新品中,Broadwell-E是針對LGA2011平台的HEPT發燒級處理器,Kabylake是針對主流市場的LGA1151處理器,前者最動人的地方在于桌面處理器首次出現10核心設計,旗艦型号Corei7-6950X将是10核20線程,頻率3.0GHz,L3緩存高達25MB。
至于跟跑者AMD,他們今年上半年會把第四代模塊化架構Excavator核心帶到桌面市場上,推出AM4插槽的BristolRidge處理器,下半年的重點則是Zen架構處理器,也是AM4插槽,但架構、工藝全新升級,放棄之前由推土機架構引入的模塊多核理念,回歸傳統的SMT多線程。
Zen架構曝光率非常高,隔三差五就要在媒體上亮相,雖然我們對Zen架構的細節所知甚少,但從AMD及各方流傳出來的信息來看,Zen架構性能值得期待,官方表示IPC性能提升40%還多,14nmFinFET工藝也會大幅降低處理器的功耗。
還有一點值得注意,不光Intel在推8核甚至10核處理器,AMD的Zen架構多核并行能力也有提高,桌面版首發時至少是4核8線程起步,中高端會是8核16線程,而服務器/工作站出現16核32線程甚至32核64線程也不要驚訝。
不論是Intel的10核處理器還是AMD的16核處理器,桌面處理器在突破6核、8核之後會繼續進入10核+時代,IntelBroadwell-E在前兩代突破8核之後已經确定有10核20線程産品,AMD的Zen架構更加激進,8核16線程不是問題,是否會在桌面市場推出12核甚至16核的旗艦也令人期待。
伴随着CPU、GPU計算性能的飛速增長,PCI-E總線也要有相應的準備,不過最新一代PCI-E4.0總線技術已經推遲了,原定于2015年上半年發布最終規範,但現在來看PCI-E4.0總線可能要拖到2016年甚至2017年了。
新一代總線具備更高的性能,具體來說,目前在用的PCI-E3.0總線速率是8GT/s,Link帶寬8Tb/s,每一通道帶寬約為1GB/s,x16通道雙向帶寬32GB/s,而PCI-E4.0在PCI-E3.0基礎上保持架構不變,速率翻倍到16GT/s,通道帶寬提升到2GB/s,x16雙向帶寬高達64GB/s。
不過PCI-E4.0面臨的問題也不少,除了銅介質速率繼續提升的技術難題之外,PCI-E4.0最大的尴尬之處在于——桌面顯卡用不到這麼高的帶寬,高性能計算領域PCI-E4.0帶寬又不給力。前者很好說,因為從PCI-E2.0到PCI-E3.0時代,顯卡性能也沒有因此受益,PCI-E3.0x16帶寬已經達到了32GB/s,目前的高端顯卡并不需要這麼高的帶寬,而升級到PCI-E4.0,64GB/s的帶寬對桌面顯卡來說也是浪費。
如果用到HPC領域,PCI-E4.0帶寬的64GB/s又有點捉襟見肘了,等不及的廠商早已經在暗地裡開發新的總線技術,其中NVIDIA跟IBM聯合開發了NVLink總線,号稱帶寬是PCI-E總線的5-12倍,AMD也在開發自家的架構互聯技術,帶寬超過100GB/s。
無論AMD還是NVIDIA,他們開發的新總線技術帶寬可以輕松超過100GB/s,這對服務器産品很有用,但對桌面市場有什麼意義呢?值得發燒友關注的就是多卡互聯技術,目前AMD、NVIDIA最多能做到的也就是4卡SLI/CF交火,有了NVLink這樣的技術,8卡SLI或者CF都是有可能的。
說完了CPU處理器,我們也不能忽視GPU處理器。作為當前PC中功耗最高的一部分,顯卡對遊戲性能影響至關重要,但在性能越高=功耗越高這條路上,顯卡也面臨一個選擇——NVIDIA的Maxwell架構證明了顯卡性能增長的同時,能耗也可以很低。2016年的GPU不僅要性能,更重要的是效能,我們要看到還是每瓦性能比。
在Maxwell架構之後,NVIDIA将推出新一代的Pascal架構。根據官方公布的資料,Pascal顯卡将支持3DMemory顯存,容量、帶寬可達普通顯存的2-4倍,而顯卡隻有标準PCI-E顯卡的1/3大小,如今基于Pascal架構的新一代顯示芯片已經有兩款高端産品——GeForceGTX1080、GTX1070相繼問世了。
至于AMD,由于目前的R200、R300系列顯卡大都還在使用GCN架構改款,制程工藝還是28nm工藝,能效方面已經落後NVIDIA的Maxwell架構了,所以2016年AMD也會在GPU領域有大動作——推出了GCN4.0架構Polaris,制程工藝升級到14/16nmFinFET,同時會搭配HBM2顯存,号稱每瓦性能比提升一倍。
AMD還實際演示了Polaris顯卡的能效優勢,之前使用用Polaris架構的一款中端顯卡跟NVIDIA的GTX950做了對比,同樣是在1920x108060fps的性能上,Polaris顯卡的整機功耗是86W,而GTX950整機功耗是140W,可見功耗優勢非常非常大。2016年GPU要想提高性能、降低功耗,除了架構改進之外,新一代内存技術也功不可沒,其中AMD在去年的Fury顯卡上首次使用的HBM内存就是代表,NVIDIA所說的3D顯存其實也是HBM技術,不過是HBM2代技術。與HBM競争的則是美光主導的HMC内存技術。對于HBM技術,簡單來說,HBM就是在GDDR5顯存無法繼續大幅提升頻率的情況下換了一種思路,通過提高總線位寬來提高帶寬,第一代HBM顯存的頻率隻有500MHz,等效1GHz,遠低于目前的GDDR5顯存,但帶寬高達128GB/s,4顆芯片總計可以帶來512GB/s的帶寬,遠高于主流GDDR5顯存。
2016年HBM2代也來了,JEDEC已經正式批準了HBM2顯存規範,相比第一代HBM,HBM2可堆棧的層數更多,單顆容量最高可達8GB,頻率也翻倍到2Gbps,帶寬從128GB/s提高到256GB/s,這樣一來布置4組HBM2顯存就可以實現32GB容量、1TB/s的帶寬了,次之也有16GB容量,1TB/s帶寬,這正好與NVIDIA之前宣稱的數據相符。
HBM内存技術已經得到了SKHynix、三星等廠商的支持,另一個内存技術大腕美光的選擇不同——顯存市場他們繼續推改良版的GDDR5X,3D堆棧内存上則選擇了HMC(HybridMemoryCube),它跟HBM一樣都需要使用TSV工藝連接多層DRAM芯片。
性能方面,HMC閃存相比DDR内存依然有足夠多的優勢,普通DDR3-1600内存雙通道帶寬不過12.8GB/s,美光之前宣稱HMC的性能是DDR3内存的20倍,單通道帶寬就有128GB/s(跟HBM1代相同),同時功耗比DDR3減少70%,占用面積比DDR3減少95%。
HMC陣營實際上也有Intel、三星等其他公司參與,但目前力推HMC的基本上隻有美光公司,他們現在推出了2/4GB容量的HMC内存,有兩種封裝,896-BallBGA封裝的帶寬為160GB/s,666-BallBGA封裝的帶寬是120GB/s。
具體應用方面,HMC在Intel的新一代XeonPhi加速卡上露過面了,代号KnightsLanding的XeonPhi加速卡配備了16GB闆載緩存,号稱5倍帶寬、5倍能效于DDR4内存,它就是美光提供的HMC内存。
不過總體來看,HMC相對HBM來說還有點滞後,HBM在新一代顯卡上站穩腳跟沒問題,未來也會進入服務器等市場,HMC受到的支持力度不如HBM,不過3D内存技術現在還是新興事物,現在給HBM、HMC作出最終判決還有點為時過早。2016年半導體/處理器技術的進步首先要依賴工藝升級,雖然10nm及7nm工藝還有點遠,但2016年我們可以預期新一代處理器全面升級14/16nmFinFET工藝,這比去年的28nm、20nm工藝已經有很大進步了。不論是AMD、Intel的CPU還是AMD、NVIDIA的GPU,FinFET工藝都會帶來20%以上的性能提升,30-40%的功耗降低,最終的CPU/GPU不僅性能更強,功耗也會大幅降低。