22年後再戰高性能顯卡市場 Intel Xe GPU架構詳解:王之野望

驅動之家 發佈 2020-08-13T21:16:26+00:00

現在Xe GPU的架構就變成了Xe LP、Xe HPG、Xe HP及Xe HPC四大金剛了,未來會覆蓋核顯到HPC超算在內的多個場景。

作為CPU界的王者,Intel對高性能GPU市場一直沒有死心,1998年就推出了i740獨顯,12年後又推出Larrabee,22年後的今天又重燃戰鼓,推出了Xe GPU架構。

Intel重新殺入高性能GPU市場的傳聞已久,並挖來了AMD RTG部門前主管、首席架構師Raja Koduri坐鎮GPU業務,這次是否會不一樣呢?

今天的2020年架構日上,Intel終於詳細地解開了Xe GPU的面紗,這裡我們就來管中窺豹一探Intel歷時多年重新打造的GPU架構。

對於Xe架構,我們之前的報導已經多次提到Intel對它的期望是希望用一種架構去滿足多種使用場景,從筆記本到遊戲卡再到高性能超算,都是Xe架構,推動GPU算力從萬億次(TFLOPS)向千萬億次(PFLOPS)邁進。

Intel Xe架構總覽:一種架構通殺四方、適應AI、雲時代

對於Xe GPU架構,官方的定義是「並行矢量矩陣架構」,已經突出了這個架構的特點,那就是高度並行,適合擴展多種場景。

Xe GPU架構有三大重點——軟體第一、並行第二,同時適應全新的工作負載,比如AI、視覺雲計算等等,這也是Intel作為GPU後來的一個優勢,研發GPU架構的時候可以不用照顧太多之前的積累,直接面向未來潛力巨大的場景,比如AI、雲計算等等。

Xe GPU希望用一個架構統一所有應用場景,不過實際情況還是很複雜的,不同場景對性能、功耗的要求不同,可以細分為集成+低能耗、中端、發燒級、數據中心/AI、HPC百億億次計算等等。

在這些細分場景中,Intel打造了三種不同的架構——Xe LP低功耗、Xe HP高性能、Xe HPC,不過實際上已經擴展到了四種,後面會再詳細說。

雖然有三四種不同的架構,不過Intel現在做的主要是兩種——適用於HPC的Xe HPC及低功耗的Xe LP,後者適合核顯、筆記本及低端獨顯,包括之前曝光最多的DG1顯卡。

Intel Xe GPU架構詳解:EU、存儲、AI、顯示、視頻單元全都改了

目前進度最好的還是Xe LP低功耗版,Xe GPU的結構介紹都是基於Xe LP的,具體如下:

Xe LP架構簡單來說就是在提升FLOPS浮點性能的同時,還要考慮功耗,所以能效很重要,性能及能效兼顧。

提升性能就要提升計算規模,Xe架構在Gen11基礎上全面提升了執行單元的規模,EU單元從Ice Lake處理器上的Gen11核顯最多64個提升到了96個,每周期Texel紋理、Pixel像素渲染能力也從32、16提升到48、24,總體性能1.5倍於目前Gen11顯卡水平。

考慮到Gen11的規模實際上已經是目前Gen9.5的2倍多,理論上Tiger Lake上的Gen12核顯性能是現有核顯的至少3倍。

能效方面,在同樣的電壓下,Xe LP GPU的頻率大幅提升,從之前1.1GHz左右提升到了1.7GHz,還有其他手段一起降低了功耗,能效也全面改進了。

下面就是Gen11與Xe架構EU單元的具體對比了。

存儲單元方面,Xe LP GPU的改變也不小,L1新增了數據緩存,並支持端對端壓縮,L3緩存從Gen11的3MB大幅提升到16MB,同時GTI(Graphics Technology Interface 圖形技術接口)帶寬翻倍。

在AI上,Xe架構之前的GPU主要是支持FP32、FP16及Int16浮點,而Xe GPU開始支持INT8指令,AI性能是FP32的4倍。

多媒體引擎上,Xe GPU架構的解碼、編碼帶寬翻倍,支持AV1加速,同時支持4K/8K60播放,還有HDR、杜比音效等等。

顯示輸出方面,Xe GPU支持4屏擴展,支持雙eDP,接口支持DP 1.4、HDMI 2.0、TBT4及USB4,並支持8K UHD輸出,還有360Hz高刷、自適應Sync,全面達到頂級水平。

為何說軟體第一?Intel Xe GPU驅動及軟體優化

前面提到Xe GPU架構的時候,Intel第一個強調的是軟體,很多人可能並不理解,實際上Intel這次是抓到重點了,軟體支持是GPU最容易翻車的地方,Intel的核顯GPU多年來理論性能不弱,但是遊戲表現一言難盡,就是驅動和優化是最大的鍋。

這次Intel對軟體及驅動的重視終於提上來了,這也跟Raja Koduri本人的風格有一定關係,2013年他回到AMD的時候,當年AMD第一個改革的就是催化劑驅動,全面放棄之前的介面及設計,變成了現在的腎上腺素Adrenalin驅動。

在圖形軟體方面,不同場景下的GPU面對的挑戰也是不同的,3D渲染、計算、多媒體、性能、穩定性等等都很重要。

在驅動及編譯器效率上,Xe GPU改變了調度設計,支持AI優化指令,降低了DX11中的驅動開銷(overhead),減少了API延遲等等。

針對GPU優化,Xe GPU可以自適應優化,在後台就最大化GPU性能。

Xe GPU還支持了VRS可變幀率渲染,根據渲染場景的不同來選擇降低或者提升渲染內容,之前在Ice Lkae的Gen11上首先應用了。

還有就是IGCC控制面板,這裡面提供了不少遊戲輔助弓箭手,包括截屏、銳化、直播等等,如果大家用過NVIDIA的GFE及AMD的RIS,就知道Intel這是在一比一的致敬兩位對手了,這對遊戲玩家來說也是好事。

最後就是遊戲支持,這個才是考驗GPU廠商的關鍵,目前已經得到英雄薩姆4、GRID、Gear Tactics、Ring of Elysium、Chvalry II等遊戲支持的,這個只能慢慢來了。

Intel Xe GPU產品線:Xe LP首發三款、One More Thing驚喜亮相

在尾聲階段,來看看Intel Xe GPU最終的產品線,目前主要是Xe LP及Xe HPC兩個架構有結果,其中LP架構會有三款產品。

最快見到的Tiger Lake處理器上的Gen12核顯,然後就是DG1,這個是針對移動內容創造者的,還有就是針對伺服器的SG1,後兩者規格應該差不多。

然後就是One More Thing了,前面說到了Xe GPU有LP、HP及HPC三種,現在Intel又增加了一個選擇——Xe HPG,專門為發燒級遊戲玩家設計的。

Xe HPG最大的特點就是支持RT光線追蹤,硬體光追這個未來遊戲的最大賣點也追上來了,至此AMD、NVIDIA及Intel三家都明確了支持光追了。

現在Xe GPU的架構就變成了Xe LP、Xe HPG、Xe HP及Xe HPC四大金剛了,未來會覆蓋核顯到HPC超算在內的多個場景。

最最後就是四款GPU架構的工藝及封裝了,Xe LP會使用Intel的10nm SuperFin工藝,Xe HPG及Xe HP則是增強版10nm SuperFin工藝,其中Xe HP還會使用EMIB 2.5D封裝技術。

在往上,Xe HPC的計算卡之前原定是7nm工藝首發,現在隨著7nm延期,也退回到了10nm SuperFin工藝了,不過封裝技術是最先進的Foveros及Co-EMIB。

總之,今天公布的Xe架構可以讓大家過過癮,然而這些東西依然是紙面上的,停留在架構上的,有關DG1顯卡、HPG光追卡的最終規格、性能、價格、上市時間等信息還得等等,最快也要年底左右了

關鍵字: