系統(tǒng)之家 - 系統(tǒng)光盤(pán)下載網(wǎng)站!

當(dāng)前位置:系統(tǒng)之家 > IT快訊 > 詳細(xì)頁(yè)面

Intel重回高性能GPU市場(chǎng)!Xe HPG微架構(gòu)潛力無(wú)窮

編輯:alear 2022-12-08 15:25:08 來(lái)源于:快科技

  2022年Intel接連發(fā)力,在6月份率先推出了旗下首款高性能桌面級(jí)GPU A380,雖然定位入門(mén)級(jí),卻也初具規(guī)模。而在同年10月再次推出了中高性能的A750/A770桌面級(jí)GPU,本次的兩款顯卡一躍達(dá)到了市場(chǎng)主流產(chǎn)品的水準(zhǔn),雖然尚未達(dá)到旗艦級(jí)發(fā)燒性能,但其潛力可見(jiàn)一斑。

  下面則為大家簡(jiǎn)單解析一下Intel的Xe HPG微架構(gòu),到底有何玄妙之處。

  Xe HPG微架構(gòu)淺析

  本代Intel 3款顯卡采用了Xe HPG微架構(gòu)設(shè)計(jì),最初發(fā)布的入門(mén)級(jí)A380顯卡包含8個(gè)Xe內(nèi)核(Xe Core),即兩個(gè)渲染切片(Rendering Slice),下面我們從最小的Xe Core逐步為大家講解。

Intel重回高性能GPU市場(chǎng)!Xe HPG微架構(gòu)

  Xe Core

  每個(gè)Xe Core包含16個(gè)256位寬的(XVE)矢量引擎,它主要負(fù)責(zé)傳統(tǒng)圖像處理計(jì)算的任務(wù),且提供大部分運(yùn)算。

  同時(shí)由于AI算法核心幾乎完全圍繞著一系列大型矩陣算法和累加算法,所以每個(gè)Xe Core還包含16個(gè)1024位寬的矩陣引擎(XMX),主要為加速AI運(yùn)算而生。

  為了滿(mǎn)足矩陣、矢量和光線(xiàn)追蹤單元的高帶寬需求,每個(gè)Xe Core中還構(gòu)建了一個(gè)192KB的大型本地內(nèi)存。它可以根據(jù)每個(gè)工作負(fù)載的需要在L1緩存和共享本地內(nèi)存(SLM) 之間動(dòng)態(tài)分配。

Intel重回高性能GPU市場(chǎng)!Xe HPG微架構(gòu)

  Render slice

  綜上所述,每4個(gè)微小的Xe Core,將構(gòu)成一個(gè)Render slice(渲染切片)。除此之外,每個(gè)Render slice還集成了幾何處理、光柵化、紋理采樣、像素處理和光線(xiàn)跟蹤等主流圖形技術(shù)。

  新的光線(xiàn)追蹤單元架構(gòu)可為DirectX Raytracing和Vulkan RT提供全面支持,通過(guò)加速光線(xiàn)遍歷、光線(xiàn)盒交叉點(diǎn)和光線(xiàn)基元交叉點(diǎn)實(shí)現(xiàn)逼真的閃電和視覺(jué)保真度。

Intel重回高性能GPU市場(chǎng)!Xe HPG微架構(gòu)

  Xe HPG

  Xe HPG架構(gòu)最大的特點(diǎn)就是出色的靈活性,Intel可通過(guò)疊加渲染切片的方法來(lái)構(gòu)建不同核心,目前最少為2個(gè)(8 Xe Core),最大可以做到8個(gè)(32 Xe Core),A380為兩個(gè),而A770則為8個(gè)Render slice。

  通過(guò)此方法,可實(shí)現(xiàn)GPU配置從低功耗解決方案擴(kuò)展到旗艦級(jí)的游戲引擎。每個(gè)Render slice通過(guò)大型L2緩存的高帶寬內(nèi)存交換矩陣,能夠靈活地?cái)U(kuò)展到強(qiáng)大的多切片配置,并連接到獨(dú)立的GPU基礎(chǔ)架構(gòu)。

  具有連接每個(gè)切片的大型二級(jí)緩存的高帶寬內(nèi)存交換矩陣能夠靈活地?cái)U(kuò)展到強(qiáng)大的多切片配置,并連接到獨(dú)立的GPU基礎(chǔ)架構(gòu)。

  Intel Xe HPG微架構(gòu) 其他特性

  XeSS 超級(jí)采樣

  針對(duì)游戲幀數(shù)優(yōu)化方面,目前NVIDIA擁有DLSS、NIS技術(shù),AMD擁有FSR、RSR技術(shù),這幾種技術(shù)旨在降低渲染分辨率,輸出高幀率畫(huà)面,但原理有所不同。

  而Intel的XeSS超級(jí)采樣技術(shù),同樣在未發(fā)布時(shí)就引起了玩家的高度關(guān)注。

Intel重回高性能GPU市場(chǎng)!Xe HPG微架構(gòu)

  它是由機(jī)器學(xué)習(xí)通過(guò)相鄰像素以及運(yùn)動(dòng)補(bǔ)償先前幀重建子像素細(xì)節(jié),可以幫助合成非常接近于原生超高分辨率渲染質(zhì)量的圖像。

  整體算法采用了人工智能算法和硬件加速,以較低分辨率渲染所要求的性能水平,提高輸出分辨率,提供超高清視覺(jué)效果,性能可提高2倍。

  根據(jù)官方的描述,XeSS采用了與DLSS相似的時(shí)間算法,它類(lèi)似于用相機(jī)拍攝長(zhǎng)曝光,捕捉的時(shí)間越長(zhǎng),收集到的細(xì)節(jié)也就越多。

Intel重回高性能GPU市場(chǎng)!Xe HPG微架構(gòu)

  在多個(gè)不同幀之間,AI會(huì)通過(guò)運(yùn)動(dòng)矢量來(lái)跟蹤對(duì)象并分析數(shù)據(jù),并決定如何將它們結(jié)合在一起。XeSS會(huì)通過(guò)中間幀和前后幀,收集超高像素后,再經(jīng)由AI網(wǎng)絡(luò)處理,輸出相對(duì)較小且清晰的畫(huà)面。

  和時(shí)間算法相比,NIS、FSR、RSR這類(lèi)空間縮放算法則只能取一個(gè)像素點(diǎn)附近的低分辨率圖像進(jìn)行采樣,然后縮放銳化。但銳化并不能從低分辨率圖像中創(chuàng)建額外的細(xì)節(jié),只能提高低分辨率信息中已經(jīng)存在的細(xì)節(jié)對(duì)比度。

Intel重回高性能GPU市場(chǎng)!Xe HPG微架構(gòu)

  令人驚喜的是,XeSS是采用開(kāi)放標(biāo)準(zhǔn)實(shí)現(xiàn)的。換句話(huà)說(shuō),在游戲廠(chǎng)商的支持下,它可以適配多家GPU廣泛使用。當(dāng)然,XeSS算法在Xe GPU的DP4a和XMX硬件功能下,會(huì)呈現(xiàn)更好的性能效果。

  Deep Link

  Deep Link可充分利用Intel CPU和GPU協(xié)同工作,完成如視頻轉(zhuǎn)碼,直播推流等任務(wù),編解碼優(yōu)勢(shì)顯著。Deep Link并不是某種具象技術(shù),而是多項(xiàng)技術(shù)的總稱(chēng),下面我們來(lái)分別講解。

Intel重回高性能GPU市場(chǎng)!Xe HPG微架構(gòu)

  Stream Assist

  Stream Assist技術(shù)主要針對(duì)游戲主播,或者有直播需求的用戶(hù)。在開(kāi)啟直播時(shí),Stream Assist可將直播負(fù)載分載到系統(tǒng)中的輔助引擎,從而優(yōu)化游戲性能。性能更強(qiáng)的獨(dú)顯則依舊負(fù)責(zé)游戲運(yùn)算,以獲得最高的幀率和協(xié)同工作效率。

  另外集顯負(fù)責(zé)直播的同時(shí),還負(fù)責(zé)捕獲任務(wù)(如虛擬綠屏、自動(dòng)構(gòu)圖、清晰直播和自動(dòng)捕捉游戲精彩時(shí)刻)。

Intel重回高性能GPU市場(chǎng)!Xe HPG微架構(gòu)

  需要注意的是,臺(tái)式機(jī)如果想使用Stream Assist技術(shù),前提是與12代酷睿處理器或代次更高的處理器搭配使用,另外需要帶有集成顯卡的處理器,后綴帶有“F”的則無(wú)法使用。

  超級(jí)編碼、超級(jí)計(jì)算

  超級(jí)編碼可以讓Intel平臺(tái)上并行工作的多個(gè)媒體引擎(適用于看重工作效率的選定應(yīng)用程序),加速編碼。從而讓用戶(hù)花更少的時(shí)間等待項(xiàng)目輸出,最大限度地發(fā)揮創(chuàng)作動(dòng)力。

  而超級(jí)計(jì)算則需要用到XMX引擎,它可以利用Intel平臺(tái)上的多個(gè)計(jì)算引擎和 AI 加速器(適用于看重工作效率的選定應(yīng)用程序),加速內(nèi)容創(chuàng)作。

Intel重回高性能GPU市場(chǎng)!Xe HPG微架構(gòu)

  同樣,這兩項(xiàng)技術(shù)均需要搭載12代酷睿處理器或代次更高的處理器搭配使用,另外需要帶有集成顯卡的處理器。

  這里著重說(shuō)一下超級(jí)編碼,它可以使用CPU和GPU上所有可用的媒體編碼引擎,某種意義上說(shuō),可以看做雙顯卡共同編碼。

  我們此前的編碼工作,無(wú)論使用CPU或者GPU,都是單線(xiàn)程工作。而Intel超級(jí)編碼則是通過(guò)OneVPL這個(gè)跨平臺(tái)的開(kāi)放性框架,讓CPU和GPU協(xié)同工作。

Intel重回高性能GPU市場(chǎng)!Xe HPG微架構(gòu)

  當(dāng)超級(jí)編碼開(kāi)始工作時(shí),一組組解碼后的原始幀通過(guò)特定的API函數(shù)被交給oneVPL,進(jìn)而按組被分配到不同的多媒體引擎上,拷貝到相應(yīng)的內(nèi)存中緩存起來(lái)。

  不論每一組有多少幀,相應(yīng)的集顯或者獨(dú)顯的多媒體引擎會(huì)開(kāi)始按照設(shè)定的格式編碼。而OneVPL會(huì)完成后續(xù)的打包工作,把編碼后的幀一組組拼接成最終視頻來(lái)輸出。這種并行處理,編碼效率比單一顯卡更加顯著。

  高級(jí)Xe媒體引擎

  高級(jí)Xe媒體引擎帶有專(zhuān)門(mén)AI加速、寬編解碼器支持,包含H.264/AVC、H.265/HEVC、VP9以及AV1。并且得益于強(qiáng)大的媒體引擎,它也是全球首款支持AV1硬件編碼的GPU。與軟件編碼相比,編碼速度提高了50倍。

Intel重回高性能GPU市場(chǎng)!Xe HPG微架構(gòu)

  AV1與H.265編解碼誰(shuí)才是未來(lái)一直廣受爭(zhēng)議,從壓縮效率來(lái)講,AV1比最為常見(jiàn)的H.264編解碼器高出50%,比H.265高30%。換句話(huà)說(shuō),對(duì)于相同的圖像質(zhì)量,AV1可以比HEVC節(jié)省多達(dá)30%的文件大小。

  當(dāng)然,如此強(qiáng)大的AV1也需要更強(qiáng)大的硬件來(lái)解碼,即便如此,它也比HEVC需要更長(zhǎng)的時(shí)間來(lái)解碼。并且HEVC已經(jīng)由AMD、NVIDIA、Intel、Apple、高通等公司的GPU/CPU支持,而AV1目前的支持是有限的。

  最重要的是,AV1是完全開(kāi)放沒(méi)有任何授權(quán)費(fèi)用的編解碼器。雖然目前還沒(méi)有被廣泛采用,但行業(yè)內(nèi)用戶(hù)對(duì)其前景非常認(rèn)可。

  目前,包括FFMPEG、Handbrake、Adobe和XSplit都已集成了對(duì)銳炫AV1的支持。

  結(jié)語(yǔ):

  作為Intel第一代高性能獨(dú)顯架構(gòu),Xe HPG微架構(gòu)從硬件水準(zhǔn)來(lái)說(shuō),顯然已經(jīng)達(dá)到預(yù)期,目前欠缺的只是軟件方面的優(yōu)化。根據(jù)Intel官方說(shuō)明,剛剛發(fā)布的A770已經(jīng)達(dá)到了最大的8個(gè)Render Slice成為完全體,性能的提升也是有目共睹。

  當(dāng)然一代架構(gòu)并不能說(shuō)明太多問(wèn)題,我們還要看后續(xù)以Xe HPG微架構(gòu)為藍(lán)本的迭代升級(jí)效果如何,不過(guò)無(wú)論怎樣,在NVIDIA和AMD兩強(qiáng)相爭(zhēng)多年的格局下,Intel重回高性能GPU市場(chǎng),無(wú)疑會(huì)在未來(lái)幾年內(nèi)對(duì)市場(chǎng)格局帶來(lái)巨大沖擊。

Intel重回高性能GPU市場(chǎng)!Xe HPG微架構(gòu)

標(biāo)簽 Intel GPU

發(fā)表評(píng)論

0

沒(méi)有更多評(píng)論了

評(píng)論就這些咯,讓大家也知道你的獨(dú)特見(jiàn)解

立即評(píng)論

以上留言?xún)H代表用戶(hù)個(gè)人觀點(diǎn),不代表系統(tǒng)之家立場(chǎng)

官方交流群 軟件收錄