AMD技術(shù)日干貨分析:市場成功后,設計更加成熟。
在今年6月的COMPUTEX電腦展期間,AMD和Intel先后發(fā)布了他們的下一代移動和桌面端CPU相關(guān)信息,如果你關(guān)注我們?nèi)咨钪暗膬?nèi)容,你可能會知道。

然而,在那之后,這兩家制造商并沒有直接從6月份開始銷售新產(chǎn)品。根據(jù)之前的一些說法,他們似乎都選擇了在最初發(fā)布后再次調(diào)整和優(yōu)化新產(chǎn)品。當時是2024年7月中旬,隨著AMD在美國洛杉磯的召開,Tech Day,更多關(guān)于其新一代桌面和移動平臺的細節(jié)也終于浮出水面。
Zen5架構(gòu)分析:更“豪橫”的設計,完整的512bit向量
首先,我們來看看全新的Zen5 CPU架構(gòu)的變化。根據(jù)官方公布的技術(shù)細節(jié),Zen5并不屬于“推倒重來”的全新設計,但絕對可以說是充滿了“英雄堆砌”,體現(xiàn)了AMD在CPU領(lǐng)域的快速發(fā)展。
首先,在前端部分,Zen5采用了雙管預取設計,并與改進的分支預測算法相匹配。官方聲明不僅降低了預測延遲,提高了準確性,還增加了吞吐量。同時,它還有兩組4寬度的指令解碼模塊和8總寬度的Dispatch模塊。
但是在執(zhí)行部分,單個Zen5核心有6個ALU(算術(shù)邏輯單元)、8寬整數(shù)重命名模塊,以及更多的ALU調(diào)度器和更大的執(zhí)行窗口。
此外,Zen5最終擁有一個真正完整的512bit長度的向量加速器,與Zen4之前采用的雙256bit向量浮點單元設計相比。這意味著在運行AVX-512指令集時,不再需要“拆解”指令集的過程,可以顯著提高一些高負載游戲、多媒體編輯和AI計算的性能。
順便說一下,雖然AVX-512是Intel提出的第一個標準,但由于眾所周知的核結(jié)構(gòu)模式問題,家用酷睿處理器至少要到下一代才能再次擁有512bit向量指令集。因此,Zen5這次可能會有更大的優(yōu)勢,對于需要重負荷多媒體的用戶來說。
最后,在核內(nèi)緩存設計中,每個Zen5核心都有32KB 緩存L1指令,48KB L1數(shù)據(jù)緩存,1MBL2緩存。若將其與Zen4進行比較,可以發(fā)現(xiàn)新架構(gòu)的L1數(shù)據(jù)緩存增加了50%。另外AMD方面也強調(diào),L1緩存到CPU浮點單元的峰值帶寬現(xiàn)在已經(jīng)翻了一番。但從Zen5L2緩存大小并沒有大幅上升的角度來看,AMD還是考慮到了產(chǎn)品的成本,并沒有因為使用了臺積電N4X工藝而“飛行”太多。
在執(zhí)行單元、緩存設計、預取算法的多重加持下,AMD Zen5的平均IPC增長率約為16%,但如果是機器學習、AES解密等重數(shù)學加速場景,其結(jié)構(gòu)進步幅度可達30%以上??紤]到目前還沒有推出內(nèi)置NPU的桌面CPU產(chǎn)品,AMD在Zen5的CPU架構(gòu)中強調(diào)機器學習性能,自然是一種相當有目的的設計。
RDNA3.5 GPU:官方表示,改進是為了效率,但可能仍然存在懸念。
下一步,AMD對其RDNA3.5圖形結(jié)構(gòu)的設計進行了詳細的分析。這是Zen5、XDNA22Zen5c核心, 在AMD的最新一代銳龍AI移動平臺上,NPU被整合到AMD。
或許就是這樣,新的RDNA3.5架構(gòu)從一開始就考慮了能效比和它們之間的“協(xié)同”因素??陀^上,RDNA3.0在AMD獨立顯示方面也有一些有趣的變化,而RDNA3.0在AMD獨立顯示方面更為熟悉。
第一,RDNA3.5線條采樣率是RDNA3的兩倍,同時也使著色器內(nèi)部的插值和比較操作速度翻了一番。雖然AMD方面聲稱這些改進旨在提高核顯的能效比,但是對AMD很熟悉。 同時,GPU的朋友們也可以看到,這些優(yōu)化的本質(zhì)一般是提高RDNA3.5的“傳統(tǒng)光柵性能”,即非光追、非AI超分時的3D圖像生成率。而且這恰恰是目前的AMD。 GPU的優(yōu)點。

第二,RDNA3.5架構(gòu)還改進了內(nèi)存控制器,它采用了更好的數(shù)據(jù)壓縮算法,減少了顯存負荷。AMD表示,它改善了新GPU的“每個比特性能”,這實際上可以理解為新的GPU減少了對PC內(nèi)存頻率的相對需求。
請注意,這種減少是“相對的”。由于眾所周知,新一代Radeon 890M核顯然有更大的計算陣型。如果不提高內(nèi)存效率,理論上也需要等比例提高內(nèi)存頻率,才能“喂飽”這些增加的GPU核心,顯然會大大提高產(chǎn)品成本。因此,提高GPU的內(nèi)存效率是極其必要的一步,無論是為了讓銳龍平臺的筆記本電腦更貼近百姓,還是為了讓傳說中的超大核顯APU將來真正成立。
XDNA2 NPU:不僅是最高計算能力,而且在精度上特別領(lǐng)先。
說實話,如果你對AMD目前的AI產(chǎn)品線比較熟悉,你可能會覺得有點迷茫。因為對于目前的AMD來說,它們實際上相當于AI加速器設計,它們來源不同,架構(gòu)不同,完全不共享軟件生態(tài)。其中一個來自顯卡團隊,用于那些CDNA架構(gòu)的計算卡,以及集成在RDNA3.0架構(gòu)中的獨立顯示器。
另外一套,來自于AMD收購的賽靈思團隊,他們的XDNA加速器有自己獨立的產(chǎn)品線。與此同時,從銳龍7000系統(tǒng)開始,XDNA也被整合到AMD移動APU中,作為“NPU”使用。
幸運的是,隨著銳龍7000系列和8000系列兩代移動平臺在市場上取得了巨大的成功,AMD似乎逐漸加強了他們在家庭AI解決方案中的選擇。最新的銳龍AI 在300系列中,我們可以看到新的XDNA2架構(gòu)模式。
與第一代XDNA相比,新的集成NPU將內(nèi)部AI引擎的切片數(shù)量從20個增加到32個,同時將每個切片的MACs(乘加累計操作)性能提高到原來的兩倍,同時將NPU的內(nèi)置緩存提高到60%。

從結(jié)論來看,目前版本的銳龍AIXDNA2 在300系CPU中,可以提供50TOPs的獨立AI計算率。而且這樣,它就成了目前已經(jīng)發(fā)布的PC集成NPU方案,性能最強。

而且AMD這個NPU還有一個很特別的地方,那就是它支持“Block FP16浮點格式,在這種格式下仍然可以跑到50TOPs的滿速。相比之下,其他家庭的大部分NPU只能用INT8格式“跑滿”,如果運行FP16的AI計算,速度會減半。

正因為如此,AMD才會特別強調(diào)XDNA2 FP16 AI處理速度的原因。歸根結(jié)底,眾所周知,F(xiàn)P16對于目前的AI推理項目來說,的確能帶來比INT8更高的精度優(yōu)勢。所以從技術(shù)層面來說,AMD的這套XDNA2 在理論速度和理論精度方面,NPU確實可以“按壓”競爭對手的同代NPU。
結(jié)論:市場表現(xiàn)加速進攻,AMD之路越走越寬。
上述基本都是AMD在這個Tech。 在Day期間,發(fā)布了一些關(guān)于新產(chǎn)品結(jié)構(gòu)的詳細信息,不知大家看了之后會有什么感受?

從我們?nèi)咨畹慕嵌葋砜矗v觀AMD的新產(chǎn)品,最大的感受就是近年來市場的成功,這確實給了AMD更大的信心,讓他們“勇敢”地使用一些更激進的設計來追求更高的CPU多媒體吞吐量,更多的GPU核顯規(guī)格,以及NPU上行業(yè)領(lǐng)先的計算理念。
同時,更值得稱道的是,AMD從未放棄產(chǎn)品設計中的“性價比”。、特別是對家庭和游戲用戶的重視。從Zen55開始, 事實上,CPU可以非常清楚地看到,CPU不會盲目堆疊緩存容量,RDNA3.5優(yōu)先增強光柵性能,而不是增強AI特性。
當然,有些朋友可能還是會有疑問。他們會認為這種取悅游戲玩家的設計不夠“噱頭”,面對競爭對手的“創(chuàng)造力”。、以“專業(yè)化”為主的宣傳方式,AMD在市場宣傳方面可能會吃虧。
但很明顯,PC廠商看得很清楚。一方面,華碩作為AMD活動的嘉賓之一,在現(xiàn)場發(fā)布了包括游戲本、創(chuàng)意工作站、輕薄本在內(nèi)的多條產(chǎn)品線新產(chǎn)品,進而有效證明了銳龍移動平臺今天的“全能”。

另一方面,根據(jù)AMD官方公布的數(shù)據(jù),從第一代銳龍AI平臺到現(xiàn)在的第三代方案,市場上商品風格的數(shù)量不斷增加,幾乎呈現(xiàn)出翻倍的趨勢。與各種PPT的輸贏相比,AMD現(xiàn)在真正的自信顯然是商品數(shù)量直接反映出來的市場信心。

此外,從AMD此次發(fā)布的信息來看,顯然不能排除它背后還有一些“懸念”,比如超大型RDNA3.5核顯設計,前面已經(jīng)提到已經(jīng)曝光很久了,比如未來AMD獨立顯示產(chǎn)品線和XDNA。 結(jié)合NPU。經(jīng)過從5000系到8000系的不斷探索,AMD的產(chǎn)品規(guī)劃和技術(shù)路線開始再次展現(xiàn)出更加成熟的特征,這也讓外界對自己的未來有了更多的信心和期待。
本文來自微信微信官方賬號“三易生活”(ID:IT-作者:三易菌,36氪經(jīng)授權(quán)發(fā)布,3eLife)。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




