服務(wù)熱線
0755-83044319
發(fā)布時間:2023-01-10作者來源:芯智訊瀏覽:2192
1月6日消息,AMD 在 CES 2023展會上推出了下一代面向數(shù)據(jù)中心的APU產(chǎn)品Instinct MI300,其采用chiplet設(shè)計,擁有13個小芯片,晶體管數(shù)量高達(dá)1460億個。
具體來說,Instinct MI300由13個小芯片整合而成,其中許多基于3D堆疊的,擁有24個Zen4 CPU 內(nèi)核,并融合了CDNA 3 圖形引擎,以及共享的統(tǒng)一內(nèi)存池,包括 Infinity Cache 高速緩存和8個HBM共享內(nèi)存設(shè)計??傮w而言,該芯片擁有1460億個晶體管,超過了英特爾的1000億晶體管的Ponte Vecchio,成為了AMD投入生產(chǎn)的[敏感詞]芯片。
從曝光的照片可以看到,MI300兩側(cè)擁有八個共計128GB的HBM3芯片,在這些 HBM3芯片之間還放置了多個小塊結(jié)構(gòu)的硅片,以確保冷卻解決方案在封裝頂部擰緊時的穩(wěn)定性。
MI300的計算部分由9個基于臺積電5nm工藝制程的小芯片組成,這些小芯片包括了CPU和GPU內(nèi)核,但AMD并未提供每個小芯片的詳細(xì)信息。
由于Zen 4 內(nèi)核通常部署為八個核芯,因此24核CPU則意味著有3個小芯片是CPU芯片,另外6個則是GPU芯片。GPU芯片使用AMD的CDNA 3架構(gòu),這是AMD數(shù)據(jù)中心特定圖形架構(gòu)的第三個版本。AMD 尚未明確CU數(shù)量,不過官方公布的數(shù)據(jù)顯示,CDNA 3的每瓦特AI性能達(dá)到了上代CDNA 2的5倍。
這9個小芯片是通過3D封裝堆疊在4個6nm小芯片上,這些芯片不僅僅是無源中介層——這些芯片是有源的,可以處理I/O和各種其他功能。
AMD 代表展示了另一個 MI300 樣品,該樣品打磨了頂部模具,以揭示四個有源中介層模具的結(jié)構(gòu)??梢郧宄乜吹絻?nèi)部結(jié)構(gòu),這些結(jié)構(gòu)不僅可以在I / O瓦片之間實(shí)現(xiàn)通信,還可以實(shí)現(xiàn)與HBM3堆棧接口的內(nèi)存控制器之間的通信。但是這個樣品禁止拍照,因此沒法提供照片。
3D堆疊設(shè)計允許CPU、GPU 和內(nèi)存芯片之間實(shí)現(xiàn)令人難以置信的數(shù)據(jù)吞吐量,同時還允許 CPU 和 GPU 同時處理內(nèi)存中的相同數(shù)據(jù)(零拷貝),從而節(jié)省功耗、提高性能并簡化編程??纯丛撛O(shè)備是否可以在沒有標(biāo)準(zhǔn)DRAM的情況下使用會很有趣,正如我們在英特爾的Xeon Max CPU中看到的那樣,它也采用了封裝上的HBM。
AMD的代表不愿透露更多細(xì)節(jié),因此不清楚AMD是否使用標(biāo)準(zhǔn)的TSV方法將上下芯片連接在一起,或者是否使用更先進(jìn)的混合鍵合方法。AMD表示,將很快分享有關(guān)封裝方面的更多詳細(xì)信息。
AMD聲稱MI300提供的AI性能和每瓦性能是Instinct MI250的8倍和5倍(使用稀疏性FP8基準(zhǔn)測試)。AMD還表示,它可以將ChatGPT和DALL-E等超大型AI模型的訓(xùn)練時間從幾個月減少到幾周,從而節(jié)省數(shù)百萬美元的電力。
當(dāng)前一代的Instinct MI250為世界上[敏感詞]臺百萬兆級超級計算機(jī)Frontier提供動力,Instinct MI300將為即將推出的美國新一代El Capitan超級計算機(jī)提供動力,其FP64 峰值計算性能高達(dá)200億億次(2 ExaFLOPS)。
AMD表示,這些面向超級計算機(jī)的MI300芯片將昂貴且相對罕見——這些不是大批量產(chǎn)品,因此它們不會像EPYC Genoa數(shù)據(jù)中心CPU那樣廣泛部署。但是,該技術(shù)將過濾到不同外形尺寸的多個變體。
該芯片還將與Nvidia的Grace Hopper Superchip競爭,后者是在同一基板上整合了Hopper GPU和Grace CPU。這些芯片預(yù)計將于今年上市?;贜eoverse的Grace CPU基于Arm v9指令集,配備了兩個與Nvidia新品牌的NVLink-C2C互連技術(shù)融合在一起的芯片。AMD的方法旨在提供卓越的吞吐量和能源效率,因?yàn)閷⑦@些設(shè)備組合到單個封裝中,通常比連接兩個單獨(dú)的設(shè)備時能夠在單元之間實(shí)現(xiàn)更高的吞吐量。
MI300還將與英特爾的Falcon Shores競爭,后者將具有不同數(shù)量的計算模塊,包括x86內(nèi)核,GPU內(nèi)核和內(nèi)存,具有令人眼花繚亂的可能配置,但這些要到2024年才能到來。
在這里,我們可以看到MI300封裝的底部,其中包含用于LGA安裝系統(tǒng)的接觸墊。AMD沒有分享更多細(xì)節(jié),該芯片目前正在AMD的實(shí)驗(yàn)室中。
AMD預(yù)計將在2023年下半年交付Instinct MI300,屆時El Capitan超級計算機(jī)將首發(fā)部署MI300,有望成為世界上最快的超級計算機(jī)。
值得一提的是,英特爾聯(lián)合阿貢國家實(shí)驗(yàn)室也在部署運(yùn)算速度高達(dá)200億億次極光(Aurora)超級計算機(jī),該超級計算機(jī)基于英特爾的擁有超過1000億個晶體管的Ponte Vecchio數(shù)據(jù)中心顯卡。
免責(zé)聲明:本文采摘自“芯智訊”,本文僅代表作者個人觀點(diǎn),不代表薩科微及行業(yè)觀點(diǎn),只為轉(zhuǎn)載與分享,支持保護(hù)知識產(chǎn)權(quán),轉(zhuǎn)載請注明原出處及作者,如有侵權(quán)請聯(lián)系我們刪除。
友情鏈接:站點(diǎn)地圖 薩科微官方微博 立創(chuàng)商城-薩科微專賣 金航標(biāo)官網(wǎng) 金航標(biāo)英文站
Copyright ?2015-2024 深圳薩科微半導(dǎo)體有限公司 版權(quán)所有 粵ICP備20017602號-1