服務(wù)熱線
0755-83044319
發(fā)布時(shí)間:2022-09-28作者來源:薩科微瀏覽:4212
幾天前,英偉達(dá)和AMD將在中國暫停銷售高端GPU的消息在芯片圈不脛而走。
美國證監(jiān)會(huì)文件
根據(jù)美國證監(jiān)會(huì)文件顯示:這次被限制的不是常規(guī)意義上的GPU顯卡,而是高端的商用芯片。據(jù)了解,該禁令影響了英偉達(dá)的A100和H100芯片以及包含這些技術(shù)的DGX系統(tǒng)和合作伙伴系統(tǒng)制造商使用的HGX平臺(tái);AMD也收到了美國當(dāng)局的指示,要求停止向中國和俄羅斯銷售其[敏感詞]GPU芯片MI250。
這些芯片是針對(duì)AI高速運(yùn)算、HPC及數(shù)據(jù)中心場(chǎng)景而研發(fā)的。
然而,GPU“斷供”事件在發(fā)酵中也出現(xiàn)了一絲轉(zhuǎn)機(jī)。9月1日,英偉達(dá)在提交給美國證券交易委員會(huì)(SEC)的一份文件中宣稱,已獲得美國政府批準(zhǔn)豁免,可以在明年3月前進(jìn)行出口以支持A100的美國客戶;允許在明年9月1日前通過其香港辦事機(jī)構(gòu)履行A100和H100訂單和物流。
AMD也指出,新規(guī)定或不會(huì)對(duì)其業(yè)務(wù)產(chǎn)生實(shí)質(zhì)性影響。
但盡管如此,新的GPU斷供“風(fēng)波”,再次揪緊了中國半導(dǎo)體行業(yè)的神經(jīng),也重新揭開了本土GPU產(chǎn)業(yè)的傷疤。
圖源:nextplatform
慌張背后,再次吹響了加速國產(chǎn)替代的號(hào)角。
一記GPU組合拳
以上述英偉達(dá)A100和H100 GPU為例,A100芯片是英偉達(dá)2年前發(fā)布的一款3D堆疊芯片,集AI訓(xùn)練和推理于一身,號(hào)稱當(dāng)時(shí)全球[敏感詞]的7nm芯片。
H100則是一款針對(duì)大模型專門優(yōu)化的產(chǎn)品,今年3月在GTC大會(huì)上才發(fā)布,采用了[敏感詞]的Hopper架構(gòu)和臺(tái)積電4nm工藝,擁有800億個(gè)晶體管,[敏感詞]功率800W,用于提升大型AI語言模型、深度推薦系統(tǒng)等。目前H100還未正式進(jìn)入商用。
圖片來源:anandtech
在中國市場(chǎng),A100的用戶包括阿里巴巴、騰訊、百度,這些公司主導(dǎo)著中國市場(chǎng)的云計(jì)算服務(wù),提供按需計(jì)算和存儲(chǔ),也可以用于企業(yè)為人工智能應(yīng)用編程。此外,英偉達(dá)的其他中國客戶還包括聯(lián)想和云計(jì)算及服務(wù)器提供商浪潮集團(tuán)。
可見,國內(nèi)GPU高端場(chǎng)景的GPU應(yīng)用基本上都由英偉達(dá)的A100覆蓋,今年3月份H100發(fā)布時(shí),國內(nèi)主流廠商也都已經(jīng)預(yù)定。
針對(duì)這些GPU和相關(guān)DGX產(chǎn)品以及AMD產(chǎn)品的許可要求,多位業(yè)內(nèi)人士表示,這是美國全面限制中國技術(shù)發(fā)展的組合拳。包括此前美國限制高端EDA的銷售,以及聯(lián)合半導(dǎo)體設(shè)備和晶圓代工廠,限制中國的先進(jìn)制程芯片制造等,均旨在全面減慢中國的發(fā)展,盡量拖慢中國的發(fā)展速度。
對(duì)此,Truist Securities分析師表示:短期內(nèi),中國客戶可能會(huì)轉(zhuǎn)向不受許可證限制的老一代英偉達(dá)芯片;長期來看,這一行為將加速中國GPU芯片廠商的推進(jìn)速度和投資力度,進(jìn)而導(dǎo)致客戶轉(zhuǎn)向國內(nèi)供應(yīng)商。
事實(shí)上,我國高端GPU芯片進(jìn)口從2019年以來就一直被限制,之前受限制的應(yīng)用場(chǎng)景主要以超算中心為主,企業(yè)和消費(fèi)者在產(chǎn)品端的感知并不強(qiáng)。而這次范圍擴(kuò)大之后,許多互聯(lián)網(wǎng)大廠和服務(wù)器廠商都受到了影響,應(yīng)用場(chǎng)景延伸到了云計(jì)算服務(wù)器、數(shù)據(jù)中心、AI訓(xùn)練等領(lǐng)域。
重壓之下,國產(chǎn)GPU產(chǎn)業(yè)亟待突圍,目前也已取得了一定成果。
近兩年,國產(chǎn)初創(chuàng)GPU公司累計(jì)拿下超百億融資——成立剛2年的壁仞科技融資總額超過50億,摩爾線程一年融資30億,沐曦集成電路第五輪融資10億元,天數(shù)智芯也宣布拿下10億元C輪融資...
巨額融資背后,是資本市場(chǎng)堅(jiān)信國產(chǎn)GPU未來的信心和決心。
尤其近段時(shí)間來,國產(chǎn)GPU廠商除了陸續(xù)獲得大筆融資以外,也在相繼發(fā)布產(chǎn)品進(jìn)展,切實(shí)在產(chǎn)品上取得了一定的突破。
國產(chǎn)GPU雙線突圍
按照用途,GPU可以分為通用GPU(GPGPU)和渲染GPU兩種。
前者是用在AI深度學(xué)習(xí)和超算上的高性能加速卡;而圖形渲染GPU就是比較傳統(tǒng)的游戲、桌面,做各種圖形化應(yīng)用的GPU顯卡。
在“斷供”消息發(fā)酵之際,與英偉達(dá)、AMD股價(jià)大幅下跌相比,9月1日上午,國內(nèi)上市的GPU及AI芯片上市公司股價(jià)普遍上漲,寒武紀(jì)股價(jià)大漲20%,景嘉微股價(jià)大漲10%,海光信息大漲16%...
與此同時(shí),一些GPU芯片創(chuàng)新企業(yè)也不忘抓住機(jī)會(huì)釋放訊號(hào)。在剛過去的2022世界人工智能大會(huì)(WAIC)上,天數(shù)智芯、壁仞科技、瀚博半導(dǎo)體、燧原科技、愛芯元智等國內(nèi)一眾GPU新貴芯片廠商悉數(shù)到場(chǎng),宣布其[敏感詞]成果和行業(yè)動(dòng)態(tài)。
GPGPU市場(chǎng)火熱
先來看GPGPU市場(chǎng)。
當(dāng)前,云端需求和應(yīng)用多樣,既要做訓(xùn)練又要做推理,因此要求訓(xùn)練芯片要具備強(qiáng)大的單芯片計(jì)算能力,基本是GPGPU的天下。
GPGPU不具備圖形處理能力,主要是用來計(jì)算原本由CPU處理的通用計(jì)算任務(wù),實(shí)現(xiàn)一些AI訓(xùn)練和推理等方面的加速運(yùn)算。
從市場(chǎng)現(xiàn)狀來看,目前中國90%的GPGPU市場(chǎng)都被英偉達(dá)壟斷。目前國產(chǎn)GPU廠商中,在這一方面發(fā)力的主要有天數(shù)智芯、瀚博半導(dǎo)體、璧仞科技等廠商發(fā)展較為迅速,正在快速布局積極追趕。
在今年WAIC上,天數(shù)智芯面市了其[敏感詞]7nm制程的云端推理通用GPU產(chǎn)品“智鎧100”,該芯片已于今年5月點(diǎn)亮,將于2022年第四季度正式發(fā)布,年底量產(chǎn)。智鎧100正在進(jìn)行[敏感詞]批客戶的驗(yàn)證和適配。
此外,基于天數(shù)智芯[敏感詞]GPGPU天垓100芯片的加速卡“天垓100”亮相于去年WAIC上。截至目前,“天垓100”累計(jì)訂單金額已經(jīng)超過2.3億,觸達(dá)客戶300多家,其中有意向簽約的客戶有200多家,覆蓋行業(yè)超過20個(gè),正在被推廣到各式各樣的互動(dòng)場(chǎng)景中。天數(shù)智芯CTO呂堅(jiān)平表示,天數(shù)智芯100%客戶都是英偉達(dá)的客戶,公司接下來目標(biāo)是先拿下英偉達(dá)在國內(nèi)10%的市場(chǎng)份額。
至此,天數(shù)智芯成為國內(nèi)[敏感詞]同時(shí)擁有GPU架構(gòu)下云端訓(xùn)練+推理完整解決方案的公司。
緊隨其后,云端AI芯片公司瀚博半導(dǎo)體在發(fā)布會(huì)上預(yù)覽了其[敏感詞]7nm云端GPU芯片SG100,將圖形渲染加入其產(chǎn)品布局。
據(jù)介紹,SG100具備業(yè)界領(lǐng)先的圖形渲染性能,擁有超高吞吐、超高質(zhì)量、低延時(shí)編碼等能力,集渲染、AI、視頻于一體,可為云游戲、云計(jì)算等元宇宙關(guān)鍵性應(yīng)用場(chǎng)景提供深度優(yōu)化。同時(shí),SG100還提供SR-IOV虛擬化支持,端到端整體提升用戶視覺體驗(yàn),能夠滿足市場(chǎng)對(duì)智能視頻視覺、圖形圖像處理的算力需求。目前該芯片還未正式發(fā)布。
去年,瀚博半導(dǎo)體發(fā)布了面向云端的通用AI推理芯片SV102芯片,其特點(diǎn)是推理性能高(單芯片INT8峰值計(jì)算能力200TOPS,還支持FP16/BF16數(shù)據(jù)類型),延遲低,視頻解碼性能。支持64路1080p(解碼格式支持H.264、H.265、AVS2)。
SV102芯片中有專門的硬件視頻解碼單元,其視頻處理和深度學(xué)習(xí)推理的性能指標(biāo)比現(xiàn)有主流數(shù)據(jù)中心GPU高出數(shù)倍,可應(yīng)用于云和邊緣解決方案,節(jié)省設(shè)備投資,降低運(yùn)營成本。
在一眾國產(chǎn)GPU廠商中,壁仞科技算得上對(duì)標(biāo)英偉達(dá)較為突出的一個(gè)。
8月10日,成立僅2年時(shí)間的壁仞科技就推出了[敏感詞]通用GPU產(chǎn)品BR100系列,采用7nm制程,并創(chuàng)新性應(yīng)用Chiplet與2.5D CoWoS封裝技術(shù),創(chuàng)出全球算力紀(jì)錄。據(jù)透露,其16位浮點(diǎn)算力達(dá)到1000T以上、8位定點(diǎn)算力達(dá)到2000T以上,單芯片峰值算力達(dá)到PFLOPS級(jí)別,以“每秒1千萬億次的計(jì)算”算力紀(jì)錄,超過了英偉達(dá)目前在售的旗艦計(jì)算產(chǎn)品A100 GPU的3倍,強(qiáng)勢(shì)對(duì)標(biāo)英偉達(dá)H100。
壁仞科技BR100與英偉達(dá)A100性能參數(shù)對(duì)比
(圖源:路透社)
目前BR100已流片回來,正在進(jìn)行可靠性、穩(wěn)定性等一系列測(cè)試,屬于風(fēng)險(xiǎn)期小規(guī)模量產(chǎn)階段,這個(gè)過程業(yè)內(nèi)普遍需要9個(gè)月,但壁仞希望能在年底前完成,真正開始商用量產(chǎn)。
圖源:芯潮IC
此外,昆侖芯科技、燧原科技、寒武紀(jì)、登臨科技、沐曦集成電路、芯瞳半導(dǎo)體等國產(chǎn)GPU/AI芯片廠商也在緊鑼密鼓的進(jìn)行研發(fā)布局,加速國產(chǎn)GPGPU和AI芯片的發(fā)展進(jìn)程。
渲染GPU躍躍欲試
當(dāng)前,我們正在進(jìn)入“一切需要可視化”的時(shí)代,圖形可視化對(duì)于渲染GPU市場(chǎng)的需求增長迅速。
這幾年,在諸多企業(yè)的努力下,除了最近上述企業(yè)在GPGPU方面的進(jìn)展,國產(chǎn)GPU廠商在圖形渲染GPU方面也在爭(zhēng)分奪秒的交出有實(shí)力的產(chǎn)品。
在圖形GPU領(lǐng)域,國內(nèi)以芯動(dòng)科技、格蘭菲、景嘉微、摩爾線程等為代表的企業(yè)為主力。
芯動(dòng)科技
最近幾年,芯動(dòng)科技將業(yè)務(wù)拓展至新賽道,著手GPU研發(fā),目前是基于Imagination的GPU架構(gòu)自主開發(fā),同時(shí)采用全套自研高性能IP。和蘋果公司一樣,芯動(dòng)在架構(gòu)授權(quán)的基礎(chǔ)上不斷優(yōu)化GPU內(nèi)核,現(xiàn)已完整獨(dú)立掌握了GPU內(nèi)核演進(jìn)架構(gòu)圖,實(shí)現(xiàn)了自己的GPU架構(gòu)把控,并將以每年發(fā)布兩款GPU的速度迭代演進(jìn)。
去年,聚焦于數(shù)據(jù)中心、服務(wù)器領(lǐng)域的“風(fēng)華1號(hào)”GPU正式發(fā)布,實(shí)現(xiàn)了國產(chǎn)5G數(shù)據(jù)中心服務(wù)器GPU應(yīng)用場(chǎng)景從0到1的突破。
據(jù)了解,“風(fēng)華1號(hào)”顯卡實(shí)現(xiàn)了多項(xiàng)[敏感詞],如[敏感詞]款渲染能力達(dá)到5T-10T FLOPS的國產(chǎn)GPU顯卡,[敏感詞]款圖形API達(dá)到OpenGL4.0以上,并能實(shí)際演示4.0 benchmark的GPU,還是[敏感詞]款支持多路渲染+編解碼+AI服務(wù),硬件虛擬化和Chiplet可延展的國產(chǎn)GPU等。
“風(fēng)華1號(hào)”GPU性能參數(shù)(圖源:芯動(dòng)科技)
從芯片算力性能來看,“風(fēng)華1號(hào)”雙芯片B卡FP32浮點(diǎn)性能達(dá)到10T FLOPS,可以對(duì)標(biāo)英偉達(dá)Tesla T4 GPU(FP32 / 8.1T FLOPS),且功耗更低。此外,風(fēng)華GPU還搭載了Chiplet、GDDR6X以及虛擬化解決方案等眾多優(yōu)勢(shì)技術(shù),為產(chǎn)品提供賦能。
今年8月,芯動(dòng)科技又推出了針對(duì)于桌面市場(chǎng)的“風(fēng)華2號(hào)”GPU,“風(fēng)華2號(hào)”渲染能力突出,GPU像素填充率48GPixel/s,F(xiàn)P32單精度浮點(diǎn)性能1.5TFLOPS,AI運(yùn)算(INT8)性能12.5TOPS,實(shí)測(cè)功耗4至15W,支持OpenGL4.3、DX11、Vulkan等API。
“風(fēng)華2號(hào)”GPU性能參數(shù)(圖源:芯動(dòng)科技)
作為參照,就像素填充速率和FP32來說,風(fēng)華2號(hào)和英偉達(dá)GT1050大致處于同一檔(GT1050像素填充速率為43.3 GPixel/s,F(xiàn)P32為1.862 TFLOPS,TDP為75W)。
芯動(dòng)科技指出,“風(fēng)華2號(hào)”是賦能桌面生態(tài)鏈的開始,將拉開風(fēng)華系列GPU走向大眾市場(chǎng)的序幕。目前“風(fēng)華3號(hào)”已基本完成研發(fā),將為國內(nèi)用戶提供超大算力光追等酷炫性能;同時(shí),GPGPU和座艙產(chǎn)品也正與客戶定義中,未來更多定制計(jì)算產(chǎn)品線將接踵而至。
格蘭菲
格蘭菲是兆芯GPU部門獨(dú)立出去,同時(shí)吸引投資人入股成立的GPU公司,其技術(shù)源自2000年VIA收購的S3,走的是“技術(shù)引進(jìn)-消化吸收-再創(chuàng)新”的路子。
格蘭菲[敏感詞]的顯卡是Arise-GT10C0,是一款為桌面、商業(yè)顯示以及通用計(jì)算等中高端應(yīng)用場(chǎng)景,研發(fā)設(shè)計(jì)的[敏感詞]款圖形和圖像獨(dú)顯芯片。其單精度浮點(diǎn)性能為1.5TFlops,GPU像素填充率48GPixel/s,主頻500Mhz,工藝28nm,TDP為45W,支持DX11和OpenGL4.5、Vulkan等API。
Arise-GT10C0性能參數(shù)(圖源:格蘭菲)
從以上參數(shù)可以看出,Arise-GT10C0的規(guī)格看起來與風(fēng)華2號(hào)相似,但功耗比風(fēng)華2號(hào)GPU高上不少。
目前,對(duì)于格蘭菲GPU的底層架構(gòu)了解的不多,該公司沒有透露GPU內(nèi)核數(shù)量和時(shí)鐘速度等基本規(guī)格。據(jù)報(bào)道,Arise-GT10C0顯卡對(duì)標(biāo)的應(yīng)該是Intel Arc A380、AMD Radeon RX6400和英偉達(dá)GeForce GTX 1630 等獨(dú)立顯卡。然而,格蘭菲在 FP32 模式下的 28nm GPU 只能與老式的 GTX750Ti 或AMD Vega 8集成顯卡競(jìng)爭(zhēng)。
兆芯
在核顯級(jí)GPU領(lǐng)域,兆芯2019年發(fā)布了兆芯KX-6000,其核顯與S3的C645規(guī)格和性能類似,甚至連驅(qū)動(dòng)都能共用,3Dmark成績?yōu)?50分左右,當(dāng)時(shí)集成的是C-960 GPU。
近日,有網(wǎng)站曝光了兆芯KX-6000G處理器的相關(guān)測(cè)試結(jié)果。3DMark顯示,這款尚未發(fā)布的處理器集成了高性能的格蘭菲Arise-GT10C0芯片,3Dmark成績?yōu)?000分左右,相較于KX-6000提升了3倍,這個(gè)成績和英偉達(dá)2012年發(fā)布的GT630差不多,性能作為核顯是足夠了,特別是當(dāng)下黨政辦公Wintel電腦的獨(dú)顯也就這個(gè)水平。
兆芯KX-6000G與英偉達(dá)GT630跑分比較
(圖源:快科技)
景嘉微
景嘉微是中國[敏感詞]家成立的GPU公司,產(chǎn)品主要分為圖形圖像處理系統(tǒng)、小型雷達(dá)系統(tǒng)、GPU芯片。
目前,景嘉微的[敏感詞]GPU產(chǎn)品是JH920,是繼JM5400、JM7200之后的第三代GPU,該芯片采用14nm工藝,支持OpenGL4.0、OpenCL 3.0、Vulkan 1.1等,但不支持DX。關(guān)鍵指標(biāo)上,JH920像素填充率為32G Pixels/s,F(xiàn)P32浮點(diǎn)性能為1.5Tflops,功耗為30W。
從參數(shù)來看,JH920的性能與英偉達(dá)2016年發(fā)布的GTX1050相仿,GTX1050大概為英偉達(dá)10系顯卡中的入門級(jí)產(chǎn)品,遜色于風(fēng)華2號(hào)和Arise-GT10C0。
幾個(gè)月前,景嘉微宣布其JM9系列第二款圖形處理芯片已經(jīng)完成了流片和封裝,正在進(jìn)行測(cè)試工作。根據(jù)測(cè)試效果來看,這款顯卡的性能可以滿足游戲、作圖渲染等需求。
摩爾線程
另一邊,成立于2020年的初創(chuàng)企業(yè)摩爾線程發(fā)展迅速,僅用18個(gè)月時(shí)間就發(fā)布了全新統(tǒng)一系統(tǒng)架構(gòu)MUSA和全能GPU產(chǎn)品“蘇堤”等系列新品,宣稱完成了首顆國產(chǎn)全功能GPU的研制,紙面算力相當(dāng)于2016年推出的英偉達(dá)GTX 1070。
據(jù)了解,摩爾線程的蘇堤芯片是多功能GPU,不單只是有圖形渲染引擎,還具備有多媒體引擎、AI計(jì)算加速,以及物理仿真與科學(xué)計(jì)算引擎,這可以滿足更加廣泛和不同平臺(tái)的多元算力需求。
在實(shí)際的顯卡產(chǎn)品方面,摩爾線程還同步推出了MTT S60和MTT S2000兩款桌面級(jí)的獨(dú)立顯卡,其中MTT S60是面向PC和工作站的,MTT S2000則是專為數(shù)據(jù)中心打造的。
目前摩爾線程已與浪潮、聯(lián)想、清華同方等服務(wù)器OEM達(dá)成合作。
圖源:芯潮IC
另外,從事CPU研發(fā)的龍芯也開始切入這個(gè)賽道,正在不斷增強(qiáng)國內(nèi)GPU企業(yè)的整體研發(fā)實(shí)力。
綜合來看,雖然上述廠商取得了一系列進(jìn)展和突破,整體而言國產(chǎn)GPU的現(xiàn)狀并不算樂觀,雖然在特殊領(lǐng)域算是可以滿足自給自足的需求,但是在中高端領(lǐng)域及個(gè)人消費(fèi)領(lǐng)域還有著不小的差距。
要全面取代英偉達(dá)和AMD的GPU,不管是AI/FP還是渲染,目前還是不現(xiàn)實(shí)的。規(guī)格參數(shù)雖然能夠一定程度上反映GPU的性能,但實(shí)際體驗(yàn)并不一定就與規(guī)格參數(shù)劃等號(hào)。GPU核心設(shè)計(jì)能力不足和API支持不足,或是驅(qū)動(dòng)方面的問題,都會(huì)導(dǎo)致GPU規(guī)格與體驗(yàn)倒掛的情況。
GPU是典型入門容易畢業(yè)難的行業(yè)。近期英特爾時(shí)隔20多年重回獨(dú)立GPU市場(chǎng),拉開架勢(shì)發(fā)布的新品,表面看疊了不少buff,實(shí)際到了最考驗(yàn)功底的驅(qū)動(dòng)程序方面,卻被英偉達(dá)按在地上摩擦。所以對(duì)于新品牌的顯卡來說,參數(shù)的意義往往有限,紙面上的數(shù)據(jù)最終需要市場(chǎng)來檢驗(yàn)。
不過從中低端切入,再慢慢向高端滲透,最終進(jìn)行取代,也是國產(chǎn)廠商們這么多年一直在走的路線,盡管現(xiàn)在還不行,但風(fēng)波之下,確實(shí)也給國產(chǎn)GPU提供了一個(gè)機(jī)遇,帶來了新的擴(kuò)張機(jī)會(huì)。
不過,國產(chǎn)GPU仍前路漫漫,道路曲折,充滿挑戰(zhàn)。
國產(chǎn)GPU還要翻越幾重山?
IP困境
IP的質(zhì)量很大程度上決定了國產(chǎn)GPU性能的底色。
但由于IP研發(fā)難度大、開發(fā)周期長,目前中國GPU開發(fā)者大多使用Imagination提供的IP,GPU作為高性能的大芯片,想在短期內(nèi)出成果,快速推出相關(guān)產(chǎn)品,必然需要依賴外部IP。
簡單來說,就是購買一個(gè)商用GPU IP,然后自行修改迭代,如果IP供應(yīng)商終止合作,那么就會(huì)面臨研發(fā)、生產(chǎn)中斷等問題。目前國內(nèi)主流的GPU企業(yè)中,有不少都是采用的商用IP授權(quán),只有景嘉微、天數(shù)智芯等少數(shù)企業(yè)有自研架構(gòu)的GPU產(chǎn)品。
國內(nèi)GPU底層技術(shù)空白點(diǎn)較多,IP大多受制于國外廠商,產(chǎn)品前端穩(wěn)定性不理想,目前又很難在主線中高端電子產(chǎn)品上得到普及化應(yīng)用,需多年沉淀形成自主IP積累才能具有一定替代性。
有聲音表示,國內(nèi)核心IP能力至少比英偉達(dá)、AMD等落后十年左右。而整體而言,GPU企業(yè)與國際大廠技術(shù)差距約3年,渲染GPU與國際大廠差距約10年左右。
軟件門檻
有業(yè)內(nèi)人士指出,計(jì)算芯片[敏感詞]的門檻其實(shí)不是硬件,而是軟件。如果一個(gè)芯片沒有與之配套的軟件生態(tài),則很難真的形成大面積的應(yīng)用,而這其實(shí)也是許多國內(nèi)GPU公司的產(chǎn)品難以獲得客戶認(rèn)可的原因所在。
英偉達(dá)當(dāng)前競(jìng)爭(zhēng)優(yōu)勢(shì)的形成,可以回溯到十幾年前黃教主制定的戰(zhàn)略,硬件領(lǐng)先競(jìng)爭(zhēng)對(duì)手至少一個(gè)代際差距,軟件做生態(tài)、建護(hù)城河。
據(jù)了解,2021年英偉達(dá)僅在顯卡驅(qū)動(dòng)測(cè)試工作上的投入就高達(dá)180萬小時(shí)。而多年近乎壟斷的行業(yè)地位,形成了很強(qiáng)的生態(tài)效應(yīng),讓軟件開發(fā)商更愿意為N卡進(jìn)行針對(duì)性適配。
在當(dāng)前GPU生態(tài)中,軟件的權(quán)重已越來越高。Imagination中國區(qū)戰(zhàn)略市場(chǎng)與生態(tài)副總裁時(shí)昕博士曾表示,GPU軟件極為復(fù)雜,包括各種圖形API和計(jì)算接口、基礎(chǔ)庫、與上層應(yīng)用對(duì)接適配等等,開發(fā)工作量巨大。國內(nèi)GPU生態(tài)的發(fā)展更需要“眾人拾柴”,要加快打造國產(chǎn)GPU產(chǎn)業(yè)鏈,下游的整機(jī)廠商需要對(duì)國產(chǎn)GPU給予更多包容。
生態(tài):強(qiáng)者恒強(qiáng)
對(duì)于國產(chǎn)GPU來說,產(chǎn)品如何實(shí)現(xiàn)規(guī)模化商用,搭建國產(chǎn)GPU生態(tài)同樣是一個(gè)難題。
如果說砸錢可以買到IP,可以買到[敏感詞]的工藝,靠堆核心面積可以做出和英偉達(dá)類似性能的GPU,但是生態(tài)體系沒有10年以上積累是做不起來。
圖源:電腦技術(shù)
所謂生態(tài),是指硬件架構(gòu)和軟件架構(gòu)相互匹配。經(jīng)過多年發(fā)展,英偉達(dá)已經(jīng)構(gòu)建了完整的技術(shù)生態(tài),包括四層技術(shù)棧:硬件、系統(tǒng)軟件、軟件平臺(tái)、應(yīng)用框架。除了性能超強(qiáng)的芯片,英偉達(dá)為客戶提供了快速實(shí)現(xiàn)AI模型訓(xùn)練和部署的軟件系統(tǒng),而且將主流AI算法模型通通開源,企業(yè)假如對(duì)某個(gè)AI算法缺乏積累,可以直接免費(fèi)下載英偉達(dá)現(xiàn)成的先進(jìn)模型,稍做調(diào)整就能落地應(yīng)用。
開發(fā)者都是慣性的,尤其是在軟件生態(tài)上,用戶的使用體驗(yàn)已經(jīng)形成,想要輕易移植難度很大。由于英偉達(dá)等國外龍頭推出GPU時(shí)間更長,長期使用國外GPU的廠商出于慣性也不會(huì)突然更換國產(chǎn)GPU。
另一方面,ICViews在采訪中指出:目前國產(chǎn)GPU在相同性能下,由于出貨規(guī)模較小,導(dǎo)致價(jià)格更貴。在消費(fèi)級(jí)市場(chǎng),無法有效降低成本的國產(chǎn)芯片,往往價(jià)格偏高。不過,在更看重安全性和可靠性的企業(yè)級(jí)GPU市場(chǎng),以及需要自主可控產(chǎn)品的一些行業(yè),不存在C端那種明顯的生態(tài)壟斷,是國產(chǎn)GPU率先突圍的賽道。
芯片的成功和成熟需要大量的驗(yàn)證和出貨,而找到可持續(xù)的落地場(chǎng)景才是長期發(fā)展的關(guān)鍵驅(qū)動(dòng)力。
市場(chǎng)認(rèn)可度
另一方面還在于市場(chǎng)的接受度,在之前國外高端GPU芯片購買暢通的時(shí)候,國內(nèi)芯片很難受到客戶的認(rèn)可,大家普遍的選擇都是購買[敏感詞]、穩(wěn)定的產(chǎn)品。
而國外先進(jìn)GPU受到限制之后,也在提醒國內(nèi)客戶重新考慮外部的實(shí)際情況,從而也給國產(chǎn)GPU企業(yè)進(jìn)入客戶供應(yīng)鏈提供了一次機(jī)會(huì)。
對(duì)此,百度資深系統(tǒng)工程師表示:“之前國產(chǎn)GPU有30%的性能提升可能都不會(huì)考慮,現(xiàn)在有30%的性能差距可能都不是問題了,畢竟刀架在脖子上,先用上再說。”
整體來說,GPU的研發(fā)牽一發(fā)而動(dòng)全身,需要的不僅僅是企業(yè)的架構(gòu)迭代與升級(jí),還需要制造設(shè)備、材料、EDA軟件等一系列配套產(chǎn)業(yè)的同步提升,才能縮短國產(chǎn)GPU與國際領(lǐng)先水平之間的差距。
目前,國產(chǎn)GPU在危機(jī)之下,正在醞釀新的生機(jī)。
結(jié)語
GPU是一個(gè)高技術(shù)含量的賽道,是一項(xiàng)系統(tǒng)工程,包含硬件架構(gòu)、算法、軟件生態(tài)等多個(gè)組成,缺一不可。我國在這一領(lǐng)域已經(jīng)落后許久,盡管近年來突然開始有不少初創(chuàng)公司踏足GPU領(lǐng)域,并受到資本青睞,但想要徹底打破GPU壟斷也絕非易事。
目前,雖然很多國產(chǎn)GPU廠商的紙面數(shù)據(jù),已經(jīng)可以和英偉達(dá)2016年前后的10系產(chǎn)品掰掰手腕,但在調(diào)試以及軟件適配方面的差距,不是一朝一夕就可以完成的。
GPU芯片技術(shù)具有很強(qiáng)的馬太效應(yīng),在芯片行業(yè),領(lǐng)先者與跟隨者的差距缺的不是資本,而是技術(shù)洞察、戰(zhàn)略規(guī)劃、還有超過十年時(shí)間的落地執(zhí)行。
這片巨大的市場(chǎng),目前正吸引著越來越多資本的涌入,國內(nèi)投資GPU的熱潮既是商業(yè)化的需求,也是國家戰(zhàn)略替代的需求,給國產(chǎn)GPU的發(fā)展添了一把火。
不過,也有觀點(diǎn)強(qiáng)調(diào):“我們也不能忽視這背后的投機(jī)屬性。一方面,一些GPU新勢(shì)力尚沒有明確自己的細(xì)分市場(chǎng),沒有想清楚未來長遠(yuǎn)的發(fā)展方向,還只是停留在PPT階段,所以盡管熱度高漲,但真正能用產(chǎn)品說話的企業(yè)還較少,尤其是高性能商業(yè)化的渲染GPU產(chǎn)品鳳毛麟角;另一方面,GPU技術(shù)門檻高,長期被國外行業(yè)霸主壟斷,新勢(shì)力想要生存必須掌握核心技術(shù),有多年的技術(shù)積累和人才資金供給。”
總的來看,如今的GPU市場(chǎng)略顯浮躁,很多初創(chuàng)公司通過競(jìng)相融資來“秀肌肉”,像極了通過比拼燒錢來爭(zhēng)勝負(fù)的互聯(lián)網(wǎng)公司。但燒錢模式是難以為繼的,通過燒錢,遲早會(huì)燒出越來越大的窟窿。
每一個(gè)硬件公司、芯片公司,只有保持良性正循環(huán),只有踏踏實(shí)實(shí)服務(wù)客戶,服務(wù)市場(chǎng),并且能夠不斷的回收研發(fā)成本,進(jìn)一步實(shí)現(xiàn)創(chuàng)新,不斷通過一個(gè)勝利來贏得下一個(gè)勝利,才是國產(chǎn)GPU的成功之路。
長遠(yuǎn)來看,GPU領(lǐng)域要面臨一定程度洗牌,國產(chǎn)GPU將在競(jìng)爭(zhēng)中將會(huì)逐漸由多家公司收斂成屈指可數(shù)的幾家公司,那個(gè)時(shí)候才是真正的國產(chǎn)替代、縮小差距的開始。
道阻且長的國產(chǎn)GPU賽道,在市場(chǎng)、政策和資本的推動(dòng)下,正在百花齊放,在危機(jī)中尋找生機(jī),或?qū)⒂瓉戆l(fā)展的黃金時(shí)代。
免責(zé)聲明:本文轉(zhuǎn)載自“芯潮IC”,本文僅代表作者個(gè)人觀點(diǎn),不代表薩科微及行業(yè)觀點(diǎn),只為轉(zhuǎn)載與分享,支持保護(hù)知識(shí)產(chǎn)權(quán),轉(zhuǎn)載請(qǐng)注明原出處及作者,如有侵權(quán)請(qǐng)聯(lián)系我們刪除。
友情鏈接:站點(diǎn)地圖 薩科微官方微博 立創(chuàng)商城-薩科微專賣 金航標(biāo)官網(wǎng) 金航標(biāo)英文站
Copyright ?2015-2024 深圳薩科微半導(dǎo)體有限公司 版權(quán)所有 粵ICP備20017602號(hào)-1