合见工软徐昀:中国芯将通过超节点组网完成性能超越
【导语】11月23日,在第七届全球IC企业家大会上,上海合见工业软件集团总经理徐昀称,中美智算竞赛中,中国芯可借超节点组网实现性能超越,多级互联将促发展,但中国智算芯片发展仍面临诸多挑战,合见工软针对痛点提供一站式解决方案,已积累众多国内客户并进军亚太市场。
11月23日,上海合见工业软件集团有限公司总经理徐昀在第二十二届中国国际半导体博览会(IC China 2025)同期举办的第七届全球IC企业家大会上表示,中美智算竞赛中,中国芯可通过超节点组网完成性能超越。多级互联将促进中国智算芯片快速发展。
当前,业内已达成共识:国力的比拼也是算力的比拼。黄仁勋在2023年提出的“Sovereign AI(主权人工智能)”概念,主张通过控制算力、算法、数据等关键要素,实现国家层面的AI自主权。这一观点受到了广泛关注。
“其实,中国的智算发展仍面临诸多挑战。受地缘政治的影响,国内半导体企业在先进工艺、高带宽存储器(HBM)、设计工具、针对超算和智算的芯片等方面受到限制。”徐昀坦言,“解决方案主要是通过堆叠和互联达到更大的算力。”
中美智算芯片存在多方面的差别。从代表企业来看,北美智算芯片玩家以英伟达、AMD、英特尔三大家为首,国内则是以华为、寒武纪、海光为首,各家在芯片或算法上都有各自的优势;从工艺制程来看,中国和美国大概差两代工艺,国内尖端工艺主要在12nm—7nm,而美国制程工艺甚至快到2nm;从单颗芯片的算力来看,国内芯片算力大概是北美芯片算力的30%,同时受工艺限制,国内芯片的内存和带宽、容量只能达到北美芯片的40%—70%。但在超节点组网后的性能指标对比中,中国芯则实现了性能超越——384卡组网后算力(FP16)可达到300PFLOPS,是北美72卡组网方案的1.7倍;组网后内存容量更是达到北美方案的3.6倍,Scale-Up带宽(Tb/s)达2.1倍。
徐昀指出,目前中国智算芯片设计主要面临三大痛点:一是先进工艺受限,并影响了芯片面积、存储颗粒等;二是智算Scale-Up组网设计、验证及生态需要支持,智算互联尤其Scale-Up相关标准协议迅速发展且复杂多变,为智算芯片客户的组网设计开发、验证以及未来芯片集群生态适配落地等增加了相当的难度;三是芯片良率亟待提升,智算芯片开发涉及的工具链广度与复杂度提升,导致一次流片成功及芯片良率提升面临巨大压力。
“中国芯可通过超节点组网完成性能超越,多级互联将促进中国智算芯片快速发展。”徐昀表示。她指出,多级互联包括芯片内Die-to-Die的互联、板内Chip-to-Chip的互联,服务器内多卡互联,超节点互联等。“比如超节点互联,无论是在国内,还是在国际上都有各种协议,我们现在也在尝试对各种协议的支持。”徐昀说道。
合见工软针对智算芯片的一站式解决方案在设计方面,构建了完整多工艺平台IP解决方案;在验证方面,打造了面向智算超节点互联组网的、从芯片级到系统级的全方位验证平台;在封测方面,能够提供良率提升与先进封装协同设计服务,并能提供从原型到生产的系统级(jí)服(fú)务(wu)、可(kě)测(cè)性(xìng)设(shè)计(jì)服(fú)务(wu)、后(hòu)端(duān)实(shí)现(xiàn)服(fú)务(wu)、组(zǔ)网(wǎng)测(cè)试(shì)与(yǔ)认(rèn)证(zhèng)等(děng)定(dìng)制(zhì)化(huà)服(fú)务(wu)。
据(jù)悉(xī),合(hé)见(jiàn)工(gōng)软(ruǎn)是(shì)国(guó)内(nèi)率(lǜ)先(xiān)实(shí)现(xiàn)为(wèi)高(gāo)性(xìng)能(néng)智(zhì)算(suàn)芯(xīn)片(piàn)设(shè)计(jì)提(tí)供(gōng)“EDA+IP+系(xì)统(tǒng)级(jí)”联(lián)合(hé)解(jiě)决(jué)方(fāng)案(àn)的(de)工(gōng)具(jù)供(gōng)应(yīng)商(shāng)。公(gōng)司(sī)发(fā)布(bù)的(de)创(chuàng)新(xīn)产(chǎn)品(pǐn)涵(hán)盖(gài)了(le)数(shù)字(zì)验(yàn)证(zhèng)全新(xīn)硬(yìng)件(jiàn)平(píng)台(tái)、DFT全流(liú)程(chéng)工(gōng)具(jù)、PCB板(bǎn)级(jí)设(shè)计(jì)工(gōng)具(jù)以(yǐ)及(jí)高(gāo)速(sù)接(jiē)口(kǒu)IP解(jiě)决(jué)方(fāng)案(àn)等(děng)多(duō)个(gè)领(lǐng)域。在(zài)UCIe技(jì)术(shù)领(lǐng)域,合(hé)见(jiàn)工(gōng)软(ruǎn)实(shí)现(xiàn)了(le)国(guó)产(chǎn)首(shǒu)个(gè)跨(kuà)工(gōng)艺(yì)节(jié)点(diǎn)的(de)互(hù)连(lián)验(yàn)证(zhèng)。在(zài)Chiplet互(hù)联(lián)IP领(lǐng)域,合(hé)见(jiàn)工(gōng)软(ruǎn)重(zhòng)点(diǎn)开(kāi)发(fā)了(le)UCIe(Universal Chiplet Interconnect Express)和(hé)HiPi(High Performance IP)接(jiē)口(kǒu)IP,支(zhī)持(chí)多(duō)芯(xīn)片(piàn)拼(pīn)接(jiē)技(jì)术(shù)。这(zhè)一(yī)布(bù)局(jú)针(zhēn)对(duì)国(guó)内(nèi)先(xiān)进(jìn)制(zhì)程(chéng)工(gōng)艺(yì)受(shòu)限(xiàn)的(de)现(xiàn)状(zhuàng),通(tōng)过(guò)Chiplet技(jì)术(shù)提(tí)升(shēng)单(dān)芯(xīn)片(piàn)算(suàn)力(lì),同(tóng)时(shí)满(mǎn)足(zú)高(gāo)性(xìng)能(néng)互(hù)联(lián)需(xū)求(qiú)。
自(zì)成(chéng)立(lì)至(zhì)今(jīn)短(duǎn)短(duǎn)五(wǔ)年(nián)时(shí)间(jiān)内(nèi),合(hé)见(jiàn)工(gōng)软(ruǎn)已(yǐ)在(zài)国(guó)内(nèi)积(jī)累(lèi)了(le)300多(duō)家(jiā)客(kè)户(hù),国(guó)内(nèi)主要(yào)的(de)AI客(kè)户(hù),包(bāo)括(kuò)HPC、GPU、5G、AUTO等(děng)智(zhì)算(suàn)领(lǐng)域客(kè)户(hù)大(dà)部(bù)分(fēn)都(dōu)采用(yòng)了(le)合(hé)见(jiàn)工(gōng)软(ruǎn)的(de)产(chǎn)品(pǐn)。目(mù)前(qián),合(hé)见(jiàn)工(gōng)软(ruǎn)已(yǐ)开(kāi)始(shǐ)进(jìn)入(rù)亚(yà)太(tài)市(shì)场(chǎng),产(chǎn)品(pǐn)性(xìng)能(néng)接(jiē)近(jìn)国(guó)际(jì)标(biāo)杆(gān)。
“合见工软在正确的时间踏入了一个正确的领域。可以看到,AI时代,中国智算产业跑出了‘加速度’,我们希望未来能够把支撑工作做得更好,能够完全支持国内智算芯片和智算系统的快速发展。”徐昀表示。