DeepSeek成国内半导体产业链新引擎？

发布时间：2025-02-20 11:03:43

在人工智能领域，人们对训练模型的固有印象就是对算力的需求极大。因此，长期以来，诸如英伟达H100 GPU等高算力芯片几乎(hu)成(chéng)为(wèi)行(xíng)业标配，使得国内芯片厂商难以施展拳脚，也制约了我国人工智能的在地化发展。而DeepSeek的出现打破了这一困境，使尖端GPU不再是大模型训练的唯一解法，让越来越多的的国内半导体厂商有机会与全球领先的AI模型适配，有望成为驱动国内半导体全产业链发展的新引擎。

当前，每天都有像华为昇腾、沐曦、天数智芯、燧原科技、昆仑芯等国内半导体厂商(shāng)宣(xuān)布(bù)与(yǔ)DeepSeek旗(qí)下(xià)不(bù)同(tóng)模(mó)型(xíng)展(zhǎn)开(kāi)适(shì)配(pèi)工(gōng)作(zuò)的(de)消(xiāo)息(xi)，据(jù)不(bù)完(wán)全统(tǒng)计(jì)，参(cān)与(yǔ)其(qí)中(zhōng)的(de)国(guó)内(nèi)厂(chǎng)商(shāng)已(yǐ)经(jīng)超(chāo)过(guò)了(le)20家(jiā)。

DeepSeek提(tí)供(gōng)技(jì)术(shù)验(yàn)证(zhèng)“实(shí)练(liàn)场(chǎng)”

对(duì)于(yú)国(guó)内(nèi)芯(xīn)片行业来说，缺乏实际应用场景和技术验证机会是其发展过程中的一大难题。而DeepSeek为国内芯片提供了宝贵的技术验证场景。

据了解，DeepSeek在架构创新方面，采用了经DeepSeek-V2验证的MLA和DeepSeekMoE技术，并引入了无辅助损失负载均衡策略(è)。这(zhè)种(zhǒng)架(jià)构(gòu)优(yōu)化(huà)使(shǐ)得(de)模(mó)型(xíng)在(zài)训(xun)练(liàn)过(guò)程(chéng)中(zhōng)能(néng)够(gòu)更(gèng)高(gāo)效(xiào)地(de)利(lì)用(yòng)计(jì)算(suàn)资(zī)源(yuán)，减(jiǎn)少(shǎo)了(le)对(duì)特(tè)定(dìng)高(gāo)端(duān)芯(xīn)片(piàn)的(de)依(yī)赖(lài)。同(tóng)时(shí)，在(zài)训(xun)练(liàn)效(xiào)率(lǜ)上(shàng)，DeepSeek设(shè)计(jì)了专门的FP8训练混合精度框架，以实现训练效率和数值稳定性的平衡，还开发了DualPipe算法实现高效的流水线并行处理，降低训练过程中的通信开销。

业内专家表示，这些技术创新使得DeepSeek能够适配国内芯片架构，并且在适配过程中，国内芯片企业可以深入了解模型对芯片性能的需求，从而针对性地进行优化和改进。例如，通过观察DeepSeek模型在国产芯片上的运行(xíng)情(qíng)况(kuàng)，芯(xīn)片(piàn)企(qǐ)业(yè)可(kě)以(yǐ)发(fā)现(xiàn)芯(xīn)片(piàn)在(zài)计(jì)算(suàn)速(sù)度(dù)、能(néng)耗(hào)、稳(wěn)定(dìng)性(xìng)等(děng)方(fāng)面(miàn)存(cún)在(zài)的(de)问(wèn)题(tí)，并(bìng)及(jí)时(shí)调(diào)整(zhěng)研(yán)发(fā)方(fāng)向(xiàng)，改(gǎi)进(jìn)芯(xīn)片(piàn)设(shè)计(jì)和(hé)制(zhì)造(zào)工(gōng)艺(yì)。这(zhè)种(zhǒng)实(shí)际(jì)应(yīng)用(yòng)中(zhōng)的(de)反(fǎn)馈(kuì)和(hé)优(yōu)化(huà)，对(duì)于(yú)国(guó)内(nèi)芯(xīn)片(piàn)技(jì)术(shù)的(de)提(tí)升(shēng)至(zhì)关重(zhòng)要(yào)。

目(mù)前(qián)，华(huá)为(wèi)昇(shēng)腾(téng)、沐(mù)曦(xī)、天(tiān)数(shù)智(zhì)芯(xīn)、摩(mó)尔(ěr)线(xiàn)程(chéng)、海(hǎi)光(guāng)信(xìn)息(xi)、壁(bì)仞(rèn)科(kē)技(jì)、燧(suì)原(yuán)科(kē)技(jì)、昆(kūn)仑(lún)芯等厂商，相继宣布适配或上架DeepSeek模型服务，让国内芯片能够在实际应用中发挥作用，展示自身的性能和潜力。

例如，天数智芯和合作伙伴仅用时一天，便完成了与DeepSeek R1的适配工作，并且已正式上线多款大模型服务，包括15亿、70亿、140亿参数的蒸馏版Qwen模型等。天数智芯表示，适配完成之后，公司将重点推动基于国内算力资源的DeepSeek大模型应用落地：一是持续优化软硬件，开发高性能、高性价比的算力产品方案，支持合作伙伴在平台上推出DeepSeek各大模型在线服务，广泛提供预训练、微调和推理服务；二是与合作伙伴开发基于DeepSeek模型的一体机、工作站，将DeepSeek模型接入到(dào)各类AI应用服务，提供更多个性化、边侧、端侧的服务。当然，天数智芯始终将通用GPU创新突破作为首要任务，发挥自主通用芯片架构优势，根据DeepSeek带动的需求变化来研发更高算效的通用GPU产品。

燧原科技和壁仞科技则是(shì)已(yǐ)完(wán)成对DeepSeek全系列模型的优化，支持从1.5B到70B参数规模的DeepSeek R1蒸馏模型推理部署，覆盖能源、金融等垂直场景。在这些实际应用场景中，国内芯片的性能得到了充分验证，也为其在更多领域的应用积累了经验。通过与DeepSeek的合作，国内芯片在技术验证和优化方面取得了显著进展，为其未来的发展奠定了坚实基础。

2月2日，Gitee AI宣布上线1.5B、7B、14B、32B四个尺寸的DeepSeek R1模型，均部署在沐曦曦云GPU上。2月5日，又确认DeepSeek-V3全精度满血版(671B)可在沐曦训推一体GPU上成功运行，并将V3满血版上线到平台。沐曦通过与DeepSeek的适配，不仅验证了自身芯片在AI推理中的性能，也让更多AI应用开发者看到本土GPU支持大规模模型运行的(de)潜(qián)力(lì)。

寒(hán)武(wǔ)纪(jì)作(zuò)为(wèi)国(guó)内(nèi)知(zhī)名的(de)AI芯(xīn)片(piàn)厂(chǎng)商(shāng)，与(yǔ)南(nán)京(jīng)智(zhì)算(suàn)中(zhōng)心(xīn)合(hé)作(zuò)，借(jiè)助(zhù)DeepSeek实(shí)现(xiàn)了(le)技(jì)术(shù)与(yǔ)应(yīng)用(yòng)场(chǎng)景(jǐng)的(de)有(yǒu)效(xiào)对(duì)接(jiē)。通(tōng)过(guò)在(zài)零(líng)售(shòu)业(yè)务(wu)场(chǎng)景(jǐng)中(zhōng)的应用，寒武纪芯片的性能得到了实际检验，也为其进一步优化产品、拓展市场提供了宝贵经验。

华为昇腾、海光信息、龙芯中科等GPU/CPU厂(chǎng)商(shāng)也(yě)在(zài)积(jī)极(jí)行(xíng)动(dòng)，通(tōng)过(guò)参(cān)与(yǔ)DeepSeek模(mó)型(xíng)的(de)训(xun)练(liàn)优(yōu)化(huà)，提(tí)升(shēng)产(chǎn)品在AI推理市场的竞争力。

同时，DeepSeek的开源特性也为国内芯片的技术验证提供了便利。众多开发者基于DeepSeek模型进行二次开(kāi)发(fā)和(hé)应(yīng)用(yòng)探(tàn)索(suǒ)，使(shǐ)国(guó)内(nèi)芯(xīn)片(piàn)可(kě)以(yǐ)在(zài)不(bù)同(tóng)的(de)应(yīng)用(yòng)场(chǎng)景(jǐng)、不(bù)同(tóng)的(de)算(suàn)法(fǎ)需(xū)求(qiú)等(děng)多(duō)样(yàng)化(huà)的(de)环(huán)境(jìng)下(xià)接(jiē)受(shòu)检(jiǎn)验(yàn)，从(cóng)而(ér)不(bù)断(duàn)完(wán)善自身的性能和功能。

上海天数智芯半导体股份有限公司副总裁郭为告诉《中国电子报》记者，从行业角度看，以DeepSeek为代表的自主大模型创新突破，有助于推动国内算力技术的发展。国内GPU厂商已相继完成与DeepSeek的适配，实现了深度学习框架与国内硬件的融合，以进一步发挥算力优势。在适配过程中，AI产业链中的芯片厂商与模型开发者之间加强合作，促进了上下(xià)游(yóu)企(qǐ)业(yè)的(de)协(xié)同(tóng)发(fā)展(zhǎn)，共(gòng)同(tóng)构(gòu)建(jiàn)从(cóng)硬(yìng)件(jiàn)到(dào)软(ruǎn)件(jiàn)的(de)完(wán)整(zhěng)生(shēng)态(tài)闭(bì)环(huán)，完(wán)善(shàn)了(le)库(kù)和(hé)框(kuāng)架(jià)等(děng)工(gōng)具(jù)，有(yǒu)助(zhù)于(yú)构(gòu)建(jiàn)更(gèng)加(jiā)完(wán)整(zhěng)、健(jiàn)康(kāng)的(de)自主AI产业生态。DeepSeek的开源特性可降低开发门槛，吸引更多开发者和上下游企业加入，降低了AI应用开发的门槛和成本，促进AI技术在更多行业的落地和普及。

带动供应链创新发展

DeepSeek也助推了边缘计算与低成本芯片的发展。它推出的小型模型，如7B参数版本，可在笔记本电脑运行，且性能接近大模型。这种“小而美”模式的兴起，使得端侧小模型迎来了快速发展，也带动了低功耗、高能效芯片的市场需求。

以手机、平板电脑、蓝牙耳机和智能眼镜等智能终端设备为例，为了满足用户对AI语音交互、图像识别等功能的需求，这些设备需要搭载具备一定算力的芯片。而DeepSeek的应用，使得这些设备能够更好地运行端侧小模型，实现更高效的AI处理。这就促使了设备制造商加大对国内算力芯片和存储芯片的采购，推动了国内芯片在智能终端市场的应用。

在服务器领域，随着企业加速开发和部署人工智能应用，如智能客服、智慧政府、数据分析等，对服务器的算力要求也越来越高。DeepSeek的出现，让企业能够在国内算力芯片的支持下，构建高效的人工智能服务平台，有望带动国内算力芯片在服务器市场的发展。

半导体行业专家池宪念表示，目前引发的对国内算力需求的增长，如同一条强有力的纽带，将半导体产业链上的各个环节紧密联系在一起。从芯片设计、制造到封装测试，再到最终的应用市场，每个环节都因DeepSeek的出现而获得了新的发展动力。未来，整个国内半导体供应链将在DeepSeek的带动下，形成一个良性循环。但这一趋势也对国内半导体厂商提出了更多挑战。从技术迭代角度来看，人工智能技术发展日新月异，新的模型和算法不断涌现。DeepSeek需要不断优化自身模型，以保持技术领先地位。国内芯片(piàn)技(jì)术(shù)也(yě)需(xū)要(yào)加(jiā)速(sù)升(shēng)级(jí)、及(jí)时(shí)适(shì)配(pèi)，确(què)保(bǎo)模(mó)型(xíng)与(yǔ)芯(xīn)片(piàn)之(zhī)间(jiān)的(de)协(xié)同(tóng)效(xiào)应(yīng)。

英特尔：以质量守护数字生活“芯”动力

微软发布全球首个拓扑架构量子芯片