中外多家算力芯片公司宣布适配DeepSeek

发布时间：2025-02-07 14:02:42

春节假期期间，DeepSeek的爆火如“平地一声雷”。这家于2023年成立的人工智能基础技术研究企业，在今年1月20日正式开源其R1推理模型，该模型在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版，且开发成本仅为600万美元，仅相当于OpenAI 的 O1 模型开发成本的1.2% 。DeepSeek于2024年12月26日宣布上线并同步开源的DeepSeek-V3模型，以1/11的算力、仅2000个GPU芯片训练出性能超越GPT-4o的(de)大(dà)模(mó)型(xíng)，且(qiě)训(xun)练(liàn)成(chéng)本(běn)仅(jǐn)相(xiāng)当(dāng)于(yú)GPT-4o的(de)5.6%。

业(yè)内(nèi)人(rén)士(shì)表(biǎo)示(shì)，DeepSeek此(cǐ)举(jǔ)开(kāi)拓(tà)出(chū)高(gāo)性(xìng)能(néng)模(mó)型(xíng)训(xun)练(liàn)的(de)新(xīn)思(sī)路，其(qí)以(yǐ)低(dī)成(chéng)本(běn)实(shí)现(xiàn)大(dà)模(mó)型(xíng)训(xun)练(liàn)，也(yě)引(yǐn)发(fā)了(le)业(yè)界(jiè)对(duì)海(hǎi)外(wài)AI企(qǐ)业(yè)耗(hào)费(fèi)巨(jù)量算力资源训练模型必要性的怀疑。近日，多家中外算力芯片企业纷纷发布适配DeepSeek模型的消息。

燧原科技：实现全国各地智算中心DeepSeek的全量推理服务部署

2月6日，燧原科技宣布，完成了对DeepSeek全量模型的高效适配，包括DeepSeek-R1/V3 671B原生模型、DeepSeek-R1-Distill-Qwen-1.5B/7B/14B/32B、DeepSeek R1-Distill-Llama-8B/70B等蒸馏模型。截至目前，DeepSeek的全量模型已在庆阳、无锡、成都等智算中心完成了数万卡的快速部署。

华为：支持DeepSeek系列模型“一键获取”、“开箱即用”

2月(yuè)5日(rì)，华(huá)为(wèi)技术有限公司宣布，DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区，支持一键获取DeepSeek系列模型，支持昇腾硬件平台上开箱即用。

image001.j

DeepSeek系列模型上线昇腾社区

海光信息：DCU适配三大模型，相关模型已正式上线

2月4日，海光信息宣布，其技术团队成功完成DeepSeek V3和R1模型与海光DCU（深度计算单元）的适配，并正式上线。2月5日，海光信息宣布其技术团队成功完成DeepSeek-Janus-Pro多模态大模型与海光DCU的适配优化，并正式上线。因DCU采用了GPU通用加速计算架构，DeepSeek模型可直接在DCU上运行，并不需要大量适配工作，技术团队的主要工作是进行精度验证和持续的性能优化。本次适配优化的DeepSeek-Janus-Pro模型具备跨模态理解与生成(chéng)能(néng)力(lì)，专(zhuān)注(zhù)于结合视觉与语言理解能力，旨在处理更复杂的跨模态任务。

image002.j

Janus-Pro生成示例（图源：海光信息）

天数智芯：一天完成DeepSeekR1适配

2月4日，天数智芯与 Gitee AI 联合发布消息，成功完成了与 DeepSeek R1 的适配工作，并且已正式上线多款大模型服务，其中包括 DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等，其过程仅耗时1天。

image003.j

天数智芯上线多个DeepSeek大模型服务

摩尔线程：已部署DeepSeek蒸馏模型推理服务

2月4日，摩尔线程宣布实现了对DeepSeek蒸馏模型推理服务的部署。基于Ollama开源框架，完成了对DeepSeek-R1-Distill-Qwen-7B蒸馏模型的部署，并在多种中文任务中展现了优异的性能。用户也可以基于MTT S80和MTT S4000进行DeepSeek-R1蒸馏模型的推理部署。

英特尔：支持AI PC本(běn)地(de)部(bù)署(shǔ)

1月(yuè)31日(rì)，英(yīng)特(tè)尔宣布，DeepSeek目前能够在英特尔产品上运行，更可以在AI PC上实现离线使用，强调DeepSeek的本地部署能力。DeepSeek的蒸馏模型在至强和Gaudi平台上得到了支持，能够帮助客户实现(xiàn)更(gèng)低(dī)的(de)成(chéng)本(běn)和(hé)单(dān)价(jià)性(xìng)能(néng)优(yōu)势(shì)。一(yī)如(rú)，在(zài)最(zuì)新(xīn)发(fā)布(bù)的(de)酷(kù)睿(ruì)Ultra 200H（Arrow Lake H）平(píng)台(tái)上(shàng)，DeepSeek-R1-1.5B模(mó)型(xíng)能(néng)够(gòu)顺(shùn)利(lì)运(yùn)行(xíng)，且(qiě)能(néng)够(gòu)解(jiě)决(jué)数(shù)学(xué)难(nán)题(tí)。DeepSeek最(zuì)新(xīn)的(de)Janus-Pro图(tú)像(xiàng)生成和理解模型(xíng)能(néng)够(gòu)在(zài)英(yīng)特(tè)尔(ěr)酷(kù)睿(ruì)Ultra 200V系(xì)列(liè)处(chù)理(lǐ)器(qì)（Lunar Lake）上(shàng)运(yùn)行(xíng)。

酷(kù)睿(ruì)Ultra 200H可本地运行DeepSeek-R1-1.5B解数学题

英伟达：推理微服务支持DeepSeek-R1

1月30日，英伟达宣布，其开发者网站现已提供6710 亿参数的 DeepSeek-R1 模型微服务预览版。单个 NVIDIA HGX H200 系统上每秒可为DeepSeek-R1 提供多达 3872 个tokens。开发人员可以测试和试验可下载的NIM微服务应用程序编程接口（API）。通过将 NVIDIA AI Foundry 与 NVIDIA NeMo 软件结合使用，企业还将能够为专用 AI 代理创建自定义的 DeepSeek-R1 NIM 微服务。

MCU迎来变革之年

激光雷达，“跨越鸿沟”