首创AI芯片新架构 中星微成功实现单芯片运行通用大模型

【导语】4月30日,中星微在数字中国建设峰会上宣布,其最新AI芯片“星光智能五号”成功运行DeepSeek大模型,成为首款全自主可控、能同时运行通用语言和多模态大模型的AI芯片。该芯片支持本地化部署和嵌入式应用,突破算力瓶颈,可更好地服务于数字中国建设和新质生产力(lì)发(fā)展(zhǎn)。通过采用多核异构GP-XPU新架构,“星光智能五号”实现了算力与存储资源的高效利用,推动端侧、边缘侧智能化升级,大幅减少对云端算力资源的依赖,并保障数据安全。

首创AI芯片新架构 中星微成功实现单芯片运行通用大模型

4月30日,中星微在第八届数字中国建设峰会上宣布,采用其首创多核异构GP-XPU新架构的最新AI芯片“星光智能五号”已成功运行DeepSeek 7B/8B/16B大模型,成为首款全自主可控、可单芯片同时运行通用语言大模型和“万物识别”多模态大模型的AI芯片。该芯片可支持本地化部署和嵌入式应用,通过8颗芯片级联并行计算,可支持“满血版”671B参数DeepSeek大模型及其它多模态大模型运行,突破本地化端侧算力瓶颈限制,可更好服务于数字中国建设和新质生产力发展。

据介绍,“星光智能五号”通过采用GP-XPU架构,集成高性能的RISC-V CPU、GP-GPU、NPU,以及面向智能感知领域的图像信(xìn)号(hào)处(chù)理器(ISP)、视频编解码器(VPU)、加解密处理器(ECU)等多核心模块,通过专用的HCP(异构计算池)任务调度单元和安全内存管理系统,实现多异构内核之间的算力与存储资源的实时调度与动态共享,大幅提升了算力利用效率和数(shù)据(jù)吞(tūn)吐(tǔ)率(lǜ),从(cóng)而(ér)首(shǒu)次(cì)实(shí)现(xiàn)了(le)在(zài)单(dān)芯(xīn)片(piàn)上(shàng)部(bù)署运行DeepSeek 1.5B、7B、8B、16B等通用大模型及视觉大模型的能力。

在仅约一张名片大小的处理板中,单颗“星光智能五号”既满足复杂场景下的视频实时检测、识别与跟踪需求,又能实现自然语言处理、任务规划、知识管理、自动控制等智能体功能;通过(guò)8颗(kē)芯(xīn)片联合部署,能够支持“满血版”671B参数DeepSeek大模型和视觉大模型运行,彻底打破边缘端算力瓶颈。

中星微技术CEO张韵东介绍,“星光智能五号”将推动端侧、边缘侧智能化升级,大幅减少对云端算力资源的依赖,节省系统建设成本,探索了一条符合中国国情的人工智能技术路线。

据了解,传统依赖云端的AI推理流程常面临响应延迟大、成本高、受制于网络环境(jìng)等(děng)问(wèn)题(tí),而(ér)该(gāi)芯(xīn)片(piàn)通过本地化算力与内生安全机制,使大模型推理可直接在边端侧内完成闭环,既节省了云端传输与存储成本,同时极大提升了响应速度,可实现毫秒级响应,同时以信源级密码机制保障数据全生命周期安全。

友情链接 集成电路有限公司 - 芯片模拟器网站入口