9001cc金沙

产品中心

图像处置

节造系统

云联网

媒体服务器

显示智能体

视频拼接器

U15 Max/U9 Max/U6 Max X100 Pro

超等视频处置器

Z8t Z6 PRO-G2 Z5/Z4 Pro

专业视频处置器

VX20 VX10/VX6 X40m/X20m X26m X20 X8m/X12m X12 X7/X6 X4m/X2m

散布式系统

DS420/DS410 DS40/DS20

软件

ColorAdept 麒麟可视化智控平台 iSet

发送器

S20/S20F S6F/S4/S2

接管系列

5G系列 K系列 i系列经典接管卡经典G2系列 E320Pro

配件

H10FN/H10FN2/H10Fix/H2F OP4/OP1s 监控类配件 XH6

专业配屏软件

LEDSetting LEDUpgrade

播放器

A800/A500 A200/A100 A35 A4K/A2K

云平台

ColorlightCloud LEDMaster

云联网播控软件

PlayerMaster LED精灵

多媒体播控服务器

CS16K CS8K-G3 CS6K-G3 CS4K-G3

软件

GrandShow GrandMapping GrandHub

服务器配件

音视频采集卡

智慧会议

AX08/AX06/AX6K CM4KS/CM2KS

智能造作

科学级校对系统 CCM6000 产线自动化校对 Mica 310 Pro 墨色分选系统 Mica 310B 智能产线机械人 Mica P100

专业画质测评系统

LEDAnalyzer

图像处置
视频拼接器超等视频处置器专业视频处置器散布式系统软件

节造系统
发送器接管系列配件专业配屏软件

云联网
播放器云平台云联网播控软件

媒体服务器
多媒体播控服务器软件服务器配件

显示智能体
智慧会议智能造作专业画质测评系统
络书智算

络书智算官网
典型案例

经典案例利用案例
服务支持

下载专区操作视频 CCE认证服务网络盛开平台 New 投诉和建议
新闻资讯

公司新闻成功案例媒体报路行业资讯产品上新展会活动
关于9001cc金沙

9001cc金沙简介发展过程企业愿景企业使命企业价值观联系9001cc金沙人才招聘
投资者关系

投资者热线互换平台公司布告

中文 English

DeepSeek V4正式颁布，昇腾超节点系列产品全面支持

2026.04.24

起源：华为推算（企业公家号）

2026 年 4 月 24 日，DeepSeek V4-Pro 和 DeepSeek V4-Flash 正式颁布并开源，模型高低文处置长杜咨原有 128K 显著扩大至 1M，实现近 10 倍容量提升。模型初次增长 KV Cache 滑窗和压缩算法，大幅削减 Attention 推算和访存开销，并通过架构创新更好地支持 Agent 与 Coding 场景。

昇腾一向同步支持 DeepSeek 系列模型，本次通过双方芯模技术缜密协同，实现昇腾超节点全系列产品支持 DeepSeek V4 系列模型。昇腾 950 通过融合 kernel 和多流并行技术降低推算开销，结合多种量化算法，实现高吞吐、低时延的推理部署；昇腾 A3 超节点系列产品全面适配，同时提供基于 A3 超节点的训练参考实现，方便用户急剧微调。

一、昇腾 950 超节点：沉新界说长文本推理机能天花板

基于昇腾 950 底层架构三大升级，实现极致机能阐发：

· 原生精度加快：全面支持 FP8、MXFP8、MXFP4 等体式，保障精度同时内存占用降低 50%+，推算能力翻倍。

· 稀少访存优化：针对 MoE 模型离散访存特点，提升硬件级稀少访存能力，解决专家路由带宽瓶颈。

· Vector 与 Cube 共享 Memory：创新存储架构，解除大量片上数据搬运开销，显著降低端到端时延。

机能实测：

· DeepSeek V4-Pro：8K 输入场景，TPOT 约 20ms，单卡 Decode 吞吐 4700TPS。
· DeepSeek V4-Flash：8K 输入场景，TPOT 约 10ms，单卡 Decode 吞吐 1600TPS。

同时，昇腾结合界说超节点架构，实现低成本、高扩大、万卡级集群规模，支持 4K–1M 序列长度全领域低延长高吞吐，并可基于 NAND SSU 实现超低成本、超大容量 KV Cache，支持长序列利用。

二、昇腾 A3 超节点：单卡吞吐突破 2000+TPS

Atlas 900 A3 SuperPoD 液冷超节点及 Atlas 800 A3 风冷超节点选取平等架构、全局内存统一编址，点对点互联带宽达 784GB/s，提供 32 到 384 多种规格，是国内唯一成熟规模商用的超节点产品，可满足互联网、运营商、金融等行业大模型推理的极致机能需要。

基于昇腾 A3 64 卡超节点结合大 EP 模式部署，在 vLLM 引擎下，DeepSeek V4-Flash 模型可实现单卡 Decode 吞吐 2000+TPS，机能持续提升；同时已支持 DeepSeek V4-Pro 推理部署。

三、PyPTO 编程新范式与 TileLang 规划同步开源

为解决自界说算子开发门槛高、周期长的痛点，昇腾 CANN 推出 PyPTO 编程范式：

· 高效算子开发：提供 Python API，自动实现流水编排与内存治理，DeepSeek V4 新一代模型算子开发周期缩短至天级。
· 高机能 Kernel 自动天生：针对 Attention、Compressor、mHC 等复杂算子自动天生优化 Kernel，缩短算法验证到部署周期。
· PTO ISA 虚构指令集跨代兼容：统一指令接口，实现一套代码多代芯片兼容，借助毕昇编译器实现更优融合。

TileLang-Ascend 针对昇腾平台深杜着化，提供 AscendC 基础指令和 PTO AS 两种对接档次，有关 DeepSeek V4 模型实现已在 TileAI 开源社区颁布。

四、全系列产品适配，盛开生态加快 AI 落地

目前，昇腾 A2、A3 及 950 全系列产品已实现 DeepSeek V4-Flash、DeepSeek V4-Pro 适配。昇腾将持续以极致算力与盛开生态，为大模型产业提供高效支持，与客户及开发者携手推动 AI 产业繁华。

版权申明：本文转载自华为推算官方公家号，仅用于行业资讯互换与技术分享，不代表本公司态度，不用于任何贸易用处。版权归原作者及原出处所有，如有侵权，请联系9001cc金沙实时删除。

原文链接：https://mp.weixin.qq.com/s/i9P0B0FLEBFg2jhOkxSpQg

下一条造就智能原生新业态新模式2026.04.10

返回列表

在线征询

4008-770-775

电话征询

【网站地图】