DeepSeek V4 适配国产芯片:摩尔线程 MTT S5000 实现 Day-0 支持
2026-04-24 17:53:28
4 月 24 日消息:今日,DeepSeek 正式上线「V4 预览版」并宣布开源;该模型支持百万字超长上下文处理。
摩尔线程联合智源众智FlagOS社区宣布,在旗舰AI训推一体GPU MTT S5000上,完成对DeepSeek-V4-Flash大模型的Day-0极速适配,并实现全量核心算子深度优化与部署支持。

DeepSeek-V4-Flash采用MoE架构,总参数284B、激活参数13B,支持百万Token上下文,首次采用FP4+FP8混合精度,对算力芯片提出更高要求。
摩尔线程MTT S5000是国内率先原生支持FP8的全功能GPU,搭载硬件级FP8 Tensor Core,相比BF16/FP16可将显存压力降低50%,计算吞吐量翻倍。

本次适配由智源FlagOS完成FP8量化,团队聚焦FP8算子与Sparse Attention算子两大关键,通过两大方向实现突破:
一是依托FlagTree编译器做精细化shape对齐与矩阵计算加速;
二是通过FlagOS-Tune自动搜索最优内核配置,效果超越手工调优。实测显示,开启自动调优后TTFT时延降低16.5%,ITL时延降低39.7%,吞吐量提升65.7%。

目前,双方已完成DeepSeek-V4-Flash适配,并正在推进更大规模的DeepSeek-V4-Pro(1.6T)在MTT S5000上的迁移适配。
开发者可在魔塔、HuggingFace下载镜像开箱即用。
声明:文章不代表链懂观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
相关阅读
-
芬兰徒步网红阿里·莱尼奥离世享年 49 岁,荒野发现遗体链资讯 2026-04-24 17:47:57
-
斑马智能接入支付宝 AI 付车载版,打通座舱“支付即服务”新生态链资讯 2026-04-24 17:42:04
-
雷军为何小鹏送专属 T 恤!温情话语勾起老歌回忆杀链资讯 2026-04-24 17:36:14
-
ALGO 币实际应用场景全解析:为何获银行与机构高度关注?链资讯 2026-04-24 17:33:21
-
大疆 Osmo Pocket 4 图赏:一英寸口袋云台相机深度解析链资讯 2026-04-24 17:30:50
-
高校运动会突发意外:疑遭无人机信号干扰,机器人失控拥抱女生链资讯 2026-04-24 17:25:07
-
央视曝光网恋骗局:骗子伪装完美精英男,诈骗女子 185 万!链资讯 2026-04-24 17:19:01
-
五菱星光 L 实车亮相:10 万级大六座插混 SUV,综合续航超 1100km链资讯 2026-04-24 17:13:28
-
比特币为何近期暴涨?深度解析上涨原因及后市走势预测链资讯 2026-04-24 17:13:12
-
2026 莱特币挖矿全攻略:新手必看 LTC 挖矿教程与收益分析链资讯 2026-04-24 16:52:59