DeepSeek V4 中文能力测评:性能飙升重回国内第一
2026-04-28 09:13:09
4 月 28 日消息,SuperCLUE 团队发布 DeepSeek V4 系列中文大模型测评结果:DeepSeek-V4-Pro 凭借综合表现拿下国内第一,Flash 版本紧随其后位居第二,国产开源模型再迎突破。
本次测评覆盖数学推理、科学推理、代码生成、智能体任务规划、指令遵循、幻觉控制六大维度,Pro版本得分70.98分,Flash版本68.82分,两项成绩均大幅领先国内其他模型。

DeepSeek V4系列采用全新注意力机制,全版本支持百万级长上下文,同时降低算力与显存占用,搭配国产芯片使用,整体效率更高。
相比上一代 V3.2,两个版本均实现全面提升。Pro版本智能体能力提升超20分,数学推理提升近10分,指令遵循提升近12分,幻觉控制也有明显优化。

Flash版本在保持高效推理的同时,智能体与数学推理同样大幅提升,性价比突出。

Pro版本(15元/百万Tokens)侧重高性能,幻觉控制更稳,适合复杂任务与专业场景。Flash 版本速度更快、成本更低,API价格仅1.25元每百万Tokens,日常使用更划算。
测评同时指出,模型与海外顶尖模型在代码生成、复杂指令执行等方面仍有差距。整体来看,DeepSeek V4凭借均衡能力与亲民成本,站稳国内第一梯队,成为日常办公、开发创作、长文本处理的优质选择。
声明:文章不代表链懂观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
相关阅读
-
KITE 币上线交易所了吗?2024 最新可买平台及购买教程链知识 2026-04-28 09:05:00
-
Meta 拟 140 亿收购中国 AI 公司 Manus?官方回应:终止外资并购链资讯 2026-04-27 18:31:20
-
华为 Mate XT2 下半年发布:首发麒麟 9050,最强三折叠屏手机来了链资讯 2026-04-27 18:25:45
-
存储涨价冲击手机行业:Q1 全球 SoC 出货量下滑 8%链资讯 2026-04-27 18:19:24
-
史上最薄 iPhone 来了!iPhone Fold 参数曝光:厚度仅 4.7mm链资讯 2026-04-27 18:12:43
-
人类马拉松破 2 小时纪录:97 克超轻跑鞋引发巨大争议链资讯 2026-04-27 18:07:30
-
微软启动 K2 计划重塑 Windows 11:去广告、大提速、质量优先链资讯 2026-04-27 18:01:31
-
888888 靓号法拍:起拍价 21 万无人问津,过户需预存 5 万元链资讯 2026-04-27 17:55:33
-
罗永浩怒斥西门子 iQ100 冰箱:设计劣质引集体爆雷,真相揭秘链资讯 2026-04-27 17:49:18
-
时隔 11 年!《异形:隔离 2》正式公布:弃用自研引擎转投 UE5链资讯 2026-04-27 17:43:13