首页 > 链资讯 > DeepSeek 华为首秀:基于华为芯片训练大模型,美国急指控“抄袭”

DeepSeek 华为首秀:基于华为芯片训练大模型,美国急指控“抄袭”

2026-04-27 11:41:01

4 月 27 日消息:上周五(24 日),DeepSeek 正式发布「V4」大模型预览版。这是全球首个主要针对华为昇腾 AI 处理器深度优化的前沿大模型,全程脱离 NVIDIA CUDA 体系。

而就在同一天,美国国务院已向全球各国大使馆发出外交电报,指示其工作人员警告外国政府,指控DeepSeek和其他中国人工智能公司“涉嫌窃取知识产权”。

DeepSeekV4参数规模达1.6万亿,上下文窗口达100万token,分为Pro与Flash两个版本。Pro版输出定价每百万token 24元,Flash版仅2元,远低于GPT-5.4、ClaudeOpus4.6等海外闭源模型。官方表示,DeepSeek V4 Pro性能比肩顶级闭源模型。

此次发布最大突破是彻底切换算力底座。DeepSeek上一代V3依赖2048张NVIDIA H800训练,曾被调查涉嫌通过第三方采购受限芯片。V4全程采用华为昇腾芯片训练,华为确认昇腾全系列超节点与最新950系列实现首日兼容。DeepSeek透露,下半年昇腾950超节点批量上市后后,Pro版价格有望进一步下调。

据报道中如此形容这一事件。

毕竟,这是此前无论中国公司还是外国公司的大模型,都没有采用过的方式。早在去年8月,DeepSeek V3.1就支持了UE8M0FP8Scale参数精度,并特别表示这一数据格式是针对即将发布的下一代国产芯片设计,为脱离CUDA生态埋下伏笔。

据悉,DeepSeekV4发布当天,美国国务院向全球使馆发送外交电报。美方要求驻外人员提醒各国,提防DeepSeek、月之暗面、MiniMax等企业“窃取并蒸馏美国AI模型”。白宫此前也发布备忘录,指责中方开展工业化规模模型蒸馏。OpenAI与Anthropic早前均指控过DeepSeek涉嫌蒸馏其模型。

不诱于誉,不恐于诽,率道而行,端然正己。”DeepSeek在官方新闻稿中表示。

“感谢每一位用户的信任与支持,大家的肯定、建议和期许,是我们不竭探索、持续进步的动力,也让我们始终坚守初心,专注于不懈的创新。我们将始终秉持长期主义的原则理念,在尝试与思考中踏实前行,努力向实现AGI的目标不断靠近。”

NVIDIA CEO黄仁勋曾公开警告,DeepSeek若在华为芯片上完成首发,意味着AI模型有望在美国技术架构之外实现最优运行。如果这款模型针对华为架构完成专属优化,会直接让美国在全球AI竞争中落入劣势,这对美国是重大损失。

DeepSeek 华为首秀:基于华为芯片训练大模型,美国急指控“抄袭”

声明:文章不代表链懂观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
相关阅读相关阅读
热门资讯热门资讯
风险
提示

链懂数据及信息均来源公开资料,不构成任何推荐或投资建议。炒币属投资行为,市场有风险,投资需谨慎。

闽ICP备2023001858号-1 站点地图
Copyright ©2025 链懂.All Rights Reserved