【最新发布】
黄仁勋最担心的事发生了!DeepSeek V4华为芯片首发:8163银河网站CUDA护城河崩塌
—— 深度解析 8163银河网站 行业新动向
24501
订阅已订阅已收藏
收藏点击播报本文,约
快科技于4月26日报道,黄仁勋最为担忧的情况终于发生了!最新发布的DeepSeek V4版本,首次实现了与华为芯片的深度适配。
“不诱于誉,不恐于诽,率道而行,端然正己。”在这一理念的指引下,DeepSeek V4预览版于4月24日正式推出,距离上一个V3.2版本更新已近五个月。


当前,海外主流大模型基本上以三个月为周期进行快速迭代。相较之下,DeepSeek的更新节奏显得缓慢,曾一度遭遇外界质疑。


近期,GPT Image-2的问世引发网友热议,认为“有图有真相”的时代已然结束,现在的AI图像生成能力已足以以假乱真。
然而,DeepSeek在面对外界和竞争对手的质疑时,选择了沉默与专注。

DeepSeek团队表示:“感谢每一位用户的信任与支持,大家的肯定、建议和期许,是我们不断探索和持续进步的动力,也让我们始终坚守初心,专注于不懈的创新。我们将始终秉持长期主义的原则理念,在尝试与思考中踏实前行,努力向实现AGI的目标不断靠近。”
🕙 事实证明,长时间的沉淀与技术投入,终将得到回报。
据路透社报道称,DeepSeek在发布V4之前,并未向美国芯片公司NVIDIA和AMD提供模型的早期访问权限,而是选择让中国企业华为提前数周进行软件适配优化,这一举动被形容为“打破行业惯例”。
这一方式在此前的中国和外国大模型中均未曾出现过。
实际上,DeepSeek V4对华为昇腾国产芯片的深度适配,并非偶然,而是早有规划。
去年8月,DeepSeek发布V3.1时,便已支持UE8M0 FP8 Scale参数精度,并明确表示该数据格式是专为即将发布的下一代国产芯片设计。


东莞证券指出,该格式通过更高的灵活性支持复杂模型推理,提升芯片的解码效率与运算能力,为国产芯片适配更大模型提供了技术路径,加速国产AI算力生态的形成。
☘️ 那么,UE8M0 FP8究竟是什么?将产生何种影响?
人工智能领域的企业家与技术专家、清华大学计算机系人工智能所博士梁斌表示,DeepSeek强调UE8M0 FP8的原因在于,这与NVIDIA的FP8是两种不同的标准。
他解释称,显存的发展是有限的,而模型的发展却是迅速的,因此对每个参数的表达必须通过量化进行压缩。FP32是32位表达一个参数,FP8则是8位表达一个参数,在可接受的范围内,越低的表达方式可以让显存中容纳更多的参数。
FP8有NVIDIA的E4M3/E5M2方案与DeepSeek的UE8M0方案,主要区别在于前者有3-2位的小数表达,而后者则没有小数表达。前者精度高,后者功耗低,运算速度快,对芯片的要求也低。
梁斌表示,DeepSeek支持UE8M0 FP8,加上国产芯片向这一标准靠拢,实际上是与NVIDIA彻底决裂。今后,其他推理模型将只能选择DeepSeek的体系或NVIDIA的体系,国内芯片公司也积极向DeepSeek的体系靠拢。
“华为为了适配这一标准,正全力以赴,若成功将会留下历史的印记,这对DeepSeek而言,绝对是一次巨大的挑战和机遇。”

软件主动适配硬件特性,本质上是在为国产芯片量身定制。
从软件层面主动适配国产硬件,为本土算力生态铺平道路,表面上简单,实则难度极大。这需要对底层调度代码进行大规模重写,全方位打通软硬件兼容链路,工程量庞大,技术壁垒极高。

长期以来,NVIDIA依靠CUDA生态,将硬件、软件与开发者深度绑定,构筑起坚固的技术护城河。在其巅峰时期,NVIDIA芯片在国内大模型训练市场的占比高达95%,几乎所有顶级大模型均高度依赖CUDA框架运行。
国产AI芯片面临着两道艰难的选择:要么妥协兼容CUDA,依附于海外生态以降低迁移成本;要么自主研发全套软件栈,从零开始构建自主技术体系。
回顾国内高端制造与核心科技的发展历程,可以清晰地看到,核心技术永远无法通过购买或讨价还价获得,要想不被国外卡脖子,AI领域必须打造软硬件一体化的自主协同能力。
此次DeepSeek V4实现了对昇腾芯片的深度适配,成功部署高吞吐、低时延的稳定推理,既是技术上的关键突破,也是国产AI打破外部技术垄断、自主突围的重要信号。
国产算力生态的崛起,从来不是单点突破。今年初,智谱GLM-5已完成对7家主流国产芯片的适配,并能够在纯国产算力集群中稳定运行。越来越多的大模型实现了全流程的国产化训练,纯本土算力的实践案例日益增多。
业内分析认为,这标志着一套完整、成熟的国产AI软硬件协同生态正在稳步成型。
必须承认,目前国内芯片制程仍有差距,单卡硬件性能不及海外顶尖水平。然而,多年来,我们在无数领域的实践中都表现出色。
从关键设备、核心软件被封锁限制,到一步步自主攻坚、慢慢突围,中国产业向来擅长在有限条件下,依靠架构优化、集群设计、软硬件协同以及资源统筹,走出一条属于自己的发展道路。
这正是我们多年来对抗技术封锁、突破重重壁垒的缩影,核心技术自主可控,才能真正攥紧主动权,确保不再被他国所制约。

近期,NVIDIA首席执行官黄仁勋在专访中直言,一旦DeepSeek新一代模型首先在华为芯片平台上运行,将对美国科技体系产生灾难性后果。
黄仁勋明确表示,DeepSeek在华为架构上落地并完成专属优化,意味着顶级AI模型能够脱离美国技术框架实现高效运行,这将直接动摇美国在全球AI领域的竞争优势,造成严重的战略损失。
有趣的是,黄仁勋此前一直反对孤立和围堵中国科技。他坦言,中国拥有充足的能源、完整的芯片产业链以及大量的AI科研人才,强行将中国推向对立面,并人为割裂产业合作,绝非明智之举。
在他看来,强行拆分两套AI生态是极为愚蠢的选择。一套是脱离美系技术的开源本土生态,另一套是高度绑定美国架构的封闭生态,这种割裂格局最终只会反噬美国自身。
他多次提到,中国拥有丰富的算力资源,只要完成内部算力整合,完全能够自给自足,支撑本土AI产业的长期发展。
同时,黄仁勋指出,美国极端的芯片出口管制政策过于短视。他结合所提出的AI“五层蛋糕”理论,强调能源才是AI最底层的核心基础,7nm成熟制程完全能够满足绝大多数AI落地需求,而中国的天然优势则在于能源的充足。
美国本土的能源资源紧张,因此NVIDIA不得不拼命压缩功耗,提升单卡能效。相对而言,中国电力资源储备充足,不需要极致优化每瓦性能,即使使用成熟制程芯片,通过大规模集群组网,依然能够弥补硬件差距。
即便面临EUV光刻机的限制,国内依然拥有充足的7nm芯片量产能力。虽然全球主流大模型大多基于NVIDIA Hopper架构训练,但中国完全可以依托能源优势,通过集群规模来抵消单芯片性能的短板,走出一条差异化的发展路线。
“他们庞大的AI研究人员队伍,难道不是他们最根本的优势吗?我们都看到了这一点。”这是黄仁勋反复强调的观点。受限于硬件环境,反而促使国内团队打磨出更加精简、高效的算法模型。
在他看来,AI行业的核心突破,更多来自于算法的迭代,而非单纯的硬件堆砌。海量的本土科研人员与持续进化的自研算法,才是中国AI长期竞争的最大底气。
【本文结束】如需转载请务必注明出处:快科技
责任编辑:朝晖
《 深度产经观察 》( 2026年 版)
分享让更多人看到
8163银河网站 热门排行
- 利记注册平台北京车展发布主动式智能体座舱方案 2nm车载芯片已在计划中
- 105cc娱乐app下载评《祝你幸福!》:震撼心灵 引人深思
- 金沙casino 2026 财年第一财季净利润 483.03 亿日元,同比下降 33.1%
- 《jdb电/子金鸡报晓》因使用AI引争议 导演回应口音问题
- 十大正规竞彩app:智驾已从“尝鲜功能”蜕变为影响消费者购买决策的因素,第二代VLA成为拉动销量增长的关键引擎
- 在大变局中汇聚jdb电子爆
- 0898网投Pura X Max全系搭载麒麟9030Pro!整机性能提升30%:支持实时光追
- 《世界计划:无法歌唱的冰球突破豪华版爆100万》定档1025
- 《一顿火锅》终极预告 不朽情缘官网登录入口于谦组团“犯罪”
- 25年金沙电子pg赏金女王颁发 《秘密会议》最佳影片
- 评论
- 关注


































第一时间为您推送权威资讯
报道全球 传播中国
关注权威网,传播正能量