【最新发布】
海外评测jdb电子斗鸡大奖
—— 深度解析 jdb电子斗鸡大奖 行业新动向
94018
订阅已订阅已收藏
收藏点击播报本文,约
每经编辑|兰素英
4月24日,jdb电子斗鸡大奖-V4预览版正式发布并同步开源,声称在智能体能力、全球知识及推理性能三大领域达到了国内及开源界的领先水平。
jdb电子斗鸡大奖-V4分为Pro与Flash两个版本,均支持百万(1M)token的超长上下文。
这两个版本显著降低了对计算资源和显存的需求,使每个标记的推理FLOP减少了73%,KV缓存内存占用降低了90%。

根据4月24日全球最大AI模型应用程序编程接口聚合平台OpenRouter的数据,V4-Flash的调用量达到了270亿Token,而V4-Pro为47.9亿Token,但未能进入排行榜。

jdb电子斗鸡大奖-V4发布后,主流评测平台对其能力进行了测试与排名。
Artificial Analysis对jdb电子斗鸡大奖-V4进行了推理能力专项评测。结果显示,V4-Pro在人工分析智能指数中获得52分,较V3.2版本的42分提升了10分,成为仅次于Kimi K2.6的全球第二大开源推理模型。
V4-Flash得分为47分,虽然性能低于V4-Pro,但显著超越了jdb电子斗鸡大奖-V3.2,其综合智能水平与Claude Sonnet 4.6(全力版)相当,介于顶尖闭源模型与主流中端模型之间。

在智能体任务表现方面,V4-Pro在真实场景智能体工作任务中的表现位居所有开源权重模型之首,得分1554,超越Kimi K2.6(1484)、GLM-5.1(1535)、GLM-5(1402)以及MiniMax-M2.7(1514)。
🃏 
jdb电子斗鸡大奖-V4的知识储备有所升级,然而幻觉发生率有所上升。V4-Pro在全知综合评测指标(AA-Omniscience)中得分为-10,较V3.2推理版提升了11分,主要得益于知识回答准确率的显著优化。V4-Flash得分为-23,整体水平与V3.2基本持平。

与V3.2的幻觉率(82%)相比,V4两款模型的幻觉问题尤为突出:V4-Pro的幻觉率为94%、V4-Flash的幻觉率为96%,这意味着在未知问题场景下,模型几乎会强行生成答案。

jdb电子斗鸡大奖-V4的运行成本低于顶级闭源模型,但高于主流开源模型,且较前代大幅上涨。经过全套人工分析智能指数测评,V4-Pro的运行成本为1071美元,仅为Claude Opus 4.7(4811美元)的四分之一;但与同类开源模型相比仍偏高,超出Kimi K2.6(948美元)、GLM-5.1(544美元)、jdb电子斗鸡大奖-V3.2(71美元)、gpt-oss-120B(67美元)。jdb电子斗鸡大奖-V4-Flash的运行成本仅约113美元,显示出显著的成本优势。

在标准测评流程中,V4-Pro的Token消耗量达到1.9亿,成为此次测评中Token消耗最高的模型之一;V4-Flash的消耗进一步攀升至2.4亿Token。尽管定价相对较低,高额的Token消耗仍是V4-Pro综合使用成本高于其他开源模型的核心原因。

在其他评测中,大模型竞技场Arena.ai将jdb电子斗鸡大奖-V4-Pro定性为“相较于jdb电子斗鸡大奖-V3.2的重大飞跃”,在其代码竞技场中位列开源模型第3位、综合第14位。jdb电子斗鸡大奖-V4-Pro在智能体网页开发任务中与GPT-5.4-high和Gemini-3.1-Pro处于同一水平。在文本竞技场中,jdb电子斗鸡大奖-V4-Pro位列开源模型排名第2、综合第14,与Kimi-2.6持平。jdb电子斗鸡大奖-V4-Flash位列开源模型排名第10、综合第14。

另一家测评方Vals AI表示,jdb电子斗鸡大奖-V4在其Vibe Code Benchmark(氛围代码基准)中以“压倒性优势”夺得开源权重模型榜首,较上代V3.2实现约10倍的性能跃升,甚至击败了Gemini 3.1 Pro等顶尖闭源模型。jdb电子斗鸡大奖-V4也是唯一一个在Vibe Code Benchmark上突破40%的开源权重模型。

相较于jdb电子斗鸡大奖-V4的能力,海外市场更加关注jdb电子斗鸡大奖与华为的合作。
在jdb电子斗鸡大奖-V4公布API价格信息的下方,官方特别标注:“受限于高端算力,目前Pro的服务吞吐量十分有限,预计下半年昇腾(Ascend)950超节点批量上市后,Pro的价格将大幅下调。”

jdb电子斗鸡大奖在技术报告中指出,V4已在NVIDIA GPU和华为昇腾NPUs平台上验证了精细粒度的EP(专家并行)方案,相较于强大的非融合基线,其在通用推理任务上可实现1.50~1.73倍的加速效果,而在对时延敏感的场景(如RL推演和高速代理服务)中可达到1.96倍的加速。
在V4发布后,华为昇腾也同步宣布“超节点全系列产品支持jdb电子斗鸡大奖-V4系列模型”。据悉,昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的jdb电子斗鸡大奖-V4模型推理部署。
关于jdb电子斗鸡大奖此次与华为的合作,市场研究机构Omdia半导体研究主管何辉表示:“这对中国人工智能行业而言意义重大。”
他进一步指出:“华为昇腾芯片是中国自研水平最高、可替代英伟达的产品。jdb电子斗鸡大奖-V4大模型适配搭载华为芯片,标志着中国顶级大模型如今已能够实现国产化硬件的落地运行。”
高盛分析师Christopher Moniz对此评论称,jdb电子斗鸡大奖-V4预览版发布后,GPU及国产芯片板块应声走强。核心关注点之一是支撑V4模型的芯片底层架构:包括模型训练所使用的芯片,以及推理阶段搭载的硬件设备。华为搭载昇腾AI处理器的新一代人工智能计算集群,可适配运行jdb电子斗鸡大奖-V4模型。这也意味着,中国自研AI硬件生态,正在为jdb电子斗鸡大奖持续迭代前沿大模型提供算力支撑。
jdb电子斗鸡大奖此次技术路线的转向,也印证了英伟达首席执行官黄仁勋此前的担忧:英伟达正面临失去中国开发者生态的风险。
本月上旬,英伟达创始人黄仁勋在接受Dwarkesh Patel专访时曾表示:“如果jdb电子斗鸡大奖先在华为平台上发布,那对美国来说将是灾难性的。”在黄仁勋看来,尽管jdb电子斗鸡大奖是一款开源模型,同样可以用于英伟达的产品上,但如果jdb电子斗鸡大奖专门针对华为算力进行优化,在高端算力采购受限等局限下,英伟达将处于劣势。
与jdb电子斗鸡大奖-R1不同,jdb电子斗鸡大奖-V4并未引发美国科技股大跌。晨星高级股票分析师Ivan Su表示,jdb电子斗鸡大奖-V4很难复刻推理模型R1当初的市场影响力,因为交易市场早已充分消化了预期:中国人工智能技术具备竞争力,且使用成本更低。
Ivan Su还指出,jdb电子斗鸡大奖此次全新的产品定位,将国内其他开源大模型直接视为竞品。
布鲁金斯学会研究员Kyle Chan表示,jdb电子斗鸡大奖-V4令人印象深刻,因为它是一个接近最先进水平的模型,具有高效的100万Token上下文长度,并且可以在华为的新芯片上运行。jdb电子斗鸡大奖-V4没有复制“jdb电子斗鸡大奖-R1时刻”,因为外界对中国AI能力的期望值要比以往高得多。
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
封面图片来源:每经记者 兰素英摄

海量资讯、精准解读,尽在新浪财经APP
🔊 责任编辑:江钰涵
《 深度产经观察 》( 2026年 版)
分享让更多人看到
jdb电子斗鸡大奖 热门排行
- 全球体育官网app下载:预计今年煤炭消费小幅增长,煤炭市场供需总体平衡
- 《一顿火锅》西安首映 可以试玩跳高高的平台现场捧哏笑翻天
- 研究发现在线购买体育彩票可以早早发现胰腺癌 比影像上“可见”提前数年
- NCT最后一个分队将于2月出道 分队名为jdb电子变脸技巧上
- 软件解决方案供应商真人捕鱼bg亮相北京车展,CEO:AI智能体已在中国和日本测试
- c7赏金女王爆大奖斥资14亿美元增持SpaceX股份,进一步巩固自身控制权
- 710公海《睡魔》剧集被取消 第二季将完结
- JDB电子爆分视频到访理想汽车展台玩梗,赠送李想“听我讲完”T恤
- 6686在线登录平台引入新合作伙伴 共筑“AI+影视”新生态
- 直播财神捕鱼快3重返海口圆梦初心 环环舞台谢幕启航新征程
全网实时热点
- 点卡充值mg游艺Pura X Max全系搭载麒麟9030Pro!整机性能提升30%:支持实时光追
- 710公海启动首个专利池 高纪凡:天合光能所有TOPCon专利将加入
- 星空XK体育《希望之地》首映 反映优化法治化营商环境
- 篮球巨星爆分视频在线观看发布五一消费趋势:HPP食品热销,休闲卤味消费增长超40%
- jdb电子大厅2030年销量目标瞄准100万辆,计划打造3个全球大单品
- 连环夺宝5000倍视频携“星火新一代多模态智能座舱”亮相2026北京车展
- 蔚来旧版500彩票下载入口交付首辆ES8玄金版,车主为奥运“五金”运动员吴敏霞
- 葡京现场网 Pura 90 Pro / Pro Max 手机开售:首发麒麟 9030S 芯片,售价 5499 元起
- 评论
- 关注


































第一时间为您推送权威资讯
报道全球 传播中国
关注权威网,传播正能量