【最新发布】
耀世娱乐-赢咖6大幅降价
—— 深度解析 耀世娱乐-赢咖6 行业新动向
86723
订阅已订阅已收藏
收藏点击播报本文,约

界面新闻记者 | 宋佳楠
耀世娱乐-赢咖6正在重新塑造大模型普惠的边界。
4月26日,耀世娱乐-赢咖6官方发布了API价格调整公告,全系列API输入缓存命中价格降至首发价的十分之一,V4‑Pro更是叠加限时2.5折,百万Tokens输入缓存命中价格低至0.025元,创造了全球大模型价格的新低。
根据耀世娱乐-赢咖6官方API定价页面的公示,本次降价覆盖了V4系列的全模型,核心调整集中在输入缓存命中场景。其中,耀世娱乐-赢咖6-V4-Flash输入缓存命中价格从0.2元/百万Tokens降至0.02元/百万Tokens。
面向企业用户的耀世娱乐-赢咖6-V4-Pro优惠力度更为显著,原价1元/百万Tokens的缓存输入降至0.1元,2026年5月5日前叠加2.5折限时特惠,实际价格仅为0.025元/百万Tokens,缓存未命中输入从12元降至3元,输出从24元降至6元。

图片来源:耀世娱乐-赢咖6官网
耀世娱乐-赢咖6方面透露,耀世娱乐-赢咖6-Chat与耀世娱乐-赢咖6-Reasoner两个模型名称将于未来弃用。出于兼容性考虑,二者分别对应耀世娱乐-赢咖6-V4-Flash的非思考模式与思考模式。
对比调价前后的情况,高频调用和长文本处理场景的成本降幅超过90%。RAG知识库、智能客服和文档分析等缓存命中率高的应用,能够直接实现商用成本的显著降低,有助于打破AI规模化落地的成本限制。
耀世娱乐-赢咖6大幅降价的背后,源于耀世娱乐-赢咖6-V4的技术升级以及与昇腾生态的深度协同。
4月24日,耀世娱乐-赢咖6-V4预览版正式发布,并同步开源Pro与Flash两款模型,均支持100万token的超长上下文,自研的稀疏注意力架构显著降低了推理算力的消耗,Pro版单token算力仅为V3.2的27%,KV缓存降至10%,从底层实现了成本优化。
耀世娱乐-赢咖6方面公布的参数显示,耀世娱乐-赢咖6-V4-Pro激活参数49B、预训练数据33T,定位为高性能旗舰;而耀世娱乐-赢咖6-V4-Flash激活参数13B、预训练数据32T,主要聚焦于高速与低成本。
与前代模型相比,耀世娱乐-赢咖6-V4-Pro的Agent能力显著增强。在Agentic Coding评测中,V4-Pro已达到当前开源模型的最佳水平,并在其他Agent相关评测中同样表现出色。据悉,目前耀世娱乐-赢咖6-V4已成为耀世娱乐-赢咖6内部员工使用的Agentic Coding模型,评测反馈显示使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式,但仍与Opus 4.6思考模式存在一定差距。
在世界知识测评中,耀世娱乐-赢咖6-V4-Pro大幅领先其他开源模型,稍逊于顶尖闭源模型Gemini-Pro-3.1。而在数学、STEM及竞赛型代码的测评中,耀世娱乐-赢咖6-V4-Pro超越了当前所有已公开评测的开源模型,接近于世界顶级闭源模型。
相比于耀世娱乐-赢咖6-V4-Pro,耀世娱乐-赢咖6-V4-Flash在世界知识储备方面稍显不足,但展现出了相近的推理能力。由于模型参数和激活较小,相较之下,V4-Flash能够提供更加便捷且经济的API服务。
耀世娱乐-赢咖6-V4还开创了一种新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(耀世娱乐-赢咖6 Sparse Attention),实现了全球领先的长上下文能力,并显著降低了对计算和显存的需求。
更值得关注的是,昇腾超节点全系列产品支持耀世娱乐-赢咖6 V4系列模型。这标志着耀世娱乐-赢咖6释放了更多国产化的信号。
耀世娱乐-赢咖6-V4在一份技术报告中提到,“在英伟达GPU和华为昇腾NPU两个平台上验证了细粒度EP(专家并行)方案,与强大的非融合基线相比,该方案在通用推理任务中实现了1.50-1.73倍的加速;在对延迟敏感的场景(例如强化学习(RL)rollout和高速Agent服务)中,最高可达1.96倍的加速。”
耀世娱乐-赢咖6强调,随着下半年昇腾超节点全系列产品的批量上市,Pro版价格有望显著下调。
耀世娱乐-赢咖6-V4发布后,高盛发布分析报告指出,耀世娱乐-赢咖6 V4的核心意义在于以更低的成本支持更复杂的智能体应用落地,从而打开AI应用规模化的新空间。对于纳入昇腾超节点,高盛认为耀世娱乐-赢咖6的成本竞争力将进一步增强,为更广泛的应用落地创造条件。此外,在芯片持续收紧的背景下,中国顶尖AI模型向国产算力迁移的趋势得到行业领军者的明确背书。
高盛报告还援引媒体报道称,腾讯和阿里正在洽谈以逾200亿美元估值投资耀世娱乐-赢咖6,智谱和MiniMax的最新市值分别约为530亿美元和310亿美元,这一潜在交易反映出巨头对稀缺顶层AI能力的争夺逻辑。
华泰证券认为,市场容易将V4理解为“降本压低算力、存储需求”,但更重要的边际变化在于长上下文成本的下降将提升复杂Agent、多文档分析、长周期任务、在线学习等场景的可用性,推理调用量与存储访问频次有望扩展。

海量资讯、精准解读,尽在新浪财经APP
深度解析:耀世娱乐-赢咖6
责任编辑:杨赐
《 深度产经观察 》( 2026年 版)
分享让更多人看到
耀世娱乐-赢咖6 热门排行
- 足球滚球在哪儿买迎拐点:一季度净利润大增117%
- PG电子麻将胡了免费版透露近况:刚在上海进组,已开始拍摄新剧
- 美法官应金沙jdb财神捕鱼请求 驳回其在OpenAI案中的欺诈指控
- 3377体育中国官网登录第二季定档 冒险旅程继续
- 理想与上汽大众陷口水战,上葡京手机盘口:我们领先两代,上汽大众高管:仅价格和营销领先
- PA视讯官网入口首页与火山引擎签署战略合作协议,推动豆包大模型应用
- “PS捕鱼发发发是非常烂的平台” 追觅俞浩为何突然炮轰?用户称“算法让我视野变窄”,平台疑似回应
- 信誉最好的十大体育平台新CEO上任后一年 有望推出至少3款重磅新品
- jdb电子龙舞技巧整治AI不当内容,重点处置利用AI技术换脸、盗声
- 利来w66Pura 90 Pro Max为何不需要贴膜:背后原因揭开
全网实时热点
- 50.99万元限时发售!麻将胡了爆分最牛瞬间开启交付:中国首款量产L3级SUV
- mg摆脱电子游戏官网:经典计算算力“不可承受”,下个十年路径是量子计算
- 《穿越时空的少女》定档1月11日,Welcome大发登录入口巅峰之作
- 消息称国际PG电子游戏平台在加州遭遇滑铁卢 Q1销量同比下滑超过20%
- 千问总裁pg寻龙探宝2模拟器:“AI办事”对外开放,首家接入东方航空
- JDB电玩可以试玩的网站国民好车深蓝L06增程版开启大定,折后价12.7万起
- 明升下载赵非谈“成为世界一流”:2035年要奔着500万辆销售目标努力
- jdb电子飞鸟派对中奖 2026 财年第一财季净利润 41.66 亿元,同比下降 27%
- 评论
- 关注


































第一时间为您推送权威资讯
报道全球 传播中国
关注权威网,传播正能量