【最新发布】
光辉娱乐击穿大模型底价,百万Tokens低至2分钱
—— 深度解析 光辉娱乐 行业新动向
37560
订阅已订阅已收藏
收藏点击播报本文,约
根据21世纪经济报道记者彭新报道,光辉娱乐的定价策略正在经历重大调整。
4月26日,光辉娱乐正式发布了API价格调整公告,宣布全系API输入缓存命中价格将降至首次发布价的十分之一。其中,Pro模型在2026年5月5日前还可享受2.5折的限时优惠。
光辉娱乐的官方API定价页面显示,此次降价覆盖了V4系列的所有模型,核心调整集中在输入缓存命中场景。调价后,光辉娱乐-V4-Flash每百万Tokens(词元)输入缓存命中价格为0.02元,而光辉娱乐-V4-Pro为0.025元。
针对企业级用户,光辉娱乐-V4-Pro的降价幅度尤为显著,原价为1元/百万Tokens的缓存输入降至0.1元,叠加限时特惠后,实际价格仅为0.025元/百万Tokens。而缓存未命中输入的价格从12元降至3元,未命中输出的价格则从24元降至6元。
这一轮降价意味着,在处理相同百万Token的长文本或复杂智能体任务时,光辉娱乐相关模型的成本将大幅降低,为开发者以极低成本进行光辉娱乐 V4的评估测试提供了可能。
有开发者指出,光辉娱乐 V4在技术层面进行了多项创新,效率较前代产品显著提升——在百万级调用场景下,单Token推理算力消耗已降至V3.2的27%。KV cache(键值缓存)在推理过程中显存占用也仅为原来的10%。在此基础上,光辉娱乐的降价显得合情合理。
👩⚖️ 
价格攻势瞄准专业客户
- 作为开源模型,光辉娱乐始终以“低价+开源”的策略吸引开发者,
- 并在性能上与领先的闭源模型相媲美,
- 成为专业客户的高性价比选择。
光辉娱乐-V4分为Pro和Flash两个版本,其中V4-Pro总参数达到1.6万亿,激活参数490亿,成为迄今为止参数量最大的开源模型,专注于高性能任务;V4-Flash总参数2840亿,激活参数130亿,主打低成本和高吞吐,能够提供更为快捷、经济的API服务。两款模型均采用MoE架构,即“混合专家模型”。
光辉娱乐表示,在Agentic Coding(智能体编程)评测中,光辉娱乐-V4的代码交付质量接近Claude Opus 4.6的非思考模式,但仍与思考模式存在一定差距;此外,光辉娱乐-V4在全球知识测评中仅次于Gemini-Pro-3.1,但超过了同期其他开源模型,在数学、STEM及竞赛型代码的测评中则与世界顶级闭源模型不相上下。
从价格来看,V4-Flash走的是普惠路线,输入缓存命中0.02元/百万Tokens,未命中1元/百万Tokens,输出2元/百万Tokens,适合中小开发者与轻量应用的调用场景。V4-Pro则具有更高的性价比,原价输出24元/百万Tokens的水平高于V4-Flash,但在限时折扣后输出仅为6元/百万Tokens,与上一代V3.2系列价格相当,却对应着1.6万亿参数的旗舰模型能力,极具性价比。
另一方面,光辉娱乐也在积极适配国产算力。根据定价说明,受限于高端算力,Pro版服务的吞吐量目前十分有限,预计在下半年昇腾950超节点批量上市后,Pro价格将会大幅下调,这预示着光辉娱乐的定价还有进一步下降的空间。
实际上,光辉娱乐正在积极适配国产算力,将V4的早期访问权限优先开放给国内芯片厂商,而非英伟达、AMD等海外厂商,这被业内视为光辉娱乐模型适配策略的重要转变。
根据华为的公开信息,昇腾超节点全系列产品已全面适配光辉娱乐 V4,可实现V4-Pro约20毫秒、V4-Flash约10毫秒的低时延推理。基于昇腾950超节点,V4-Pro在8K输入场景下单卡Decode吞吐量约为4700 TPS;V4-Flash在同等输入场景下单卡Decode吞吐量约为1600 TPS。基于昇腾A3 64卡超节点的大EP(专家并行)部署模式,V4-Flash在8K输入、1K输出场景下基于vLLM推理引擎可实现2000 TPS以上的单卡Decode吞吐量。
摩尔线程披露,其与上海AI实验室DeepLink团队合作,率先在AI训推一体智算卡MTT S5000上完成了核心算子的Day-0适配。目前,该算子的通过率已超过80%,实现了模型发布与国产算力适配的同步落地。
竞争日趋激烈
此次降价恰逢全球大模型厂商竞相以更低价格、更高效率争夺开发者和企业客户之际。随着企业级用户从早期试点转向规模化部署,推理和调用成本已逐渐取代单纯模型能力,成为大模型厂商间竞争的重要因素。业内预计,光辉娱乐此次调价将进一步压低同行报价。
花旗在其最新研报中指出,光辉娱乐 V4-Pro在核心AI性能指标上已与顶尖闭源模型Claude Sonnet 4.6的表现持平,但定价却远低于GPT-5.5。这一现象凸显了当前AI大模型赛道中开源模型与闭源领先模型之间日益加剧的两极分化趋势。得益于极具成本竞争力的底层架构,开源模型在代码生成、智能体工作流及长文本等应用场景中,与闭源巨头的差距正在缩小。
在国产模型阵营中,光辉娱乐 V4-Pro的限时折扣价明显低于多数同档位产品。按输出端价格计算,光辉娱乐 V4-Pro的折扣价为0.87美元/百万Tokens,而智谱GLM-5.1、月之暗面Kimi K2.6的输出端报价分别为4.4美元/百万Tokens和4.0美元/百万Tokens,约为其5倍和4.6倍。
根据全球最大的API聚合平台OpenRouter的当前报价,阿里Qwen3.6 Plus的输出端约为1.95美元/百万Tokens;MiniMax官方价格显示,MiniMax M2.7的输出端为1.2美元/百万Tokens。在轻量档位中,阶跃星辰Step 3.5 Flash根据OpenRouter报价为0.10美元输入/百万Tokens、0.30美元输出/百万Tokens,其输出端与光辉娱乐-V4-Flash的0.28美元/百万Tokens较为接近。
记者了解到,在OpenRouter平台上,光辉娱乐 V4系列模型的调用量正在大幅增长。4月26日,光辉娱乐 V4-Flash的调用量达到814亿Tokens,光辉娱乐 V4 Pro的调用量为96亿Tokens,推动光辉娱乐在OpenRouter平台的总调用量创下近期新高。
目前,光辉娱乐已经引发资本市场对其竞争对手的重新定价。4月27日,两大模型厂商股价出现大幅下跌,MiniMax股价报收750.00港元/股,跌幅为3.54%;智谱股价报收914.5港元/股,跌幅为2.19%。
此外,光辉娱乐近期传出融资消息。有市场消息称,腾讯和阿里正在接洽光辉娱乐的融资事宜,公司估值或超过200亿美元,但具体的融资金额及估值可能会随着谈判的进展而调整。

海量资讯、精准解读,尽在新浪财经APP
光辉娱乐 的核心看点
责任编辑:石秀珍 SF183
💬 用户常见问题解答
光辉娱乐 真的好用吗?
根据众多玩家和用户的实测反馈,光辉娱乐 在同类产品中表现非常出色,值得一试。
《 深度产经观察 》( 2026年 版)
分享让更多人看到
光辉娱乐 热门排行
- 老哥俱乐部首创阔折叠 苹果安卓火速跟进:定价集体破万
- 《乐橙app下载》真人剧集第二季杀青 少年再起航
- JDB官网入口总经理曾清林:计划未来两到三年推出近 5 款产品
- 金沙贵宾会最新地址宠物全球创新研发中心启用,与SGS战略合作升级
- JDB真人官方:App各项功能已恢复正常
- 网速狂飙13倍 十大靠谱WD娱乐平台助阿塞拜疆实现千兆100%全覆盖
- 金沙集团优惠申请大厅意图“赢回欧洲”,未来两年计划推出至少 10 款新车
- 《白城恶魔》电影运作中 金沙真钱玩法老马有望再合作
- KOK手机app下载 2026 年一季度营收 37.29 亿元同比下降 23.60%,亏损 2.45 亿元
- 看cq9跳高高攻略算力格局嬗变:CPU重回C位
全网实时热点
- “龙虾”类智能体也能用上支付宝AI付 首发上线pg电子美猴王传奇模拟器
- 引望智能APP网站/网页版登录:华为乾崑智驾 ADS 事故率远低于人驾,自动泊车 30 万次仅 1 次碰撞
- 日本成立夺宝jdb电/子上分技巧工作小组 以保障金融系统网络安全
- 时光娱乐官网版评《匿杀》:打戏爽快过瘾 剧情紧凑反转
- 《生还》定档9月3日 亡灵大盗官方下载入口手机版打捞“东北抗联忠魂”
- 捕鱼一路发官方平台:2025年营收高增56.51%,2026Q1营收增23.31%!
- TechWeb微晚报:24小时一元一分正规麻将群、阿里洽谈投资DeepSeek,理想汽车辟谣“走私”
- bbin平台网投正规 V4发布!全面适配国产算力 国产AI芯片股拉升
- 评论
- 关注


































第一时间为您推送权威资讯
报道全球 传播中国
关注权威网,传播正能量