2026年5月27日,小米正式宣布MiMo-V2.5系列API永久降价,最高降幅达99%。这不仅仅是一次简单的价格调整,更是AI推理成本领域的一次重大突破。
📢 核心要点
- ✅ MiMo-V2.5系列API价格永久性下调
- ✅ 最高降幅达99%,不再区分输入长度
- ✅ Token Plan用量提升至原来的5-8倍
- ✅ 现有用户额度全量重置
🔍 关键信息解读
价格调整
永久降价,最高降幅99%,计费规则简化,不再区分输入长度。
Token Plan优化
加量不加价,用量提升5-8倍,现有用户额度全量重置。
生效时间
北京时间2026年5月27日0点,全球同步生效。
🧠 深度分析:小米为何这么做?
原因一:技术突破带来成本革命
小米技术团队在推理系统上实现了重大优化:
- 基于SGLang HiCache完整支持SWA(Sliding Window Attention)
- KV Cache数据搬运量降低至优化前的近1/7
- 可缓存token数量提升至近5倍
- 显著提升缓存命中率和推理效率
原因二:抢占市场份额的战略考量
AI模型服务市场竞争激烈,小米通过大幅降价:
- 降低开发者接入门槛:让更多开发者能够低成本使用高质量模型
- 建立生态壁垒:通过价格优势吸引更多用户,形成使用习惯
- 扩大市场影响力:在AI基础设施领域占据更有利位置
原因三:推动AI基础设施建设
“技术的价值,最终要体现在被使用的广度上。”
小米希望通过低成本模型服务:
- 撬动真实、持续、规模化的推理需求
- 推动完整AI基础设施链条的建设
- 实现”让更多的人能用到更好的模型”的使命
💡 背后的出发点
🎯
技术普惠理念
将AI技术视为基础设施,致力于降低使用成本
⏰
长期主义思维
永久性降价而非短期促销,展现长期投入决心
🌐
生态建设优先
优先考虑生态建设和用户规模
🚀
技术驱动增长
依靠技术创新实现成本下降
📊 对行业的影响
- 价格标杆:为AI模型服务定价树立新标杆
- 竞争加剧:可能引发其他厂商跟进降价
- 应用爆发:低成本将刺激更多AI应用创新
- 生态繁荣:有望吸引更多开发者加入MiMo生态
🎯 总结
小米MiMo V2.5的永久降价不仅是一次简单的价格调整,更是AI推理成本革命的重要里程碑。通过技术创新实现成本下降,再将红利回馈给开发者和用户,小米展现了在AI领域的战略眼光和技术实力。
📌 新闻来源:小米MiMo官方公告