小米首个推理大模型开源数学与代码测评超越OpenAI

2025-4-30 11:39| 发布者: 仟茂传媒| 查看: 872| 评论: 0|来自: 和讯财经

摘要: 凤凰网科技讯4月30日，小米公司于“XiaomiMiMo”公众号正式宣布开源其首个专注于推理能力的大模型「XiaomiMiMo」。小米官方表示，该模型以7B参数规模，在数学推理和代码竞赛等公开测评中表现优异，超越OpenAI的闭源 ...

凤凰网科技讯(作者/高书柔) 4月30日，小米公司于“Xiaomi MiMo”公众号正式宣布开源其首个专注于推理能力的大模型「Xiaomi MiMo」。小米官方表示，该模型以7B（70亿）参数规模，在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）等公开测评中表现优异，超越OpenAI的闭源模型o1-mini及阿里Qwen2.5-32B等更大规模的开源模型。

小米技术团队表示，MiMo的核心突破在于预训练与后训练阶段的协同优化。在预训练阶段，模型通过挖掘高质量推理语料并合成约2000亿tokens专项数据，采用三阶段渐进训练策略，累计训练量达25万亿tokens。

后训练阶段则引入创新强化学习技术，包括自研的"Test Difficulty Driven Reward"算法和"Easy Data Re-Sampling"策略，有效提升模型在复杂任务中的稳定性。技术团队还开发了"Seamless Rollout"系统，使训练效率提升2.29倍，验证速度加快1.96倍。