热搜词:

天才少女罗福莉加入小米后,小米首个开源推理大模型发布

出品|搜狐科技

作者|张雅婷

天才少女罗福莉加入小米之后,小米交出了首份在大模型领域的成绩单。

4月30日小米,小米官方宣布开源首个为推理而生的大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。

在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

随着DeepSeek-R1引发业界强化学习(RL)共创潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下,小米MiMo-7B 的数学&代码领域的强化学习潜力显著领先。