LLM

小米在 AI 领域的布局一直在稳步推进，从最早的语音助手小爱同学，到后来的端侧 AI 能力，再到如今推出的大语言模型系列——MiMo。今天来聊聊小米最新的推理模型 MiMo-v2.5-Pro。什么是 MiMo-v2.5-Pro？ MiMo（Mi Model）是小米自研的大语言模型系列。MiMo-v2.5-Pro 是该系列的最新版本，定位为推理增强型大模型。它在数学推理、代码生成、逻辑推理等方面表现突出，是小米在大模型推理能力上的一个重要里程碑。核心能力推理能力 MiMo-v2.5-Pro 最大的亮点在于其强大的推理能力。它采用了类似 Chain-of-Thought（思维链）的训练策略，让模型在面对复杂问题时能够进行逐步推理，而不是直接给出答案。这使得模型在数学竞赛题、逻辑推理题等任务上表现优异。数学与编程在数学推理方面，MiMo-v2.5-Pro 在多个数学基准测试中取得了出色的成绩，包括 MATH-500、AIME 等竞赛级别的数学题。在编程方面，模型在 LiveCodeBench 等代码生成基准上也有不错的表现，能够理解复杂的需求并生成高质量的代码。通用能力除了推理和编程，MiMo-v2.5-Pro 在通用的语言理解、对话生成等任务上也保持了较高水准。它不是那种「偏科」的推理模型，而是在推理能力增强的同时，通用能力没有明显退化。技术特点训练方法 MiMo-v2.5-Pro 采用了多阶段训练策略：预训练阶段：使用大规模高质量数据进行基础能力训练监督微调（SFT）：使用精心构造的指令数据进行微调强化学习（RL）：通过类似 GRPO（Group Relative Policy Optimization）的强化学习方法，进一步增强模型的推理能力这种多阶段的训练方式，让模型既能保持通用语言能力，又能在推理任务上取得突破。模型规模 MiMo-v2.5-Pro 有多个参数规模的版本，从轻量级到旗舰级，满足不同场景的需求。其中旗舰版本在推理任务上的表现可以媲美甚至超越许多更大参数量的模型，体现了小米在模型效率优化上的功力。开源策略小米选择了开源的方式来发布 MiMo 系列模型，这在国产大模型厂商中是一个值得肯定的举动。开发者可以在 Hugging Face 上下载模型权重，进行本地部署和二次开发。这种开放的态度有助于整个 AI 生态的发展。与竞品对比在推理模型这个赛道上，MiMo-v2.5-Pro 面对的竞争非常激烈：模型厂商特点 MiMo-v2.5-Pro 小米推理能力强，开源，多尺寸 DeepSeek-R1 深度求索推理能力极强，开源，671B MoE OpenAI o1 OpenAI 推理标杆，闭源 Qwen3 阿里巴巴全能型，开源，MoE 架构 MiMo-v2....

本文最后更新于 2024 年 4 月 20 日，未来可能会更新更多我在用的 AI 工具。 2023 年 2 月 ChatGPT 发布以来，已经过去一年多的时间了。作为一个科技爱好者，每一次的 iOS Beta 更新都会让我兴奋不已，我会在第一时间更新，即使有很多的 Bug，我也愿意作为那个上报 Bug 的人。而对于最近一年兴起的生成式 AI 也是如此，我从 2023 年 2 月开始，一直在使用各种类似的工具。一年多过去了，我有必要分享一些我在用的工具，以及最近一年我自己写的相关的项目。从 ChatGPT 的诞生到今天，想要使用这些平台都有一些门槛，最早的 ChatGPT 必须要验证手机号以及需要魔法以外，最让人头大的是支付方式，最初我的帐号的支付都是用的我好朋友 Ming 的 BoA 信用卡。然而没过多久我来到了美国，直到今天我有了很多美国银行的银行卡，然而这些平台几乎都诞生于美国，几乎所有的平台都支持给美国的用户使用。因此，我也就有机会体验到很多新的 AI 模型。值得一提的是，目前为止我的所有帐号封号率为 0%。平台平台订阅使用频率使用场景 ChatGPT Plus & Team 50% 写代码 / 文本生成 Claude Pro 40% 写代码 Perplexity Pro 10% 检索信息 / 搜索引擎我自己其实最多的场景还是写代码，之前就是单平台，完全依赖 ChatGPT，现在逐渐将这些场景交给 Claude Opus，个人觉得 Opus 比起 GPT-4 的表现更优秀。而 Perplexity 是我最近才开始使用的，主要是用来检索信息，它的优点就是使用次数可以很多，每天 600 次对我来说绰绰有余。...

小米 MiMo-v2.5-Pro：小米最强推理模型

AI I am currently using