Mistral的首个强推理模型：开源开源，推理速度快10倍

2025/06/12

强推理终于要卷速度了。

大模型强烈刺激，又令人兴奋的重量级玩家。

本周二，欧洲人工智能公司 Mistral AI 发布了 Magistral，这是一个全新的大语言模型（LLM）系列，锻炼了强大的推理能力。它能够进行不断反思，并解决更复杂的任务。

此次发布包含两个版本：面向企业客户的中小企业模型Magistral Medium，以及一个24B参数的开源版本Magistral Small。其中开源版本使用Apache 2.0许可，可以自由使用、控制化；Magistral Medium则可通过Mistral的Le Chat界面和La Plateforme API访问。

直接使用：https://chat.mistral.ai/chat
模型开源：https://huggingface.co/mistralai/Magistral-Small-2506
论文：https://mistral.ai/static/research/magistral.pdf

在基准测试中，新模型取得了不错的成绩。这里主要是 Magistral 与前身 Mistral-Medium 3 和 DeepSeek 系列的对比。Magistral Medium 在 AIME2024 上的得分为 73.6%，其中大多数投票为 64%，得分为 90%。Magistral Small 的得分分别为 70.7% 和 83.3%。

新模型在其他一些高要求测试中也表现出色，包括研究生水平的快速基准测试 GPQA Diamond 和用于编程挑战的 LiveCodeBench。

Mistral进一步展示了一些实际使用的案例。

Magistral Medium展示了自身的编程能力，一次生成输出的代码就可以模拟出重力、摩擦力。

除了通过基准和编程等「必考题」，Magistral 模型还擅长在多种语言中保持高保真推理。它特别适合英语、法语、西班牙语、德语、希腊语、阿拉伯语、拉丁语、中文等语言的推理。

借助 Le Chat 中的 Flash Answers，Magistral Medium 还能实现比大多数竞争对手多达 10 倍的代币吞吐量。Mistral 称，这基本可以实现大规模的实时推理和用户输入。

由于以上一系列特征，Mistral 认为 Magistral 非常适合需要长时间思考和更高准确度的通用任务，相比非推理类的大模型，提升明显。

在报告技术中，Mistral表示Magistral应用了自主研发的可扩展的强化学习模型，其并不依赖现有实现和从先前模型中提炼出的强化学习痕迹，而是采用自下而上的方法，完全依赖自己的模型和基础设施。

在司法工作中研究人员发现，基于文本的强化学习能够保持甚至提升多模态理解、指令遵循和函数调用能力。

有趣的是，Magistral的核心设计原则是使用与用户相同的语言进行推理。在任何语言问题和数学编程问题上进行强化学习通常会导致删除模型在推理过程中出现混合。在没有语言限制的初步实验中，Mistral工程人员也经常观察到混合英语、中文和单词的输出。虽然这些输出是连贯的，但为了避免语言切换，在计算对话（由问题、他们思考、答案组成）的奖励时，首先通过LaTeX内容和代码块对这三个部分进行归一化，然后对每个部分应用 fastText 分类器。如果分类器指示所有三个部分都使用相同的语言，则额外奖励 0.1 的奖励。

这样简单的修改使得思维模型能够严格跟踪用户的语言，最大限度地减少代码切换，同时保持推理任务的语言性能。尽管只是将原始英语问题翻译成几种语言，但我们能够观察到Magistral模型能够成功生成任何的链、系统提示。

米斯特拉尔进一步在系统提示中指定了格式和语言要求，如下图所示。实验发现强化学习训练对这些系统提示非常敏感。例如，系统提示中的「故障便捷，故障长」部分增加了模型的语义，从而提高了模型的探索能力。

Mistral 正在将 Magistral Medium 模型评估包括 Amazon SageMaker 纳入的主流云平台，Azure AI、IBM WatsonX 和 Google Cloud Marketplace 也将紧随其后。

在使用成本方面，Mistral把Magistral Medium定位为一款独特的高端产品，价格也大幅上涨。

它的每百万输入代币价格为 2 美元，每百万输出代币为 5 美元，相比老款 Mistral Medium 3 价格大幅上涨，下一步输入成本为 0.4 美元，输出成本为 2 美元。

然而，与外部竞争对手相比，Magistral Medium 的策略定价却萎缩了。它的输入成本比 OpenAI 最新型号便宜，与 Gemini 2.5 Pro 的价格相同水平，产出成本也远低于这两款产品。

外观、推理速度比竞品快10倍的竞争优势确实很大。

Magistral API 与其他领先的 LLM 的推理成本对比。

在 Magistral 推出之后，Mistral 的目标是后续版本开始快速迭代模型。

参考内容：

https://mistral.ai/news/magistral

https://venturebeat.com/ai/mistrals-first-reasoning-model-magistral-launches-with-large-and-small-apache-2-0-version/

上一篇 : 砸千亿重金、挖28岁华裔天才CEO、高薪聘谷歌OpenAI员工，传Meta正重组AI研发体系下一篇 : 通义实验室最新成果WebDancer：开启自主智能Deep Research的新时代

预约演示

Mistral的首个强推理模型：开源开源，推理速度快10倍