咱们正式推出 Mistral Large,这是咱们迄今为止最新、最先进的言语模型。Mistral Large 现已能够经过 la Plateforme 获取,同时,咱们也经过 Azure 这一咱们的首个合作伙伴向用户供给。
Mistral Large,咱们的全新旗舰模型
Mistral Large 是咱们最新研发的前沿文本生成模型,具备顶尖的推理才能。它能够担任包含文本理解、转换和代码生成在内的复杂多言语推理任务。
在常规的基准测验中,Mistral Large 展现出杰出功用,成为全球第二个(仅次于 GPT-4)能够经过 API 获取的顶尖模型[详见下文基准测验概况]。
图 1: 在 MMLU(大规模多任务言语理解丈量)测验中,GPT-4、Mistral Large (预练习)、Claude 2、Gemini Pro 1.0、GPT 3.5 与 LLaMA 2 70B 的比照。
Mistral Large 带来了以下新特性和优点:
-
它能流利使用英语、法语、西班牙语、德语和意大利语,并对这些言语的语法和文化背景有深化理解。
-
32K Token 的上下文窗口使其能够从大型文档中精确地回想信息。
-
精确的指令履行才能答应开发者自主设计内容审阅政策——咱们使用这一特性为 le Chat 设定了系统等级的内容审阅。
-
天然生成具备函数调用才能。这一特性,加上在 la Plateforme 实施的输出约束形式,为大规模的应用开发和技能栈现代化供给了可能。
与 Microsoft 合作,经过 Azure 供给咱们的模型
Mistral 的任务是推动前沿 AI 技能的普及。因此,咱们今日宣告将咱们的敞开和商业模型引入 Azure。微软对咱们模型的信任标志着咱们行进的一大步!现在,咱们的模型能够经过以下方法获取:
-
La Plateforme:在 Mistral 的欧洲基础设施上安全保管,这一接入点让开发者能够使用咱们丰富的模型库来创立应用程序和服务。
-
Azure:Mistral Large 能够经过 Azure AI Studio 和 Azure Machine Learning 获取,供给与咱们 API 相同的无缝用户体会。Beta 客户现已明显成功地使用了它。
-
自我布置:对于最敏感的使用场景,咱们的模型能够布置在您的环境中,您能够获取咱们的模型权重;阅览关于这种布置方法的成功案例,并联系咱们的团队了解更多信息。
Mistral Large 的才能展现
咱们将 Mistral Large 与市场上其他顶尖大言语模型在常用基准测验中的功用进行了比较。
推理和常识
Mistral Large 展现出了强大的推理才能。下图展现了预练习模型在标准基准测验中的体现。
图 2: 市场上顶尖大言语模型在广泛认可的常识、推理和常识基准测验中的体现:MMLU、HellaSwag (10-shot)、Wino Grande (5-shot)、Arc Challenge (5-shot)、Arc Challenge (25-shot)、TriviaQA (5-shot) 和 TruthfulQA。
多言语才能
Mistral Large 具有超卓的多言语才能,在法语、德语、西班牙语和意大利语的 HellaSwag、Arc Challenge 和 MMLU 基准测验中远超 LLaMA 2 70B。
图 3: Mistral Large、Mixtral 8x7B 和 LLaMA 2 70B 在法语、德语、西班牙语和意大利语的 HellaSwag、Arc Challenge 和 MMLU 测验中的比照。
数学与编程
Mistral Large 在编程和数学任务中展现出尖端功用。下表报告了市场上一些顶尖大言语模型在盛行基准测验中的编程和数学功用。
图 4: 市场上领先的大言语模型在盛行的编程和数学基准测验中的体现:HumanEval pass@1, MBPP pass@1, Math maj@4, GSM8K maj@8 (8-shot) 和 GSM8K maj@1 (5 shot)。
新推出的 Mistral Small,针对低推迟工作负载进行优化
咱们不仅推出了 Mistral Large,还发布了一个针对推迟和成本进行优化的新模型 Mistral Small。Mistral Small 在功用上超过了 Mixtral 8x7B,且具有更低的推迟,是咱们敞开权重产品和旗舰模型之间的抱负挑选。
Mistral Small 拥有与 Mistral Large 相同的创新特性,包含 RAG 启用和函数调用。
咱们简化了端点服务,供给以下选项:
-
具有竞争力定价的敞开权重端点,包含
open-mistral-7B
和open-mixtral-8x7b
。 -
新的优化模型端点,
mistral-small-2402
和mistral-large-2402
。咱们将继续保护mistral-medium
,但今日不进行更新。
咱们的基准测验为您供给了功用与成本权衡的全面视角。
除了新模型的推出,咱们还引入了组织管理多币种定价,并在 la Plateforme 上更新了服务等级。咱们还大幅度降低了一切端点的推迟。
JSON 格局和函数调用
JSON 格局形式使言语模型的输出有必要为有用的 JSON。这一功用使开发者能够更自然地与咱们的模型交互,以结构化的格局提取信息,便于在他们的流程中使用。
函数调用功用答应开发者将 Mistral 端点与他们自己的工具集合进行接口对接,实现与内部代码、API 或数据库的更复杂的交互。您能够在咱们的函数调用指南中了解更多概况。
函数调用和 JSON 格局目前仅在 mistral-small 和 mistral-large 模型上可用。咱们方案不久将来将这些功用扩展到一切端点,并答应更细粒度的格局界说。
立即体会 Mistral Large 和 Mistral Small
从今日开始,Mistral Large 就能够在 La Plateforme 和 Azure 上使用了。此外,Mistral Large 还经过咱们的 beta 版演示工具 le Chat 对外揭露。咱们一向期待着您的反应!