MiniMax发布M3模子，历练数据规模达100万亿Token

澜筑建材有限公司

热点资讯

MiniMax发布M3模子，历练数据规模达100万亿Token

发布日期：2026-06-03 10:49 点击次数：121

6月1日，国产大模子公司MiniMax认真发布新一代通用模子 MiniMax M3。据先容，M3摄取全新的自研荒芜细心力架构MiniMax Sparse Attention（MSA），在编程及智能体才略、超长高下文及原生多模态等多个要津倡导，均已毕代际结巴。MiniMax暗意，M3是国内首个同期具备“前沿 Coding 才略、1M超长高下文、原生多模态”三项中枢才略的大模子，亦然现在各人唯独具备圆善才略组合的开源选项。

MiniMax暗意，撑握M3三大才略合一的，是其自研的荒芜细心力架构MSA（MiniMax Sparse Attention）。相较传统全细心力机制，MSA梗概显贵缩短长高下文下的计较资本，并将高下文窗口普及至100万token。这意味着模子在不休长文档、复杂代码仓库、多轮任务勾通等场景时，梗概在一次推理中保留更圆善的信息链路。MiniMax走漏，日韩精品极品视频在线观看免费在100万高下文规模下，M3单token计较量仅为上一代模子的约1/20，推理成果显贵普及。

除模子架构升级外，MiniMax在底层推理算子层面也进行了进一步优化。通过再行贪图数据读取与计较旅途，关系性能较主流开源决策普及4倍以上。

在业内看来，这亦然各人大模子竞赛的伏击新变量。跟着Agent任务复杂度不绝提高，丈夫让妻子陪上司睡觉的后果“更长高下文、更褂讪系念、更低资本推理”正在成为决定产物可用性的要津才略。

据先容，M3 在编程与 Agent 历练中翻新引入交互式用户模拟器框架——通过模拟真确开垦者在勾通经由中的行动模式，让模子在历练和评测阶段就战役到更接近分娩环境的交互场景。业界以为，从代码开垦、赓续分析，到跨诳骗协同施行，Coding&Agentic 才略正缓缓成为各人头部模子的新竞争焦点。这次MiniMax重心强化这一才略，也被外界视为对下一阶段AI产物形貌的提前布局。

MiniMax暗意，M3从历练起初便摄取文本、图片、视频等多模态混杂历练，并在数据规模和历练管线上进一步推广。模子不仅支握图像与视频明白，也具备桌面操作才略，可在复杂跨诳骗环境中施行Computer Use任务。M3 是一个从Step0开动进行多模态混杂历练的模子。MiniMax 在论说中强调，Interleaved data（交错数据）——文本和图像等其他模态在序列中轮流当然胪列的数据——对模子性能带来的普及，比一般以为的愈加要津。在为这些数据重构整套数据管线后，MiniMax已不错将历练数据Token规模普及至100万亿的量级。

同日，MiniMax Code 也迎来更新：当作专为 M3 贪图、并与 M3 一皆历练的 Agent 产物，MiniMax Code 梗概充分进展 M3 在长高下文、Coding/Agentic、原生多模态方面的才略，是搭配 MiniMax-M3 的首选 Agent。在长程复杂任务上，MiniMax Code 的 Agent Team 不错将大型任务拆解为多阶段、可并发、可动态诊疗的 Workflow，由 Agent 集群勾通推动。

南边+记者叶丹

上一篇：拙劣耗低温技巧初次落地！粤东粮仓“变身”

下一篇：中外工程师汇注深圳讨论6G前沿时间