首页 > 科技

解决传统架构记忆瓶颈 MiniMax发布新一代模型

2025-01-15 23:19:00 记者：罗亦丹编辑：岳彩周

新京报贝壳财经讯（记者罗亦丹）1月15日，“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型，包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新，以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。

未来，AI智能体有望成为最重要的产品形态，由于智能体处理的任务变得越来越复杂，涉及的数据量也越来越大，单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此，长上下文能力与多模态处理能力的提升至关重要。

技术上，MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别，受益于此次架构创新，该系列模型在处理长输入的时候具有非常高的效率，接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑，MiniMax选择模型参数量为4560亿，其中每次激活459亿，能够高效处理400万token的上下文，将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型，MiniMax-01随着输入长度变长，性能衰减最慢。

值得注意的是，MiniMax还开源了Text-01模型、VL-01模型的完整权重，以便于更多开发者做有价值、突破性的研究。MiniMax方面表示，“我们认为这有可能启发更多长上下文的研究和应用，从而更快促进Agent时代的到来，二是开源也能促使我们努力做更多创新，更高质量地开展后续的模型研发工作。”

编辑岳彩周

校对穆祥桐

13 +1

微信

解决传统架构记忆瓶颈 MiniMax发布新一代模型

我要评论

相关推荐

宋婷婷代表：大模型升级高质量数据短缺建议扩大公共数据开放

10秒克隆泰语逻辑智能发布AudioX-Thai语音大模型

方大特钢牵手华为迎两连涨，钢铁行业大模型打开想象空间

新京报AI研究院发布第二期AI大模型测评报告！五大维度实测

大模型传媒能力如何？新京报AI研究院报告：存幻觉，写作待提高

热点

最新

解决传统架构记忆瓶颈 MiniMax发布新一代模型

我要评论

相关推荐

宋婷婷代表：大模型升级高质量数据短缺 建议扩大公共数据开放

10秒克隆泰语 逻辑智能发布AudioX-Thai语音大模型

方大特钢牵手华为迎两连涨，钢铁行业大模型打开想象空间

新京报AI研究院发布第二期AI大模型测评报告！五大维度实测

大模型传媒能力如何？新京报AI研究院报告：存幻觉，写作待提高

热点

最新

宋婷婷代表：大模型升级高质量数据短缺建议扩大公共数据开放

10秒克隆泰语逻辑智能发布AudioX-Thai语音大模型