近日,国产AI大模型风向标之一的MiniMax,携MiniMax-01系列模型入驻国家超算互联网。作为首个大规模线性注意力模型,MiniMax-Text-01通过架构创新、重构推理系统,实现了超长四百万token的上下文,可为复杂智能体系统提供基础能力。

超算互联网的ChatBot可视化对话界面,已经接入MiniMax-01系列模型,用户可直接体验32个专家和456B参数的文本模型,同时体验集成了文本、视觉理解、联网一体的智能对话服务。
在国内智能体探索实践的百舸争流之际,科研、金融、医疗等大语言模型的典型应用场景,对模型推理的上下文长度提出了前所未有的要求,而MiniMax-01系列模型目前在该赛道一骑绝尘。

此外,语言大模型 MiniMax-Text-01 、视觉多模态大模型 MiniMax-VL-01现已入驻超算互联网AI开源社区,依托平台海量普惠的异构加速算力,大模型能力得以全面释放。MiniMax相关负责人表示,未来会继续在超算互联网平台上线更多旗舰模型,并期待与平台一起在智能体领域深度合作。
MiniMax-01系列模型,在架构上通过1/8的传统Transformer与7/8的Lighting Attention(闪电注意力,线性注意力的一种 I/O 感知实现),使得模型在处理超长文本的时候,在保持优异处理效果的同时,同时做到了低延迟。目前,该系列模型已支持VLLM推理。
![]() | ![]() |
左:和全球先进模型相比,随着处理文本变长,MiniMax-Text-01 在推理效果(Long-context RULER performance)上保持最好。
右:和全球先进模型相比,随着上下文窗口变长,MiniMax-Text-01 的推理延迟上升缓慢。
作为国家级综合算力服务平台,超算互联网凭借异构算力资源池、一体化算力网、开放协同的AI合作生态,已成为响应“人工智能+”行动、推动“异构算力+开源模型”在更多行业融合创新的主要平台之一。
相关新闻
-
2025-04-18
超算&AI应用周报Vol.53 | 智谱6款GLM模型、Skywork-OR1、InternVL3、HiDream-I1上线
-
2025-04-18
机器化学家:算力=智力=研究力
-
2025-04-17
最佳实践Vol.35 | Wan2.1-ComfyUI实操:玩转AI视频,让文字、图片一键动起来
-
2025-04-17
科研更“晋”一步 - 国家超算互联网生态沙龙在太原顺利开展
-
2025-04-15
智谱GLM开源模型系列上线,32B性能比肩DeepSeek-R1