近日,记者从国家超算互联网获悉,上海国产AI大模型风向标之一的MiniMax,携MiniMax-01系列模型入驻国家超算互联网。作为首个大规模线性注意力模型,MiniMax-Text-01通过架构创新、重构推理系统,实现了超长四百万token的上下文,可为复杂智能体系统提供基础能力。
国家超算互联网致力于链接我国算力产业上下游及供需双方资源,实现超算、智算等全国算力资源的统筹与调度,打造集算力、应用、数据、生态、社区等于一体的开放共享平台,让国产算力更加普惠易用,助力科技创新和数字经济高质量发展。
据介绍,超算互联网的ChatBot可视化对话界面,已经接入MiniMax-01系列模型,用户可直接体验32个专家和456B参数的文本模型,同时体验集成了文本、视觉理解、联网一体的智能对话服务。
超算互联网称,MiniMax-01系列模型,在架构上通过1/8的传统Transformer与7/8的Lighting Attention(闪电注意力,线性注意力的一种 I/O 感知实现),使得模型在处理超长文本的时候,在保持优异处理效果的同时,同时做到了低延迟。目前,该系列模型已支持VLLM推理。
1月15日,MiniMax发布并开源了MiniMax-01全新系列模型,包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。目前,语言大模型 MiniMax-Text-01 、视觉多模态大模型 MiniMax-VL-01现已入驻超算互联网AI开源社区,依托平台海量普惠的异构加速算力,大模型能力得以全面释放。
MiniMax相关负责人表示,未来会继续在超算互联网平台上线更多旗舰模型,并期待与平台一起在智能体领域深度合作。
(文章来源:上海证券报·中国证券网)