上海AI企业发布首个混合架构开源模型-PG（中国大陆）官方网站

PG新闻
News

分类

电话：021--64890741
传真：021--64890556
手机：13651713958
地址：上海上海闵行区闵行区颛桥镇光华路346号

上海AI企业发布首个混合架构开源模型

发布时间：2025-06-23 17:10:44 浏览：次

[返回]

上海AI企业发布首个混合架构开源模型

　　6月17日凌晨，总部位于上海的AI独角兽企业MiniMax（上海稀宇科技有限公司），发布了自主研发的“全球首个开源的大规模混合架构推理模型”MiniMax-M1（以下简称“M1”）。M1支持100万token（语言中具有独立意义的最小单位）上下文窗口，训练成本仅为53.74万美元，约合380万元人民币，其长文本处理、代码生成等核心性能填补了开源领域长上下文技术的空白，展现出比肩甚至超越业界顶尖模型的实力。

　　记者登录MiniMax自有的App和Web端看到，M1模型保持不限量免费使用。“M1如同用经济型轿车的成本造出了豪华超跑”“M1是我们眼中的性价比新王”互联网上，一些AI行业观察者给出这样的评价。

　　作为国内PG电子官方平台入口“AI六小虎”之一的MiniMax，此次发布的M1大模型何以拥有巨大的成本优势？资深人工智能专家、高级工程师丁成刚认为，这主要源于企业的两大技术创新。一是采用闪电注意力机制为主的混合架构，使得模型在计算长上下文输入以及深度推理时更加高效；二是运用CISPO强化学习算法，优化重要性采样权重，训练效率超越其他大模型。得益于CISPO的高效，M1模型的整个强化学习阶段仅使用了512块英伟达H800 GPU，耗时3周，成本仅为53.74万美元。这一成本显著低于企业最初的预期。

　　在进行8万token的深度推理时，M1所需的算力仅 PG电子官方平台入口为国内另一款大模型的约30%；生成10万token时，推理算力只需要另一款大模型的25%。当较低成本训练出顶尖模型，实现“性能跃升、成本腰斩”的双重突破，用户再也不用担心百万token上下文成为高昂服务，这将为市场提供了一个高性能、低门槛的新选择。可以预见，M1或将会成为智能体时代的首选开源基座模型。

　　行业观察人士认为，面对多个核心生产力场景，M1于同类模型中率先实现了技术突破与架构创新，它的核心竞争力在于将线性注意力与标准Softmax注意力有机融合，形成独特的“闪电注意力”机制。这一设计让M1在保持长序列处理效率的同时，解决了纯线性注意力在信息检索上的固有缺陷。

　　记者了解到，MiniMax在业内公认的17个主流评测集上对M1进行了技术“检阅”。结果显示，在软件工程、长上下文理解以及工具使用等复杂且对生产力要求较高的场景中，M1展现出绝对实力。在SWE-bench基准测试里，M1-40k和M1-80k分别取得55.6%和56.0%的高分。凭借其百万级的上下文窗口，M1在长上下文理解任务中具有压倒性优势，不仅超越所有开源模型，还在部分指标上接近OpenAI o3和Claude4Opus，在全球范围内位居第二。

　　在代理工具使用场景TAU-bench的评测中，M1不仅在所有开源模型中脱颖而出，还战胜了Gemini-2.5Pro。此外，M1-80k在多数基准测试中的表现都优于M1-40k，表明增加计算资源对提升模型性能有显著作用。在处理400页技术文档或10万行代码库时，传统模型需反复切分上下文，而M1可以做到整体消化、连贯推理，为智能体发展提供了开创性范例。

　　“M1打破了算力+资本的竞争模式，将对全球AI大模型市场产生深远影响。不过，对于更多AI领域企业来说，要从技术流派转向市场应用，以解决问题、实现任务为出发点，开拓医疗、健康、旅游、传媒等领域垂直类应用场景，才能在AI的规模化应用方面拥有更多想象空间和发展机遇。”资深创投专家、江苏投资人中心秘书长吴峰认为。

　　时值周末，许多市民和游客来到北京市海淀区三山五园文化艺术中心，参观这里举办的2025亚洲数字艺术展、薪传国粹——“万印楼”新藏当代国际篆刻精品展，感受艺术魅力，乐享周末美好时光。

　　本届年会将以“互联助力发展，合作共创繁荣”为主题，预计将有来自近100个国家和地区的3500余名嘉宾参会。

　　文化和旅游部6月3日公布2025年端午节假期文化和旅游市场情况。经测算，假期3天，全国国内出游1.19亿人次，同比增长5.7%；国内出游总花费427.30亿元，同比增长5.9%。

　　由中国铁建大桥局承建的渝万高铁珍溪河双线大桥顺利合龙，为全线按期通车奠定了坚实基础。

上一篇：AI赋能医疗健康产业开启智慧医疗新篇章！2025“天津高新显V力”第二季启动

下一篇：艾可蓝：控股子公司携手艾昆纬共推AI Agent技术赋能医疗健康产业革新

PG（中国大陆）官方网站-电子AI辅助平台

PG新闻 News 分类

上海AI企业发布首个混合架构开源模型

PG新闻
News

分类