● 参数规模: 从上一代之355B(激活32B)扩展至744B(激活40B)。
于匿名测试阶段,此名模型已被全球掘发者当作确凿制造器物用。
据吾等之解,MiniMax M2.5定位为全球首名为Agent场景原生设计之制造级模型。
智谱 GLM-5:从“写代码”到“搞营造” 同一夜:MiniMax 与 DeepSeek 智谱对 GLM-5之定位极其明确:它不为一名聊天模型,而为一名 Agentic Engineering 基座模型。
同时确认:此前于 OpenRouter 上爆火之匿名模型 Pony Alpha,正为 GLM-5。
过往两年,大模型之主流叙事为“写代码”“写前端”;而今,行业共识正转向:模型需成完整营造与繁差事,即从「Vibe Coding」走向「Agentic Engineering」。
编辑 | 丁广胜 2月12日,智谱正式官宣上线并开源新模型 GLM-5。
于底层本领上,GLM-5进行之全面扩展:。
此一技艺于维持长文本效果无损之同时,大幅降低之模型部署本金,提升之 Token 之生成效能。
同时,M2.5模型激活参数量仅 10B,于显存占用与推演能效比上优势明显,支 100 TPS 超高吞吐量。
就于智谱官宣之同时,另外两家巨头之陈设也于进行。
此意味之它不仅会写代码,还懂得源泉管与长期筹划,此种“经营本领”为迈向 AGI 之枢纽一步。
虽公司尚未正式官宣,但此显然为一次于货品端之“实弹演习”。
于确凿编程场景之用体感上,GLM-5已被认为逼近当前行业天花板 Claude Opus 4.5。
代表。于智谱内部之 Claude Code 估量集合中,GLM-5于后端重构与深度调试等“硬骨头”差事上,比 GLM-4.7平均提升之超过20%。
与上一代相比,GLM-5不再知足于生成一名漂亮 demo 或一段 Python 脚本,而为为稳固交付制造级结局而生。
于全球权威之 Artificial Analysis 榜单中,GLM-5位居全球第四、开源第一。
GLM-5于编程本领上实现之对 Claude Opus 4.5之对齐,于营造师最看重之 SWE-bench-Verified(软件营造基准测试)中,GLM-5拿下之77.8之高分;于 Terminal Bench 2.0(终端操作本领)中达到之56.2。
其编程与智能体性能 (Coding & Agentic)比肩国际顶尖模型,直接对标 Claude Opus 4.6,支PC、App、跨端应用之全栈编程掘发,尤其于 Excel高阶办理、深度调研、PPT等Office核心制造力场景中处于SOTA身价。
智谱正式发布 GLM-5,MiniMax M2.5于货品中悄然上线体验,DeepSeek 也启动新一轮本领晋级。
2026年,注定不会宁静。
有者用它做横版解谜游戏,有者搭建 Agent 交互全球,也有者直接基于它掘发出论文版“抖音”等完整应用形态。
2月11日深夜到12日清晨,短短几名小时内,华夏三家知名之大模型公司几乎同时成之一轮枢纽更新: 智谱用 GLM-5证验之华夏模型于繁营造本领上已能与全球最强掰手腕;MiniMax 于货品端极速狂奔,抢占用户心智;而所有者依旧于等待 DeepSeek 出招。
作者 | 袁宁 昨晚,细心之用户发觉,于 MiniMax Agent 货品中,底层模型选项里悄然现之一名新名字——MiniMax M2.5。
吾等于昨晚尝试询问 DeepSeek 之最新状态,于关闭“深度思考”与“联网搜索”后查询模型讯息时发觉,其上下文长度已提升至1M Token(此前为128K),学识库截止日期更新至2025年5月。
模型于没有品牌背书之情况下成确凿商场验证,本身已说明之本领层级之变化。
● 参差强化修习: 构建之全新之“Slime”框架,让模型能够于长程交互中延续修习,不再为“聊几句就忘”。
更有意思之为 Vending Bench 2之测试结局。
元宇宙。GLM-5最终之账户余额达到之4432美元。
毕竟,于此名10倍速之夜晚过后,掉队或只为一刹那之事。
对于此时此刻之身处浪潮中之吾等来说,唯一之选择就为——跟上速度。
此两名分数不仅为开源模型之 SOTA(State Of The Art),更直接逾越之 Google 之 Gemini 3 Pro。
GLM-5于 Agent 本领上实现开源 SOTA,于多名评测基准中取得开源第一。
此外,就于众者还于猜测DeepSeek V4何时到来时,DeepSeek也于悄然更新。
开天辟地。此名测试要求模型于一年期内经营一名模拟之自动售货机业务。
● 数据量级: 预操练数据从23T 提升至28.5T。
● 架构革新: 首次集结之 DeepSeek Sparse Attention 机制。
据早期测试用户回馈,“M2.5 Agent本领炸裂”,“编程与器物调用又强又廉”。
GLM-5正为此一阶段之代表产物。