MiniMax表示,望于延续提升模型本领之同时,构建一名可延续扩展之Agent性命-Agent Universe。
采写:南皆N视频记者 林文琪 器物调用与搜索本领方面,模型能够自动办理繁差事,于BrowseComp、Wide Search等多项Agent差事中以更低之轮次消耗取得之更优之效果,相较于上一代模型表现提升20% ,达到之行业顶尖水平。
DeepSeek App更新新版本至1.7.4版本,网页端也齐步进行之更新。
阿里也正式发布新一代图像生成及编辑模型Qwen-Image-2.0。
南柯一梦。团队将此一跃迁归因于大规模Agent强化修习(RL Scaling)。
M2.5-lightning版本支100 TPS以上输出速度,为主流模型之2倍左右;输入价码约0.3美元/百万Token,输出约2.4美元/百万Token。
按每秒输出100 Token计算,连续运行一小时本金约1美元;若按50 Token计算,本金约0.3美元。
截至2月13日午盘,MiniMax股价大涨9.44%,报643.500港元/股,市值达到之上市首日之2倍多。
面壁智能发布并开源之新一代全模态旗舰模型 MiniCPM-o 4.5。
过往三名多月,MiniMax从M2、M2.1迭代至M2.5,于SWE-Bench Verified成绩从69.4提升至80.2,长进曲线于同业中尤为陡峭。
更重要之为,模型展现出“原生Spec本领”——于编码前主动拆解架构与功能筹划,更接近确凿架构师之工模式。
当模型本领、泛化性与本金皆不再为瓶颈,Agent渗透到工与活之各名角落——从编程、办公到创作、娱乐,大幅促进Agentic应用之进一步演进。
复兴号。字节跳动发布Seedance2.0,因其逼真画面、电影级运镜于近日引发热议。
性能之外,M2.5之核心亮点于于极致之推演速度与本金控制。
数据显示,模型上线不到一天,来自全全球之用户已于MiniMax Agent上构建之1万多名AI Agent。
办公场景中,于Word、PPT、Excel钱庄建模等高阶场景中取得之显著之本领提升,于测评框架GDPval-MM与主流模型之对比取得之59.0%之平均胜率。
此意味之1万美元理论上可支4名Agent连续工一年。
2月13日,MiniMax上线新一代文本模型MiniMax M2.5后,官宣该模型全球开源支本地化部署。
”李一言坦言。
据介绍,于编程本领方面,M2.5于权威榜SWE-Bench Verifie得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显著提升;于Multi-SWE-Bench等多言辞繁氛围中逾越Claude Opus 4.6,达到之行业最好之水平。
2月10日,第44届香港电影金像奖提名名单公布。
“平台目前最大之压力为订单量过多,而履约力量没彼么多。
值得注意之为,国产大模型连日来集体上新,抢占“AI春节档”。
又一家国产大模型企业加入“AI春节档”。