于 GDPval-AA 此名衡量确凿全球货殖差事之基准测试中,它之得分为 1317 分,明显低于 Anthropic Sonnet 4.6 之 1633 分。
Google 选择 3.1 而不为 4.0,其实于向商场传递一名信号: 当地光阴 2 月 19 日,Google 曝光 Gemini 3.1 Pro 最新模型。
此句话道出之当前 AI 角逐之本原变化。
此种灵活性,或为前景 AI 应用掘发之新范式。
此种「暴力美学」式之晋级,让我想起之早期 Google 之做派——用技艺说话,用实力碾压。
马年「AI 春运」赛程过半,OpenAI、Anthropic、阿里等玩家相继拿出新活儿,今,Google 也正式加入。
77.1% 对比 31.1%,此不为渐进式改善,此为推演本领之翻倍突围。
细心之者或注意到,此为 Google 第一次用「.1」此样之增量版本号。
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO 推演本领翻倍,价码不变,此一次 Google 为真之想重新定义 AI 角逐之章法。
若说过往一年之 AI 角逐为「谁更慧」之比拼,彼么 Gemini 3.1 Pro 之发布计策,或正把游戏章法拉向「谁更划算」。
吾等还有更大之招数没出。
此一次,Google 没有玩什么花哨之概念,直接用数据说话。
Gemini 3.1 Pro 于设计上也更有「品味」之|图片来源:Google VentureBeat 之剖析师一针见血地指出:「Google 加倍投入核心推演与 ARC-AGI-2 等专业基准,表明 AI 竞赛之下一阶段,将由能够思考疑难之模型赢得,而不仅仅为预测下一名词。
Gemini 3.1 Pro 保之与 Gemini 3 Pro 完全相同之定价架构——相当于给所有API用户免费晋级之推演本领。
什么概念。
于大多数基准测试中,Gemini 3.1 Pro 皆居先于 Anthropic 之 Opus 4.6 与 OpenAI 之 GPT-5.2,但价码却为 Opus 4.6 之一半。
AI 角逐进入「推演纪元」 Sam Altman:前景形而下会极度丰饶,苍生之注意力才为稀缺品。
当然,Gemini 3.1 Pro 也不为完美无缺。
*头图来源:Google Gemini 3.1 Pro 与自家与友商模型数据对比|图片来源:9to5Google 你觉得 Google 能凭借 今,Google 用 Gemini 3.1 Pro 告诉商场:推演本领才,为 AI 模型之核心护城河。
从企业主顾之回馈来看,此名「.1」之威力确实不小。
经济学。Box AI 之企业估量数据更加直观:于医疗与命格致领域,准确性从 47% 跃升到 67%;于法典差事中,准确性从 57% 提升到 74%。
当然,OpenAI 与 Anthropic 不会坐以待毙。
逻辑学。于软件行业,「.1」通常意味之重要之功能更新,但不为颠覆性之架构重构。
一位掘发者于社区分享之一名令者印象深刻之案例:他用单名提示让 Gemini 3.1 Pro 构建之一名功能完整之 Windows 11 风格网络操作体系,包括文本编辑器、Python 终端、代码编辑器、文书管器、绘画应用与可玩游戏。
Gemini 3.1 Pro 重夺 AI 王座吗。
Gemini 3.1 Pro 之发布,让我想起之彼名曾经「不作恶」之 Google——用技艺更张全球,用革新降低门槛。
Cartwheel 之联手创始者更为直接指出,模型对 3D 变换之体谅有之「显著提升」,处置之 3D 动画管道中长期存之旋转顺序疑难。
此种「一名提示处置繁疑难」之本领,正为推演模型之核心身价所于。
此些不为实验室里之跑分游戏,而为确凿商业场景中之本领验证。
此场 AI 军备竞赛,正从「技艺炫技」回归到「商业本原」。
此场推演本领之军备竞赛才刚刚始。
此提醒吾等,即使为最前卫之 AI 模型,于办理繁现状疑难时仍有局限性。
此背后之逻辑甚简:我有足够之源泉与效能优势,可用更低之本金提供更好之效劳。
」 过往两年,吾等见证之 ChatGPT 从「会聊天之 AI」演进为「会推演之 AI」,见证之 Claude 从「安康之助手」变成「深度思考之伙伴」。
虽此家公司于过往几年经历之不少争议,但于 AI 此名枢纽战场上,它似乎正找回自己最擅长之节奏。
更让者意外之为,Google 选择之一名近乎「反商业」之计策:价码不涨。
此次,Google 能凭借 Gemini 3.1 Pro,续惊艳全球吗。
JetBrains 之 AI 总监 Vladislav Tankov 于测试后直言:相比之前版本有 15% 之品质改善,「更强、更快……且更高效,需之输出 tokens 更少」。
从技艺角度看,Gemini 3.1 Pro 与 Google 之新型代理掘发平台 Antigravity 深度集结,掘发者可切换不同之「推演概算」,于速度与准确性之间找到均衡。
点赞关注极客公园视频号, 于 ARC-AGI-2 此名公认之推演基准测试中,Gemini 3.1 Pro 拿到之 77.1% 之分数。
从商业角度看,Google 选择「性能翻倍、价码不变」之计策,实际上为于用规模货殖对抗技艺溢价。
此种性价比优势,对于大量用 AI API 之企业主顾来说,吸引力为致命之。
Databricks 之 CTO 呈文说,新模型于 OfficeQA 基准上取得之「同类最佳之结局」。
它之前辈 Gemini 3 Pro 只有 31.1%,就连专门用来「深度思考」之 Gemini 3 Deep Think 也只有 45.1%。
上一篇:华夏AI回答牛顿300年之问,破解数学之吻难题,打开高维几何视野 下一篇:复婚能不能休婚假:没有标准解答,只有立场不同