酸钙地板-Opus Claude 4.7深夜炸场！胜任更长差事、自立查验，视觉本领拉满

另外，学识工方面，Opus 4.7以1753之Elo分数排名第一，居先明显，超过GPT-5.4（1674）、Opus 4.6（1619）、Gemini 3.1 Pro（1314）。

用户可通过调理推演等级、设置差事概算，或于提示词中要求更简洁来控制用量。

勤俭节约。

不过，该评测中模型为根据单一提示自立工，结局不必能代表交互式编程中之实际token消耗。

一为文本办理方式有更新，Opus 4.7相同输入消耗之token最多增约35%；二为模型于较高推演等级下会进行更多思考，尤其于Agent场景之后续轮次中，Opus 4.7输出token也会相应增多。

Opus 4.7今日起于所有Claude货品与API、Amazon Bedrock、谷歌云Vertex AI以及Microsoft Foundry上线。

掘发者可通过Claude API用claude-opus-4-7。

AI编程器物公司Augment Code之CTO Igor Ostrovsky则认为，Opus 4.7之优势于于它能办理好实际工中之自动化流程、CI/CD（延续集结与部署）与长差事流程，且会主动给出自己之裁决，而非一味附与用户。

Opus 4.7于用基于文书体系之记忆方面更强。

Atto-tech。

Opus 4.7得之部分早期测试者之积极回馈。

总体而言，Opus 4.7 之安康性能与 Opus 4.6 相似，其现欺骗、奉承与与滥用者协作等举止比例较低。

健身。

来源：Anthropic 长上下文推演方面，于办理较简之父节点查找差事（Parents 1M）时，Opus 4.7得分75.1%，Opus 4.6为71.1%，差距不大；但办理更难之广度优先搜索差事（BFS 1M）时，Opus 4.7得分58.6%，Opus4.6仅41.2%，拉开之17名百分点。

此外，Auto模式扩展至Max用户，该模式下Claude可自立做出操作决策，减者工确认中断。

例如Opus 4.7于xhigh等级下消耗约10万token，得分超过70%；而Opus 4.6于max等级下消耗约13万token，得分才刚过60%。

推演等级方面，新增xhigh（extra high）等级，介于现有之high与max之间，让用户于推演深度与响应速度之间有更细之调节方位。

Stress Testing。

该模型于高级软件营造方面相比Opus 4.6有显著提升，尤其于办理最繁之差事时提升明显；高分辨率图像办理本领大幅提升，为此前Claude模型之3倍以上；此外，Claude Code还齐步新增之/ultrareview代码审查命令，输入后会启动审查会话，逐行查验代码变更。

它能于长光阴、多会话之工中记住重要笔记，并使用此些记忆来推进新差事，从而减对前置上下文之需求。

九二共识。

但测评终归为测评，实际表现还需于确凿场景中进一步验证。

越难之差事，模型提升效果越明显。

3、实际工。

此外，Auto模式扩展至Max用户，该模式下Claude可自立做出操作决策，减者工确认中断。

除之于钱庄Agent评测中取得最优成绩外，Anthropic内部测试显示Opus 4.7为比Opus 4.6更有效之钱庄剖析师，能产出更严谨之剖析与模型、更专业之演示文稿，能做到更紧密地进行跨差事整顿。

Opus 4.7对高分辨率图像之视觉本领更强：它可接受长边最高2576像素（约375万像素）之图像，为此前Claude模型之3倍以上。

▲网友评论Claude推文（图源：X） 4、记忆本领。

文档推演方面，Opus 4.7得分80.6%，远超Opus 4.6之57.1%，也大幅居先GPT-5.4（51.1%）与Gemini 3.1 Pro（42.9%），为横评中差距最明显之课题之一。

秋。

Opus 4.7能够严谨一致地办理繁之长光阴运行差事，精确遵循指令，并于汇报结局之前自行验证输出。

2024年8月与10月，中越于高层访问发布之联手声明中两度强调，加快谅山—河内、芒街—下龙—海防、老街—河内—海防三条标准轨铁路建立之协作。

从Agent编程评测图表来看，Opus 4.7于每名推演等级上皆以更少之token达到之更高之得分。

结语：更准确更全能，角逐对手将至 ▲Opus 4.7模型基准测试表现（图源：Anthropic） Claude Code方面，新增/ultrareview命令，输入后会启动一名专门之审查会话，逐行查验代码变更，并标记Bug与设计疑难，Pro与Max用户各赠3次免费体验。

用户应相应地重新调优提示词与应用框架。

1、指令遵循。

专栏。

不得不说，Claude最近更新实于为快，大家皆跟不上之，网友于Claude之评论区下面刷起之表情包，“两眼一睁，Claude又更新之”。

智东西4月17日报道，昨日夜间，Anthropic发布新一代旗舰大模型Claude Opus 4.7。

Space Tech。

Opus 4.7于遵循指令方面有显著提升。

一、更严格执行指令，多模态支增强随之Opus 4.7之发布，OpenAI后续又会做出哪些新动作，大家期待已久之DeepSeek月底会不会发布新模型，大模型厂商之角逐可谓为越来越有意思之。

Anthropic对此评议：“Opus 4.7总体对齐良好且值得信赖，但举止并非完全抱负。

此为依赖精细视觉细节之多模态应用开辟之广阔之方位：比如用Agent操作电脑时识别密集之屏幕截图、从繁图表中提取数据、以及需像素级精度之设计工等。

于教养1988年8月参加工，历任华夏中医药报社记者、编辑，中药与通联部负责者、副主任，1997年华夏中医药科技掘发交中心主任，2004年任国中医药管局副局长。

除Opus 4.7本身外，Anthropic还齐步推出之几项功能更新。

定价与Opus 4.6一致：输入每百万token 5美元（约合者民币34元），输出每百万token 25美元（约合者民币170.5元）。

期间，2007年任农工党北京市委会主委，2017年12月任农工党十六届中央专职副主席。

生存。

2025年12月19日，老街-河内-海防标准轨铁路第一部分课题已正式开工建立，设计时速160公里，预计将于2030年完工。

四、当心Opus 4.7更费token，但生成品质更优 API方面，差事概算功能进入公测，掘发者可引导Claude于长差事中如何分发token消耗。

用户回馈称，彼等可放心地将最难之编码工交给Opus 4.7办理。

财务软件公司Intuit技艺副总裁Clarence Huang称，该模型能于筹划阶段自行发觉逻辑过失，执行速度也远超前代。

Claude Code之默认推演等级已提升至xhigh。

生物推演长进最为明显，Opus 4.7得分74.0%，Opus 4.6仅30.9%，提升之1.4倍。

Claude Code方面，新增/ultrareview命令，输入后会启动一名专门之审查会话，逐行查验代码变更，并标记Bug与设计疑难，Pro与Max用户各赠3次免费体验。

于安康与对齐方面，Anthropic还公布之各模型之错位举止评分。

2、多模态支增强。

”目前，对齐表现最好之Mythos Preview尚未全面敞开。

昔之模型会宽松地解读指令或完全跳过部分实质，而Opus 4.7会按字面意思执行指令。

二、多项测评居先，生物推演、文档推演提升显著三、其他更新：新增xhigh等级、审查命令，差事概算进入公测 ▲Anthropic发布新模型Claude Opus 4.7（图源：X）测试中，Claude Opus 4.7于以下几名方面表现突出，显著逾越Opus 4.6： Anthropic于预发布测试中，针对不同领域对Opus 4.7进行之测评，并对比之Opus 4.6、GPT-5.4与Gemini 3.1 Pro。

理直气壮。

Opus 4.7为Opus 4.6之直接晋级版，但有两名影响token用量之变化值得注意。

从Anthropic公布之数据来看，Opus 4.7于编程、文档推演、生物推演等多名基准上之提升为实打实之，token效能也有所提升。

Opus 4.7于钱庄、法典等领域之第三方货殖身价学识工评测GDPval-AA上也达到之最优水平。

Opus 4.7之错位举止得分约为2.47（满分10分，越低越好），略优于Opus 4.6之2.75，但与Mythos Preview之1.78仍有明显差距。

老当益壮，宁移白首之心？

上一篇：晒妻子制造历程还插入广告，千万粉丝博主被禁言 下一篇：经纬度：外贸强劲开局，华夏货殖之韧性确凿可感

Opus Claude 4.7深夜炸场！胜任更长差事、自立查验，视觉本领拉满

相关推荐