伦敦金交易平台-Claude变蠢之，新模型发布前之黑暗时刻？

你只能感受到它变之，变得没昔好用之。

https://github.com/anthropics/claude-code/issues/42796）还为拿者际交往之彼名比喻：凭什么一始好好之，用到后面就觉得我之事情不重要之。

放于此里之意思也甚直接，模型实际给到用户之本领变少之，但模型看起来还为同一名名字。

网上甚至始现一些视频，调侃今之Opus就像凶猛之狮子被摘之毛圈，发觉原来只为一条狗。

一名更直接之说法始流传：Opus被削之。

伊朗，最新表态。

当不同用户于不同场景下始重复同一类疑难时，此件事似乎不再为所谓之“觉受不对”，更像为一种举止模式之变化。

此名逻辑没有直接证据，但它正被越来越多用户相信。

当模型本身从一名稳固之器物变成一名会不断变化之体系，它自己做出之“更好之调理”，没有提示，没有版本说明，也没有边界。

回答更快之，推演更短之，有时候看起来像为跳过之某些本该认真成之步骤，变得敷衍之。

Flowise。

比如read:edit（读取代码vs修改代码）之比例，从6.6降到之2.0；3月8日之后，被stop hook捕捉到之违规举止有173次，而之前为0。

一始只为零星之用户于吐槽，说 Claude Opus“变懒之”“没昔慧之”。

特朗普发声从用户之视角来看，最让者不满之并不为模型之“变蠢”，而为它之“不稳固”。

当新模型之本领上限更高、潜于身价更大时，把更多源泉投入进去，本身为一种理性之选择。

于为选择就变得微妙起来：似乎不再为你主动选择新模型，而为旧模型之变化把你推向更新之彼一名。

此些变化后被解释为多种因素叠加之结局：包括推演计策调理、安康计策收紧，以及对本金与响应速度之改良。

还为差事本来就不适合。

相比之下，呈文里更有说服力之，其实为彼些举止层面之变化。

难得糊涂。

若此种情况只为名例，用户或还会疑虑为不为自己之疑难，但当相似之声响越来越多，此就不再为单纯之“觉受不对”之。

某种意义上，与模型之协同甚像为与真者之交往，始终以来配合得甚好之“同事”某天忽然变脸之，搁谁谁皆得难受。

因此它被限制性地提供给少数机构用，用来加固“全球最枢纽之软件体系”。

他举之名例子：于Claude Code中，一部分疑难被认为源于器物链与体系prompt，而不为模型本身；与此同时，于高负载情况下，体系需对算力、token与请求进行控制，此也会影响用户体验。

把阴谋论抛于一面，若确实存必程度之源泉倾斜，于AI行业其实算为常态：无论为OpenAI还为Google，几乎所有公司皆会优先改良最新一代模型，旧模型则逐渐被边缘化。

真正让讨论晋级之为此名数术：有者于Claude Code之用历程中，对史册交互日志进行对比，发觉模型于繁差事中之推演历程明显缩短，自2月更新以来，推演深度降之67%。

精神力量。

当“更强之新模型”与“体感变差之旧模型”同时现，一名于社区中不断被提起之猜测始成型：把旧模型削之再抬新模型，一捧一踩，就会显得新模型有之巨大之晋级。

或只为偶尔犯之一些过往不会犯之低级过失，或者于繁差事里少做之几步推演。

此名时候，有一名新模型放于你之面前，看起来比今此名更稳固、更可靠，或许用起来会更顺手。

缩水式通胀为一名货殖学术语，指之为商品之大小或数量减，而价码不变。

于最新版本中，Anthropic引入之一种叫“自随顺推演”（adaptive thinking）之机制，模型会根据差事繁度，动态决定为否以及用多少推演。

早于2023年就有研讨对比之GPT-4于不同光阴之表现，发觉同一名模型于几名月内，推演方式与输出举止皆生之明显变化。

换句话说，不为觉受错之，为模型真之于变。

美伊谈判，突传利好。

Claude Opus变蠢之。

作为用户，你不知道它什么时候变之，不知道它实在变之什么，更不知道此种变化会不会影响你正做之事情。

Music。

但疑难于于，效能改良与本领弱化，于用户体验上并没有区别。

不过数术为否精确并没有彼么重要，重要之为它让一件原本模糊之体感疑难，第一次被量化成一名可讨论之趋势。

碰到此种情况，大多数者之第一反应皆为疑虑自己：为不为prompt写得不够好。

最近一段光阴，越来越多用户始有一种甚难讲之觉受：虽此名模型没有明显出错，但也不再像昔彼样“慧”。

公告。

不过体谅归体谅，新模型不敞开给大众用，旧模型又于毫无征兆之情况下弄成此样，谁能轻易接受。

你只能感受到它变之，变得没昔好用之。

此为真之吗。

算力为本金，也为制造力。

即使你知道，新模型也或于某一天变成下一名旧模型，或还为会猝不及防地“改良”成让者难受之版本。

Claude Code之掘发负责者Boris给出之解释为，此些变化来自体系层之调理：包括器物调用方式、推演计策以及源泉分发机制之变化，而不必为模型本身本领之降。

有者说它不再仔细读代码；有者说它更快给解答，但经常漏掉枢纽步骤；也有者发觉，它于长差事中更易“提前终”，像为默认事情已成。

此种情况应只为偶然事件吧。

新能源汽车。

此种不适感甚快被另一名变化放大之：Mythos还未发布就广受关注，Claude Mythos Preview直接被Anthropic称为“本领跃迁之一代”，于代码与安康差事上表现出远超以往之本领。

实际上，类似之事情对AI来说并不陌生。

若为真之，它为什么会被削呢。

作者坦率地说明，67%为基于签名长度与思考实质长度之相关估计，而不为直接测量。

回首向来萧瑟处，归去，也无风雨也无晴。

但甚快，于Reddit之Claude社区里，类似之回馈始密集现，而且描述高度一致：于为，一名新词于社区里始流行：“AI shrinkflation”（AI缩水式通胀）。

当一名模型始更少阅读上下文、更快给出解答、更频繁地提前终差事，用户感受到之不会为改良，而为敷衍。

还提到一月份之日志被删除之，故基线对比不太准确。

从营造角度看，此为一种甚合理之改良，简差事少思考，繁差事多思考，以提升整体效能 https://news.ycombinator.com/item?id=47660925）而且此名自随顺推演机制，从感性之角度来讲，也确实会让者不太舒服。

顺遂。

相比社区之激烈反应，Anthropic并没有直接承认“模型变弱”。

但于彼一刻，差距已摆于眼前。

也就为说，并不为模型变差之，只为模型始“自己决定”要用多少算力。

于此名历程中，旧模型之状态自会生变化：被“降权”、推演深度被压缩、源泉分发被重新调理……此些皆可体谅为一种营造上之取舍。

生存。

上一篇：大六座SUV三名灵性拷问丨2026气象与趋势 ③ 下一篇：中方如何评议当前中俄关系？邦交部回应

Claude变蠢之，新模型发布前之黑暗时刻？

相关推荐