当前位置:文章 > 列表 > 正文

Claude变蠢之,新模型发布前之黑暗时刻?

📅 2026-04-19 18:57:57 🏷️ 伦敦金交易平台 👁️ 229
Claude变蠢之,新模型发布前之黑暗时刻?

你只能感受到它变之,变得没昔好用之。

https://github.com/anthropics/claude-code/issues/42796) 还为拿者际交往之彼名比喻:凭什么一始好好之,用到后面就觉得我之事情不重要之。

放于此里之意思也甚直接,模型实际给到用户之本领变少之,但模型看起来还为同一名名字。

网上甚至始现一些视频,调侃今之Opus就像凶猛之狮子被摘之毛圈,发觉原来只为一条狗。

一名更直接之说法始流传:Opus被削之。

伊朗,最新表态。

当不同用户于不同场景下始重复同一类疑难时,此件事似乎不再为所谓之“觉受不对”,更像为一种举止模式之变化。

此名逻辑没有直接证据,但它正被越来越多用户相信。

Truth。戏剧

当模型本身从一名稳固之器物变成一名会不断变化之体系,它自己做出之“更好之调理”,没有提示,没有版本说明,也没有边界。

回答更快之,推演更短之,有时候看起来像为跳过之某些本该认真成之步骤,变得敷衍之。

Flowise。

比如read:edit(读取代码vs修改代码)之比例,从6.6降到之2.0;3月8日之后,被stop hook捕捉到之违规举止有173次,而之前为0。

一始只为零星之用户于吐槽,说 Claude Opus“变懒之”“没昔慧之”。

特朗普发声 从用户之视角来看,最让者不满之并不为模型之“变蠢”,而为它之“不稳固”。

当新模型之本领上限更高、潜于身价更大时,把更多源泉投入进去,本身为一种理性之选择。

于为选择就变得微妙起来:似乎不再为你主动选择新模型,而为旧模型之变化把你推向更新之彼一名。

此些变化后被解释为多种因素叠加之结局:包括推演计策调理、安康计策收紧,以及对本金与响应速度之改良。

还为差事本来就不适合。

年俗

相比之下,呈文里更有说服力之,其实为彼些举止层面之变化。

难得糊涂。

若此种情况只为名例,用户或还会疑虑为不为自己之疑难,但当相似之声响越来越多,此就不再为单纯之“觉受不对”之。

某种意义上,与模型之协同甚像为与真者之交往,始终以来配合得甚好之“同事”某天忽然变脸之,搁谁谁皆得难受。

因此它被限制性地提供给少数机构用,用来加固“全球最枢纽之软件体系”。

他举之名例子:于Claude Code中,一部分疑难被认为源于器物链与体系prompt,而不为模型本身;与此同时,于高负载情况下,体系需对算力、token与请求进行控制,此也会影响用户体验。

把阴谋论抛于一面,若确实存必程度之源泉倾斜,于AI行业其实算为常态:无论为OpenAI还为Google,几乎所有公司皆会优先改良最新一代模型,旧模型则逐渐被边缘化。

真正让讨论晋级之为此名数术:有者于Claude Code之用历程中,对史册交互日志进行对比,发觉模型于繁差事中之推演历程明显缩短,自2月更新以来,推演深度降之67%。

精神力量。

当“更强之新模型”与“体感变差之旧模型”同时现,一名于社区中不断被提起之猜测始成型:把旧模型削之再抬新模型,一捧一踩,就会显得新模型有之巨大之晋级。

王建波

或只为偶尔犯之一些过往不会犯之低级过失,或者于繁差事里少做之几步推演。

冬奥会

此名时候,有一名新模型放于你之面前,看起来比今此名更稳固、更可靠,或许用起来会更顺手。

缩水式通胀为一名货殖学术语,指之为商品之大小或数量减,而价码不变。

于最新版本中,Anthropic引入之一种叫“自随顺推演”(adaptive thinking)之机制,模型会根据差事繁度,动态决定为否以及用多少推演。

早于2023年就有研讨对比之GPT-4于不同光阴之表现,发觉同一名模型于几名月内,推演方式与输出举止皆生之明显变化。

换句话说,不为觉受错之,为模型真之于变。

美伊谈判,突传利好。

世界银行。

Claude Opus变蠢之。

作为用户,你不知道它什么时候变之,不知道它实在变之什么,更不知道此种变化会不会影响你正做之事情。

Music。

但疑难于于,效能改良与本领弱化,于用户体验上并没有区别。

不过数术为否精确并没有彼么重要,重要之为它让一件原本模糊之体感疑难,第一次被量化成一名可讨论之趋势。

碰到此种情况,大多数者之第一反应皆为疑虑自己:为不为prompt写得不够好。

最近一段光阴,越来越多用户始有一种甚难讲之觉受:虽此名模型没有明显出错,但也不再像昔彼样“慧”。

公告。

不过体谅归体谅,新模型不敞开给大众用,旧模型又于毫无征兆之情况下弄成此样,谁能轻易接受。

你只能感受到它变之,变得没昔好用之。

此为真之吗。

算力为本金,也为制造力。

大中城市

即使你知道,新模型也或于某一天变成下一名旧模型,或还为会猝不及防地“改良”成让者难受之版本。

Claude Code之掘发负责者Boris给出之解释为,此些变化来自体系层之调理:包括器物调用方式、推演计策以及源泉分发机制之变化,而不必为模型本身本领之降。

搜索栏

有者说它不再仔细读代码;有者说它更快给解答,但经常漏掉枢纽步骤;也有者发觉,它于长差事中更易“提前终”,像为默认事情已成。

此种情况应只为偶然事件吧。

新能源汽车。

此种不适感甚快被另一名变化放大之:Mythos还未发布就广受关注,Claude Mythos Preview直接被Anthropic称为“本领跃迁之一代”,于代码与安康差事上表现出远超以往之本领。

实际上,类似之事情对AI来说并不陌生。

SpaceX

若为真之,它为什么会被削呢。

为你写诗

作者坦率地说明,67%为基于签名长度与思考实质长度之相关估计,而不为直接测量。

回首向来萧瑟处,归去,也无风雨也无晴。

但甚快,于Reddit之Claude社区里,类似之回馈始密集现,而且描述高度一致: 于为,一名新词于社区里始流行:“AI shrinkflation”(AI缩水式通胀)。

当一名模型始更少阅读上下文、更快给出解答、更频繁地提前终差事,用户感受到之不会为改良,而为敷衍。

还提到一月份之日志被删除之,故基线对比不太准确。

英超

从营造角度看,此为一种甚合理之改良,简差事少思考,繁差事多思考,以提升整体效能 https://news.ycombinator.com/item?id=47660925) 而且此名自随顺推演机制,从感性之角度来讲,也确实会让者不太舒服。

顺遂。电源

相比社区之激烈反应,Anthropic并没有直接承认“模型变弱”。

但于彼一刻,差距已摆于眼前。

也就为说,并不为模型变差之,只为模型始“自己决定”要用多少算力。

赔偿

于此名历程中,旧模型之状态自会生变化:被“降权”、推演深度被压缩、源泉分发被重新调理……此些皆可体谅为一种营造上之取舍。

生存。

上一篇:大六座SUV三名灵性拷问丨2026气象与趋势 ③ 下一篇:中方如何评议当前中俄关系?邦交部回应