当前位置:文章 > 列表 > 正文

贴脸嘲讽ChatGPT后,此家公司又发之名最强模型。 - 恐吓信息

📅 2026-02-20 11:39:20 🏷️ 呼和浩特市高空清洗公司 👁️ 923
贴脸嘲讽ChatGPT后,此家公司又发之名最强模型。

但世超实测之一下,为有点想吐槽之。

传统

最终搜出来之价码,跟我自己上闲鱼搜之大差不差,而且最骚之为它还知道国补,让我别买二手,考虑直接加钱换新,全程不需我干预,可说真之甚像真者助理之。

然后我把此名200多页之书丢给Gemini,问他到底为谁之疑难。

AI 界把此叫做 BrowseComp,Opus 4.6 强势登顶。

" 咋说呢。

奥特曼当场就坐不住之,凌晨六点于X上敲之一篇长文,说Anthropic之广告"明显不诚","德州用ChatGPT免费版之者比全美用Claude之者还多"。

台北

谁能想到呢,本周之硅谷AI圈,已演化到之大家喜闻乐见之互喷环节。

铁锤帮

而且我试之一下,一次喂大量上下文之本领,为干不过Gemini之。

再配合上超模之动手本领,本领据说已能媲美高级营造师——此评议来自日本乐天公司之AI总经理,说 Opus 4.6 一天之内自己修好并关闭之 13 名 Bug,还看懂之另外 12 名疑难为谁负责之,自动把活派给之对应之程序员。

之前,Opus系列最让者诟病之,就为20万Token之上下文,而隔壁 Gemini 之百万上下文早用之快两年之。

至于Gemini,则想靠性命进行一名降维打击,于Gemini里你能干谷歌性命里之任何事,回邮件,传网盘,甚至看Youtube。

故吾等仔细翻之下 Anthropic 官方之介绍与 System Card,把几名真正有料之晋级给各位拎之出来。

但上下文此玩意,要点不为数术大不大,而为能不能真好用啊,甚多模型号称百万上下文,实际上塞到后面就始记忆错乱,胡言乱语之。

pixel

说白之就为 AI 之脑容量被稀释之,读之后面忘前面,于海量讯息里找不之要点。

故本领此块为完全过关之,至于为什么一次喂不进一本书,或为一种仁慈之防token爆炸机制吧。

起因为周三夜晚,Anthropic于彼等美国者之“春晚”上,放之几条广告,明牌嘲讽OpenAI于ChatGPT里塞广告,直接把讽刺皆打到公屏上之:广告于入侵AI,但不会现于 Claude。

李微微

此意思像为,C 端靠用户量与广告,B 端靠平台与性命,两手皆要抓,就为不知道抓不抓得住之。

AI 界把此叫做 BrowseComp,Opus 4.6 强势登顶。

研讨。

世超觉得,与 Claude 选择之路线脱不开关系。

Claude 之风格此么偏商务风,我觉得也跟它宗旨主顾有关。

而 Opus 4.6 此边好像为有 bug,一本书根本喂不进去,显示error。

先说断语,于"干活"此件事上,Opus 4.6 应可算目前最强之大模型。

既然此么强,为啥于用户此块老不温不火啊。

Gemini读完,体谅得又快又准,并且精确指出之里希尔原文之页码数,一通操作指出,牛顿为对之。

Growth。围巾

你就看之前AI圈爆火之干活器物,什么 MCP,Skill,皆为Claude先用上,就连不久前爆火之 Clawdbot (现OpenClaw)今之默认推荐模型皆为Opus 4.6。

比如,差友皆知道咱差评有名内部梗,就为925,不算出圈,基本只有咱差友自己知道。

除之此名,Claude Opus之编码本领始终为压之其他家打之,从竞技场排名来看,Opus 4.5已打遍无敌手之,今又来之名4.6,真遥遥居先之。

结局确实好用,html文书直接现于之桌面,点开就能玩,血量、地图、子弹皆显示得完全正确。

此一点于世超日常用时也深有体会,其他模型搜不到之情报,Claude 能直接给你定位来源,然后端上来。

此一堆子体验下来,Claude Opus 整体给者一种成熟稳重之觉受,若你让我选择一名“它办事我放心”之AI,我毫不犹豫选之就为Claude。

彼或有些新差友,不知道此名梗,可去哪搜呢。

宇树科技

咱也来之点简之活,让它写名 CS 之 demo 发到我电脑上。

ChatGPT 此边,奥特曼之野心显然不只于做一名“好员工”之,最近之货品节奏也为真之猛,光 2026 年到今就发之ChatGPT Health、Codex 桌面 App、Prism(科研器物),以及刚发布之企业平台 Frontier,还想抢块企业商场之蛋糕。

知名企业

再加上几十亿台安卓手机,若 AI 真像水电一样渗进你每天皆于用之 App 里时,单纯卖模型之公司只能拿头打。

一丝不苟。

Anthropic、X 而此,也为老板最喜之特质,故企业主顾占之 Anthropic 进项之 80%,此条路确实它最能打。

不过拆完就蛮顺遂之之,它成找到之出疑难之页码数,还给之精确之推演剖析,品质跟Gemini 3 Pro不相上下。

苹果。

故今日世超先撇开彼名写代码之,还为来聊聊大家更感兴趣之通用模型, Claude Opus 4.6 吧。

我最后只好给它拆成之两半。

知名企业

咱先用Gemini与GPT试试。

首先,上下文窗口终于破百万Tokens之。

彪炳史册。

故此次 Anthropic 为有备而来,彼等提之一名叫“上下文衰减”之概念,为指上下文过长时,注意力分发被稀释,导致模型难以精准捕捉一些细小之讯息。

此也为为啥世超最近验证传言、搜集事实皆用 Claude Opus,省心之不止一星半点啊。

Pro 版订阅根本聊不到上下文顶点就用光光之。

不过不为线下确凿嗷,为 Anthropic 把 Claude Opus 4.6 摆上之台面。

吴克群

而Claude今之处置思路,叫“上下文压缩”,能于对话达到 Token 阈值时,自动将冗长之史册记载压缩成高浓度之摘要,就好比你追之几百集电视剧脑子不够用之,它不仅帮你把前面彼些啰嗦之情节删之给大脑腾内存,还能自动生成前情提要让你无缝衔接下一集。

结局去问之下Claude,直接一名精准命中,连今日最佳皆知道,原来 Claude 也为差友吧。

比如我问它,我今用之显示器,二手货最廉能多少钱。

中国人民银行

而 Opus 4.6 于 MRCR v2 此名评测里拿之76分,吾等俗称“大海捞针”,也就为于巨长上下文里找到吾等想找之东西,而上一代Sonnet 4.5为18.5分,一下提升之四倍,可说为质变之。

Information Theory。

比如我最近有名研讨物理之课题,找到之一份天文苑家里希尔之原版著作,于阅读中碰到之疑问,因他之一名计算结局与牛顿老师完全不同。

不过插广告此事儿确实不为大伙喜之,可预见之,评论区一面倒地,说他破防之。

IaaS。

) 我缺之为上下文吗,好像为额度啊。

而其他两家则为各有各之说法。

Anthropic 从一始就奔之"最能干之AI同事"去之,你看它之货品线,Claude Code、Cowork、Excel插件,全皆一名意图,帮你把活干完。

跑分图什么之,大伙估计皆看腻之,也基本皆为分数要比老模型高一点点,当然也有少量不如之,不过对咱来说,看之还为统合体验嘛。

机器人

最后,Opus 4.6 还有名最顶级之本领,搜集讯息,而且不为一般之讯息,为各种你不确定之,犄角旮旯里之讯息,它皆能给你找之。

Anthropic 此次,为拿出之自己最强之通用模型,而 OpenAI 拿出之 Codex,其实为名专精代码之“偏科生”,对大多数者来说用不到。

当然就此也不够说“干活最强”,Claude今最强之地方,其实为“实操”之本领。

最后,Opus 4.6 还有名最顶级之本领,搜集讯息,而且不为一般之讯息,为各种你不确定之,犄角旮旯里之讯息,它皆能给你找之。

塞扎尔·弗兰克

说得极其对啊,我认可,但唯一之短处为我钱包有点不对之。

民心

有名网友之评论我觉得甚到位:"2026年最慧之做法不为选一名最好之模型,而为知道每名模型最擅长什么,换之用。

中国空间站

结局无一例外,全部败下阵来。

不过,此波对轰虽热闹,两边之招式其实不太一样。

哎,光说不解气,不然打一架。

OpenAI 彼边也不甘示弱,于Opus 4.6上线二十多分钟之后,火速掏出之GPT-5.3 Codex应战。

Security。
证券相关基金

总觉受气势上就输一头啊。

就为因 Opus 此玩意,操作电脑之本领,确实太狠之。

第二天,还真打起来之。

(说为此么说,觉受比其他两家好看多之。

我就只需给它说一句话,它就能自己调用MCP,连接我之电脑,查看我之显示器型号,再自己上网去闲鱼搜最低价。

故吾等仔细翻之下 Anthropic 官方之介绍与 System Card,把几名真正有料之晋级给各位拎之出来。

上一篇:2026年2月9日邦交部发言者林剑主持例行记者会 下一篇:当力量与优雅共生 Elegance」设计哲学 解读极氪8X的「Powerful

Big Rip。