当前位置:文章 > 列表 > 正文

贴脸嘲讽ChatGPT后,此家公司又发之名最强模型。 - 姜晓丽

📅 2026-02-20 19:17:14 🏷️ 非遗技艺六堡茶公司 👁️ 600
贴脸嘲讽ChatGPT后,此家公司又发之名最强模型。

我就只需给它说一句话,它就能自己调用MCP,连接我之电脑,查看我之显示器型号,再自己上网去闲鱼搜最低价。

故本领此块为完全过关之,至于为什么一次喂不进一本书,或为一种仁慈之防token爆炸机制吧。

(说为此么说,觉受比其他两家好看多之。

奥特曼当场就坐不住之,凌晨六点于X上敲之一篇长文,说Anthropic之广告"明显不诚","德州用ChatGPT免费版之者比全美用Claude之者还多"。

电影。

而 Opus 4.6 此边好像为有 bug,一本书根本喂不进去,显示error。

再加上几十亿台安卓手机,若 AI 真像水电一样渗进你每天皆于用之 App 里时,单纯卖模型之公司只能拿头打。

谁能想到呢,本周之硅谷AI圈,已演化到之大家喜闻乐见之互喷环节。

此一堆子体验下来,Claude Opus 整体给者一种成熟稳重之觉受,若你让我选择一名“它办事我放心”之AI,我毫不犹豫选之就为Claude。

带动。好房子

故吾等仔细翻之下 Anthropic 官方之介绍与 System Card,把几名真正有料之晋级给各位拎之出来。

咱先用Gemini与GPT试试。

ChatGPT 此边,奥特曼之野心显然不只于做一名“好员工”之,最近之货品节奏也为真之猛,光 2026 年到今就发之ChatGPT Health、Codex 桌面 App、Prism(科研器物),以及刚发布之企业平台 Frontier,还想抢块企业商场之蛋糕。

故此次 Anthropic 为有备而来,彼等提之一名叫“上下文衰减”之概念,为指上下文过长时,注意力分发被稀释,导致模型难以精准捕捉一些细小之讯息。

比如我问它,我今用之显示器,二手货最廉能多少钱。

故吾等仔细翻之下 Anthropic 官方之介绍与 System Card,把几名真正有料之晋级给各位拎之出来。

不过,此波对轰虽热闹,两边之招式其实不太一样。

特朗普

不过不为线下确凿嗷,为 Anthropic 把 Claude Opus 4.6 摆上之台面。

先说断语,于"干活"此件事上,Opus 4.6 应可算目前最强之大模型。

Anthropic、X 而此,也为老板最喜之特质,故企业主顾占之 Anthropic 进项之 80%,此条路确实它最能打。

OpenAI 彼边也不甘示弱,于Opus 4.6上线二十多分钟之后,火速掏出之GPT-5.3 Codex应战。

再配合上超模之动手本领,本领据说已能媲美高级营造师——此评议来自日本乐天公司之AI总经理,说 Opus 4.6 一天之内自己修好并关闭之 13 名 Bug,还看懂之另外 12 名疑难为谁负责之,自动把活派给之对应之程序员。

AI 界把此叫做 BrowseComp,Opus 4.6 强势登顶。

你就看之前AI圈爆火之干活器物,什么 MCP,Skill,皆为Claude先用上,就连不久前爆火之 Clawdbot (现OpenClaw)今之默认推荐模型皆为Opus 4.6。

全过程人民民主。

不过插广告此事儿确实不为大伙喜之,可预见之,评论区一面倒地,说他破防之。

之前,Opus系列最让者诟病之,就为20万Token之上下文,而隔壁 Gemini 之百万上下文早用之快两年之。

英超

既然此么强,为啥于用户此块老不温不火啊。

跑分图什么之,大伙估计皆看腻之,也基本皆为分数要比老模型高一点点,当然也有少量不如之,不过对咱来说,看之还为统合体验嘛。

Theology。

起因为周三夜晚,Anthropic于彼等美国者之“春晚”上,放之几条广告,明牌嘲讽OpenAI于ChatGPT里塞广告,直接把讽刺皆打到公屏上之:广告于入侵AI,但不会现于 Claude。

而其他两家则为各有各之说法。

最后,Opus 4.6 还有名最顶级之本领,搜集讯息,而且不为一般之讯息,为各种你不确定之,犄角旮旯里之讯息,它皆能给你找之。

" 咋说呢。

至于Gemini,则想靠性命进行一名降维打击,于Gemini里你能干谷歌性命里之任何事,回邮件,传网盘,甚至看Youtube。

除之此名,Claude Opus之编码本领始终为压之其他家打之,从竞技场排名来看,Opus 4.5已打遍无敌手之,今又来之名4.6,真遥遥居先之。

说白之就为 AI 之脑容量被稀释之,读之后面忘前面,于海量讯息里找不之要点。

比如,差友皆知道咱差评有名内部梗,就为925,不算出圈,基本只有咱差友自己知道。

) 我缺之为上下文吗,好像为额度啊。

Anthropic 此次,为拿出之自己最强之通用模型,而 OpenAI 拿出之 Codex,其实为名专精代码之“偏科生”,对大多数者来说用不到。

而 Opus 4.6 于 MRCR v2 此名评测里拿之76分,吾等俗称“大海捞针”,也就为于巨长上下文里找到吾等想找之东西,而上一代Sonnet 4.5为18.5分,一下提升之四倍,可说为质变之。

十大中场

结局确实好用,html文书直接现于之桌面,点开就能玩,血量、地图、子弹皆显示得完全正确。

孟姜女。

结局无一例外,全部败下阵来。

但上下文此玩意,要点不为数术大不大,而为能不能真好用啊,甚多模型号称百万上下文,实际上塞到后面就始记忆错乱,胡言乱语之。

世超觉得,与 Claude 选择之路线脱不开关系。

Pro 版订阅根本聊不到上下文顶点就用光光之。

结局去问之下Claude,直接一名精准命中,连今日最佳皆知道,原来 Claude 也为差友吧。

总觉受气势上就输一头啊。

胸有成竹。

不过拆完就蛮顺遂之之,它成找到之出疑难之页码数,还给之精确之推演剖析,品质跟Gemini 3 Pro不相上下。

伊比利亚

最后,Opus 4.6 还有名最顶级之本领,搜集讯息,而且不为一般之讯息,为各种你不确定之,犄角旮旯里之讯息,它皆能给你找之。

首先,上下文窗口终于破百万Tokens之。

Anthropic 从一始就奔之"最能干之AI同事"去之,你看它之货品线,Claude Code、Cowork、Excel插件,全皆一名意图,帮你把活干完。

此也为为啥世超最近验证传言、搜集事实皆用 Claude Opus,省心之不止一星半点啊。

詹姆斯(塞文子爵)

故今日世超先撇开彼名写代码之,还为来聊聊大家更感兴趣之通用模型, Claude Opus 4.6 吧。

AI 界把此叫做 BrowseComp,Opus 4.6 强势登顶。

但世超实测之一下,为有点想吐槽之。

此一点于世超日常用时也深有体会,其他模型搜不到之情报,Claude 能直接给你定位来源,然后端上来。

Claude 之风格此么偏商务风,我觉得也跟它宗旨主顾有关。

最终搜出来之价码,跟我自己上闲鱼搜之大差不差,而且最骚之为它还知道国补,让我别买二手,考虑直接加钱换新,全程不需我干预,可说真之甚像真者助理之。

我最后只好给它拆成之两半。

第二天,还真打起来之。

咱也来之点简之活,让它写名 CS 之 demo 发到我电脑上。

说得极其对啊,我认可,但唯一之短处为我钱包有点不对之。

当然就此也不够说“干活最强”,Claude今最强之地方,其实为“实操”之本领。

比如我最近有名研讨物理之课题,找到之一份天文苑家里希尔之原版著作,于阅读中碰到之疑问,因他之一名计算结局与牛顿老师完全不同。

就为因 Opus 此玩意,操作电脑之本领,确实太狠之。

哎,光说不解气,不然打一架。

而且我试之一下,一次喂大量上下文之本领,为干不过Gemini之。

天眼。
王楚钦

然后我把此名200多页之书丢给Gemini,问他到底为谁之疑难。

Gemini读完,体谅得又快又准,并且精确指出之里希尔原文之页码数,一通操作指出,牛顿为对之。

而Claude今之处置思路,叫“上下文压缩”,能于对话达到 Token 阈值时,自动将冗长之史册记载压缩成高浓度之摘要,就好比你追之几百集电视剧脑子不够用之,它不仅帮你把前面彼些啰嗦之情节删之给大脑腾内存,还能自动生成前情提要让你无缝衔接下一集。

国乒

彼或有些新差友,不知道此名梗,可去哪搜呢。

此意思像为,C 端靠用户量与广告,B 端靠平台与性命,两手皆要抓,就为不知道抓不抓得住之。

中国

有名网友之评论我觉得甚到位:"2026年最慧之做法不为选一名最好之模型,而为知道每名模型最擅长什么,换之用。

Scikit-learn。
边防线

上一篇:冬季穿出高级感,全靠此3名招数简好懂,中年女者赶紧照搬 下一篇:华夏网友:米兰对他俩太差 林孝埈无缘500米半决赛刘少昂无缘决赛