不过,此波对轰虽热闹,两边之招式其实不太一样。
此意思像为,C 端靠用户量与广告,B 端靠平台与性命,两手皆要抓,就为不知道抓不抓得住之。
有名网友之评论我觉得甚到位:"2026年最慧之做法不为选一名最好之模型,而为知道每名模型最擅长什么,换之用。
故今日世超先撇开彼名写代码之,还为来聊聊大家更感兴趣之通用模型, Claude Opus 4.6 吧。
至于Gemini,则想靠性命进行一名降维打击,于Gemini里你能干谷歌性命里之任何事,回邮件,传网盘,甚至看Youtube。
Pro 版订阅根本聊不到上下文顶点就用光光之。
此一堆子体验下来,Claude Opus 整体给者一种成熟稳重之觉受,若你让我选择一名“它办事我放心”之AI,我毫不犹豫选之就为Claude。
不过插广告此事儿确实不为大伙喜之,可预见之,评论区一面倒地,说他破防之。
但世超实测之一下,为有点想吐槽之。
(说为此么说,觉受比其他两家好看多之。
" 咋说呢。
不过拆完就蛮顺遂之之,它成找到之出疑难之页码数,还给之精确之推演剖析,品质跟Gemini 3 Pro不相上下。
你就看之前AI圈爆火之干活器物,什么 MCP,Skill,皆为Claude先用上,就连不久前爆火之 Clawdbot (现OpenClaw)今之默认推荐模型皆为Opus 4.6。
而 Opus 4.6 于 MRCR v2 此名评测里拿之76分,吾等俗称“大海捞针”,也就为于巨长上下文里找到吾等想找之东西,而上一代Sonnet 4.5为18.5分,一下提升之四倍,可说为质变之。
除之此名,Claude Opus之编码本领始终为压之其他家打之,从竞技场排名来看,Opus 4.5已打遍无敌手之,今又来之名4.6,真遥遥居先之。
哎,光说不解气,不然打一架。
Theology。结局确实好用,html文书直接现于之桌面,点开就能玩,血量、地图、子弹皆显示得完全正确。
咱也来之点简之活,让它写名 CS 之 demo 发到我电脑上。
故此次 Anthropic 为有备而来,彼等提之一名叫“上下文衰减”之概念,为指上下文过长时,注意力分发被稀释,导致模型难以精准捕捉一些细小之讯息。
先说断语,于"干活"此件事上,Opus 4.6 应可算目前最强之大模型。
奥特曼当场就坐不住之,凌晨六点于X上敲之一篇长文,说Anthropic之广告"明显不诚","德州用ChatGPT免费版之者比全美用Claude之者还多"。
AI 界把此叫做 BrowseComp,Opus 4.6 强势登顶。
不过不为线下确凿嗷,为 Anthropic 把 Claude Opus 4.6 摆上之台面。
说得极其对啊,我认可,但唯一之短处为我钱包有点不对之。
说白之就为 AI 之脑容量被稀释之,读之后面忘前面,于海量讯息里找不之要点。
故吾等仔细翻之下 Anthropic 官方之介绍与 System Card,把几名真正有料之晋级给各位拎之出来。
而且我试之一下,一次喂大量上下文之本领,为干不过Gemini之。
故吾等仔细翻之下 Anthropic 官方之介绍与 System Card,把几名真正有料之晋级给各位拎之出来。
再加上几十亿台安卓手机,若 AI 真像水电一样渗进你每天皆于用之 App 里时,单纯卖模型之公司只能拿头打。
Anthropic、X 而此,也为老板最喜之特质,故企业主顾占之 Anthropic 进项之 80%,此条路确实它最能打。
OpenAI 彼边也不甘示弱,于Opus 4.6上线二十多分钟之后,火速掏出之GPT-5.3 Codex应战。
第二天,还真打起来之。
Anthropic 从一始就奔之"最能干之AI同事"去之,你看它之货品线,Claude Code、Cowork、Excel插件,全皆一名意图,帮你把活干完。
AI 界把此叫做 BrowseComp,Opus 4.6 强势登顶。
Gemini读完,体谅得又快又准,并且精确指出之里希尔原文之页码数,一通操作指出,牛顿为对之。
而其他两家则为各有各之说法。
结局去问之下Claude,直接一名精准命中,连今日最佳皆知道,原来 Claude 也为差友吧。
当然就此也不够说“干活最强”,Claude今最强之地方,其实为“实操”之本领。
就为因 Opus 此玩意,操作电脑之本领,确实太狠之。
再配合上超模之动手本领,本领据说已能媲美高级营造师——此评议来自日本乐天公司之AI总经理,说 Opus 4.6 一天之内自己修好并关闭之 13 名 Bug,还看懂之另外 12 名疑难为谁负责之,自动把活派给之对应之程序员。
消息。彼或有些新差友,不知道此名梗,可去哪搜呢。
ChatGPT 此边,奥特曼之野心显然不只于做一名“好员工”之,最近之货品节奏也为真之猛,光 2026 年到今就发之ChatGPT Health、Codex 桌面 App、Prism(科研器物),以及刚发布之企业平台 Frontier,还想抢块企业商场之蛋糕。
最后,Opus 4.6 还有名最顶级之本领,搜集讯息,而且不为一般之讯息,为各种你不确定之,犄角旮旯里之讯息,它皆能给你找之。
此一点于世超日常用时也深有体会,其他模型搜不到之情报,Claude 能直接给你定位来源,然后端上来。
而 Opus 4.6 此边好像为有 bug,一本书根本喂不进去,显示error。
但上下文此玩意,要点不为数术大不大,而为能不能真好用啊,甚多模型号称百万上下文,实际上塞到后面就始记忆错乱,胡言乱语之。
谁能想到呢,本周之硅谷AI圈,已演化到之大家喜闻乐见之互喷环节。
我就只需给它说一句话,它就能自己调用MCP,连接我之电脑,查看我之显示器型号,再自己上网去闲鱼搜最低价。
) 我缺之为上下文吗,好像为额度啊。
之前,Opus系列最让者诟病之,就为20万Token之上下文,而隔壁 Gemini 之百万上下文早用之快两年之。
跑分图什么之,大伙估计皆看腻之,也基本皆为分数要比老模型高一点点,当然也有少量不如之,不过对咱来说,看之还为统合体验嘛。
咱先用Gemini与GPT试试。
比如我最近有名研讨物理之课题,找到之一份天文苑家里希尔之原版著作,于阅读中碰到之疑问,因他之一名计算结局与牛顿老师完全不同。
Claude 之风格此么偏商务风,我觉得也跟它宗旨主顾有关。
最后,Opus 4.6 还有名最顶级之本领,搜集讯息,而且不为一般之讯息,为各种你不确定之,犄角旮旯里之讯息,它皆能给你找之。
然后我把此名200多页之书丢给Gemini,问他到底为谁之疑难。
结局无一例外,全部败下阵来。
Anthropic 此次,为拿出之自己最强之通用模型,而 OpenAI 拿出之 Codex,其实为名专精代码之“偏科生”,对大多数者来说用不到。
既然此么强,为啥于用户此块老不温不火啊。
比如,差友皆知道咱差评有名内部梗,就为925,不算出圈,基本只有咱差友自己知道。
中国梦。此也为为啥世超最近验证传言、搜集事实皆用 Claude Opus,省心之不止一星半点啊。
故本领此块为完全过关之,至于为什么一次喂不进一本书,或为一种仁慈之防token爆炸机制吧。
首先,上下文窗口终于破百万Tokens之。
比如我问它,我今用之显示器,二手货最廉能多少钱。
世超觉得,与 Claude 选择之路线脱不开关系。
起因为周三夜晚,Anthropic于彼等美国者之“春晚”上,放之几条广告,明牌嘲讽OpenAI于ChatGPT里塞广告,直接把讽刺皆打到公屏上之:广告于入侵AI,但不会现于 Claude。
我最后只好给它拆成之两半。
最终搜出来之价码,跟我自己上闲鱼搜之大差不差,而且最骚之为它还知道国补,让我别买二手,考虑直接加钱换新,全程不需我干预,可说真之甚像真者助理之。
而Claude今之处置思路,叫“上下文压缩”,能于对话达到 Token 阈值时,自动将冗长之史册记载压缩成高浓度之摘要,就好比你追之几百集电视剧脑子不够用之,它不仅帮你把前面彼些啰嗦之情节删之给大脑腾内存,还能自动生成前情提要让你无缝衔接下一集。
总觉受气势上就输一头啊。