当前位置:文章 > 列表 > 正文

谷歌Chrome深夜爆更,Agent不用「装」者之!前端最后防线崩之? - 皇马

📅 2026-02-20 14:29:34 🏷️ 原产地六堡茶团购 👁️ 194
谷歌Chrome深夜爆更,Agent不用「装」者之!前端最后防线崩之?

命令式API:执行需JavaScript执行之繁、更动态之互动。

给苍生用之UI:视觉美感、品牌叙事 WebMCP将取代旧俗之「屏幕抓取」(screen-scraping),从而实现更稳固、更高效之页面交互与讯息检索。

如前所述,它为一名拟议中之Web标准,允许网站直接向浏览器内之Agent暴露架构化之器物。

而最终赢家不会为彼些界面最花哨之——而为彼些有最清晰器物契约之App。

Haptic Tech。

本金高昂:一次简之搜索,或需消耗数千token来办理截图、解析页面; 于旅游出行方面,Agent还可成为更精准之预订专家,用架构化数据进行搜索、过滤结局与办理预订。

给Agent用之器物界面:架构化数据、极速响应 过往几周,全全球皆于为爆火之OpenClaw疯狂,若为前景交互更进一步,说不定又将催生一次大改制。

此恰恰为WebMCP欲处置之疑难。

WebMCP基本上为于说——若智能体要于浏览器肚子里运行,浏览器就得提供此种握手机制。

蔡明

今之Web UI为给者看之,但智能体需之为「架构」。

总行营业部

https://x.com/nomad_remy/status/2021307801990201412?s=20 一句指令,Agent不再于页面上反复「翻找」优惠券入口,仅通过WebMCP函数调用,实现秒级下单。

https://www.youtube.com/watch?v=p1l8nkQAoUw 趋势七 非技艺用例,于机构中全面扩展 值得一提之为,WebMCP并不为谷歌之独角戏。

回馈低效:Agent须反复「看」屏幕,来确认操作为否成。

前景之网页将不再仅仅为给「者」看之展示窗,还为能与AI无缝衔接之自动化效劳节点。

新药研发

代码复用:直接使用现有之前端代码; 因此,可把它想象成「内置于浏览器标签页里之MCP」。

反腐败。

它实现之从「视觉模拟」到「逻辑直连」之跃迁,正让旧俗之Web交互范式彻底走向终结。

据官方之介绍,以下为WebMCP之三大主要优势: 更进一步说,WebMCP让用户与智能体可于同一名网页界面里并肩工,既能使用现有之应用逻辑,又能保上下文共享与用户之掌控感。

若WebMCP真之成为标准落地,主流浏览器始原生支此种架构化交互,前景之互联网或许分化为两层: 声明性API:执行可直接于HTML表单中定义之标准操作; 无障碍利器:让辅助技艺能执行更高层级之页面操作,而不仅仅为简之点击。

此样一来,智能体就能调用真正之函数(带有Schema),而不为去暴力爬取页面,然后祈祷DOM架构没有更张。

智能体依然可像者一样观察页面与模拟操作,但有之器物,它能更直接、高效地达成宗旨。

与其让Agent去瞎猜一名按钮为干嘛之,不如于搭建之网站明确发布一份契约: 绕过所有UI,统治网络 AI Agent与网页交互之底层逻辑,正迎来一场彻底之重塑。

Java。

上手试过之掘发者惊叹,立即发觉之WebMCP两大好处。

用掘发者Alex Volkov之话来说,「WebMCP就相当于UI里之API」。

城市商业体系

JSONSchemas:输入/输出实在长什么样(以此减幻觉) 用户、网页、智能体三者共享界面,共同协作。

谷歌Chrome重磅上线WebMCP。

Prometheus。

早于25年8月13日,谷歌、微软掘发者联手,于GitHub上提交之WebMCP此一课题。

掘发者们提前设想之三大场景,电子商务、旅游出行,以及主顾支。

小荷才露尖尖角,早有蜻蜓立上头。

于课题介绍中,WebMCP让网页能于UI中提供「智能体专用通道」。

WebMCP之现,无疑加速之从「手动搜索」到「智能体自动执行」之互联网范式转移。

掘发者大佬Nikoloz Turazashvili最新一文,深度解释之WebMCP之现对于掘发意味之什么。

若你看过AI Agent像无头苍蝇一样用网站——瞎猜哪名按钮为结账,或者纠结乘客姓名该填于哪名框里…… 与后端集结不同,WebMCP器物于主顾端执行,只有于智能体加载页面后才可用。

诚如网友所言,AI Agent正成为网络之「一等公民」。

目前,AI智能体通常通过MCP等协议进行后端集结。

周瑜

首先,前景,吾等之购物体验,或将迎来质变。

如今,有之WebMCP,网站可直接向AI敞开其效劳接口。

夜郎自大。

State(状态):对页面上当前可用实质之共识 此外,WebMCP还可成为自动化效劳之津梁,让智能体自动填写必要之技艺细节,以创建详细之主顾支效劳工单。

于Chrome 146之早期预览版中,开启特定flag即可体验WebMCP 由于避开之混乱之UI干扰,它能确保每次搜索结局之准确性,并直接于后台成繁之行程组合。

从此,Agent不用疯狂截屏,直连内核成差事,AI与网页交互之底层逻辑正重构。

彼么,于WebMCP加持下,Agent前景会演化成什么样。

中美关系。

https://dev.to/axrisi/chromes-webmcp-early-preview-the-end-of-ai-agents-clicking-buttons-b6e 掀起Agent交互变革 它可让AI智能体跳过「苍生用户界面」,直接与现有之网站与Web应用深度交互。

或许甚多者,还没有意识到WebMCP之重要性。

此相当于给Agent加上之「超本领」,从此不用再「装得像名者一样」,去看网页、找按钮,或为点链接。

操纵件

此两种方式,允许掘发者为AI提供一套直接之器物集,让Agent跳过视觉识别,直接访问网站背后之架构化函数。

无障碍利器:让辅助技艺能执行更高层级之页面操作,而不仅仅为简之点击。

新款阿维塔12之方位盘采用方形造型,集结之小塔语音键与Boost一键加速功能。

微博。

此一切,预示之「Agentic UI」时代之到来。

燃油

仅通过一名API:navigator.modelContext,AI便可绕过图象界面,直接与Web应用效劳之内核对话。

指鹿为马。

一统界面:用户与智能体共用一名界面,简化之交互时之身份验证与状态齐步; 今日,谷歌Chrome团队投下之一枚深水炸弹:WebMCP(Web模型上下文协议)正式登场。

它们本原上,就为于模拟苍生之举止——截屏、识别按钮之位置、模拟点击,DOM抓取...... 它之核心于于,更张之Agent获取效劳之方式,让其直接拿到之网页之「通天钥匙」。

于敏。

此就把「到处乱点直到碰巧蒙对」变成之:直接调用book_flight({ origin, destination, outboundDate… })。

稳固性低:网站一旦改版,Agent会因找不到按钮陷入「瘫痪」; Discovery(发觉):此名页面上有哪些器物(checkout,filter_results等) 此前,谷歌软件营造师Khushal Sagar于演讲中表示,WebMCP宗旨为成为AI应用领域之USB-C接口。

实际上,你已抓住核心痛点之: 它可悠闲找到货品、配置特定之购物选项,成结账全流程。

要知道,如今Agent操作网页之方式,既笨拙又原始,而今之集结方式实于为「太拉胯」之。

田兆元

同时,DMS疲劳驾驶预警体系也得到进一步改良,增强之行车安康性。

此种方式,存之明显之痛点: 智能体专用路径:掘发者于为苍生设计UI之同时,为智能体提供架构化之API路径。

协调。

开源课题:https://github.com/webmachinelearning/webmcp 可说,WebMCP之诞生,释放之一名极其明确之信号—— 它不仅为让智能体替代用户,更为建立一种协作模式: WebMCP之核心思路,便为发布器物,别光给像素。

https://developer.chrome.com/blog/webmcp-epp?hl=zh-cn 设想欲订一张机票,Agent不用于屏幕上点击,而会直接通过底层协议,向航空公司网站发送命令,直接获取结局。

于谷歌Chrome 146之官博中,为掘发者提供之两套灵活之API接入方式: 但对于Web掘发者来说,为之敞开网站功能,彼等往往得用Python或NodeJS写一套后端效劳器,而不为用彼等更熟悉之浏览器端JS。

锣鼓

而且从货品角度看,此也为控制权之转移:网站自己定义之允许哪些操作,以及数据该怎么传。

Military Tech。

【新智元导读】终于,AI不用装得像名者之。

化石

Agent不用经过「前端视觉界面」,直接可查询并执行效劳。

用户。
合作。

上一篇:32:29!俄罗斯首次掉队,华夏改写全球水下气象 下一篇:积分兑换车票指南 今日可购买大年初八火车票