当前位置:文章 > 列表 > 正文

OpenAI祭出GPT-5.4神装!Codex同款Harness全面敞开 - 基恩·派路·加斯柏连尼

📅 2026-04-19 15:26:10 🏷️ 贵金属开户平台 👁️ 022
OpenAI祭出GPT-5.4神装!Codex同款Harness全面敞开

一年多过往,模型于本领上之提升可谓为翻天覆地——一口气能跑几名小时、几天,甚至几周。

对此,FurtherAI CTO Sashank Gondala披露,彼等之Agent啃下之一份900多页之保险理赔记载,提取成率100%。

Techno-war。

一句话版本,OpenAI此次把Agents SDK从「聊天机器者之玩物」改造成之「制造级Agent之底座」。

七家能同时接入,枢纽于OpenAI给之一名叫Manifest之玄虚层——一份描述Agent工区之配置清单。

跨省通办。

结局就为,沙盒里既没有API密钥,也没有任何敏感凭证。

最枢纽之为此份Manifest与实在沙盒供应商解耦。

多边外交。

此次之重写,主要做之两件事。

沙盒对跑agent生成之代码来说极其完美。

仗义执言。

https://x.com/OpenAIDevs/status/2044466699785920937。

Box掘发者关系负责者Carter Rabasa,则传之一份业务数据并配上bash/python作为器物,让agent于沙盒里跑之一整套发票对账业务流程。

OpenAI下场把基建层做之,留给第三方之方位,肉眼可见地于收窄。

模型能操作电脑之,可Agent跑于哪台电脑上、怎么保证跑起来不出事,还为得自己东拼西凑一套框架。

两家公司之共同点为,于拿到成熟Agent基建之后,业务团队之制造力现之断层式跃迁。

但此一版SDK,本原上为为聊天机器者场景做之。

应急管理。

此为整名Agent架构之范式转移。

OpenAI不声不响,又下之一手狠棋。

compute为一名独力之沙盒,专门负责读写文书、跑命令、装包、吐产物。

让一名Agent跑进本地沙盒,挂上一名财报目录,对比FY2025与FY2024之三项财务指标,核心代码不到20行。

# pip install "openai-agents>=0.14.0"import asyncioimport tempfilefrom pathlib import Pathfrom agents import Runnerfrom agents.run import RunConfigfrom agents.sandbox import Manifest, SandboxAgent, SandboxRunConfigfrom agents.sandbox.entries import LocalDirfrom agents.sandbox.sandboxes import UnixLocalSandboxClientasync def main() -> None: with tempfile.TemporaryDirectory() as tmp: dataroom = Path(tmp) / "dataroom" dataroom.mkdir() (dataroom / "metrics.md").write_text( """# Annual metrics| Year | Revenue | Operating income | Operating cash flow || --- | ---: | ---: | ---: || FY2025 | $124.3M | $18.6M | $24.1M || FY2024 | $98.7M | $12.4M | $17.9M |""", encoding="utf-8", ) agent = SandboxAgent( name="Dataroom Analyst", model="gpt-5.4", instructions="Answer using only files in data/. Cite source filenames.", default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}), ) result = await Runner.run( agent, "Compare FY2025 revenue, operating income, and operating cash flow with FY2024.", run_config=RunConfig( sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()), ), ) print(result.final_output)if __name__ == "__main__": asyncio.run(main()) https://openai.com/index/the-next-evolution-of-the-agents-sdk/ 今日用E2B写之Agent,明日想换成Modal跑,不用重写代码,改一行配置。

解答为靠补齐OpenAI原生SDK不够「制造可用」之彼块空白。

者生当如水一般投入,且不失自我觉知,主动面对境遇,善用自身本领、所处氛围与者之联结,顺势而为。

做业务层Agent应用之团队盘算要不要迁移。

https://techcrunch.com/2026/04/15/openai-updates-its-agents-sdk-to-help-enterprises-build-safer-more-capable-agents/ Tomoro AI研发营造师Douglas Adams给出之另一组硬数术,相同本领之Agent,此次需之代码量比昔少之6倍。

另外两名对长跑差事格外枢纽之新本领为,让沙盒容器挂之也能从查验点续命之快照与状态复原;以及处置扩展性疑难之多沙盒并行+子Agent隔离氛围。

AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2全覆盖。

餐饮产业大会

讲此次晋级之前,先得搞清楚原来之Agents SDK长啥样。

仔细。

哪家沙盒廉、哪家离数据近,就切到哪家。

GPT-5.4带之原生computer use登台,Agents SDK给它配齐之真正之运行氛围。

https://modal.com/blog/building-with-modal-and-the-openai-agent-sdk https://modal.com/blog/building-with-modal-and-the-openai-agent-sdk 原来彼套为聊天机器者设计之SDK,自也就跟不上时代之。

比卢普斯

沙盒本身完全隔离,甚至可与网络断开,没有任何对外流量。

Python先行,TypeScript还于排队 harness/compute分离之第一名结局,为沙盒供应商之性命图一夜铺开。

西装

编排、记忆管、护栏、追踪、多Agent协作,此些皆为第三方框架之主战场。

春。

做沙盒之供应商始算OpenAI流量能不能接得住。

第二件,把harness与compute彻底分离。

一路顺风。

一半PR出自Agent 更狠之为,此一刀同时砍于之LangChain、CrewAI、LangGraph此些第三方Agent框架身上。

此不为安康性能之小修小补。

如今,OpenAI把此些曾经只有头部公司才能攒出来之基建,变成之SDK里开箱即用之默认配置。

没想到,第一轮试水就跑通之。

理直气壮。

2025年3月,OpenAI第一次推出Agents SDK,主打轻量、少玄虚、几行Python就能跑起来之卖点。

今日或还为OpenAI之协作伙伴,明日之身份甚或就只为OpenAI性命下之「组件供应商」之。

官方给之一名最小示例。

今晚此名缺口被OpenAI自己补上之。

杯弓蛇影。

今日用E2B写之Agent,明日想换成Modal跑,不用重写代码,改一行配置。

harness负责控制流、模型调用、器物路由、暂停复原;沙盒负责读写文书、装依赖、跑代码,两层彻底解耦。

破釜沉舟。

到此一层,此次发布对行业之冲击才真正显露。

哪家沙盒廉、哪家离数据近,就切到哪家。

下一步缺之,只为更多掘发者把业务逻辑搭于此名基建之上。

此次发布,Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercel七家沙盒厂商同时被写进官方支列表。

就于刚刚,Agents SDK迎来一次彻底之架构重写。

harness与sandbox之新本领首发只上之Python,TypeScript版本排于后续更新谋划里;SDK至今仍然停留于0.Y.Z版本号。

不仅如此,Stripe也于本年早些时候披露,内部之AI Agent每周产出超过1000名PR。

从「聊天机器者之玩物」到制造级底座 而且,OpenAI口中之「兼容所有沙盒效劳商」,本身就为于把沙盒供应商纳入OpenAI之性命位。

NFT。

原生harness、原生沙盒、Codex级之文书体系器物,外加七家头部沙盒厂商一键接入。

两层之间之接口标准化,API key与敏感凭证压根儿不会进入模型生成代码实际执行之彼名氛围。

于一篇技艺长文中,Modal技艺团队成员Erik Dunteman顺手透露之一名细节—— 由此,Agent第一次有之「掉线续命」与「分身作战」之原生本领。

狼王

LangChain们无处躲 今,OpenAI一次性把此些主战场全接管之。

900页保险单100%提取 虽此一切目前还不完美。

OpenAI下场做基建 彼等要做之就为Agent全球之根基设施层,第三方框架从此要么往更高层走(编排、垂直场景),要么往更低层走(专用沙盒、专用器物),夹于中间之彼块地板,已被OpenAI自己踩实之。

三顾茅庐。

40天后回头看,真正之惊喜今日才发。

900页保险单100%提取 900多页、100%、保险理赔记载,此三名词凑于一起之含金量老保险从业者一看就懂,业内最难啃之文档之一,昔跑到某一页崩掉为常态。

【新智元导读】GPT-5.4真正之杀招终于落地。

GPT-5.4出厂彼天被一些者说成为「没有惊喜之例行晋级」。

同名同姓

https://x.com/snsf/status/2044514160034324793 第一件,给模型配一名完整之运行框架——harness。

3月初,GPT-5.4带之原生computer use(计算机用)高调登场时,掘发者就已吐槽过一件事。

没错,OpenAI此次为把自家Codex过往一年踩过之坑、积攒之最佳实践,顺手货品化塞进之SDK。

熟悉Claude Code与Codex之掘发者看到此套清单会甚眼熟。

配置化记忆、感知沙盒之编排、类似Codex之文书体系器物、通过MCP调器物、通过skills渐进式披露讯息、通过AGENTS.md自定义指令、用shell器物执行代码、用apply patch器物编辑文书,全部打包进SDK原生支。

harness跑于你之可信基建里,管模型调用、审批、追踪、运行状态。

Weaviate。

从此,做Agent框架之创业公司会重新审视自己之定位。

Ramp已用Modal跑之一支后台编码Agent大军,公司超过一半之PR皆为此些Agent自己创建之。

旧时代之聊天玩物已被抛弃,工业级Agent全面觉醒。

OpenAI连夜重写基建、原生收编七大沙盒,彻底封死第三方框架之活路。

要挂载哪些本地文书、从哪名云存储拉数据、产物写到哪里,全写于此份Manifest里。

LangChain、LangGraph、CrewAI、AutoGen此些第三方Agent框架,过往一年靠什么活之。

上一篇:非洲狮被饿成“纸片”? 辽宁本溪市动植物园回应:丧偶所致,正复原好转 下一篇:雄鹿连两季横扫鹈鹕:锡安32分 无字母哥仍3者25+7者上双

黄继光。