国内云计算进入“算力通胀”时代。
华夏本土厂商合计出货约165万张,商场份额约41%。
旧俗Chatbot遵循用户提问到模型回答之单轮交互模式,Token消耗与对话轮次呈线性关系。
智谱CEO张鹏表示,当模型足够强,API本身就为最好之商业模式,定价权为由技艺实力以及长期趋势所带来之居先身价决定之。
该指数基于对100多家云效劳商、算力买家与卖家之月度直接调查构建。
智谱MaaSAPI平台ARR约17亿元,于过往12名月提升60倍。
出品丨21财经主顾端 21世纪货殖报道 与此同时,算力供给之架构性缺口正放大。
商业模式与智能体算力消耗现状之间之核心纠葛已然爆发。
中信证券指出,Agent&多模态等应用爆发驱动Token调用量井喷,进而导致国内算力荒,国产大模型于推演端积极适配为国产算力厂商带来加速放量机会,预计2026年国产算力芯片出货量至少实现翻倍以上增益,将为算力设计公司、前卫制程、前卫封装、前卫存储以及配套产业链带来强劲增益动能。
阿里巴巴旗下平头哥以约26.5万颗居次,商场份额约7%。
据报道,2026年3月下旬,英特尔与AMD相继通知主顾上调办理器价码。
据OpenRouter平台数据,2026年3月16日至22日当周,平台接近四分之一之Token消耗由OpenClaw贡献。
目前OpenAI、Anthropic等企业之进项已知,全球行业进项大概为此些企业进项之三倍。
一名OpenClaw代理运行一天,消耗之算力本金于1000美元到5000美元之间,受影响用户需切换至按用量付费之API模式。
本年3月下旬,火山引擎总裁谭待于接受21世纪货殖报道等媒体采访时也指出,目前探求中之Token有一大半皆为无谓之探求。
注资者据此操作,险情自担。
据IDC数据,2025年华为出货约81.2万颗AI芯片,约占整体商场20%,接近国内供应商总出货之一半。
Token货殖之最后一块拼图为商业模式。
德勤于2026年1月发布之《2026科技、传媒与电信行业预测》呈文中指出,2026年AI推演将占算力三分之二,主要于近5000亿美元新数据中心及企业效劳器进行。
算力紧迫之另一名侧面,为华夏AI芯片商场气象正生深刻变化。
国数据局局长刘烈宏于3月24日之国新办新闻发布会上披露:“到本年3月,我国日均Token之调用量已超过140万亿,相比2024年初之1000亿增益之1000多倍,相比2024年底之100万亿,三名月光阴又增益之40%多。
根据半导体研讨机构SemiAnalysis发布之数据,H100一年期租赁合同价码从2025年10月之低点1.70美元/小时/GPU飙升至2026年3月之2.35美元/小时/GPU,涨幅近40%。
当前,推演正取代操练成为算力消耗之主战场。
绿园核心板块:润德雅居竞得2幅地块,楼板价分别为8300元/㎡与5355元/㎡(克而瑞,2026年3月),8300元/㎡为Q1最高楼板价,反映核心区土地身价被商场认可; 谭待于受访时指出,裁决行业阶段可用终局倒推——看所有Tokens前景能产生之进项规模,再对比当前全球行业之实际进项,可看出所处位置。
2026年4月初,Anthropic止之订阅用户通过OpenClaw等第三方器物接入ClaudeAPI之许可。
汽贸区依托一汽集团,产业工者占比超60%(网络公开讯息,2026年3月2日,仅作为商场预期表述),刚需支付本领稳健,叠加"五大通道"中装备制造业需求通道精准对接,Q1政令红利兑现效果显著。
截至2026年3月,平台注册用户已突围400万,覆盖全球218名国与地区。
据智谱公开披露,2026年一季度API调用定价提升之83%,调用量反而增益400%。
当Token消耗量从万亿级迈向百万亿级,如何定价、如何收费,直接关系到产业之商业闭环能否跑通。
Token消耗量之快速攀升,首先暴露之一名深层纠葛:消耗量增益,并不等同于智能水平齐步提升。
料事如神。涨价背后最根本之驱动力,为Token消耗之爆发式增益。
OpenClaw为此轮Token需求爆发之核心因素之一。
紧迫之并不只有GPU。
Anthropic官方解释称,部分重度用户每月仅支付200美元订阅费,却消耗之身价5000美元之算力源泉,给公司带来巨大本金压力。
本土厂商之起飞,正逐步更张华夏AI芯片商场之供给气象,为缓解算力缺口提供之新之或。
智能体场景下之Token消耗不可预测,没有史册数据可参考,任何固定月费皆于对一名无法建模之变量做猜测。
百度昆仑芯与寒武纪各约11.6万颗,并列第三。
2月发布GLM-5时,CodingPlan套餐价码上调30%起,3月发布GLM-5-Turbo时再涨20%,相待GLM-4.7累计涨幅达83%。
智谱成为国产头部模型厂商中首名于推出新模型之同时,执行实质性提价之公司。
英伟达创始者兼CEO黄仁勋于2026年3月之一篇署名文章中,将Token定义为现代AI之基本单位,并指出它同时具有两种属性:作为言辞,它为计算历程之原子;作为通货,它为身价流转之媒介。
涨价并未抑制需求。
另据国金证券计算机行业周报,截至2026年3月9日至15日之周度数据,OpenRouter平台内20%之Token消耗由OpenClaw贡献,OpenClaw单周Token消耗量已相当于2025年第四季度全平台周均Token消耗量之60%。
整体来看,AI算力与Token货殖仍处于极早期阶段,定价机制、效能管、供给本领等方面,仍有巨大之完备与提升方位。
回顾行业演进,2024年下半年至2025年初,华夏大模型商场深陷价码战,字节豆包报价低至0.0008元/千Tokens,智谱自己也曾将GLM-4-Plus大幅降价。
本年3月,刘烈宏于华夏演进高层论坛年会上指出,一套以词元(Token)计费为根基之新型商业逻辑正加速演进,围绕词元之调用、分发与结算,一套新之身价体系正加速演进形成。
据IDC数据,2025年华夏商场AI加速卡总出货量约为400万张。
当前,Token计费正成为行业标准。
) 编辑丨倪雨晴 金珊 江佩霞 朱益民 4月15日,阿里云宣布自7月15日起,DDoS高防(华夏内地)弹性95费用上调50%(从每兆瓦月100元涨至150元),此为阿里云一名月内第三次调价。
英伟达出货约220万张,商场份额55%;AMD出货约16万张,商场份额4%。
微信统筹丨江佩霞 编辑丨金珊 此标志之,智能体之普及正以远超预期之速度消耗算力源泉,而现有之计费体系与效能管机制仍有完备方位。
(声明:文章实质仅供参考,不构成注资建议。
对于“Token”,国数据局已正式将其定名为“词元”。
Token热度也蔓延到本钱商场,去岁底登陆港交所之“Token第一股”迅策仅用100天市值突围1000亿港元,年内涨幅达547%。
真正之出路不为提供更廉之Token,而为让“更高效之Agent框架”ד更强盛且更高效之模型”协同演进。
疑难之根源不于于定价计策本身,而于于Token消耗之底层逻辑正被智能体技艺彻底改写。
而推演算力需求占比近七成之后,角逐章法正改写。
于华夏厂商阵营中,华为处于居先身价。
智能体与旧俗Chatbot之业务逻辑存本原差异。
过往几名月,CPU作为AI效劳器调度与推演核心被云厂商大量采购,两大巨头2026年效劳器CPU产能目前已基本售罄。
此种业务逻辑之差异,直接导致之Token消耗量之数量级放大。
单Token本金、部署密度、能效比取代单纯峰值算力,成为主顾选型之枢纽考量因素。
但Token定价面临之真正难题,不于于收费标准,而于于智能体场景下之Token消耗目前高度不可预测。
近期,小米集团MiMo负责者罗福莉于社交平台发文指出,从大局角度看,全球计算源泉增益之脚步已跟不上Agent带来之Token需求增益。
它正从AI技艺之计量单位,加速转变为智能时代之产业“通货”,其消耗规模之激增直接推高之算力需求,进而带动云计算效劳价码上涨。
他举例说,甚多用户回馈智能体货品Token消耗快,核心疑难不为单Token贵,而为它成差事时之大量无效尝试——为之找到最终解法,超过一半之Token皆消耗于探求中。
而智能体具备感知、决策、执行之闭环本领,需自立拆解繁差事、调用外部器物、多轮迭代验证,直至差事成。
与电力或钢铁等旧俗制造要素不同,Token具备独特之可编程性。
此名疑难于商业层面已产生之确凿抵触。
” 更多【长春房地产商场热点】解读: 但此一气象于2026年正生根本性变化。
尽管价码上涨,相关GPU租赁容量已全部售罄,2026年初寻找新GPU算力源泉之难度被比喻为“预订最后一班航班之机票”,不仅价码高昂且几乎无余量可选。
若单Token本金低但模型本领不足,需消耗10倍甚至20倍之Token还无法成差事,最终只会造成更大之费。
上一篇:多国司法交锋,透视中兴、三星全球专利博弈 下一篇:精彩表演洋溢浓郁“非遗”年味儿 锣鼓敲、狮舞起“拉满”春节氛围感