当算力本金决定之模型定价之底线,没有自研芯片之云厂商,注定只能为英伟达之“售票员”,永远无法触碰到商业闭环之核心赢利。
注资者们笃定地认为,国产替代之终局已到来,寒武纪将像当年之英伟达一样,躺于互联网巨头之算力军备竞赛中,坐享高毛利之红利。
即便为于被视为“平替”之国产芯片领域,情况也并未好转太多。
此便为“中间商”于巨头博弈时代之宿命。
而当外界大力争抢英伟达显卡时,谷歌却默默祭出之TPU。
对于有数亿日活用户之“豆包”与视频生成模型而言,推演环节之算力消耗远超操练环节,此恰恰为本金失控之“重灾区”。
然而,千者团队之集结仅仅为一名始,真正之博弈才刚刚拉开序幕。
于英伟达高端算力受限、国产自研芯片尚未量产之空窗期,字节需大量之现货来维持“豆包”模型指数级增益之推演需求,并且作为互联网第一大厂也有担当与本分扶持国产算力。
彼段光阴,券商研报皆于用最亢奋之语调高呼“华夏之英伟达已诞生”,科技股论坛皆于讨论思元系列如何于成为字节之“太子”,甚至还有字节入股寒武纪之小作文传出。
据钱庄时报报道,字节跳动2026年之本钱开支拟达到约1600亿元者民币,高于2025年约1500亿元者民币之投入,其中约一半资金将用于采购前卫半导体芯片以掘发AI模型与应用,而若获准采购更多前卫芯片,还会进一步大幅增本钱开支。
商业之逻辑永远为追寻规模效应之最大化:当“SeedChip”或“真武”经过之内部数百万卡级别之打磨验证,良率稳固、本金极低时,它们必然会走向对外售卖。
此并非败,而为另一种样貌之“上岸”。
此为一种典型之“窗口期红利”。
此些公司之商业模式,于甚大程度上皆为试图成为“华夏之英伟达”,即通过设计通用之高性能GPU,卖给云厂商与智算中心。
与其于巨头之夹缝中被“去中介化”慢慢绞杀,不如于自己技艺尚有身价、团队尚有战力之时候,选择并入巨头之版图,融合成为字节或阿里内部之一名硬件部门。
若退步回五年前,用于AI芯片之此笔钱字节跳动花得起,也愿意花。
运筹帷幄之中,决胜千里之外。对于大多数无法成为英伟达之国产芯片厂商而言,此或许为最好之归宿。
此为一种物理距离归零带来之化学反应: 算法营造师上午提出之算子改良需求,芯片架构师下午就能将其写入指令集,甚至直接调理片上内存之配比。
该知情者士透露,字节跳动芯片研发团队目前核心集中于芯片设计环节,围绕公司自身业务开展专用硬件定制与改良,面向云端场景研发多款采用前卫半导体工艺之繁芯片,以提升性能、降低算力本金。
正为得益于字节跳动、百度、阿里等互联网大厂之此种“避险性采购”,寒武纪迎来之它成立以来之最高光时刻。
阿里之PPU已证验之此条路之可行性。
其自研之AI芯片已于阿里内部之推荐与推演业务中大面积铺开,并且始探求外售之路途。
更何况,于全球科技巨头之牌桌上,“自研芯片”早已不为一道本金选择题,而为一道本领证验题——证验你为否有资格成为真正之云巨头。
前景,以字节、阿里为代表之互联网巨头,绝不会仅仅将自研芯片锁于自家之机房里做“内部特供”。
寒武纪之业绩爆发,本原上为建立于“英伟达供给不足”与“巨头自研尚未到位”此两名光阴差之上之。
对于字节跳动此样千亿级采购规模之超级大主顾来说,此意味之每花100块钱买芯片,就有70块钱为于给黄仁勋交“过路费”。
此种协作于2025年达到之顶峰:随之字节AI货品爆发,推演算力需求激增,而英伟达产能吃紧,寒武纪之思元590芯片成切入之字节之供应链体系,填补之部分算力缺口。
若续依赖价码贵之通用GPU来办理海量之用户请求,不仅意味之延续给供应商“打工”,更意味之火山引擎于对外提供MaaS效劳时,难以掌握定价之主动权。
若将光阴轴拨回两年前,此为一场于偏激外部压力下之“抱团取暖”。
兵戎介入周边事务,冲击地区军力气象 随之“SeedChip”课题之落地,字节之算法团队可直接与芯片团队坐于同一名办公室里。
不识庐山真面目,只缘身在此山中。通过此种极致之Co-design,字节可于几名月内实现硬件层面之迭代支。
但随之“豆包”大模型及豆包、即梦等AI应用之全面爆发,情况生之根本性之逆转。
回顾此段关系之起点,字节跳动与寒武纪之联手,从一始就带有浓厚之“备胎”色彩。
正如张涛所言,极对于互联网企业来说,极致之Co-design才为破局枢纽。
只有把算力之“水龙头”彻底掌握于自己手里,字节跳动才能于前景惨烈之模型价码战中,有不用看别者脸色之底气。
对于字节跳动而言,2024年到2025年之大规模采购,更多为一场“基于恐惧之避险”与“不得不成之差事”,而非基于技艺与信赖之协作。
据雷峰网通之推演框架改良专家张涛解析,“以DeepSeek推出大型MoE模型为例,其本原便为于云端集群场景下实现之极致之模型与硬件之co-design,以此最大化释放算力性能,而阿里之全栈自研将为更‘急进’之原生适配预案。
前景之牌桌上,只有两类玩家:要么强盛到能像英伟达一样,制定章法,让巨头为你打工; 要么,慧到能像Annapurna一样,融入巨头,成为章法之一部分。
和平统一。你没有十年之光阴去慢慢培育掘发者性命,因字节与阿里们之自研芯片明日就会上线,直接用PyTorch/TensorFlow之底层适配绕过你之性命壁垒;你也没有从容试错之机会,因本钱商场与主顾不再相信长周期之传说。
寒武纪作为一家独力之芯片设计公司,其货品迭代周期通常遵循旧俗之硬件法则,一款芯片从定义到量产往往需18到24名月。
以字节跳动核心供应商之一之寒武纪为例,其2025年财报显示,受益于互联网大厂之疯狂扫货,公司不仅实现之史册性盈利,其思元系列推演卡之毛利息也随之规模效应始攀升,公司毛利息也超过50%。
并于阿里云实现多名万卡集群部署,并效劳之国电网、小鹏汽车等400多家主顾。
又能否复刻谷歌TPU之传说,使用极致之软硬协同重新定义MaaS商场之定价权。
当数以十万计之GPU于机房轰鸣,每一秒钟流走之不仅为电费,更为被英伟达等上游硬件厂商切走之巨额赢利。
花天酒地。于此名赢家通吃之算力时代,单纯之“硬件中间商”正失存之土壤。
若说阿里云为第一名吃螃蟹之者,彼么字节跳动就为彼名紧随其后、且胃口更大之掠食者。
正为凭借TPU与TensorFlow框架之软硬一体化,谷歌于保证自家搜索、YouTube推荐等庞大业务算力需求之同时,将单位算力本金压缩到之角逐对手之几分之一,甚至还始之TPU之外售,扮演起之“第二英伟达”之角色。
当字节可用更低之本金、更快之迭代速度来知足自身需求时,续维持寒武纪之高毛利采购,就违背之商业之基本逻辑。
届时,此些互联网巨头将成最可怕之跨界:它们既为最大之云效劳商,也为最大之芯片供应商。
向上,彼等无法像英伟达彼样有无可撼动之CUDA性命护城河,能够让主顾“不得不买”;向下,彼等又面临之大厂自研芯片之极致性价比角逐。
回顾英伟达之起飞,彼为建立于长达15年之“孤独长跑”之上之。
对于寒武纪而言,2025年之盈利或许为短暂辉煌之起点,但也或为大厂“去中介化”前最后之狂欢。
但今,此名“天时”已彻底灭之。
于云计算与AI之产业链条中,处于中游之第三方独力芯片设计厂商,正面临之前所未有之“夹层挤压”。
Computational Biology。产业链知情者士曾向超聚焦透露,字节跳动于彼时扫货寒武纪思元590芯片,核心诉求极其简:填坑。
彼时,受制于禁令因素,A100/H100军无法正常供应,虽随后推出之H800、H20等“阉割版”之货品,但此把悬于头顶之达摩克利斯之剑让所有互联网巨头皆感到脊背发凉。
02 芯片“去中介化”谁于寒冬里发抖。
近日,据蓝鲸科技报道,字节跳动芯片研发团队将始规模化招聘,实在招聘都邑涵盖北京、上海、深圳等,所需职位包括芯片架构、soc设计等。
于供应链最黑暗之时刻,字节跳动急需一名“Plan B”来对冲英伟达随时或断供之险情。
此并非危言耸听,看看供应商之财报就知道“打工”打得有多惨烈。
而于此种降维打击下,留给寒武纪等“特种活命派”之路,只剩下两条。
第二条路,则为更现状之卖身互联网。
为之把赢利留于自己锅里,字节选择下场造芯。
于为,当最大之主顾变成之最强之角逐对手,第三方厂商之活命方位将被压缩到极限。
于此条路上,你要做之不仅仅为画出最好之电路图,而为要构建出像CUDA一样坚不可摧之软件性命护城河。
而当光阴来到2026年,当字节跳动之1000者芯片团队成之从架构设计到流片验证之全部拼图时,此名贵之“备胎”也将逐渐失存之意义。
1月底,平头哥官网上线之最新一代AI芯片“真武810E”,性能直接对标海外芯片巨头英伟达之H20,出货量已达10万片,超过寒武纪,于国产GPU厂商中属于第一梯队。
自研芯片,为一笔不得不算之货殖账。
目光放宽到整名国产芯片赛道,壁仞科技、摩尔线程等独角兽公司,同样面临之被大厂“降维打击”之险情。
此条路意味之要于巨头之眼皮底下再造一名英伟达,但残酷之为,此注定为一场九死一生之突围。
据QuestMobile数据显示,豆包APP于2025年底之月活用户已稳居国内AI类应用榜首,且用户时长呈指数级增益。
于为,一名甚残酷但也甚清晰之逻辑浮现之:上游芯片厂商之超额赢利,本原上就为字节跳动与火山引擎之本金黑洞。
而此场险境,不仅仅属于寒武纪。
据产业链调研数据显示,2023年至2024年间,字节跳动于疯狂扫货英伟达合规芯片之同时,始向寒武纪下达之规模可观之意向订单。
为之不当此名“售票员”,字节跳动须掌握此种“量体裁衣”之技艺。
于AI已成为全球科技军备竞赛核心之今日,任何一家初创公司欲重走一遍CUDA之路,皆会发觉周围早已为巨头环伺。
既然推演芯片并不需像操练芯片彼样追寻极致之通用性与双精度计算本领,彼么为什么要把此几百亿之赢利拱手让者。
但于字节内部,此名逻辑被彻底重写之。
01 贵之“过路费” 字节不得不算之千亿开支账 彼时,AI于字节之版图中仅仅为一名“改良项”,主要用于推荐算法之提效或广告体系之精准度提升。
而于本钱商场上,寒武纪之股价随之此份“超预期”之成绩单闻风起舞。
而对于寒武纪等刚刚盈利之国产芯片厂商而言,大厂之每一次流片成,究竟为商场兴旺之信号,还为彼名残酷之“去中介化”倒计时。
于经历之将大模型价码打入“厘时代”之急进价码战后,火山引擎通过极致性价比计策,正将日均办理Token推向之百万万亿级别。
此为一场典型之“基于恐惧之采购”,而非“基于性能之优选”。
面对日益增益之AI投入,自研芯片能否帮字节跳动彻底摆脱“给英伟达打工”之魔咒,将贵之算力本金转变为火山引擎之独家赢利。
“目前字节芯片团队已实现多次一版成流片,早期多名课题进入量产部署阶段,覆盖多名主流前卫工艺节点,整体研发与落地节奏稳步推进。
然而,兴旺之表象之下,为极其脆弱之地基。
” 2025年,寒武纪营收实现之惊者之翻倍式增益,一举突围60亿元者民币大关,同比增益率超过200%;更重要之为,它终于跨越之彼道困扰之自身多年之财务天堑,实现之史册性之首次年度盈利。
此些芯片并没有立刻被部署于核心之推荐算法集群中,而为主要用于部分非核心业务之推演场景测试。
Techno-good。于存量角逐时代,供应商之每一分赢利,皆为字节可挖掘之降本方位。
从2025年初始,其股价犹如坐上之火箭,一路击穿各大阻力位,市值一度逼近5000亿大关。
当字节跳动决心将彼几百亿之“超额赢利”留于自己锅里时,对于刚刚于2025年尝到甜头之国产芯片厂商而言,此不仅仅意味之丢失之一名大主顾,更意味之一场关于“去中介化”之命倒计时正式开启。
据The Information剖析,英伟达高端GPU之毛利息长期维持于70%以上之高位。
日本正建造排水量约1.6万吨之驱逐舰,强化反导战力。
放眼全球,能走通此条路之独力厂商只有英伟达一名,此需“天时地利者与”之极致配合。
而作为国产AI芯片“第一股”之寒武纪,凭借其思元系列货品,成为之当时为数不多能拿出量产现货、且软件栈相待成熟之供应商。
更重要之为,阿里云也借此实现之“平头哥+阿里云+千问模型”黄金三角之闭环。
黄仁勋于AI爆发前之荒原里,每年烧掉数亿美金推广CUDA,彼时没有巨头盯之他,没有云厂商抢他之生意,他有充足之光阴窗口去“猥琐发育”,将显卡从游戏器物一点点改造成AI引擎。
此种以价换量之计策虽抢占之MaaS之商场份额,但也让底层之算力承压达到之临界点,火山不仅要支撑内部数亿用户之即时交互,还要响应外部企业主顾海量之API调用。
然而,商业全球之甲之蜜糖,往往为乙之砒霜。
放眼海外,谷歌早于十三年前就开启之TPU之研发。
对于字节跳动而言,前有谷歌TPU之“珠玉于前”,后有阿里PPU之“近身示范”,此时下场造芯,不仅为出于本金控制之防守,更为为之于MaaS战中复刻谷歌传说之进攻。
与此同时,作为字节跳动B端业务全新增益极之火山引擎,也于经历一场前所未有之算力饥渴。
于AI芯片之卖方商场里,定价权完全掌握于上游手中。
第一条路为成为英伟达。
此不仅仅为技艺指标之胜,更为商业逻辑之质变:当采购规模突围之“自研盈亏均衡点”,下场造芯就从一种可有可无之技艺储备,变成之巨头博弈中须跨越之活命门槛。
于为,当AI业务从“锦上添花”变成之公司之“核心增益极”,算力消耗之性质也变之:它不再为研发投入,而为每一分钟皆于流血之运营本金。
” 目光转回国内,阿里云走之也为自研之路途。
相比于采购通用GPU,自研之ASIC芯片更像为一把精准之手术刀,它能针对字节独有之推荐算法与Transformer架构进行深度定制,剔除所有冗余之通用功能,把每一颗晶体管皆用于刀刃上。
此意味之,当字节跳动之算法团队于2026年提出之一名新之稀疏化注意力机制时,彼等若用寒武纪之芯片,或要等到2027年底才能用上硬件加速。
业界估算,此种极致之专用性,能将单位算力本金降低50%以上。
换句话说,大厂买你,不为因你不可替代,而为因当时只有你“有货”。
除此之外,已无更多坦途之。
而于团队规模上面,据雷达Finance报道,字节之AI芯片团队与CPU团队者数较多,其中,AI芯片方位者数过半,达500者以上,CPU团队于200者左右。