当前位置:文章 > 列表 > 正文

对话魔形智能CEO徐凌杰:token出海没考虑算力本金,当下不现状 - 票房

📅 2026-04-21 19:34:57 🏷️ 贵金属交易平台 👁️ 219
对话魔形智能CEO徐凌杰:token出海没考虑算力本金,当下不现状

3月底,吾等于上海见到之徐凌杰,聊之聊魔形智能之宗旨愿景与业务模式;也试图借助他“局内者”之视角,一窥Token工厂、Token货殖学,以及电力出海等衍生概念之背后真相。

央视

因或甚多者皆不知道AI 芯片、效劳器长什么样子,但Token作为购买智力之一名单元,许多耗费者已有所感知。

人类命运共同体。

于2019年壁仞科技成立后,徐凌杰作为联手创始者之一,主要负责货品筹划与商场拓展业务。

Q:此可等同于黄仁勋说之“谁之每瓦Token吞吐量最高,谁之制造本金就最低”? 吾等有一名对标之思维惯式。

链条

Q:最近“token出海”“电力出海”之概念甚火,强调之为国产动力优势之体系变现,此于商业模式上可行吗。

魔形必为面向提供Token出发,效劳器、集群会为此名模式之副货品。

所有者到之彼里之后,学会之第一名词叫 speed of light(光速)。

而此需更大之集群。

英超

当模型一统面向所有者开源时,于前景一段光阴内,大家要关注之就为怎么把硬件机构得更好、让模型跑得更好,此就为Infra要做之事情。

故必要搞定硬件、掌握供应链之枢纽环节,才有或达到抱负之本金。

从地图上看,魔形智能与位于浦江之壁仞科技大楼相距不到半小时之车程,但两家公司之使命已不同。

第二种之算力消纳模式,或会为前景吾等扩自己源泉之一种方式。

今日来看,推演inference相比操练training 来讲,前景之成长性会高甚多。

大家于此名赛道里,面对之皆为百倍千倍之成长机会。

建工

同月,黄仁勋于英伟达年度盛会GTC 2026上预言“前景之数据中心会变成一名制造Token 之工厂”——与魔形之愿景不谋而合。

Q:魔形智能会考虑自研芯片吗。

前者之概念为更贴近于活之。

DeepSeek V2与GPT-5每百万Token本金对比,图/网络 徐凌杰讲道,于过往动力、芯片、Infra、大模型各自分立之行业架构里,贤才为分层之,欲形成软硬结合Infra之商业闭环就需跨层次之贤才,而“魔形之团队恰好有此样之者”。

航空航天。

而此名电力决定之你之装机量上限,进而再去谈每天制造之多少Token。

数据之直观对比尤为惊者,DeepSeek V2之每百万Token本金相比同年发布之GPT-5降低之约96%。

”。

吾等为一家制造高品质Token之公司。

但其实甚多选择并没有前路可循,再往后走,需吾等去进行第一性原理之裁决,而不为跟随谁。

公司

A:今日之商场还没有到互相角逐之阶段。

三年之后,此名赛道里面认可能跑出千亿级别者民币以上之公司,而且或不止一家。

于他看来,此并不贴切: 他进一步解释道,单纯说算力改良,更接近旧俗软件行业之演进逻辑:相待芯片公司、数据中心、模型厂商而言,算力改良方为乙方,每付出一次改良效劳、卖出一名License授权,得一次性付费。

毫无疑问,目前英伟达还为技艺极限之追寻者与定义者。

信中谈及前景,他简而神秘地写道:。

三星

徐凌杰曾任职于英伟达、AMD、三星北美研讨院从事GPU研发、管工,并曾担任阿里巴巴阿里云智能业群总监。

” A:Nebius与其他甚多Infra企业不同之为,它有一部分效劳器为自研之。

大国重器。

就像当初之芯片商场,假如一家芯片公司于2020年融完资后,就觉得商场之钱皆被吸完之、窗口期关闭之,彼就错之;事实证验,2021年又成立之好多芯片公司,甚多也成长得不错。

“超节点”顾名思义,为指通过高速互联技艺将多台效劳器、数十乃至上百块GPU紧密集结之高性能计算单元,堪称“算力巨兽”。

从超节点与DeepSeek V2讲起,Token如何走入视野中央 2026年元旦之后,全球头部模型Token调用量大幅升,数据/OpenRouter,图/东吴证券 故说此不只为叙事模式之更张,更为货殖成效之再分发历程。

A:不仅为叙事上之变化,而为整名行业于演进。

研报同时写道,此种商业模式将面对三大壁垒:稳固之拿卡本领;强力之交付、上线与后续运营本领;资金周转本领。

(注:于Llama 3.1操练之54天里,Meta之1.6万块H100集群总共遇到之419次意外中断,相当于平均每3小时生一次。

印尼

(Nebius:美股上市之垂直整顿云效劳提供商,获英伟达注资,截至2025年Q2估值为约160亿美元) speed of light代表之极限,考察你之工为否做得足够好,就为用speed of light作为一名指标,公司之人文为推动每名者往100% speed of light去走。

黄仁勋提出之AI之“五层蛋糕”理论,图/英伟达 若芯片本身占据之算力身价链之顶端,一名新玩家于智能算力商场还能做些什么。

汝等语境中之“Token工厂”之概念,跟数据中心、智算中心有什么差别。

同样之数据中心用来制造7B、13B模型之Token,与用来制造Deepseek 671B模型之Token,制造效能也会极其不同。

电影。

甚长一段光阴内,此句话皆为大众体谅一家AI公司商场定位之坐标系。

于现阶段,于硬件方面去下功夫为极其有必要之。

openclaw

根据此名理论来剖析商场气象之话,Token其实就为把下面四层之动力、芯片、infra、大模型给封装于一起之。

而2024年我40岁。

Kafka。

总之我觉得吾等可先忽略无对数术,来看与Token制造效能相关之变量机缘。

) Q:于Token工厂之范畴里,英伟达它还为一名天花板之存吗。

穆尔西亚

做软硬结合之AI Infra,已成新一轮融资 “小龙虾或为任何一名Agent之用户,不再需于意效劳器为哪里来之,只要于应用层去调用此名效劳就可之。

A:今日当吾等看到一名数据中心,第一名疑难往往会去问“你为多少兆瓦之。

毕竟不同品牌、卡与卡之间之性能并不均等——英伟达卡与AMD卡即便同样标称1万PFLOPS,也为不能完全等同之,制造效能也并不同。

而于资金方面,「电厂」获悉,魔形智能刚刚于4月成新一轮融资。

者生之黄金年龄就此么几年,既然吾等认为Token之大潮即刻要来之,彼就要抓住自己精力最好之此几年,敢于纵身。

朱洁静

故另一名角度,若谈论Token工厂与数据中心有什么不一样之话。

从“Token纳入薪酬体系”说起,当大模型始产生货殖成效 黄仁勋此句话可用来评议效能。

此为行业之最佳成绩吗。

吾等为甲方,彼等为乙方,用彼等之机器来制造Token。

今日于华夏商场之每秒钟产生之Token(TPS,Tokens Per Second)大概为于30到60名,于美国此名数术或为达到100、200。

第一件为2024年之GTC大会上,英伟达发布之GB200 NVL72。

魔形智能Token效劳页面,图/魔形智能 如同“CV四小龙”曾为算法之代名词,无论国际巨头英伟达还为壁仞等国产GPU玩家,皆被等同于“算力”之代名词。

可举名例子来看,今甚多公司已于给营造师进行Token之配额,较量常见之为一名月一两千元身价之Token,故说模型已于制造中真正地被用起来之。

” NVL72也为英伟达“超节点”货品路线之代表之作。

之前吾等更多关注到之行业进展,为某地落成算力中心、打造之千卡/万卡集群。

A:当然,我于英伟达工过。

按照之前Meta操练Llama 3之数据,效劳器或每隔一段光阴就会面临故障中断,为此操练团队频繁地进行Checkpoint 保存操练数据、等待效劳器复原、再重新reload数据。

赵丽颖

于3月落幕之英伟达GTC 2026上,老黄也讲道,前景之数据中心会变成一名制造 Token 之工厂。

对于创业之光阴选择,他简讲道:“我与我之联手创始者金琛看到之趋势为,于AI大模型与芯片之间,会有许多之工需做。

“AI之三要素为算力、算法与数据”。

报告

再实在一些,让他看清此名趋势之有两件事: A:此两种皆为潜于之方位,吾等今做之更接近于为第一种,就为与算力中心协作。

可关注之点包括芯片本身之性能,比如从Grace Blackwell到Vera Rubin为一名晋级;第二名为超节点之晋级,从NVL72变成之NVL144;第三名为Format(格式)之不同,关注数据中心为用8bits还为用4bits去做计算。

此为一名集结之36名Grace CPU、72 名Blackwell GPU、合计有60万名零件、重达3000磅之“超节点(SuperPod)”机架体系。

Q:查资料可看到,目前AI Infra较量常见之商业模式有两种,一种为与 IDC 运营商、GPU云效劳商、国产芯片厂商共同对外提供Token效劳,另一种为为已有自建 GPU 集群算力消纳、改良效劳。

大体来讲,参数量越大之模型之Token越慧。

我觉得对今日之华夏公司来讲,更重要之为追寻单位之性价比。

黄仁勋说“Vera Rubin于同一座1GW数据中心里,让将Token之生成速率从2200万提升到之7亿”。

既然吾等认为自己之货品为Token本身,制造高品质之Token、把此件事做到商业闭环就为吾等最首要之差事。

夜阑卧听风吹雨,铁马冰河入梦来。利昂内尔·梅西

然则电力为能够直观去做较量之、最好量化之。

Q:魔形为国内较量早说要做AI Token Factory之公司。

视死如归。
热火队

Token迎来之可被工业化制造、精细化定价之或性。

你作为一名小龙虾或为任何一名Agent之用户,不再需于意效劳器为哪里来之,只要于应用层去调用此名效劳就可之。

全球文明倡议。

于2024年,此种表述难免让外界感到困惑。

英超

而魔形“不想成为上一代之软件公司”,而为直接租用、自持效劳器等硬件算力源泉,进行模型部署、调优等系列工后,直接向主顾输出Token。

因之前吾等讲之数据中心、效劳器,为以英伟达此样之芯片设计玩家为中心之,Token工厂之讲法更强调体系营造层面之改制、容纳之更多环节。

Q:魔形智能之公众号里有几篇文章,拆解过建立Token工厂之要素,分别为高压直流输电、液冷、高速互联、超节点架构下之推演改良与软硬协同。

还有别之或吗。

A:此名相待还较量遥远,不于吾等之今之roadmap里面。

于彼之后吾等又看到之许多应用之爆发,比如本年春节爆火之OpenClaw小龙虾。

于对魔形智能最初之媒体报道中,有者将其描述为一家“做算力改良”“效劳器集群”之公司。

满面春风。

4月发布之东吴证券研报提供之类似之预判:算力租赁厂商业务模式正从单纯之裸算力出租晋级为模型效劳或Token分成模式,商业模式有望从“卖算力”转向“卖Token”。

”他解释道。

A:实在之数术啊吾等可先放一放。

今日于华夏,包括DeepSeek于内,存大量之优质开源模型。

此皆为因吾等还受限于算力之供给。

2024年初,壁仞科技联手创始者徐凌杰离开GPU商场,转身创办之魔形智能(Magik Compute),要做“AI Token Factory”。

Q:按照今较量优质之智算工厂,Token之单位电力吞吐量应于多少。

黄仁勋说“Vera Rubin于同一座1GW数据中心里,让将Token之生成速率从2200万提升到之7亿”。

单论产生多少Token之无对数术,此为与一些限制机缘有关系之,比如模型参数量、比如所谓之离线模式与于线模式——于线模式就为延时要甚低,疑难过来要于一两秒内回复;离线模式或30分钟之后才有结局。

若吾等今日只从角逐之角度来看商场,气象就小之。

A:吾等还为借用黄仁勋提出之五层蛋糕理论来看。

它们把采购来之效劳器做之改配、进行一统化之配置,让效劳更稳固。

阿里

2024年,正为壁仞多款拳头货品进入规模化量产、营收快速攀升之光阴点;同年9月,壁仞还启动之上市辅导,即将开启国产GPGPU第一股之冲刺。

以下为与徐凌杰之对谈: 电力出海为伪命题,但Token商场大有可为 此样带来之好处为什么呢。

吴京(演员)

该怎么体谅此种底层自研。

此成之徐凌杰自己之aha moment:“当时吾等觉得,V2此样之开源模型模型与超节点将为商场之绝配啊。

一帆风顺。nba

于AI大模型之商场里,两年之光阴足以重写一套共识。

当然,模型本领不同,产生之Token智力也会极其不一致。

今日吾等讲对标Nebius,更多地为欲强调软硬件皆需做,而不只为像上一代公司一样只聚焦软件、只聚焦芯片源泉。

Q:您之前于交大之一名采访里提到,魔形智能对标之为Nebius,但走得更深、全栈自研。

Bio-integrated Tech。上海市

“AGI is calling,江湖再见。

奥林匹亚

3月底,于上海漕河泾掘发区之漕河泾科创方位里,吾等见到之徐凌杰。

大厂于发布新之处置预案之时候,也会小字标注发挥最佳性能之各种先决机缘。

他只算之电力本金,但电力本金于Token本金里占不到10%,算力本金才为最核心之。

祝福。

刚刚过往之3月,华夏Token日均调用量突围之140万亿。

A:大家对于更快、智力更高、更大规模制造之Token有需求之。

春暖花开。

据之解,相较于徐凌杰过往深耕芯片硬件之从业经历,其合伙者金琛曾任Graphcore华夏营造副总裁与算法格致家,有丰富之模型改良阅历。

此种现状得到更张之一名标志性事件——至少对华夏来讲之话,为2025年DeepSeek V3之爆发,让大家突然发觉“哎,模型能用之”。

奥运会

第二件事,则为于2024年之5月,开源模型DeepSeek V2发布,凭借MoE(混合专家模型)、MLA(多头潜注意力)等技艺,一举将模型推演本金降至行业最低。

” 徐凌杰将其表述为“软硬件协同之AI Infra”。

A:用多少电,产生之多少Token。

黄仁勋于GTC 2026,图/视觉华夏 Q:于此名历程里,魔形智能之位置为。

ISO 27001。

Q:当前国内还有硅基智能、清程极智此些公司,也于AI Infra之赛道里,彼魔形智能之独特性体今哪里。

外界难免好奇,徐凌杰为什么会于此名“收获时节”选择转身。

此主要还为因彼时产业正处于模型操练之阶段,也就为说模型还没有达到被老百姓广泛用之阶段。

吾等自己算力皆不够用。

Technology。

前景随之吾等国之芯片水平提升,此种愿景或会实现,但显然不为当下之命题。

“算力改良只为吾等之本领,但不为吾等之mission statement。

此种业务模式聚焦于“广义之AI Infra”,也就为将动力(电力)、芯片(算力)、Infra(推演与操练框架等技艺底座)、大模型封装于一起,直接对外输出Token。

大凉山

但今日从全全球范围来看,绝大部分Infra企业还皆为以软件之方式去做。

ActiveMQ。

此为行业之最佳成绩吗。

Q:行业之叙事模式现之变化。

Arts。

Q:之前衡量一名数据中心之性能,吾等会讲它为万卡还为千卡、单卡之flops为多少;今当面对一名Token工厂时,吾等应用什么样之指标去衡量它。

没优势。

总书记

比如目前可去勤勉改良运营本金,于能够获取到之硬件之根基上进行改良。

当前商场比拼之一名为无对性能,第二名就为单位之性价比。

科学

今日来看Token之本金架构,里面有约80%为与效劳器之采购本金相关之。

AI Infra之商场盘子会比芯片更大,但今日整名赛道之本钱投入还远未达到芯片赛道之程度。

做守法公民。

但当光阴迈进2026年,伴随OpenClaw、Seedance等应用走向大众,“Token货殖学”于极短光阴内成之行业内外之迅速破圈。

要形成此种高度体系化之处置预案,需魔形做哪些准备与勤勉。

“用多少电,产生多少Token”成为新之坐标系 2024年1月18日,徐凌杰最后一次以壁仞科技总裁之身份发出内部信,宣布自己即将离职。

此也涉及到一名选择疑难。

彼时此对大众还为一名陌生之说法。

A:今日讲token出海之者,不知道为不为故意忽略之一名点。

一端为算力以“超节点”之样貌被极致堆叠,另一端为模型通过架构革新不断压缩单位Token本金——供给与效能,同时生之跃迁。

” 但设想用Nebius之效劳器来操练,即便它之单价更高,然则因稳固性更好、故障中断率更低,模型也能更快操练出来。

不要人夸颜色好,只留清气满乾坤。

以数据中心、智算中心样貌落地之算力租赁生意,只为此名链条中偏重资产、运维之一环。

埃弗顿

英伟达Vera Rubin NVL144 CPX机架,图/英伟达 于写给壁仞同事之离职信中,徐凌杰还写道:“虽造芯之路告一段落,但还将坚守于智能算力之大赛道上”。

里程

A:长期来看为要往超节点之路去走,它为一名体系化之营造,当前吾等认可还于路上,但于路上也可“沿途下蛋”。

玻尿酸

但华夏之算力今有优势吗。

上一篇:台湾票房第一,让者边哭边骂? 下一篇:万兴科技(300624.SZ)旗下万兴喵影桌面端重磅晋级:视频免费剪,AI更出片!