
Token,是畴昔数字世界最中枢、最值钱的巨额商品。
2026 年 GTC 大会上,黄仁勋这么界说 AI 期间的底层通货,而数据中心即是分娩智能的工场。
往日几年,寰球绝大多数这么的"工场"皆依赖并吞套斥地:英伟达的 GPU 与 CUDA 生态。当霍尔木兹海峡的绽放与关闭,影响地缘政事与动力安全时势,寰球 AI 市集的 Token 供给也需要呈报:算力供应链出现单点依赖,怎样保险 Token 的安详产出?
4 月 24 日上昼,DeepSeek V4 崇拜发布,其官方技能讲述明确将华为昇腾 950PR 写入硬件考证清单,杀青了从英伟达 CUDA 到国产算力的全栈转移。下昼,好意思团 LongCat-2.0-Preview 绽放测试,这是当今独一公开阐述由国产算力完成万亿参数预磨真金不怕火的大模子,磨真金不怕火全程动用了 5 万至 6 万张国产算力卡,其磨真金不怕火范围是迄今为止最大的。
两款模子在并吞天跨入"万亿参数俱乐部",更关键的是,这意味着一条自主的"国产 Token "供应链,正在英伟达体系以外加快接通。
领略这一天意味着什么,需要断绝来看。
万亿参数俱乐部的新玩家
往日一段时候里,万亿参数如同大模子的"珠峰"。玩家们想登顶,需要刷好意思国技能栈的"装备",尤其离不开英伟达。
Open AI、Anthropic 等硅谷独角兽,无不是英伟达 H100/A100 集群上的"付费玩家"。凭借软硬一体的 CUDA 生态系统,英伟达在寰球 AI 磨真金不怕火负载市集结占据了 90% 以上的总共把握地位。
对中国 AI 企业而言,这有诸多不细目性。连年来,好意思国对华高端 AI 芯片的出口管制合手续收紧,从当先的 A100、H100 禁售,延迟至特供版 H20 的许可驱散,到本年 4 月,好意思国高端芯片内容对华禁售。即便通过其他渠谈拿到芯片,也随时濒临升级旅途被堵截的风险。
至此,算力不再只是开销成本,亦然生涯成本。
2026 年 4 月 24 日,备受蔼然的 DeepSeek V4 发布,同日好意思团 LongCat-2.0-Preview 启动绽放测试,双双加入了"万亿参数模子"的行列。这两个大模子用不同相貌,杀青了国产算力替代的阐述。
DeepSeek V4 的早期磨真金不怕火基于英伟达 CUDA 架构和 GPU 硬件,之后全栈转移至华为芯片。V4 适配的华为昇腾 950PR 推理芯片,以致在低精度推理中展现出越过通用 GPU 的后果。
同期进行测试的 LongCat-2.0-Preview 取舍了另一种相貌,这是当今独一由国产算力磨真金不怕火的万亿参数大模子。其磨真金不怕火与推理全程依托国产算力集群寂静完成,动用的国产算力卡数目在 5 万至 6 万张之间,是国产算力上完成的范围最大的磨真金不怕火任务。
从技能层面来看,DeepSeek V4 和 LongCat-2.0-Preview 均采选 MoE 架构,支合手 1M(100 万 token)超长高下文窗口,单次推理可处置数百万字输入,处置量级与 GPT-5.5 处于并吞水平。两款模子在常识容量、长文才调略及复杂逻辑推理的上限上,已崇拜跨入寰球第一梯队。
莫得采选行业通行的"堆算力"阶梯,DeepSeek V4 和 LongCat-2.0-Preview 皆是通过架构优化,对每一张国产卡算力进行极致榨取,同期它们也用推行讲明,极致优化算力后果,可以对消硬件的账面差距。
V4 通过夹杂缜密力架构(CSA + HCA)、Muon 优化器等底层架构创新,在高下文长度放大 8 倍的前提下,算力消费比 V3.2 裁汰七成以上。LongCat-2.0-Preview 每 token 激活参数约 48B,从一些测试反应来看,在保合手较高性能的同期,杀青了可以的推理后果。
后果转变最终转换为颠覆性的买卖订价。DeepSeek V4 最新的 API 订价,V4 Flash 每百万 tokens 输入(缓存射中)价钱为 0.02 元,V4 Pro 为 0.025 元。外洋酬酢媒体上,有网友示意,这是从 Claude 八成 GPT 转移到 DeepSeek 的最好窗口期。
两款模子的发布,激发了国产算力适配的四百四病,国产算力替代逐渐成为趋势。
从华为昇腾、百度昆仑芯、寒武追想念元、海光信息 DCU 到阿里平头哥,国产 AI 芯片在性能与生态上合手续迭代;摩尔线程、壁仞科技、沐曦股份等创业企业也在加快追逐。
TrendForce 预计,2026 年国产芯片在高端市集的份额将增长到 70%,行业对国产算力的期待,不再停留在"可用"层面。
算力解围前后
中国 AI 厂商们加快布局国产替代,除了此前说到的好意思国高端芯片出口管制等政策压力,还有一个蹙迫的考量:算力荒传导至价钱端,导致算力变得越来越贵。
中信证券指出,开云app登录Token 调用量井喷带来的是算力需求极大爆发,与此同期供给侧受到万般硬管束短期旯旮增量有限,当今国表里均出现了严重的算力荒。
而中国 AI 用户的算力消费极其巨大,证据 OpenRouter 的数据, 2026 年 3 月 30 日 -4 月 5 日,中国 AI 模子的周调用量大肆 12.96 万亿 Token,是同期好意思国的 4.3 倍。如斯浩瀚的需求, 如若长久高度依赖单一的"英伟达 + 台积电"供应链,将濒临供应受限与价钱合手续高涨的双重风险。
这种结构性矛盾,使得国产算力替代不再只是 "备选题",而是 "必答题"。然则,替代之路向来粗重。
其难点在于祛除现成的代码库、编译和调试用具,从"零"运行。英伟达 CUDA 经过 20 年积聚,领有超 400 万开发者和教诲的 cuBLAS、cuDNN、NCCL 库。国产算力平台的算子库隐私度、优化深度以及测试用具皆不竣工,需要工程团队进行巨额底层开发与调试责任。
另一个难点在于硬件的并行计较。由于单卡性能存在差距,国产芯片想要杀青通常的计较性能,例必要并行更多硬件,而算力硬件并行容易带来故障。
在大模子磨真金不怕火中,集群范围一朝扩大至万卡级别,故障概率呈指数级上升,任何轻浅的计较差错、通讯延迟或数值精度偏差,皆会在并走运算中指数级放大,导致所有磨真金不怕火任务中断或模子拘谨失败。
LongCat-2.0-Preview 在 5、6 万张国产集群上完成万亿参数 MoE 模子的安详磨真金不怕火,意味着团队必须在并行策略、通讯拓扑、夹杂精度磨真金不怕火及容错机制上进行深度自研与调优。这是对国产算力系统工程才调的一次高强度的压力测试。
工程才调还只是冰山一角,芯片缱绻制造、软件栈乃至欺骗,需要更多产业力量的长久插足。来自互联网巨头、产业成本与风险投资的资金,成为这些长久进化背后的蹙迫复古。
以好意思团为例,近几年在算力、科技硬件和大模子等边界进行了往常的早期投资。芯片方面,好意思团投资了摩尔线程、沐曦股份、紫光展锐、爱芯元智、荣芯半导体等浩荡企业,隐私了多家国产 GPU 头部和"国度队"级别的半导体公司。
这些企业的技能场合各有侧重:摩尔线程与沐曦股份聚焦通用 GPU 缱绻;紫光展锐在挪动通讯与物联网芯片边界根基深厚,为端侧 AI 提供底层连气儿才调;爱芯元智专注边缘算力、AI 视觉芯片;荣芯半导体则涉足晶圆代工,存身于芯片的产能训导。
好意思团还同期投资了包括宇树科技、星河通用、星海图在内的多产品身智能公司和科技硬件公司。从大模子上游的芯片缱绻制造、到大模子研发,再到 AI 在各个边界的欺骗,用王兴的话来说,好意思团将 AI 视为计谋机遇。
好意思团的密集投资并非孤例,它所折射的,是中国科技成本对国产算力赛谈乃至畴昔科技发展的系统性布局。
模子在国产算力上跑通了,然后呢?
当国产芯片铺开、万亿参数模子跑通,原土 AI 能否走向"更好用"阶段,濒临着数据层面的挑战。
一方面,是工程反应数据。
当超大范围 AI 模子在国产芯片集群上磨真金不怕火时,会暴线路多样问题,比如某些计较措施精度有过失、芯片之间数据传输太慢、软件编译优化不到位、多卡并行时通讯通谈拥挤、低精度计较时数值丢失等。
技能团队逐个攻克这些问题的经过,自己即是一场对国产芯片软硬件的大范围测试。每一个被赞成的 bug、每一段被调优的通讯公约,皆会反应给国产芯片厂商,鼓舞下一代硬件的纠正和软件栈的教诲。
对 LongCat-2.0-Preview 这么的"原生国产模子"来说,从磨真金不怕火阶段起便全程依托国产算力集群完成,产生的工程反应较为竣工和信得过。这种"模子反哺芯片"的闭环,故意于国产算力生态向下扎根。
另一方面,大模子需要物理底座,和具体任务、信得过世界产生高质地的数据互动。
特斯拉凭借寰球最大的信得过驾驶数据库,构建了其自动驾驶的中枢基石,从信得过世界汇注、到仿真磨真金不怕火、再到算法迭代的" Real-to-Sim-to-Real "飞轮,同期驱动了自动驾驶汽车与东谈主形机器东谈主的进化。
通常的逻辑,正在一个更复杂高频,靠近日常生活的场景伸开,那不是加州的高速公路,而是中国城市的三街六巷。好意思团领有寰宇 2800 多个市县的即时配送汇集,隐私中国最复杂的物理环境。好意思团无东谈主机已累计完成买卖订单超 78 万笔,国表里灵通 70 条航路。好意思团无东谈主车已至少已完成 550 万单配送任务,自动驾驶总里程大肆 1900 万公里。
无东谈主机在楼宇间穿行时的视觉避障数据、无东谈主车在复杂路况下的及时方案轨迹、骑手与机器协同调遣中的动态优化样本,皆是高价值、高密度的信得过世界数据。这些是 LongCat 大模子合手续进化的养料,亦然国产算力芯片在严苛环境中考证可靠性、能效比的信得过环境。
并吞天里先后发布和绽放测试的 DeepSeek V4 与 LongCat-2.0-Preview,组成了国产算力进化的一体两面。前者以开源、廉价与通用才调,讲明了国产算力可复古寰球顶尖的基础模子;后者以原生国产磨真金不怕火、万亿参数范围与物理世界闭环,讲明了国产算力集群可寂静完成极限的工程任务。
这不单是是算力心焦下的替代叙事,更是一场 "主动界说"的回身,寂静滋长、正向轮回的中国 AI 产业链,还需要长久极力,但正在加快成型。
(起首:豹变)开云
U体育(中国)官网入口
备案号: