• 隐私政策
  • 联系我们
  • 关于我们
2026 年 6 月 25 日 星期四
聚赢方舟
广告
  • 首页
  • 快讯 7x24
  • 行业新闻
  • 商业动态
  • 股市风云
  • 期货研报
  • 基金财讯
  • 贵金属
No Result
View All Result
  • 首页
  • 快讯 7x24
  • 行业新闻
  • 商业动态
  • 股市风云
  • 期货研报
  • 基金财讯
  • 贵金属
No Result
View All Result
聚赢方舟
No Result
View All Result
Home 行业新闻

算力荒,但 Token 却便宜了,智算云的账该怎么算?

by 聚赢方舟
1 天 ago
in 行业新闻
Reading Time: 1 min read
A A
分享至微博分享给朋友


ADVERTISEMENT

中国智算行业正在同时经历两件矛盾的事:算力越来越贵,但 Token 越来越便宜。

一面是算力需求溢出,国内优质算力资源持续紧张,价格自今年春节前已涨超 50%,有渠道商反映,部分热门算力卡型号」 不是贵的问题,是根本拿不到」;国内外的智算中心疯狂堆算力,甚至要靠签远期合同锁定。

但另一面是 Token 价格崩塌,两年前每百万 token 要几十美元,现在不到一美元,主流大模型厂商为了争用户,几乎在做赔本的生意。行业内有观点认为,当前以超低价争夺用户的模式,长期来看可持续性存疑。

这说明大模型产业发展的早期,还没有找到多赢的方式,也注定是不可持续的商业模式。当芯片厂商拿走了 60% 以上的利润,做应用的几乎没有定价权,中间层的智算云,顶着上游的成本压力,也要面对下游客户不断压价。

在行业人士看来,更根本的问题是,现在撑着整个行业运转的硬件,本质上是为训练设计的,拿来跑推理、生产 Token,就像开着法拉利送外卖,成本结构从一开始就对不上。

训练侧的逻辑,撑不起推理侧的账

过去三年,智算行业卖出了一个共同的故事,谁有卡,谁就赢。

这个逻辑在训练侧是成立的,大模型竞赛本质是算力竞赛,一个 1 万卡集群和一个 10 万卡集群能训出来的模型根本不在同一天花板。

九章云集创始人方磊透露,九章云极目前收到的远期订单是自身可交付容量的 10 倍以上,锁定资源的定金比例最低只有 5%,但若同时锁定价格则需要 30% 到 40% 的定金。

但推理侧的生意,早就跑在了一条完全不同的轨道上。全球范围内,Token 单价持续降低,底层的算力成本却并没有同步下降,能耗、折旧、网络,每一笔都是真实支出。

问题还不止于此,智算中心的算力利用率普遍不高,根本原因在于网络传输本身成为了瓶颈。在大规模训练集群里,数万块加速卡需要频繁同步数据,任何网络延迟都会让大量算力陷入等待。

此前有业内人士指出,千卡级训练中通信时间占比可达 30% 以上,在超大规模场景下甚至高达 50% 至 70%,scale up(单机多卡) 和 scale out(多机组网) 之间的效率鸿沟,是从训练工厂移植过来、天然无法消除的技术债。

如上所述,产业链的利润分配结构也是问题,上游芯片厂商吃掉了整条链路 60% 以上的价值,中游云厂商在 CPU 时代的净利润率大约在 35%,但在 AI 时代,算力成本占到运营支出的七八成,毛利空间被双向挤压。

银河证券分析师吴砚靖称,Token 经济的定价权目前仍集中在上游,中游是效率放大器,下游暂时没有话语权。换而言之,中下游的景气度改善需要等待上游产能充分释放之后。

硬件供给侧同样受限,国产 AI 芯片产能不足,是当前最薄的那块木板。

国内方面,还多了一层算电协同的复杂性,业内人士提到,绿电直供有 60 到 80 公里的物理传输上限,一旦上高压就要缴纳 「过路费」,而且光伏夜间不发电,风电功率曲线波动剧烈,和智算中心希望的恒定功率曲线严重错位,储能配比超过 15% 就开始亏本。

当前算电协同还有待更多突破,包括绿电直供能否通过高压更远传输,水电和核电能否纳入绿电认定,甚至绿证价格本身也在持续上涨,今年以来已涨了近一倍。

现在谈 Token 工厂,时机上既不早也不晚,早了基础设施不成熟,晚了就错失机会窗口。

做运营商,不做中间商

云计算行业已经很久没有新的挑战者,即便 AI 带来了全新的变量,但云计算所需要的规模和资金,依然是现实的护城河,一些企业极却给出了一个让人意外的答案。

「九章非常重要的定位,是走出一条与互联网大厂云不同的路——做算力赛道的 『第三方选择。」 方磊所说的大云,是阿里云和火山引擎,阿里云和火山引擎背后是两家年收入数千亿的互联网巨头,九章云极至今仍是一家创业公司,这种反差,怎么看都有些错位。

他认为,大云有大云的结构性特点,那些在互联网时代成长起来的云厂商,底层架构是为带宽和存储优化的,AI 时代 90% 的成本是计算,100G 的老交换机和为 AI 专门设计的 400G 交换机之间,效率差距难以弥合。新的云计算平台跑同样一张英伟达 GPU,在特定场景下效率优势显著,这是历史包袱决定的。

事实上,行业内存在一种 「算力贸易」 模式——买一批服务器放进机房,租给客户,自己没有调度能力。

在方磊看来,现货倒卖,客户应该签远期订单才能拿到资源,资产是自己控制的——一些与互联网大厂存在竞争关系的企业,在选择算力平台时会优先考虑中立方案——这正是第三方云存在的理由。

训练工厂对应零到一的模型制造,目标是在未来 24 个月内形成 10 万 P 的训练算力,方磊判断,下一代前沿模型的突破,要靠 30 万卡甚至更大的集群才能跑出来,而这样的超大规模基础设施仍在建设过程中。

Token 工厂对应一到 N 的规模化交付,目标是每天 10 万亿 token,但这 10 万亿不是通用 token,而是面向专业场景的」 专业级」 和」 前沿级」。方磊将 token 市场分成三层:消费级 (每百万 token 约 1 美元)、专业级 (每百万 20 到 40 美元)、前沿级 (每百万 150 美元以上)。

九章的战略锚定在后两层,帮助客户训练专业模型,再通过 Token 工厂低成本交付专业 token。他的逻辑是,千行百业里真正能让 AI 落地的,不是通用大模型,而是垂直专业模型,「没有专业模型,所谓 『AI+行业』 就只是一句口号」。

具体落地上,九章云极计划合作超过 1000 家专业模型厂商,资产端则复制了一种基础设施行业常见的轻资产模式:央国企出资持有资产,九章负责运营,按比例分成。

此外,九章云极已在东南亚、日本、中东及欧洲多地进行布局,将中国方案定位为 AI 基础设施的」 第二选项」。这背后的逻辑是:上一轮云计算,欧洲和日本几乎全面依赖美国技术栈,当前 AI 时代各国对」 主权云」 的诉求空前强烈,中国的模型能力、成本优势和不依附于美国供应链的属性,正好填上了这个缺口。(本文作者 | 张帅,编辑 | 杨林)

聚赢方舟

专业财经网站

聚赢方舟 (arkxx.com) 网站是长沙聚赢方舟文化传媒有限公司旗下运营的财经资讯门户网站。聚赢方舟致力于为用户提供全面而深入的财经资讯与金融数据分析。网站汇集了最新的市场行情、股票动态、投资策略以及经济趋势,为投资者和财经行业人士提供及时的新闻参考。网站通过高效的数据处理与分析工具,聚赢方舟帮助用户把握市场机会,优化投资决策。

此外,网站还定期发布专业的市场评估报告和财经评论,确保用户能够获得最准确的市场洞察。

方舟日历

2026 年 6 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 5 月    

标签

中国 中国企业 也不 买了 互联网 假日 养老金 北大 千元 印度 反超 奶茶 家族 工龄 怎么回事 或将 房价 房贷 新能源 新闻 日本 更大 有什么 村官 来了 楼市 江苏 沙特 浙江 特斯拉 电动车 石油 美元 美国 美籍 节日 芯片 让人 越南 长假 防晒 阿里 阿里巴巴 院士 首富

© 2025 长沙聚赢方舟文化传媒有限公司 by 聚赢方舟 - 湘 ICP 备 2025135270 号-1

No Result
View All Result
  • Home

© 2025 长沙聚赢方舟文化传媒有限公司 by 聚赢方舟 - 湘 ICP 备 2025135270 号-1

此网站使用 cookie。继续使用本网站即表示您同意使用 cookie。访问隐私和 cookie 策略.。