• 隐私政策
  • 联系我们
  • 关于我们
2026 年 5 月 8 日 星期五
聚赢方舟
广告
  • 首页
  • 快讯 7x24
  • 行业新闻
  • 商业动态
  • 股市风云
  • 期货研报
  • 基金财讯
  • 贵金属
No Result
View All Result
  • 首页
  • 快讯 7x24
  • 行业新闻
  • 商业动态
  • 股市风云
  • 期货研报
  • 基金财讯
  • 贵金属
No Result
View All Result
聚赢方舟
No Result
View All Result
Home 快讯

AI 遇上最强春节档 Token 通胀已成必然?

by 聚赢方舟
3 月 ago
in 快讯
Reading Time: 1 min read
A A
分享至微博分享给朋友

ADVERTISEMENT

《科创板日报》2 月 15 日讯 2026 年马年春节,互联网大厂的 「红包战」 如期上演。百度撒下 5 亿,腾讯元宝豪掷 10 亿,阿里更是祭出 30 亿免单的 「钞能力」。不过 「撒钱」 只是 「开胃菜」,紧随而来的则是参与者更多、频率更密集的国产 AI 新品 「春节档」:

2 月 14 日,字节跳动发布豆包大模型 2.0 系列,这是继 Seedance 2.0 视频模型和 Seedream 5.0 Lite 图像模型之后打出的春节 「第三弹」。智谱已在 2 月 11 日发布 「系统架构师」 级别的底座模型 GLM-5;MiniMax 紧随其后,于 2 月 12 日上线并开源文本模型 M2.5;连一向低调的 DeepSeek,也在几天前进行版本更新。在此之前,阶跃星辰发布 Step 3.5 Flash,阿里发布 Qwen3-Coder-Next,且有望在春节期间发布 Qwen 3.5。

每一次发布都是一次卡位,每一次迭代都是一次重塑行业格局的尝试。这一波覆盖文本、图像、视频多模态的 AI「最强春节档」 已经拉开大幕。

▌多模态大模型接连面世 Token 需求出现 「通胀」

一年多前,字节内部曾判断,AI 对话类产品可能只是 AI 产品的 「中间态」,长期更理想的产品形式,大概率需要更视觉化的用户体验、更低的用户使用门槛。因此彼时的字节选择提升即梦的产品优先级,尝试打造 「AI 时代的抖音」。

或许也正是因此,一年多以后,在字节的这次春节档 「三连弹」 中,最先出场的不是最为大众所熟悉的豆包,而是视频模型 Seedance 2.0。

而从曾经和文本大模型的 「聊几秒」 到如今视频大模型的 「看几秒」,算力消耗规模正在快速膨胀——从单条视频来看,Seedance 2.0 生成一条 10 秒、1080p 的视频,大致要消耗 35 万 token。

Seedance 2.0 的算力消耗增长并非孤例。春节档的这轮密集发布,对各家厂商而言不仅是品牌宣传的窗口期,也是一场对底层算力储备的极限压力测试。随着越来越多的多模态和长文本大模型面世,势必将进一步推高 Token 需求。

国联民生证券指出,Token 需求正在发生 「通胀」 。这种 「通胀」 并非是指 Token 本身变贵,而是指单位时间内、单位用户的 Token 消耗结构性上升。

数据显示,火山引擎的大模型日均 Token 调用量已从 2024 年底的 2 万亿增长至 2025 年底的 63 万亿;阿里云外部客户 2025 年日均 Token 调用也已接近 5 万亿,2026 年目标至少 15-20 万亿,内部业务日均调用则计划从 16-17 万亿拉到 100 万亿。从全行业看,中国整体日均 Token 消耗 2024 年初为 1000 亿,2025 年中突破 30 万亿,2026 年 2 月主流大模型合计日均 Token 消耗已到 180 万亿级别。

图|不同模型 token 调用量 (来源:海通国际证券)

摩根大通指出,春节 AI 应用推广战仅是表面,在这背后更深层的趋势在于,消费者获取信息和消费内容的方式正在经历结构性变革,这一进程实际上推升了推理量,将驱动 Token 消耗量步入一个长达数年的高速增长期。

其预测,中国的 AI 推理 Token 消耗量预计将从 2025 年的约 10 千万亿增长至 2030 年的约 3900 千万亿,五年间增长约 370 倍。

▌Token 成为 「计量单位」 产业链开启涨价

今年以来,全球云计算市场进入密集涨价周期。先是亚马逊云宣布上调 EC2 机器学习容量块价格约 15%;之后谷歌云宣布北美、欧洲、亚洲地区全部涨价;国内厂商迅速跟进:优刻得宣布全线产品与服务价格上浮。

随后,智谱打响了年内大模型涨价 「第一枪」。2 月 12 日,其宣布 GLM Coding Plan 套餐价格体系结构性调整,取消首购优惠,保留按季按年订阅优惠,套餐价格整体涨幅 30% 起。官方解释是 「市场需求持续强劲增长,用户规模与调用量快速提升,为保障高负载下的稳定性与服务质量,同步加大算力与模型优化投入」。之后 GLM Coding Plan 上线即售罄。

国联民生证券指出,智谱此前正因为用户增长导致算力阶段性紧张,对 Coding Plan 做过 「限量发售」 安排,这与其后续涨价形成了一个非常典型的 「供需链条」:需求在短期内大幅增长→资源呈现刚性约束 (导致限流/限量)→涨价。

在分析师看来,当行业依旧处在 「模型价格战」 时,智谱给出的涨价信号,意味着大模型时代的 「计量单位」 从流量 (DAU/时长) 转向 Token(推理消耗),而 Token 消耗在越来越多场景里是刚需。综合来看,Token 需求 「通胀」 不仅利好云端算力,也让模型厂商拥有了议价权;同时产业定价逻辑也发生改变,当推理消耗变成生产资料,模型厂商有机会把 「算力稀缺」 通过分层定价与订阅化产品转化为毛利与现金流。

落实到投资方向上,券商建议关注:

第一,云厂商与算力基础设施:AI 拉动的 IT 支出与基础设施投入仍处上行周期,云侧将受益于 GPU 算力、存储与网络 I/O 等 「伴随型消耗」 的持续增长。

第二,大模型厂商:当它们能在编程、Agent、企业流程等高 ROI 场景中维持订阅留存与企业席位扩张,能把 「Token 用量」 稳定转成 「省人省时省返工」 的交付价值时,就具备了穿越开源与价格战的能力。

第三,安全治理与运行时的防护工具:随着企业把 AI 嵌入工作流,数据泄露、代理越权等风险将推动 「AI 安全平台/治理平台」 成为刚需层。

聚赢方舟

专业财经网站

聚赢方舟 (arkxx.com) 网站是长沙聚赢方舟文化传媒有限公司旗下运营的财经资讯门户网站。聚赢方舟致力于为用户提供全面而深入的财经资讯与金融数据分析。网站汇集了最新的市场行情、股票动态、投资策略以及经济趋势,为投资者和财经行业人士提供及时的新闻参考。网站通过高效的数据处理与分析工具,聚赢方舟帮助用户把握市场机会,优化投资决策。

此外,网站还定期发布专业的市场评估报告和财经评论,确保用户能够获得最准确的市场洞察。

方舟日历

2026 年 5 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 4 月    

标签

中国 中国企业 也不 买了 互联网 假日 养老金 北大 千元 印度 反超 奶茶 家族 工龄 怎么回事 或将 房价 房贷 新能源 新闻 日本 更大 有什么 村官 来了 楼市 江苏 沙特 浙江 特斯拉 电动车 石油 美元 美国 美籍 节日 芯片 让人 越南 长假 防晒 阿里 阿里巴巴 院士 首富

© 2025 长沙聚赢方舟文化传媒有限公司 by 聚赢方舟 - 湘 ICP 备 2025135270 号-1

No Result
View All Result
  • Home

© 2025 长沙聚赢方舟文化传媒有限公司 by 聚赢方舟 - 湘 ICP 备 2025135270 号-1

此网站使用 cookie。继续使用本网站即表示您同意使用 cookie。访问隐私和 cookie 策略.。