国产AI芯片五强格局:华为昇腾950PR量产,寒武纪季度盈利10亿

IDC 最新数据:2025年中国AI加速卡市场总出货约400万张,本土厂商出货165万张,份额41%。英伟达从2024年的70%下滑至55%,国产替代迎来里程碑拐点。

2026年Q1,五强格局进一步固化。华为昇腾950PR量产、寒武纪单季盈利10亿、阿里平头哥5nm芯片累计交付47万颗——每个玩家都在加速出货。

五强全景

厂商2025出货量市占2026Q1营收主力产品
华为昇腾81.2万张20%未公开910C/950PR
阿里平头哥26.5万张6.6%未公开真武810E(5nm)
寒武纪11.6万张3%28.85亿元(+160%)思元590
百度昆仑芯11.6万张3%未公开昆仑芯3代
海光信息8.3万张2%40.34亿元(+68%)深算DCU K100

华为昇腾:断层领先

昇腾950PR是2026年Q1最大的变量。首款搭载自研HBM的AI芯片,FP4精度算力达到1.56 PFLOPS,112GB自研HBM显存。Atlas 350加速卡算力达到英伟达H20的2.87倍。

核心参数对比:

型号FP16算力显存互联带宽状态
910B320 TFLOPS64GB HBM2e240Gbps2024量产
910C800 TFLOPS128GB HBM2e784GB/s2025量产
950PRFP8:1P / FP4:1.56P112GB 自研HBM2TB/s2026Q1量产

出货目标已上调至150-200万颗。2026Q1已出货约15万张910系列卡。字节跳动采购150套超节点,阿里和美团各50套。单套超节点价格约2亿元。

华为的策略很清晰:全栈自研(芯片+MindSpore+CANN),借助政企和运营商订单锁定基本盘。CloudMatrix 384超节点累计已超300套。

隐患同样明显:NPU不兼容CUDA生态,模型适配成本高,依赖政企渠道。

寒武纪:从亏损王到季度盈利10亿

这是最戏剧性的反转。2025年寒武纪全年营收64.97亿元(+453%),净利润20.59亿元。2026年Q1营收28.85亿元(+160%),归母净利润10.13亿元(+185%)。经营现金流上市以来首次季度转正。

思元590是核心驱动力。7nm Chiplet封装,FP16算力256 TFLOPS,96GB HBM2e,综合性能接近A100的80%,功耗低15%。自研Bangware软件栈实现CUDA兼容,迁移成本降低约70%。

客户高度集中:前五大客户占88.66%营收,字节跳动是第一大客户(超26%)。字节自身也在研发芯片,这是悬在寒武纪头上的剑。

阿里平头哥与百度昆仑芯:大厂系的芯片棋局

平头哥是五强中唯一采用5nm制程的厂商。真武810E累计交付47万颗,年化收入百亿级。优势是云芯一体TCO显著,弱势是外部客户信任度低,出货与阿里云资本开支高度绑定。

昆仑芯2025年出货11.6万颗,外部客户占比已从30%提升至40%。2026年5月启动科创板IPO辅导,投后估值210亿元。比亚迪、中国移动都是股东。

国产四小龙:向上挤压

摩尔线程、沐曦、壁仞、天数智芯构成第二梯队。2025年集体营收翻倍,摩尔线程Q1首次盈利。产品定价普遍低于华为和寒武纪,主打CUDA兼容策略。摩尔线程MTT S5000已规模量产,可支持万亿参数大模型训练。

2026年核心变量:

  1. 昇腾950PR量产与互联网订单能否兑现(目标150-200万颗)
  2. 寒武纪能否持续盈利(Q1盈利10亿但客户集中度高)
  3. 四小龙能否全年盈利(摩尔线程Q1已转正)
  4. 英伟达H200合规不确定性(已计入45亿美元减值费用)

技术观察

短期(2026年):国产份额从41%提升至50%+,推理芯片出货大幅增长,硬件成本仅为海外1/3。中期(2027-2028年):行业洗牌窗口开启,头部3-5家占据80%+份额。长期:国产AI芯片从千亿级增长至万亿级,系统级竞争取代单卡比拼。

对开发者而言,最值得关注的是CUDA兼容层的成熟度。寒武纪Bangware迁移成本降低70%,摩尔线程MUSA架构实现零成本迁移——这意味着国产芯片的可编程性正在快速追上英伟达,不再是多年前的玩具。


← Back to blog