国产AI芯片五强格局:华为昇腾950PR量产,寒武纪季度盈利10亿
IDC 最新数据:2025年中国AI加速卡市场总出货约400万张,本土厂商出货165万张,份额41%。英伟达从2024年的70%下滑至55%,国产替代迎来里程碑拐点。
2026年Q1,五强格局进一步固化。华为昇腾950PR量产、寒武纪单季盈利10亿、阿里平头哥5nm芯片累计交付47万颗——每个玩家都在加速出货。
五强全景
| 厂商 | 2025出货量 | 市占 | 2026Q1营收 | 主力产品 |
|---|---|---|---|---|
| 华为昇腾 | 81.2万张 | 20% | 未公开 | 910C/950PR |
| 阿里平头哥 | 26.5万张 | 6.6% | 未公开 | 真武810E(5nm) |
| 寒武纪 | 11.6万张 | 3% | 28.85亿元(+160%) | 思元590 |
| 百度昆仑芯 | 11.6万张 | 3% | 未公开 | 昆仑芯3代 |
| 海光信息 | 8.3万张 | 2% | 40.34亿元(+68%) | 深算DCU K100 |
华为昇腾:断层领先
昇腾950PR是2026年Q1最大的变量。首款搭载自研HBM的AI芯片,FP4精度算力达到1.56 PFLOPS,112GB自研HBM显存。Atlas 350加速卡算力达到英伟达H20的2.87倍。
核心参数对比:
| 型号 | FP16算力 | 显存 | 互联带宽 | 状态 |
|---|---|---|---|---|
| 910B | 320 TFLOPS | 64GB HBM2e | 240Gbps | 2024量产 |
| 910C | 800 TFLOPS | 128GB HBM2e | 784GB/s | 2025量产 |
| 950PR | FP8:1P / FP4:1.56P | 112GB 自研HBM | 2TB/s | 2026Q1量产 |
出货目标已上调至150-200万颗。2026Q1已出货约15万张910系列卡。字节跳动采购150套超节点,阿里和美团各50套。单套超节点价格约2亿元。
华为的策略很清晰:全栈自研(芯片+MindSpore+CANN),借助政企和运营商订单锁定基本盘。CloudMatrix 384超节点累计已超300套。
隐患同样明显:NPU不兼容CUDA生态,模型适配成本高,依赖政企渠道。
寒武纪:从亏损王到季度盈利10亿
这是最戏剧性的反转。2025年寒武纪全年营收64.97亿元(+453%),净利润20.59亿元。2026年Q1营收28.85亿元(+160%),归母净利润10.13亿元(+185%)。经营现金流上市以来首次季度转正。
思元590是核心驱动力。7nm Chiplet封装,FP16算力256 TFLOPS,96GB HBM2e,综合性能接近A100的80%,功耗低15%。自研Bangware软件栈实现CUDA兼容,迁移成本降低约70%。
客户高度集中:前五大客户占88.66%营收,字节跳动是第一大客户(超26%)。字节自身也在研发芯片,这是悬在寒武纪头上的剑。
阿里平头哥与百度昆仑芯:大厂系的芯片棋局
平头哥是五强中唯一采用5nm制程的厂商。真武810E累计交付47万颗,年化收入百亿级。优势是云芯一体TCO显著,弱势是外部客户信任度低,出货与阿里云资本开支高度绑定。
昆仑芯2025年出货11.6万颗,外部客户占比已从30%提升至40%。2026年5月启动科创板IPO辅导,投后估值210亿元。比亚迪、中国移动都是股东。
国产四小龙:向上挤压
摩尔线程、沐曦、壁仞、天数智芯构成第二梯队。2025年集体营收翻倍,摩尔线程Q1首次盈利。产品定价普遍低于华为和寒武纪,主打CUDA兼容策略。摩尔线程MTT S5000已规模量产,可支持万亿参数大模型训练。
2026年核心变量:
- 昇腾950PR量产与互联网订单能否兑现(目标150-200万颗)
- 寒武纪能否持续盈利(Q1盈利10亿但客户集中度高)
- 四小龙能否全年盈利(摩尔线程Q1已转正)
- 英伟达H200合规不确定性(已计入45亿美元减值费用)
技术观察
短期(2026年):国产份额从41%提升至50%+,推理芯片出货大幅增长,硬件成本仅为海外1/3。中期(2027-2028年):行业洗牌窗口开启,头部3-5家占据80%+份额。长期:国产AI芯片从千亿级增长至万亿级,系统级竞争取代单卡比拼。
对开发者而言,最值得关注的是CUDA兼容层的成熟度。寒武纪Bangware迁移成本降低70%,摩尔线程MUSA架构实现零成本迁移——这意味着国产芯片的可编程性正在快速追上英伟达,不再是多年前的玩具。
← Back to blog