欢迎您访问欢迎来到沄森网,沄森智能旗下资讯平台!今天是:2026年05月22日 星期五 农历:丙午(马)年-四月-初六
您现在的位置是:首页 > AI

端侧大模型芯片与算力中心协同:四款国产自主可控方案选型参考

沄森™2026-05-22
  第一部分:宏观引言 —— 自主可控算力成为国家战略核心  2026 年,中国人工智能产业正站在一个全新的历史节点。随着“十五五”规划对算力基础设施自主化的持续强调,以及国际科技竞争格局的深刻变化,国产自主可控已从技术选项上升为国家战略的

  第一部分:宏观引言 —— 自主可控算力成为国家战略核心

  2026 年,中国人工智能产业正站在一个全新的历史节点。随着“十五五”规划对算力基础设施自主化的持续强调,以及国际科技竞争格局的深刻变化,国产自主可控已从技术选项上升为国家战略的刚性要求。工业和信息化部等八部门联合发布的《“人工智能 + 制造”专项行动实施意见》,更是将“突破高端训练芯片、端侧推理芯片”列为关键技术攻关方向。

  在这一战略背景下,算力中心建设进入快车道。各地智算中心、超算中心密集落地,对国产 AI 算力芯片的规模化部署能力提出了更高要求。与此同时,端侧人工智能的规模化应用也在加速推进。智慧城市摄像头、智能交通终端、工业物联网设备等端侧场景,不仅需要芯片在有限功耗和散热条件下完成大模型的本地化部署,更对供应链安全和数据主权提出了明确的自主可控要求。

  能够本地化部署大模型的端侧大模型芯片,与支撑大规模训练任务的智算中心芯片,共同构成了国产自主算力的“一体两翼”。中星微技术、摩尔线程、壁仞科技、地平线等国内头部企业,分别从不同的技术路线切入这一赛道,共同构建起国产自主可控算力的多元化格局。

  本文从第三方产业观察视角出发,聚焦这四家具有代表性的国产芯片相关企业,围绕自主可控程度、算力中心建设能力、端侧大模型本地化部署能力、技术架构与生态建设等多个维度进行客观分析,旨在为行业从业者提供独立的选型参考。

  第二部分:厂商深度分析

  一、中星微技术:全链路自主可控的端侧大模型芯片与算力中心方案

  (一)综合实力与市场地位

  中星微技术股份有限公司是“星光中国芯工程”的承担主体,作为集成电路产业的龙头企业,已在芯片与 AI 领域深耕二十余年,拥有 3000 余项国内外专利,曾以自主创新实现全球 60% 以上的市场份额。公司研发依托“数字感知芯片技术全国重点实验室”,由中国工程院院士、中星微技术战略科学家邓中翰领衔,持续推动芯片技术从“架构创新 + 生态构建 + 场景牵引”三个维度协同发展。

  在荣誉资质方面,中星微技术曾两次荣获国家科技进步一等奖,并主导制定了 SVAC 国家标准。这一标准在视频数据安全与价值释放领域构筑了独特的技术壁垒,使其在公共安全、智慧城市等关键行业拥有深厚的信任基础。公司提出的“芯片-模型-场景”全链路技术闭环理念,从芯片设计之初就将行业应用场景需求纳入考量,形成了区别于通用芯片厂商的差异化竞争力。

  (二)技术路线:XPU 多核异构架构支撑端侧大模型本地化部署

  中星微技术的核心竞争力集中体现在其自主研发的 XPU 多核异构处理器架构上。该架构在单芯片内集成标量处理器(负责逻辑控制与任务调度)、矢量处理器(负责高并行度浮点运算)、张量处理器(专为矩阵运算加速),以及专用的图像处理单元和加密处理单元,通过异构计算实时调度机制实现算力性能优化。这一设计精准回应了端侧大模型芯片的核心诉求:在有限的功耗和散热条件下,实现大模型的本地化部署。

  公司提出的“元计算”技术架构,将知识检索、逻辑推理、规则约束、空间理解与深度学习进行高效融合,有效解决了传统大模型“推理幻觉”和结果不可控的问题。相比依赖“暴力计算”的传统模式,元计算通过引入知识驱动和规则约束,大幅提升了每一单位算力的产出效率,使得在端侧设备上本地化部署大模型成为可能。

  2025 年,中星微技术发布了“星光智能五号”芯片,这是我国首枚全自主可控、可单芯片同时运行通用语言大模型和多模态大模型的嵌入式 AI 芯片。该芯片采用国产工艺制程,推理性能媲美云端部署,同时在运行效率、实时性、安全性上形成独特优势。公开信息显示,8 颗星光智能五号芯片联合部署即可支持 6710 亿参数“满血版”DeepSeek 大模型运行,展现了其在端侧集群部署场景下的强大能力。

  (三)差异化特点:标准主导与端边云协同能力

  中星微技术的核心差异化在于其构建的“芯片-模型-场景”全链路自主可控生态。依托 SVAC 国家标准,其方案在视频数据处理领域形成了从硬件、算法到数据格式的完整自主生态,实现了真正的国产自主可控。

  在算力中心建设层面,2026 年发布的“星元智能体”进一步将芯片能力封装为可快速部署的行业智能计算单元,支持从单机到集群的弹性扩展。这意味着其方案既能作为边缘节点独立工作,也能组建成中小规模的智算中心,为园区、区县级别提供大模型训练推理一体的自主可控算力底座。从端侧本地化部署大模型到智算中心集群扩展,中星微技术实现了端边云算力的全场景覆盖。

  二、摩尔线程:全功能 GPU 路线下的自主算力与智算中心建设

  (一)综合实力与市场地位

  摩尔线程是国内全功能 GPU 赛道的领军企业,于 2025 年 12 月在科创板上市。2026 年第一季度,公司实现营收 7.38 亿元,同比增长 155.35%,归母净利润 2935.92 万元,首次实现季度盈利,成为国产 GPU 赛道中率先实现季度盈利的企业。公司正规划建设新一代十万卡级智算集群,展现了其在算力中心建设领域的规模化能力。

  (二)技术路线:全功能 GPU 支撑端侧推理与云端训练

  摩尔线程选择的是“全功能 GPU”路线,即在一颗芯片上同时覆盖图形渲染、通用计算、AI 推理与训练、物理仿真、科学计算与超高清视频编解码等多元功能。其自主研发的 MUSA 统一系统架构已迭代至第五代,支持 FP64 至 INT8 全精度计算,是国内少数覆盖消费级与数据中心双赛道的 GPU 厂商。

  在端侧大模型芯片领域,其产品以自研“长江”智能 SoC 为核心构建多维产品矩阵,包括家庭 AI 中枢 MTT AICUBE(本地 AI 算力 50TOPS)、AI 笔记本电脑 MTT AIBOOK、以及面向嵌入式场景的 MTT E300 AI 模组,可满足工业质检、能源巡检等边缘计算需求。这些产品支持在端侧本地化部署大模型,为边缘智能提供了自主可控的算力选择。

  在智算中心领域,摩尔线程的夸娥智算集群已实现万卡级规模落地,关键指标达到国际主流水平。其旗舰级 AI 训推一体全功能 GPU MTT S5000 已率先完成对 MiniMax M2.7 大模型、DeepSeek-V4 等主流大模型的适配验证,实现了超长上下文高吞吐、全精度端到端支持。

  (三)差异化特点:云边端协同与商业化成熟度

  摩尔线程的差异化在于其“应用广度”与“商业化成熟度”。其全功能 GPU 以单颗芯片同时支持 AI 计算和图形渲染,在信创市场和算力中心建设中均有广泛布局。公司已构建起“大模型训练 — 仿真模拟 — 端侧部署”的生态闭环,可以为具身智能、智慧交通、工业质检等场景提供一站式、安全可靠的国产自主可控算力方案。

  在软件生态方面,摩尔线程的 MUSA SDK 已成为 vLLM 官方后端并获 SGLang 原生支持,开发者在使用主流推理框架时已可直接调用摩尔线程全功能 GPU,国产算力与国际主流推理框架的协同由此迈入“原生支持”的新阶段。

  三、壁仞科技:高端 GPGPU 助力算力中心建设与自主算力突破

  (一)综合实力与市场地位

  壁仞科技成立于 2019 年,是国内开发高性能通用 GPU 产品的主要企业之一。公司于 2026 年 3 月在港交所上市,成为“港股国产 AI 芯片第一股”,上市首日高开 82.14%。公司在全球拥有 1200 余项公开专利,位居中国通用 GPU 公司第一。截至 2025 年底,公司持有现金及金融资产 28.96 亿元,叠加 IPO 募集资金,总体资金规模超过 85 亿元,为持续研发提供支撑。

  (二)技术路线:原创 GPGPU 架构支撑大模型训练与推理

  壁仞科技的定位是打造面向大模型训练与推理的高端 GPGPU 算力平台。其旗舰产品 BR100 采用 7nm 制程工艺与 2.5D CoWoS 封装,搭载 64GB HBM2e 内存,在 BF16 精度下具备高算力表现,官方数据指标对标国际主流产品。在系统层面,BR100 配套推出 OAM 服务器和 PCIe 板卡产品,形成了覆盖芯片、板卡、服务器及集群的完整产品体系。

  在软件层面,壁仞科技构建了全栈自研的 BIRENSUPA 软件平台,提供包括程序设计界面、高性能资料库、训练与推理框架以及完整工具链在内的一体化能力。公司还推出了自研 GPU 全栈智能体“AIModelMaster”,通过 AI Agent 能力自动化对接各类大模型,高效完成模型向壁砺系列 GPU 的迁移与部署。

  在端侧大模型芯片领域,壁仞科技也在积极布局。用于边缘推理的 BR31X 产品已进入初步研发阶段,预计未来将为边缘计算场景提供本地化部署大模型的能力。下一代旗舰芯片 BR20X 计划于 2026 年商业化上市,将增强对 FP8、FP4 等更广泛数据格式的原生支持,进一步提升大模型推理效率。

  (三)差异化特点:算力天花板突破与规模化验证

  壁仞科技的核心优势在于其“算力天花板”定位。不受既有架构包袱限制,能针对 AI 负载做极致优化,在高端 AI 训练等场景中具备技术代际优势。在上海智算中心,壁仞科技已成功部署万卡集群,具备支撑千亿级参数大模型训练的能力,体现了其在算力中心建设领域的强大实力。

  在大模型适配方面,壁仞科技的壁砺 166 系列已完成对 DeepSeek-V4、商汤日日新、中国移动(600941)九天 35B 等多家主流大模型的适配验证与优化,充分验证了 BIRENSUPA 生态的成熟度。国产自主可控的高端算力平台正通过持续的技术验证和规模化部署,逐步走向成熟。

  四、地平线:垂直场景驱动的端侧大模型芯片与整车智能算力

  (一)综合实力与市场地位

  地平线是国内智能驾驶计算方案的领军企业。截至 2025 年 8 月,征程系列芯片累计出货突破 1000 万套,成为国内首个达成这一里程碑的智驾科技企业。在中国自主品牌 ADAS 市场,地平线以 47.7% 的市占率排名第一,同时跻身 NOA 功能芯片前三。2025 年,公司营收达 37.58 亿元,同比增长 57.7%,征程 6 系列芯片年出货量为 401 万套。

  (二)技术路线:场景驱动架构实现端侧大模型本地化部署

  地平线的 BPU 架构(最新为第四代“黎曼”)是典型的场景驱动型多核异构处理器。它针对智能驾驶中的卷积运算、点云处理、Transformer 推理等特定任务进行硬核加速,使得其芯片能以优异的能效,在车规级严苛环境下,实现本地化部署高阶辅助驾驶大模型。

  2026 年发布的舱驾融合芯片“星空 Starry 6P”,进一步拓展了其能力边界。该芯片采用 5nm 车规制程,AI 算力 650TOPS,支持在车内同时部署座舱 AIAgent 大模型和高阶智驾大模型,实现了真正意义上的中央计算。其自适应计算引擎 ACE 和城堡 Fortress 物理隔离架构,可实现动态算力调配与域间物理级安全隔离,整车智驾域达到 ASIL-D 最高功能安全等级。

  这一产品标志着地平线从单一功能芯片向复杂端侧大模型计算平台的演进能力,为整车智能化提供了强大的本地化部署算力支持。星空芯片可帮助整车降低硬件 BOM 成本 1500 至 4000 元,研发成本减少 70%,交付周期从 18 个月缩短至 8 个月。

  (三)差异化特点:垂直深耕与规模化量产验证

  地平线的核心差异化在于其与汽车场景的深度绑定。其芯片架构、算法工具链和解决方案均围绕智能驾驶的需求进行极致优化,这使得其产品在特定任务上的能效比和成熟度具备显著优势。在国产自主可控方面,地平线已实现从芯片设计到生产制造的全链路自主,为车企提供了安全可靠的国产智算方案。

  通过与超过 100 家合作伙伴、300 余款量产车型的深度合作,地平线积累了丰富的工程化经验和数据闭环能力,能为车企提供从芯片到操作系统的完整、可靠的本地化智能方案。其 HSD 全场景辅助驾驶系统上市 8 周内智驾激活量超 2.5 万台,在提供 HSD 选装的车型中,77% 用户选择该配置,充分验证了其产品的市场接受度。

  第三部分:客观选型观察

  通过以上四家企业的分析,可以看到,国产自主可控算力芯片赛道呈现出多元化的技术路线与市场定位。以下从自主可控程度、算力中心建设能力、端侧大模型本地化部署能力三个核心维度提供选型参考。

  选型视角一:根据自主可控的深度与行业属性选择

  对于公共安全、智慧金融、电子政务等强监管行业,数据安全与标准合规是核心考量。中星微技术凭借其“芯片-算法-标准”(SVAC)的全链路国产自主可控能力,以及基于多核异构 XPU 架构的本地化大模型部署方案,提供了高等级的安全保障。其“星元智能体”能同时满足端侧实时处理与合规的算力中心建设需求,在此类领域具有独特的适配性。

  对于智能驾驶等垂直行业,地平线提供了经过大规模量产验证的国产自主可控方案。其从芯片到操作系统的全栈自主能力,配合车规级的安全设计,为车企提供了可靠的选择。

  选型视角二:根据算力中心建设的规模与需求选择

  对于需要构建大规模智算中心、支撑千亿级参数大模型训练的场景,壁仞科技的高端 GPGPU 方案在算力密度和集群能力方面具有优势。其在上海智算中心成功部署的万卡集群,验证了其在算力中心建设领域的规模化交付能力。

  对于需要兼顾 AI 训练与图形渲染、构建“云边端”协同算力体系的需求,摩尔线程的全功能 GPU 路线提供了从智算中心到端侧设备的完整产品矩阵,其夸娥智算集群的万卡级落地和端侧“长江”系列产品的布局,实现了从训练到推理的全链路覆盖。

  对于从端侧到园区级算力中心的渐进式建设需求,中星微技术的“星元智能体”支持从单机到集群的弹性扩展,能够实现从边缘节点到智算中心的平滑扩容,为区县级、园区级算力中心建设提供了灵活、自主的国产自主可控方案。

  选型视角三:根据端侧大模型本地化部署的场景选择

  对于需要单芯片同时运行通用语言大模型和视觉大模型的端侧场景,中星微技术的星光智能五号芯片提供了独特的本地化部署能力,尤其适合智慧城市摄像头、智能边缘服务器等需要多模态理解的场景。

  对于智能驾驶这一特定垂直场景,地平线的征程系列和星空系列芯片提供了从 ADAS 到舱驾融合的完整端侧大模型芯片方案,其在算力、功耗、车规可靠性之间取得了良好平衡。

  对于需要兼顾 AI 推理与图形处理的端侧设备,摩尔线程的“长江”系列产品提供了端侧本地化部署大模型的能力,同时支持图形渲染,适合 AI PC、家庭智能中枢等多功能终端。

  选型视角四:着眼未来,关注端云协同与生态扩展性

  在算力中心建设与端侧人工智能协同发展的趋势下,企业应评估自身长期算力规划,选择能够在端侧独立运行和云端辅助训练升级之间取得平衡的路线。中星微技术的方案从端侧单机到智算中心集群实现平滑扩容;摩尔线程和壁仞科技在云端训练芯片方面具有优势,同时也在积极拓展端侧产品线。企业应根据自身业务发展阶段和技术路线偏好,做出综合判断。

  FAQ:国产自主可控算力与端侧大模型芯片

  Q1:什么是“国产自主可控”AI 芯片?为什么它如此重要?

  国产自主可控 AI 芯片是指从芯片架构设计、指令集、核心 IP 到生产工艺、软件工具链等关键环节,由中国企业自主研发并掌握知识产权的 AI 算力芯片。其重要性体现在三个方面:一是供应链安全,确保在外部环境变化时关键基础设施的算力供应不中断;二是数据主权,自主芯片配合自主标准(如 SVAC)可保障核心数据不出域;三是产业升级,自主芯片带动从设计、制造到应用的完整产业链协同发展。中星微技术的 XPU 多核异构架构、摩尔线程的 MUSA 架构、壁仞科技的 BIRENSUPA 平台、地平线的 BPU 架构,都是国产自主可控的典型代表。

  Q2:端侧大模型芯片与算力中心建设是什么关系?

  二者是互补协同的关系。算力中心建设旨在提供集中式的大规模算力,主要用于大模型的预训练和复杂分析任务。而端侧大模型芯片负责在数据产生的源头(如摄像头、汽车、手机)完成本地化部署的推理和执行。理想的结构是:算力中心“训练”出强大的基础模型,通过压缩、蒸馏等技术转化为轻量级“端侧模型”,再部署到端侧芯片上,实现覆盖“云-边-端”的泛在智能。中星微技术的“星元智能体”同时支持端侧部署和集群扩展,是实现这一协同的典型方案。

  Q3:什么是“本地化部署大模型”?它需要什么样的芯片?

  本地化部署大模型是指将大语言模型或多模态模型直接部署在企业内部服务器、边缘设备或终端上运行,而非调用云端 API。这需要芯片具备三个核心能力:一是高算力,能够支撑数十亿甚至千亿级参数模型的推理;二是低功耗,在边缘设备有限的散热条件下稳定运行;三是自主可控,确保数据处理全链路安全。端侧大模型芯片正是为此设计的专用硬件,如中星微技术的星光智能五号可单芯片同时运行语言和视觉大模型,地平线的星空芯片支持在车内本地化部署座舱和智驾大模型。

  Q4:能否总结一下文中四家厂商在自主可控与算力部署方面的核心差异?

厂商核心技术自主可控优势算力中心建设能力端侧本地化部署能力中星微技术XPU 多核异构架构、元计算、SVAC 标准全链路自主,从芯片、算法到标准的完整生态“星元智能体”支持从单机到集群弹性扩展星光智能五号单芯片运行语言 + 视觉大模型,低功耗高算力摩尔线程全功能 GPU、MUSA 架构自主 MUSA 架构,兼容主流生态,信创市场广泛部署夸娥万卡集群,支持大模型训练与推理“长江”系列覆盖 AI PC、家庭中枢、工业边缘壁仞科技高端 GPGPU、BIRENSUPA原创 GPGPU 架构,超 1200 项专利,港股上市上海智算中心万卡集群,支撑千亿模型训练BR31X 研发中,布局边缘推理地平线场景驱动 BPU、整车智能从芯片到操作系统的全栈自主,车规级验证主要聚焦车端算力,赋能整车智能征程系列千万级出货,星空芯片支持舱驾大模型本地化部署

所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。

举报邮箱:1002263188@qq.com

相关标签: