从边疆能源城到AI战略支点:克拉玛依智算基础设施背后的供应链逻辑
随着AI大模型加速走向应用落地,算力基础设施作为“新质生产力”的核心载体,正在迎来深层次变革。尤其是在全国各地争相建设智算中心的背景下:新疆克拉玛依,这座曾因石油而兴的资源型城市,正以先进西北算力中心城市的姿态登上AI时代的大舞台。截止2024年年末,克拉玛依云计算产业园累计建成算力17042P,成为新疆全省唯一算力超万P的云计算产业园。
在克拉玛依一众云计算产业园项目中,一个尤为引人注目的技术样本脱颖而出——由无问芯穹团队联合架构的小型算力基础设施项目。该项目率先部署了企业自主研发的异构芯片系统,并与多模态AI模型调度机制深度耦合,成为当前全国范围内少有的“软硬协同”实践范例。
无问芯穹的供应链总监周华威深度参与了该项目的策划、落地与最终部署阶段。在接受采访时,他评论道:“单一芯片、单一模型的部署体系已难以满足应用落地的复杂需求。我们在为克拉玛依项目部署AI算力服务器时,使用了无问芯穹的MXN异构技术,打破了异构芯片的生态竖井、让多芯片转化为相辅相成的大算力。”
作为一个兼具实验性与前瞻性的工程,该项目不仅为当地未来建设高等级智算中心提供了可复制的参考蓝本,也验证了“多元异构、强适配”这一新一代算力范式在西部能源型城市的落地可行性。
一、AI时代的资源重构:自然冷却与异构算力如何重塑西部算力格局
作为该项目的供应链总监,周华威主导了该项目从芯片类型配置、平台技术标准到资源扩展预留方面的多项前置规划。“选址不是建完就行,而是要看这块地是否能承载未来五年的模型演进和算力变化。”他表示。
“克拉玛依是中国西部重要的能源型城市,全年超过300天具备自然冷却条件,这对于智算中心来说是天然冷源,能够显著降低大规模运行时的能耗成本。”在谈及为何将小型算力样本项目部署于此时,无问芯穹供应链总监周华威如此解释。AI大模型的训练和推理对硬件的热负载极高,尤其是在NPU、GPU等异构计算资源高强度运行时,散热和能耗已经成为制约智算中心扩展的重要瓶颈。克拉玛依得天独厚的冷凉气候,能在不依赖昂贵制冷设备的前提下,实现全天候自然冷却,从而显著提升单位算力的运行效率。
在他看来,克拉玛依正站在一次全新的城市进化起点上——从传统石油能源枢纽,转型为服务AI时代的“算力节点”。除了气候优势,周华威也看好克拉玛依在政策导向和产业生态上的前瞻布局。“从土地资源到能源配比,再到对新基建企业的扶持力度,这座城市已经具备承接全国级智算资源外溢的硬实力与软环境。”在他眼中,克拉玛依不仅适合先行先试,更有潜力成长为西北地区的“AI底座级”城市。
二、多元异构趋势下的供应链重构逻辑
根周华威介绍,本次落成的小型智算设施内嵌了无问芯穹的领先异构技术,从一开始就被定义为面向未来的“异构算力平台”。周华威将这称为“M×N”架构——即M种模型对应N种芯片形态,背后不仅是技术兼容问题,更是一场供应链系统能力的重构。如今生成式AI导致模型结构高度复杂,使得基础设施也面临着“多模型协同—多芯片适配—多任务动态负载”的新挑战。以克拉玛依平台为例,不仅要支持传统Transformer类文本模型,还要服务图像、多模态、推理微调、边缘部署等多类场景。
“过去我们只需要准备GPU集群和相应的软件栈,而现在,要考虑ASIC、NPU、国产高密芯片等多种类型,它们的功耗、调度方式、适配能力各不相同。供应链必须参与架构设计。”他说。为了实现对多元芯片资源的高效管理,周华威带领团队联合研发部门,共同搭建起一套全线上的供应链可视化管理看板系统。这一平台将异构芯片的来源、规格、部署状态与交付节点实现动态联通,打破了传统信息孤岛式的流转模式,使各条业务线在项目落地过程中能够实时协同、精准响应。
“我们不是简单地做资源搬运,而是要让芯片资源在整个平台内流动得更有方向感、更有调度弹性。”周华威表示。通过这套机制,不仅大幅提升了芯片利用率和调配效率,也为支撑多模态AI模型的灵活适配打下基础。在这样的机制下,他所承担的供应链角色也发生了切实的变化:不仅要负责采购交付的后端支持,更要在链条上前移,成为系统性规划和技术协同的重要一环。
三、打通算法、平台与资源的协同链路
在AI基础设施的生命周期管理中,最大的不确定性往往来自模型本身——需求动态、参数迭代频繁、任务场景多变。过去的部署逻辑往往将算力平台与模型研发割裂,结果是资源浪费与交付延迟。周华威带领的供应链团队在实践中探索出一种创新化的组织协同机制:将研发纳入交付的起点,使平台规划、芯片选型与模型开发三位一体同步推进。
具体做法上,周华威与研发部门联合设立了模型申报机制。这使得算法团队在模型设计初期便提交性能特征预估、部署需求与推理路径;供应链端则根据该特征构建资源评估模型,预测最优芯片路径与调度结构,并在项目启动前完成资源锁定。这不仅减少了服务器上线后应用上线的匹配问题,更实现了算法、平台与资源的协同链路。
“我们希望构建一种‘平台即模型’的响应机制,”周华威提到:“我希望能让算法设计、芯片调度与资源规划成为同一个闭环,而不是三个各自为政的流程。唯有如此,才能加速部署效率与质量。”
在团队的通力合作下,克拉玛依项目得以顺利交付。在这之中,我们能够看到AI行业供应链端角色的转化——作为无问芯穹的供应链总监,周华威的工作不再局限于传统意义上的成本、交期与采购,而是深度参与平台设计、模型部署、芯片调度等关键环节。周华威的实践揭示了一个清晰的行业信号:未来的AI基础设施,不再只是拼性能,而是迈向了“组织智能”的系统协同时代。而供应链端,也是推动这一转型的底层驱动力。 程峰