浪潮信息该如何摆脱海外供应限制?
撰文 | 古 芯
编辑 | 李信马
题图 | IC Photo
7月13日,浪潮信息跌停收盘,距离6月20日收盘的历史高点跌超35%。
消息面上,浪潮信息7月12日发布了今年1-6月业绩预告,经初步测算,预计2023年上半年营业收入大约同比下降30%,净利润同比下降60%-70%,约2.86-3.82亿元。
浪潮信息认为,公司上半年业绩下滑主要是全球GPU及相关专用芯片供应紧张等因素导致的,只是浪潮信息似乎并不想改变这种运营方式。
长此以往,浪潮信息未来业绩可能将继续因“全球GPU及相关专用芯片供应紧张等因素”而波动,降低公司业绩稳定性。
一、成也服务器,败也服务器
据浪潮信息财报显示,自从2017年建成智能服务器工厂,浪潮信息连续7年稳居中国AI服务器市场第一。
这得益于浪潮信息与英伟达长期保持良好的合作关系,很长一段时间内可以稳定持续获得显卡及相关专用芯片,并依据从业经验,推出JDM(Joint Design Manufacture)联合开发模式。
该模式下,浪潮信息可以和客户协同设计并生产,一款新品的研发周期从1.5年压缩到9个月,下游客户提出需求最快可以3个月交付样机;生产交付方面,订单交付周期从15天缩短至5-7天,曾创造8小时交付10000台云服务器的业内交付部署记录。
在服务器及部件营收增长的推动下,浪潮信息近十年业绩复合增速超40%。营收从2013年的42.24亿元增长至2022年的695.25亿,净利润从1.45亿元增至20.80亿元。
在算力领域,浪潮信息具有通用服务器、高端服务器、存储产品、边缘服务器等产品,通用服务器全球市占率位居全球第二,存储产品、边缘服务器常年位居中国市场第一位。2022年服务器及部件全年营收占比为99.17%,达到689.48亿元,毛利率11.07%,净利率2.96%。
但在2022年,英伟达等浪潮信息服务器产品主要供应商,已经开始限制性能最高的产品出口,人工智能服务器需求不断增长,也让市场对浪潮信息传统服务器的需求放缓。
虽然浪潮信息2022年发布国内首款元宇宙服务器MetaEngine,但是公司营收全年同比增长仅3.70%,而扣非净利润同比降低3.28%,初显疲态。
今年上半年,英伟达等GPU主要生产商因合规需求进一步加大先进GPU出口限制,由此导致严重依赖海外供给的浪潮信息业绩进一步下滑,刚刚开始放量的海外服务器业务营收或将回落,无法继续支撑公司营收增长。
二、AI芯片的冯诺依曼瓶颈
相较传统服务器,大模型的爆发推动AI训练算力平均每3个多月就翻倍,需求增速远超摩尔定律,浪潮信息目前尚未解决GPU供应问题,又面临AI服务器因算力需求迅速提升,导致指令与数据放在同一内存带来的CPU利用率降低,即冯诺依曼瓶颈。
解决的办法也很简单,提升或者优化芯片生产工艺;或者使用存算一体架构,消除计算与存储的界限,配合高带宽存储器(HBM),直接在存储器内完成计算,提升AI芯片效能。
首先是进一步提升芯片工艺制程,由于海外限制出口,浪潮信息已经无法获得使用最先进制程的GPU芯片,而且因3nm制程良率及成本都较难控制,英伟达H100芯片未来一段时间只能使用4nm工艺制程,想要通过改进工艺提升芯片性能,只能通过使用2.5D/3D chiplet堆叠异构集成封装技术来实现。
以更先进的3D chiplet技术为例,将大型单元芯片划分为多个相同或者不同的小芯片,这些小芯片可以使用相同或者不同的材质、工艺节点制造,再通过先进的集成技术封装在一起形成一个系统级芯片,降低成本的同时获得更高的集成度,从而提升芯片算力。
值得注意的是,该领域国内企业不存在受限情况,长电科技、通富微电、华天科技等封测厂均已掌握该技术。应用层方面,寒武纪思元370系列智能加速卡就是在封装层面上,采用Chiplet技术,将两颗370芯片拼凑成算力更强、带宽更大的处理器模块。
第二种方法是采用存算一体架构的AI芯片,是基于模拟计算架构设计,模拟存算一体架构通常基于SRAM或非易失存储器,模型权重保持在存储器中,输入数据流入存储器内部基于电流或电压实现模拟乘加计算,并由外设电路对输出数据实现模数转换。
使用该架构的服务器可以实现低功耗低位宽的整数乘加计算,非常适合边缘端AI场景,唯一需要注意的是,存算一体架构AI芯片需要搭配HBM使用。
HBM是基于TSV和芯片堆叠技术的堆叠DRAM架构,可支持更高速率的带宽,实现高于256Gbps的突破性带宽,单颗粒的带宽远超过DDR4和GDDR6。DDR4是CPU和硬件处理单元的常用外挂存储设备,8颗DDR4颗粒带宽能够达到25.6GB/s,是HBM的1/10,而GDDR6它单颗粒的带宽只有64GB/s,为HBM的1/4。
三、浪潮能抓住大模型的机会吗?
作为行业老兵,浪潮信息从2021年开始拓展其他业务模块分摊业绩下滑风险,在算法领域,浪潮信息2021年发布面向中文的预训练自然语言大模型源1.0。
在GPU硬件方面,海光信息2018年10月启动深算一号DCU产品设计,理论性能接近AMDMI100,并兼容通用的“类 CUDA”环境以及国际主流商业计算软件和人工智能软件,2020年1月启动DCU深算二号的产品研发,目前正在研发中。
此外龙芯中科、景嘉微、中天恒星、摩尔线程等公司均从不同技术路径参与GPU的研发,性能虽不及英伟达H100等产品,却也给浪潮信息提供另一种思路,即与国内相关企业合力研发所需GPU和相关器件。
7月11日,英特尔联合浪潮信息发布了新一代AI服务器NF5698G7,将搭载英特尔最新的GAUDI2深度学习加速器。
浪潮信息高级副总裁、AI&HPC产品线总经理刘军表示,通过和英特尔的紧密协作,优化了NF5698G7在多种生成式AI场景的性能表现,为生成式AI应用提供了极具吸引力的AI算力平台。
四、“液冷战略”能做什么
2022年,浪潮信息发布服务器操作系统,确立“All in液冷”发展战略,旨在通过不同的液冷方式,降低数据中心的PUE(PUE=数据中心总能耗/IT设备能耗),实现数据中心智能节能的管理,促进节能技术的创新和产业的应用,助力绿色低碳的开放数据中心创新实践。
作为数字经济的重要基础设施,数据中心一直是碳排放大户。在“双碳”背景下,如何降低数据中心PUE成为行业难题,可以满足高功耗高密度散热的液冷技术成为新型数据中心的重要选择。
在此背景下,浪潮信息2022年提出“液冷战略”显得极具前瞻性。
依托超300项液冷技术领域核心专利,浪潮信息已参与制定与发布10余项冷板式液冷、浸没式液冷相关设计技术标准,并联合牵头立项关于冷板式液冷核心技术的4项标准,为更好的推进液冷产业化,浪潮信息还建成了亚洲最大的液冷数据中心研发生产基地,目前液冷产品和解决方案已经在互联网、金融、教科研等领域得到广泛应用。
以浪潮信息与京东云联合发布的天枢(ORS3000S)液冷整机柜服务器为例,该型服务器散热效率提升50%,能耗降低40%以上,已经在京东云数据中心实现规模化部署,为京东618、双十一、虎年央视春晚红包互动等提供了基础算力保障。
但是反应在财报上,由于浪潮信息液冷战略起步较晚,目前营收分类被归为“其他”,2022年该类营收占比为0.40%,达到2.75亿元,同比增长11.01%。对比行业数据,IDC报告显示,2022年中国液冷服务器市场规模约为70亿元,同比增长189.9%。
浪潮信息液冷服务营收增速低于行业平均,且公司在国内液冷市占率较低。想要尽快实现营收正增长,浪潮信息恐怕还需要尽快找到英伟达等海外GPU及相关专用器件的替代品。