问答 百科手机端

中国公共云,堵在哪、怎么解?

2024-04-04 00:03

中国公共云,堵在哪、怎么解?

公共云强大与否,影响算力产业健康发展,影响软件产业创新节奏,影响人工智能军备竞赛。积极信号是,政策研究方正在对中国公共云的发展路径给出建议

文|吴俊宇

编辑|谢丽容

全球算力、软件两大产业都在被大模型为代表的AI(人工智能)技术重塑。

算力结构正在剧变。智能算力(GPU等芯片算力)增速远超通用算力(CPU芯片算力)。中国信通院2023年数据显示,2022年全球通用算力规模440EFlops(FP32单精度),智能算力规模451EFlops(FP32单精度)。预计未来五年智能算力增速超过50%,远高于通用算力。虽然通用算力、智能算力无法用EFlops直接对比规模,但行业一个普遍判断是,未来算力结构中,智能算力会超越通用算力成为主要形态。

软件形态也在剧变。一批领先的国际软件公司正在利用大模型转型升级。这是软件产业十年来第二次剧变。2014年云计算普及之初,一批新老软件公司借机云转型。SAP、Oracle、Salesforce、Adobe等一批基础软件公司跃升至千亿美元市值。2024年,借助新一轮技术变革周期,这些软件公司又开启了AI转型。

算力、软件产业剧变的中枢是——云,尤其是公共云(Public Cloud有两种译法,公有云、公共云。两者无实质区别)。云下连算力,上连软件,它的重要性愈加突出。但在中国,公共云渗透率一直难以提升。

在国际市场,公共云让算力、软件自下而上形成了连贯的产业分工生态。亚马逊AWS、微软Azure、谷歌云掌握了主要的算力,用云进行调度,算力资源被高效利用。公共云天然适合全球扩张,三家云厂商占据了全球70%以上的市场份额。与此同时,软件公司(SAP、Oracle、Salesforce、Adobe等)把软件部署在云上,客户按年/月订阅软件。软件在云上持续迭代,这形成了开放生态,创新效率高、服务成本低。

在中国市场,云理想情况应该下连算力、上连软件,形成类似的生态。但国内算力资源相对分散,公共云渗透慢,私有化算力多。政策人士、企业人士普遍希望能扭转这种局面。公共云薄弱,也被认为是中国软件产业碎片化的原因之一。国内头部软件公司,普遍软件产品收入占比低,人力服务收入占比高。软件行业人士普遍认为,这种人力密集型的产业形态对创新不利,未来缺乏竞争力。

中国公共云,堵在哪、怎么解?

中国公共云,堵在哪、怎么解?

华为、阿里等多家科技公司的产业战略规划人士近期同时表示,人工智能天然长在云上,它无法脱离算力、软件存在。大模型变革来临,全球人工智能军备竞赛加剧。公共云渗透率低,这越来越成为限制产业竞争力的瓶颈。云是核心基础设施,它和5G、芯片、AI一样重要。公共云强大与否,影响算力产业健康发展,影响软件产业创新节奏,影响人工智能军备竞赛。

一个来自政策研究方的积极信号是,国家信息中心信息化和产业发展部3月29日发布了《公共云发展模式与路径研究》(《报告》详见国家信息中心官方发布渠道)。这份报告解释了中国发展公共云的必要性,并对中国如何发展公共云给出了路径建议。

为什么是公共云?

在全球市场,亚马逊AWS、微软Azure、谷歌云都在走公共云的路线。中国科技公司,华为、阿里、腾讯、百度等普遍期望坚持这一方向。因为,长期看这对中国算力产业健康发展最有利(相关内容详见《财经》2023年5月5日文章《中国算力,雄心与软肋》)。

公共云的逻辑是,底层的IaaS(基础设施)、中层的PaaS(平台软件)、上层的SaaS(应用软件)均采用公共服务,而非私有化部署的形态。公共云的算力、软件都在统一开放的基础设施上运转。

中国算力资源利用效率仍有较大提升空间。公共云天然比私有云、混合云、专属云算力利用高,且算力、调度合一,容易高效配置算力资源。

近期,政策方对国内算力利用情况进行大量调查。一个重要结论是:中国数据中心在局部区域、特定行业利用率偏低。本质是算力供需未有效匹配。这不是“量”的过剩,而是“用”的梗阻。

近两年来,中国十大枢纽集群城市的算力呈现出集中化趋势,十大枢纽集群城市的数据中心上架率稳步提升。算力效率得到了优化。不过,算力利用效率的核心指标,还包括服务器资源利用率(相关内容详见《财经》文章3月29日《国家十大算力集群上架率提升,网络成本待降低》)。

中国公共云,堵在哪、怎么解?

截至2024年,中美服务器数量各自均超过2000万台。中国信通院2022年数据显示,美国算力结构中,云计算占比超过60%,欧洲超过50%,中国为28%。我们了解到,公共云合理利用率为40%-60%,政务云合理利用率区间为25%-40%,智算和超算为50%-80%。但私有化部署的算力资源,使用率一般不超过5%。公共云算力有限,私有化算力部署较多。这意味着,中国服务器资源利用率天然偏低。

2023年开始,大模型为代表的AI技术突飞猛进——微软Azure、亚马逊AWS、谷歌云正在展开算力采购、研发投入的军备竞赛。

因为,大模型训练要基于万卡规模的算力集群,小而散的算力无法承担训练需求(相关内容详见《财经》2023年3月5日文章《ChatGPT算力消耗惊人,能烧得起的中国公司寥寥无几》)。比如,OpenAI公司的GPT-4部署微软Azure上,微软Azure用公共云为之提供了超2万枚英伟达A100的算力;Anthropic公司的Claude3部署在亚马逊AWS上,亚马逊AWS用公共云为之提供了超1.6万枚英伟达H200的算力。

先进AI算力昂贵且短缺,是中国算力企业普遍遇到的挑战。AI算力采购成本更高、大模型研发投入更大。理论上,此时有限的算力资源应该更集中。进而摊薄算力成本、研发成本,建立盈利正循环。不过,企业端算力资源在变得更分散(相关内容详见《财经》3月2日文章《中国算力产业出现五个真问题》)。

中国市场数据中心2023年投资增速甚至开始高于公共IaaS市场增速。Gartner数据显示,2023年中国数据中心系统的支出增速为20.7%,全球市场数据中心系统的支出增速仅为7.1%。IDC数据则显示,2023年上半年中国公共云IaaS市场增速仅为13.2%,国际市场公共云IaaS市场增速为16.9%。

中国公共云,堵在哪、怎么解?

企业端算力分散加剧有三点成因:一是美国对中国断供先进AI芯片,头部科技公司能获取的新增AI算力变少了;二是国内部分中小企业通过各种非正常渠道高价格、小批量转运被断供的AI芯片,对外提供算力服务;三是一批地方城市期望建立AI芯片为主的智算中心,以此基建投资、招商引资。

来自科技公司的共识是,上述问题对算力产业健康发展不利。理想的做法是,用公共云提高算力效率、缓解算力短缺瓶颈。

在多位云厂商人士看来,亚马逊AWS、微软云、谷歌云依靠覆盖全球的公共云基础设施,把触角伸向全球市场,获得了高增长、高利润。在良性循环下,可以进一步产品技术创新,形成规模效应,摊薄算力成本,把利润投入新一轮产品技术创新。中国云厂商中,仅有阿里云、百度云宣布实现了非美国通用会计准则下的盈利,其他云厂商普遍营业亏损。它们和国际云厂商相比,营收、利润仍有较大差距。仍在追赶期的中国云厂商,要避免掉队。

中国公共云,堵在哪、怎么解?

软件产业同样需要公共云作为创新土壤。从历史经验看,软件产业创新往往先诞生在公共云上,而非私有云上。公共云容易培育出统一、开放的生态,而非一个个割裂、分散、封闭的孤岛。

软件私有化部署,通常是重项目定制、重人力服务。弊端在于,封闭的技术架构如同孤岛,往往3年-5年产品无法进行大版本升级。其商业模式是人力密集型的。边际效益随人员增加递减。随着项目增加,人力投入变大,管理成本提高,企业人效下降,容易掉入增收不增利的陷阱。随之而来的问题是,软件公司缺乏充足的利润持续研发投入,最终长期低水平竞争。

软件部署在公共云,好处是IaaS、PaaS、SaaS在相对开放的平台上持续迭代。软件公司容易通过标准化产品进行规模扩张。基于这套逻辑,软件公司容易持续研发、持续盈利、保证人效,最终实现良性循环。

2014年前后,一批国际软件公司开始云转型,从私有化部署转向公共云部署。SAP、Oracle、Salsforce、Adobe等一批千亿美元市值级别的软件公司随之崛起。这些公司云收入占比通常超过70%,收入按年/月订阅付费,仅有少量服务收入。这带来了更高的市值规模、营业收入、营业利润、研发支出、人均产值。

国际软件公司用十年走完了云转型,2024年开始了AI转型。一批AI独角兽也在诞生,微软投资的OpenAI估值已超过800亿美元,亚马逊和谷歌投资的Anthropic估值超过180亿美元。一个共同预期是,AI转型会进一步提升软件产业效率。

目前,中国软件公司普遍尚未完成云转型,大部分企业云收入占比仅为30%甚至更低。人力服务收入占比高,收入按人头/天数计费。市值规模、营业收入、营业利润、研发支出、人均产值与国际企业存在差距。

中国公共云,堵在哪、怎么解?

我们统计了国际、中国市值前十软件企业的财务指标。市值前十的国际企业,总市值约17000亿美元,2023年总营收1853亿美元、总营业利润380亿美元、平均营业利润率20.7%、研发总支出350亿美元、平均研发支出率18.9%、人均产值40万美元。市值前十的中国企业,总市值约4400亿元,2023年总营收893亿元、平均营业利润率6.8%、研发总支出145亿元,平均研发支出率16.2%,人均产值36万元。

大模型为代表的人工智能技术来袭,国际软件公司开始了下一轮技术变革。中国软件公司普遍尚未完成云转型,就要开始AI转型。

多位云厂商、软件厂商人士认为,这是挑战也是机遇。挑战在于,中国软件公司业务形态相对落后,是人力密集型的。机遇在于,可以利用AI转型弯道追赶、缩小差距。但AI转型要基于公共云做大生态,从人力密集型的形态往资本、技术密集型的方向产业升级。如果AI继续以私有化部署为主,会“穿新鞋走老路”,重复过去十年软件产业割裂、分散、封闭生态的旧模式。

公共云堵在哪儿?

现实情况是,中国的公共云渗透率短期很难大幅提升。未来三年,混合云、私有云、专属云会是中国云市场的主引擎。

核心原因是,中国的互联网行业IT支出增长已停滞,政企行业(政府、金融、电信、能源、制造等)正成为IT支出主力军。

中国政企行业目前数字化转型进度仍在中前期,传统IT习惯仍有强大基础。海外成熟市场已把进度走到了中后期。因此,中国IT支出结构中,硬件远大于软件、服务。软件中,IaaS又远大于PaaS和SaaS。但在全球IT支出结构中,软件和服务远大于硬件;软件中,代表云使用深度的PaaS和SaaS又远大于IaaS(相关内容详见《财经》2022年4月11日文章《中国云市场的新逻辑》)。

中国公共云,堵在哪、怎么解?

政企暂时难以大规模采购公共云,它们更青睐私有云、混合云、专属云。这背后有一系列复杂的原因。

其一,现有预算采购、审计机制中,公共云是费用支出,无法列为固定资产。公共云在政府采购科目中一般归属维护费、租赁费,有15%预算比例限制。云要按年订阅付费,政企预算需要每年按项目申请。在审计流程复杂且周期长的情况下,一次性采购硬件、部署私有云,最简单便捷。

其二,政企机构考虑国有资产保值增值,更倾向私有云而非公共云。在现有预算采购、审计机制下,公共云是费用支出,私有云是固定资产。对央国企来说,但哪怕私有云最终摊销成本更高,报表上依旧体现为存量资产。而且公共云被列为费用化支出时,会直接影响当期利润指标。

其三,公共云对地方城市的财政、税收帮助不大。公共云通常不在本地部署。企业无需在当地注册。因此,无法创造税收,更不会带来土地收入。相反,地方鼓励私有云,会带来本地投资,拉动当地就业。

其四,政企数据托管在公共云,出现事故时难以理清权责。私有云由自己掌握,更符合监管、安全要求。

在上述堵点尚未疏通的情况下,政策人士、企业人士、行业专家均在寻找符合当下发展阶段的解法——这些解法的相同点是,避免算力资源分散,提高算力利用效率,在局部形成相对高效的市场格局。

一种解题思路是,建立一张覆盖全国统筹的“算力网”。它类似国家电网,每个主体明确定位。比如,电信运营商负责修建网络通道、降低网络成本,算力服务商提供算力资源,中立机构负责调度传输算力。这种思路好处是,综合考虑了算力区位布局、能源供给的问题。市场参与者定位分明、各司其职。挑战是,算力目前很难像电力一样输配分离、自由并网。它还要打破现有市场利益格局,引导企业积极参与。

限制小而散的算力中心也是重要途径。多位政策人士对我们表示,不鼓励地方政府亲自下场建智算中心,这容易导致重复建设、资源浪费。2023年12月底发改委等五部委联合发布的《深入实施“东数西算”工程,加快构建全国一体化算力网的实施意见》给出了明确的约束条款,“八大枢纽、十大集群”之外原则上不得新建大型或超大型数据中心(相关内容详见2023年12月29日文章《全国一体化算力网政策落定,对算力企业有三大直接影响》)。

整合部分城市低水平、碎片化的数据中心也被认为可以实现局部优化。中国信息化百会人执委、阿里云智能科技研究中心主任安筱鹏2023年10月曾对我们表示,过去部分地方建立的数据中心资源利用率低,一些中西部城市上架率甚至低于30%。他还建议,对城市内低水平、高能耗、碎片化和局部使用的数据中心进行整合和升级改造,用市场化、公共云的方式调度优化闲置资源,整体对外提供服务。

在他看来,统一纳管、升级老旧的算力设施(IDC)和算力资源(如服务器),不是想象中那么简单。这要依靠政策部门出台配套方案加强引导。同时发挥市场机制的作用,让有强大技术能力和大规模算力服务实践经验的企业来解决。

在城市、央国企内部署公共算力资源也是一种折衷方案。一位央企背景的云厂商人士透露,他所在企业2021年之前曾经试图在政企机构中推广公共云。但最终发现,哪怕是央企也难以打破壁垒。因此最终转向了私有云、混合云、专属云。后来,这家央企云厂商选择了妥协的折衷方案。

上述人士认为,目前各地城市在推进“一城一云”,也就是本地投资一朵云,政府、国企、医疗、教育等公共部门统一使用。一些大型央国企集团也在尝试“一云一网”,也就是集团建设一朵云,各子公司统一使用。“一城一云”“一云一网”可以局部提升算力效率。这虽然无法实现公共云一样高的利用率,但是中国当下IT发展阶段的现实做法。

一些企业还在寻求政企IT项目的采购、审计机制松绑。这一努力已持续近十年。近一年呼声还在变高。

一家头部互联网云厂商高管今年3月表示,早在2015年,他所在的云厂商就曾期望推动政企IT采购、审计机制为公共云松绑,但最终无疾而终。当时,云尚处发展早期,未被大众接受。云的主要增长空间在互联网、中小企业市场。政企采购、审计机制在当时虽然是“卡点”,但并非核心制约因素。

多家云厂商人士认为,2015年云在产业发展初期,给公共云松绑并不急迫。十年过去,算力、软件迎来新一轮产业变革。人工智能军备竞赛无法脱离算力、软件存在。发展公共云变得越来越急迫。政企涉密部门、业务可以不上公共云,但一般部门、业务可以尝试使用公共云。

另一家在政企市场占据较大份额的头部云厂商人士今年3月表示,政企IT采购的财政机制(预算、采购、考核、审计)可能要随着技术发展适时调整。他所在的云厂商近两年来曾和不同的政策部门反馈这些问题,期望得到改变。目前已得到了积极回应。不过,预算、采购、考核、审计等问题很复杂,突破仍需时间。

在他看来,他所在企业暂时受益于私有云、混合云、专属云占主流的格局。2023年公司营收增速超过20%。但这只是短期利益。考虑到长期利益,还是要尝试推动产业往公共云的方向走。

如何发展公共云?

局部优化只是过渡期的解法。中国如何渐进式提高公共云的渗透率?

国家信息中心信息化和产业发展部3月29日发布的《公共云发展模式与路径研究》报告提出了一系列方案。其中包括以下几个重点方向。

其一,发挥政府优化营商环境的主导作用,营造更公平的市场竞争环境,推动公共云产业生态培育和健康发展。

其二,在算力基础设施建设中给予网络直连、能耗、土地、税收等方面政策倾斜。

其三,优化算力资源布局,引导算力结构优化。支持以公共云服务方式提供算力服务,避免盲目上马、无序建设造成重复投资。

其四,推动区域小散数据中心资源整合,提高存量资源的综合利用率。

其五,鼓励财政资金购买公共云服务,对企业购买云服务纳入研发费用加计扣除税收优惠。

对于这个政策,多家云厂商人士的观点是,中国云计算产业发展,需要系统性的产业政策支持。他们很认同政策研究者提出的上述建议。但推动其中的细节逐步落地需要政策方、企业方共同持续努力。发展公共云,只需打开一道口子,让它和私有云、混合云、专属云同台公平市场竞争。最终市场自己会做出选择。

在一场近期小规模研讨会上,一位计算机工程科学专家提到,发展公共云牵涉方方面。既需要中国数字化转型的水平进一步提升,也需要云厂商提供更丰富的上层应用产品。是否降低数据中心带宽资费,铺设更多直连网络,也是议题之一。

在同一场讨论中,一位标准化组织负责人则认为,部分政企机构不愿上云的一个因素是,担心上云容易下云难,或被单一云厂商绑定。建议标准机构制定统一的云迁移标准,让企业能在不同云厂商之间实现平滑的数据迁移。

一位管理咨询机构云服务合伙人曾对我们直言,中国IT产业发展进程相对滞后,需要过渡期。2011年之前,在国际市场,公共部门、金融企业也没广泛接受公共云。那时,它们大量使用私有云、专属云。做法是,基于ITIL标准(Information Technology Infrastructure Library,即信息技术基础架构库,一套被广泛承认并用于IT服务管理的国际准则),把业务托管在IBM、惠普等服务商提供的数据中心中。公共云在公共部门、金融企业大规模普及是2014年之后。

过去几年,几个标志性事件推进了公共云在国际市场的普及进程。美国政府2011年发布“云优先”(Cloud First)战略。此后十年通过长期产业引导、国家立法、标准制定、预算调整、采购管控等举措,推动IT设施基于公共云现代化升级。

在统一的云战略下,一系列国家级公共云项目持续上马。其中包括美国联邦GovCloud项目、美国中情局C2S项目(2013年一期6亿美金,2021年二期数十亿美金)、美国国防部JWCC项目(90亿美金)、美国国家安全局Wild and Stormy项目(100亿美金)等云服务大单。这加速了亚马逊AWS、微软Azure、谷歌云被市场普遍接受。

一位国资背景的大型企业集团信息化负责人2023年12月曾对我们表示,中国未来大概率会出现类似的情况,但需要时间。他所在公司正在建设统一的混合云,各子公司统一迁移到这朵混合云。虽然公司暂时不会上公共云,但“私有云-混合云-公共云”是常规发展路径。大型央国企、金融机构要先上混合云。假以时日,才可能把非敏感业务逐渐迁移到公共云。

中国市场虽暂时处于云转型中前期,发展路径与国际同行有差异,但不能忽视共性。无论是海外成熟市场还是中国市场,云转型趋势是确定的。随着国内数字化成熟度提升,双方最终一定会“殊途同归”。

热门