物联网

  • 主页
  • 物联网
  • 东数西算号角响,华为超融合数据中心网络整装

东数西算号角响,华为超融合数据中心网络整装

发布时间:2022-04-16 02:05:35 所属栏目:物联网 阅读:

近日,国家发展改革委等部门联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。至此,“东数西算”号角响起,全国一体化大数据中心体系建设全面启动。

什么是“东数西算”?“东数西算”要解决哪些问题?

“东数西算”就是通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。“东数西算”要解决两个核心问题,即提高国家算力总水平和降低国家算力总能耗,推动算力的集约化、绿色化发展。

算力作为数字经济的核心生产力,已成为国民经济发展的重要基础设施。根据《2021-2022全球计算力指数评估报告》报告显示,算力指数平均每提高1点,数字经济和GDP将分别增长3.5‰和1.8‰。随着企业数字化加速演进,全社会对算力需求仍然十分迫切,预计每年仍将以20%以上的速度快速增长。

然而算力的提升必然带来服务器数量和能源消耗的增加。作为电力消耗的大户,数据中心常被戏称为“电老虎”。一个超大型数据中心(机架规模10000以上)每年的耗电量为亿度级别。如何解决算力提升和能耗增加的矛盾,是算力网络要面临的首要问题。

“集约化”和“绿色化”,不仅仅是服务器增加和可再生资源利用

从宏观角度讲,“东数西算”要像“南水北调”、“西电东送”一样,从全国角度一体化布局,优化资源配置。内蒙古、宁夏、贵州等地区可再生资源丰富,一些对业务时间要求不高的业务,例如后台加工、离线分析、存储备份等,可率先向西部迁移,实现算力统筹管理和最优化配置。从微观角度看,按照《新型数据中心发展三年行动计划(2021-2023年)》要求,到2023年底,全国数据中心机架规模年均增速保持在20%左右,总算力超过200 EFLOPS。这一系列政策都旨在推动算力基础设施向集约化和绿色化发展。

然而,要实现集约化和绿色化,仅增加服务器规模和利用可再生资源就够了嘛?

当前业界已经形成一个普遍共识,即服务器规模增加,并不能带来同等数量的算力增加,甚至有可能当服务器增加到一定规模后,算力反而会下降。这是因为传统以太网络天然是丢包的,并且随着网络规模的增加,丢包率呈指数级增长。当服务器集群进行计算协同时,网络丢包增大了因协同等待而产生的时间等开销,造成了服务器资源的严重浪费,使算力提升存在天花板。据实验统计,0.1%的丢包率会造成算力损失50%,同时使计算时间拉长了1倍,无形中增加了计算的能耗,也不利于算力的绿色化发展。

因此,要提升算力,首先要构建一个0丢包的数据中心网络。

超融合数据中心网络十年磨一剑,终成算力提升新动能

早在2012年,华为CloudFabric数据中心网络为了应对未来数据洪水挑战,充分挖掘数据价值,投入数十个科学家开始新一代无损网络的研究,致力于构建0丢包、低时延的以太网。十年如一日,经过多方向多路径的艰难探索,用于实现网络拥塞调度和网络自优化的iLossless智能无损算法方案,取得了突破性的进展。并最终发布了新一代超融合数据中心网络CloudFabric 3.0解决方案,成为业界首个基于以太网架构的0丢包数据中心网络。

image.png

算法突破,性能提升17%:超融合数据中心网络CloudFabric 3.0不仅打破了传统IB计算专网、FC存储专网和业务网络不兼容的局面,同时在全闪存、分布式存储、HPC高性能计算、人工智能计算等场景,都有极强的性能优势。根据第三方权威测试机构Tolly测试结果表明,超融合数据中心网络能够以以太网的成本提供超越IB专网17%的性能,降低建网和运维成本53%,完全可以和专网相媲美。

架构创新,组网规模4倍于业界:超融合数据中心网络基于新一代直连拓扑组网架构和创新分布式自适应路由协议,不仅满足算力网络0丢包的诉求,更支持270k节点大规模,组网规模4倍于业界,可助力构建E级和10E级大型和超大型算力枢纽。

绿色低碳,单位算力能耗降低47%:基于SuperCooling和SuperPower等10+核心散热和供电技术,CloudEngine数据中心交换机400GE端口每比特功耗相比业界可降低54%,同时通过提升计算效率,单位算力能耗相比传统以太网还可降低47%。根据武汉人工智能计算中心流体力学用例实测数据,完成同样任务,传统网络需要耗时375秒,0丢包以太网耗时198秒。折算到单位算力功耗,0丢包以太网单位算力能耗相比传统网络降低47%。