"); //-->
全国一体化算力网建设是国家战略和时代需求。一是满足爆发的算力需求。人工智能大模型、量子计算等前沿技术催生算力需求指数级增长,通过国产算力集群化供给,可满足前沿技术算力缺口。二是要破解国内算力资源与需求的结构性矛盾。国内算力存在区域失衡,东部算力需求大,但能源紧张、成本高;西部清洁能源富集,却面临产业基础薄弱问题。三是满足数据中心绿色低碳转型需求。数据中心用电量大,高碳排放制约可持续发展,依托西部风光资源,可推动数据中心低碳转型。四是促进数据要素流通与产业升级。通过为金融、医疗等高价值数据提供可信流通环境,可打破数据流通壁垒,激活要素价值。五是实现算力服务普惠化。通过推广按需租赁与算力券模式,中小企业将更易获取实惠的算力资源。从2023年国家启动“东数西算”工程,到2025年7月内蒙古和林格尔算力调度平台接入国家监测系统,实现北方枢纽与全国算力网联动,一体化算力网已实现从顶层设计到区域突破。
中国电信围绕国家发改委《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》(发改数据〔2023〕1779号)的要求,聚焦构建全国一体化算力网的目标,开展了一系列前沿技术试验验证工作,主要进展如下:
一、顶层设计与架构创新
中国电信基于自主研发的“息壤”一体化智算服务平台(以下简称“息壤”平台),构建了“算力、平台、数据、模型、应用”五位一体的智能云体系,其中算力调度服务是“息壤”平台的重要能力。“息壤”平台通过统一接口接入跨域异构算力资源(包括通算、智算、超算等),可实现全国算力资源的动态感知与智能调度。技术亮点包括:支持全国范围内的第三方算力并网,通过算力插件、算力网关、算力调度和算力度量等技术,突破跨服务商、跨架构资源调度的壁垒,实现算力资源的统一纳管、调度和交易。
根据国家数据局全国一体化算力监测调度先行先试工作任务要求,在“1+1+N”一体化算力网监测调度体系中,“息壤”平台北向对接国家算力服务平台,南向纳管全国八大枢纽电信自有算力和社会算力,共同实现分层算力调度运营。“息壤”平台在技术实现方面,包括但不限于自研调度引擎、标准化接入接口、算数协同模块,是全国一体化算力网监测调度平台重要技术路径实践前锋。
二、超远距无损智算互联技术突破
1、业界首例千卡分布式训练验证
2024年8月,中国电信在现网中基于800G波分复用(WDM)技术,完成1024卡智算集群的分布式训练验证,实现120公里跨域互联(武清-润泽机房)。关键成果包括:达到了极高的无损性能,千亿参数大模型分布式训练效能达集中训练的95%以上;可满足高可靠性要求,采用WSON光层重路由技术,将故障恢复时间压缩至50ms内,避免算效断崖式下降;支持动态资源复用能力,分钟级波长拆建技术提升光网络利用率30%。
2、破解跨域传输瓶颈
针对百T级带宽需求,创新融合单波长800G高阶调制与C+L波段扩容,单纤容量提升至百T级别。通过广域高吞吐、算力路由技术优化数据传输路径,降低跨节点通信开销。依托上述技术路径,中国电信构建大容量、低时延、高速泛在、安全可靠的全光算力传输网络。一是围绕算力枢纽节点,优选高铁、高速等优质路由,规模部署G.654E低损耗大截面积新型光纤,在长三角、粤港澳等地区试点部署空芯光纤,推进干线光缆网焕新升级,八大枢纽节点间平均时延下降15%以上。二是建设覆盖枢纽节点和清洁能源富集区域的400G高速全光网在枢纽节点实现800GCHL波段远距离无损互联。三是推动量子与光传输技术深度融合,中国电信在合肥-内蒙古算力中心间开通业界首条400G量子OTN传输通道,支撑数据安全高效流通。
三、跨域资源调度
算力网一体化调度是优化资源布局和供给结构的关键手段,建立全国一体化算力体系是大势所趋。基于此,中国电信通过算力插件与算力网关、算力调度、算力度量进行技术开发,满足算力并网接入、促成算力交易、闭环算力运营流程、符合算力政策四大核心需求。
1、算力插件与算力网关
采用算力插件实现对异构算力资源提供商的统一化接入,支持热插拔,可即插即用,极大提高了系统的灵活性与可扩展性,支撑大规模资源池接入。借助算力网关的统一计算、存储、网络池化能力,实现对裸算力的标准化接入,满足裸算力资源提供商的高质量增强接入需求。通过制定算力接入管理标准规范,实现公有云、私有云、社会闲散算力和裸算力等不同形态、不同类型的算力并网接入,加快算力并网进度。
2、算力调度
中国电信采用算力调度技术,基于业务场景,提供综合最优、性能调度、成本调度、低碳节能等策略,实现全域算力的统一部署和编排调度。支持多场景购买引导,提供丰富的通算、智算、超算场景化推荐能力,基于多维算网数据及AI结合算网层级化分治映射算法,通过预选、优选、决策等过程,实现算网资源的高效统筹分配和开通使用。
3、算力度量
通过建立统一高效的算力度量标准体系,为算力准入、算力调度、计量计费等提供标准的度量规则。提供不同场景下算力的度量方案,实现针对不同业务的高效算力调度,提升算力资源的使用效率。支持一站式度量服务,基于灵活可扩展架构,支持在线/离线算力度量。实现精细的度量结果分析,具备可视化查询能力,支持算力横向对比。
四、业务应用创新与案例
1、提高热点区域算力使用效率
深圳智能算力需求大,增速快。深圳人工智能产业规模已达2488亿元,据测算,在城市+AI的26+15个场景及“20+8”产业集群的需求推动下,智能算力缺口在10000PFLOPS以上。与此同时,深圳算力供给效率低价格高,各公有云厂商算力独立运营,政府自建资源池分散管理,没有统一管理调度平台。智算算力成本成为人工智能企业尤其是初创企业的沉重负担。深圳市智能算力统筹调度与创新服务平台以“息壤”平台为底座,整合区域算网资源,协调接入全市算力资源,并通过云专线等打通客户内网和算力资源的网络,提供高速、安全的网络连接服务,实现跨服务商、跨地域、跨架构的统一管理、统一调度,为业务匹配最优算网资源。
2、提供普惠算力服务
截止24年底,“息壤”平台已接入自建35EFLOPS算力,并整合生态合作27EFLOPS算力,接入生态伙伴50家,开展“息壤”平台与国家算力服务平台间的对接,推进算力网建设工作,实现全国范围的算力并网,解决供需不匹配问题。利用算力市场汇聚多样化算力资源,满足客户不同层次的算力需求,即需即用提升资源供给效率,有效降低采购成本。借助应用市场提供丰富的应用资源,包含开源工具、AI应用等类型,支持快速发现并部署所需应用,实现资源的优化配置。
3、助力“东数西算”与低碳转型
湖南云上栏山数据服务有限公司的火石平台主要用来AI短剧、AI动态漫、AI综艺辅助制作等场景,提升节目生产效率。该平台短期以湖南长沙算力为主,产能提升后国内算力都可满足,下一步优先考虑新疆算力,电力成本相较其他区域具备优势。中国电信正配合国家算力服务平台为云上马栏山公司提供试点服务。截至7月份,哈密到马栏山机房的10G OTN已经基本建设完毕,算力网关接人CPN已经建设完毕,正在进行时延、抖动等数据评估。
五、政策响应与产业协同
中国电信积极响应国家政策参与一体化算力网标准制定工作,参与编制《全国一体化算力网监测调度平台建设指南》《全国一体化算力网算力并网技术文件》《全国一体化算力网算力资源管理与调度技术要求》《全国一体化算力网算力算效衡量技术要求》等国家标准技术文件,制定算力并网接口规范,解决企业间并网接口差异性问题。同时,中国电信在生态合作方面建立试验网协同机制,与生态伙伴共建算力网,基于统一账户体系和计量结算规则,实现“一点接入、多网贯通”的用户无感调度。
综上,中国电信的实践紧扣1779号文“全国一体化算力网”目标,以光网络强算力、以标准化破孤岛,相关技术验证不仅为“东数西算”工程的建设提供了参考,更通过“息壤”平台在算力并网、算力调度和算力度量方面的创新,推动算力服务从资源化向普惠化演进,深化算力与能源、工业等领域的融合,全面支撑数字经济底座构建。
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。