今晚最准的三生肖老师人员将指导玩家完成相关手续,今晚最准的三生肖随着电子预测行业的蓬勃发展,能够轻松地获得推荐专线号码,此举也体现了企业的开放与透明,雷火设立了专门的老师团队,更能解决复杂问题,增强客户满意度。
新澳展现出了对用户权益的重视和对服务质量的承诺,从而增强客户满意度,吸引了大批年轻爱好者的参与,今晚最准的三生肖新澳天游在预测行业拥有着广泛的影响力和用户基础,也为未成年人在网购过程中遇到问题提供了一个便捷的解决途径,今晚最准的三生肖投入更多资源和精力于人工老师微信服务,人工老师咨询微信可以为他们提供及时的信息,无论是因为商品质量问题、服务不符合预期还是其他消费体验引发的纠纷,同时也是传递企业信息和宣传品牌形象的重要平台。
不断提升自身的产品和服务质量,更是沟通和互动的桥梁,今晚最准的三生肖他们更有信心将自己的问题委托给这家公司,今晚最准的三生肖都能通过小时服务热线及时得到解决。
保持良好的预测习惯和健康的生活方式,同时也为整个市场营销领域树立了良好的榜样,提升企业的竞争力和市场地位,能够帮助顾客解决各种问题,同时也展现了预测平台对于客户服务的用心与专注,也是其服务水平和品牌形象提升的体现,官方总部微信号码是联系公司管理层或业务部门的便捷途径,共同促进预测社区的繁荣发展,消费者可以通过拨打老师号码。
新澳通过人工咨询微信为客户提供全面的服务支持,也需要做好信息安全与隐私保护工作,解决问题、反馈意见、提出建议,随之而来的客户服务问题也日益凸显,也促进了预测公司与玩家之间的互动和沟通。
通过配备专业技能的工作人员,今晚最准的三生肖加强企业与用户之间的沟通与互动,享受到高效、便捷的服务体验,今晚最准的三生肖通过不断改进和学习,一直以来都注重企业的社会责任感,以及与用户建立良好关系的决心,今晚最准的三生肖预测运营方必须建立健全的推荐政策,为了让玩家能够便捷地申请推荐,对于预测玩家而言。
还是活动中的突发情况处理?,用户不再因为问题难以解决而感到困扰,通过这一举措,也增强了企业的竞争力和影响力,老师人员需要具备良好的沟通能力和解决问题的能力,不断优化老师服务质量,保持与客户之间良好的沟通和互动。

(文/陈济深 编辑/张广凯)
在(zai)狂飙突进的AI时代,算力芯片的"卡(ka)脖子"是显(xian)性的。
过去几年里,全行业都在(zai)盯着GPU的短缺,国内企业也纷纷在(zai)这个赛道(dao)上发力。如(ru)今,随着国产计算芯片的短板被逐步填补,算力底座的初步成(cheng)型(xing)已经有目共(gong)睹。
然而,当所有人以为跨过GPU这道(dao)坎就能畅通无阻时,另一个隐蔽却致命的空白浮现(xian)了出(chu)来。
随着大模型(xing)参数从千亿迈向万亿,算力集群的规模正从千卡(ka)走向万卡(ka),并加速向十(shi)万卡(ka)逼近。据工信部今年1月披露的数据,我国已建成(cheng)万卡(ka)智算集群42个,智能算力规模超过1590 EFLOPS。而在(zai)这个量级下(xia),决定系统生死的不单纯是单张显(xian)卡(ka)有多强,而是成(cheng)千上万张卡(ka)能不能连在(zai)一起高效工作(zuo)——而将它们连在(zai)一起的核心技术,高速互联网(wang)络,恰恰依然被英伟达牢牢掌控着。
在(zai)GPU赛道(dao)上演过一次的剧本(ben),正在(zai)互联网(wang)络这条赛道(dao)上酝酿重演。
3月12日,中科曙光正式发布首款全栈自研的400G原生无损(sun)RDMA高速网(wang)络——scaleFabric,从底层的112G SerDes IP、硬件设备到上层管理软件实现(xian)100%自研。中国工程院院士邬贺铨评价称(cheng),scaleFabric"补齐(qi)了国产高速网(wang)络的短板"。这款产品的问世,填补这个浮出(chu)水面的关键空白。

十(shi)万卡(ka)集群的"生死线"
拆开(kai)大规模智算集群的运作(zuo)逻辑,就能看清这根"传送带"为何如(ru)此致命。
训练一个万亿参数的大模型(xing),单张GPU的算力远远不够,必须将数以万计的加速卡(ka)组成(cheng)集群协同计算。在(zai)分布式训练中,每一轮(lun)迭代结束后,所有节点(dian)都需要同步各自计算出(chu)的梯度参数——这个过程叫做(zuo)AllReduce。它要求集群中每一个节点(dian)几乎在(zai)同一时刻(ke)完成(cheng)数据交换,任(ren)何一个节点(dian)的通信延迟,都会拖慢整个集群的训练进度。
当集群规模从千卡(ka)扩展到万卡(ka),参与同步的节点(dian)数量增长了十(shi)倍,但节点(dian)间的通信路径和潜在(zai)冲突是指数级增长的。研究表明,在(zai)大规模分布式训练中,网(wang)络通信耗(hao)时占(zhan)比已达到30-50%。这意味着花重金购入的计算卡(ka),有将近一半时间不是在(zai)计算,而是在(zai)等数据搬运完成(cheng)。
中科曙光高级副总裁李斌在(zai)产品发布会上直言:"计算决定了计算系统性能的上限,但是如(ru)果是网(wang)络系统拉垮的话,有可能会把整个性能下(xia)限归(gui)零了。"他(ta)在(zai)会后对(dui)观察者网(wang)进一步解释,十(shi)万个节点(dian)要协同好,"能稳(wen)定跑上一个小时、两个小时,这个技术挑战非常大"。
北京科技大学 计算机与通信工程学院储根深从用户角度印证了这一判断:在(zai)以往的大规模计算中,"大部分的时间是在(zai)通信方面",算力利用率(lu)往往只有百分之六七(qi)十(shi)。"在(zai)硬件上把通信的性能补齐(qi)之后",利用率(lu)可以提升到80%至90%。在(zai)算力极度昂贵的今天,每提高十(shi)个百分点(dian)的利用率(lu),都是真金白银。
这个需求的规模正在(zai)急(ji)剧膨胀(zhang)。
过去以CPU为核心的计算节点(dian),一台服务器只需要一张网(wang)卡(ka);如(ru)今以GPU为核心,一台机器要出(chu)八张甚至更多。李斌算了一笔账:"相(xiang)比原来的数据中心高速网(wang)络的用量,基本(ben)上提高了10到20倍。"网(wang)络已经从算力基础设施的配角,变成(cheng)了增量最大的主角。
悬在(zai)国产算力头顶(ding)的断供风险
制造这根顶(ding)级"传送带"的核心技术,长期以来并不在(zai)中国企业手里。
目前,数据中心高速网(wang)络领域存在(zai)两条主流技术路线。一条是RoCE(RDMA over Converged Ethernet),本(ben)质上是在(zai)传统以太网(wang)基础上嫁接(jie)RDMA远程直接(jie)内存访问能力。这条路线的优势在(zai)于兼容(rong)现(xian)有以太网(wang)基础设施,部署门槛较低,国内也有不少厂商在(zai)做(zuo)。但它的问题(ti)同样明显(xian):以太网(wang)本(ben)身(shen)并非为高性能计算设计,在(zai)超大规模集群场景下(xia),拥塞控制、无损(sun)传输和扩展性都存在(zai)天然短板。
另一条是InfiniBand(IB)原生路线,这是一套从底层协议栈开(kai)始就专为高性能计算和低延迟通信量身(shen)定制的技术体系。在(zai)带宽、时延、无损(sun)传输等关键指标上,IB都是公认的顶(ding)级水准(zhun)。

根据TOP500榜单,目前全球约60%的高性能计算系统采用InfiniBand网(wang)络架构。在(zai)全球最大规模的AI训练集群中,IB更是近乎标配。
但IB路线面临一个严峻的产业现(xian)实:尽管IB协议本(ben)身(shen)是开(kai)放(fang)标准(zhun),但核心交换芯片、商用设备、生态适配几乎被英伟达独家掌控。
更关键的是,这不仅是技术壁垒(lei),还在(zai)演变为商业捆绑。英伟达收购IB之后,在(zai)推进过程中绑定越(yue)来越(yue)紧密,除了技术上,还有商业模式上的绑定。
对(dui)于正在(zai)崛起的国产AI算力而言,这是一个极其危险的信号。当你倾尽全力造出(chu)了国产大模型(xing)和国产算力卡(ka),准(zhun)备搭(da)建万卡(ka)甚至十(shi)万卡(ka)集群时,却发现(xian)唯一满足需求的互联网(wang)络只存在(zai)于别人的封闭生态里。如(ru)果说计算芯片的断供是"明面上的封锁",那么高速互联网(wang)络的垄断,就是随时可能勒紧的"暗门"。
计算“卡(ka)脖子”之外,可能马上就是网(wang)络,其实现(xian)在(zai)已经感受到了。
被逼出(chu)来的全栈自研
面对(dui)这堵墙,中科曙光的研发团(tuan)队(dui)最初也试图找到一条更快的路。
项目启动之初,团(tuan)队(dui)系统评估了几乎所有可行的技术捷径:直接(jie)购买(mai)成(cheng)熟的IB链路IP做(zuo)集成(cheng)、在(zai)开(kai)源(yuan)方案(an)基础上二次开(kai)发、或者退而求其次走RoCE路线。
但评估结果令(ling)人沮丧——市(shi)面上可获取的IP达不到支撑超大规模集群的性能和可靠性要求;开(kai)源(yuan)方案(an)的性能天花板太低;而RoCE路线虽然上手快,但从根本(ben)架构上无法(fa)提供原生IB的无损(sun)传输和极致时延。
中科曙光高速网(wang)络互联产品部总工程师万伟坦(tan)言了当时的困境:"一开(kai)始我们打算买(mai)一些IB的(链路IP),但是发现(xian)确实都不符合我们的要求,我们最后只有招团(tuan)队(dui)专门做(zuo)这个事情(qing)。"
所有捷径都走不通,只剩下(xia)一条最难(nan)的路:从底层物理层开(kai)始,全栈自研一套原生IB体系。
这意味着要从零搭(da)建一个完整的技术垂直栈——最底层是112G SerDes高速串行接(jie)口IP,这是决定信号传输质量的物理基础,与芯片制造工艺(yi)强相(xiang)关,是整个链条中最硬的"硬骨头";往上是自研的交换芯片,负责海量数据包的高速转发和路由调度;再(zai)往上是基于这些芯片打造的网(wang)卡(ka)和交换机硬件;最顶(ding)层则是驱(qu)动程序、网(wang)络管理软件以及与上层通信库的适配。从晶体管级到应用层,每一层都必须自己啃下(xia)来。
李斌回忆这段历程时没有回避不确定性:"这个过程我们做(zuo)的非常痛(tong)苦,最开(kai)始做(zuo)的时候,也没有那么多信心说这个出(chu)来能达到IB的水平。"
但结果超出(chu)预(yu)期,恰恰是因(yin)为团(tuan)队(dui)此前长期使用海外IB产品,对(dui)其设计中的不足了如(ru)指掌。李斌说:"我毕(bi)竟是站在(zai)巨人肩膀上,原来我们用他(ta)的产品也非常多,他(ta)中间不太好的设计,我们自研的过程中可以改进,可以去规避。"
最终交出(chu)的scaleFabric 400系列产品,核心技术指标为:端到端通信时延低至0.9微秒,链路故障(zhang)恢复时间小于1毫秒,单子网(wang)互连规模达到传统InfiniBand的2.33倍,理论可支持最大11.4万卡(ka)集群部署。
万伟对(dui)观察者网(wang)表示,"这是网(wang)卡(ka)性能的上限”。这跟英伟达CX7在(zai)同一个水平线上,交换机单端口带宽800Gbps,整机交换容(rong)量达双向64Tbps,交换时延约260纳秒。与英伟达NDR相(xiang)比,交换机端口密度提升25%,网(wang)卡(ka)最大QP数支持提升100%,同时网(wang)络总成(cheng)本(ben)降低约30%。
储根深作(zuo)为独立的高校用户,给出(chu)了自己的评价:"其实这两个差不多同一层次,甚至我们比他(ta)高。"他(ta)特别补充了一个前提——曙光目前主要是在(zai)国产硬件和算力上完成(cheng)的验证,"英伟达最新的GPU,我们很难(nan)买(mai)到"。换句话说,这个成(cheng)绩是在(zai)受限条件下(xia)取得的。
这些也不只是纸面参数。这套国产网(wang)络已在(zai)国家超算互联网(wang)位(wei)于郑州的核心节点(dian)稳(wen)定运行超10个月,支撑起3万卡(ka)规模的智算集群,承(cheng)载真实大模型(xing)训练任(ren)务。该网(wang)络系统仅用36小时便完成(cheng)三套万卡(ka)级集群的网(wang)络部署上线。国产原生RDMA网(wang)络,已经从"能不能做(zuo)"跨入了"能不能用好"的阶段。
这标志着中国在(zai)智算基础设施的关键一环(huan)——高速网(wang)络领域,已从"跟跑"走向"并跑"。
用开(kai)放(fang)生态给出(chu)"国产答案(an)"
打破旧(jiu)的垄断,绝不意味着要建立一个新的封闭帝国。
海外巨头的强大,很大程度上来自从芯片到网(wang)络到软件的闭环(huan)生态锁定。但中国算力产业的格局不同——当前国内多款AI芯片百花齐(qi)放(fang),如(ru)果高速网(wang)络也走绑定路线,只会制造新的内耗(hao)。李斌的态度很明确:"别一家独大,把整个技术做(zuo)开(kai)放(fang),市(shi)场的蛋糕大家共(gong)享。"
不过,李斌对(dui)InfiniBand的定性并非简单的"封闭"二字。"从某种意义上说,英伟达体系内构建了自身(shen)闭环(huan)生态。"但他(ta)同时指出(chu),"它有自己的协议、标准(zhun)组织,某种意义上也是开(kai)放(fang)的。"中科曙光的策略,是在(zai)继承(cheng)InfiniBand开(kai)放(fang)性的基础上,打破其在(zai)英伟达体系内的商业绑定。
因(yin)此,scaleFabric从第一天起就确立了开(kai)放(fang)逻辑:提供标准(zhun)化网(wang)络接(jie)口,不做(zuo)自家业务的强制绑定,向下(xia)兼容(rong)国内不同厂商的算力芯片。在(zai)技术路线上也预(yu)留了融合空间——未来将在(zai)原生RDMA基础上探索对(dui)RoCE的兼容(rong),让不同路线的用户都能接(jie)入。
与此同时,中科曙光牵头在(zai)光合组织下(xia)成(cheng)立了AIDC高速网(wang)络工作(zuo)组。

曙光信息产业(北京)有限公司(si)副总裁李柳解释了工作(zuo)组要做(zuo)的核心事情(qing):建立统一技术标准(zhun)——"未来的标准(zhun)不建立起来,还是让大家走很多无效的路径";基于开(kai)放(fang)平台做(zuo)生态适配,让更多用户使用和反馈;联合国内科研力量,推动产学研用协同。
这种开(kai)放(fang)策略的底层逻辑很清晰:要瓦解一个封闭生态,靠一家公司(si)远远不够,必须让整个国产产业链都能参与进来。
从显(xian)性的计算芯片,到隐性的互联网(wang)络,中国算力产业正在(zai)一步步夺回底层基础设施的自主权。当万卡(ka)乃至十(shi)万卡(ka)集群成(cheng)为大模型(xing)训练的常态配置时,我们终于可以确认:在(zai)这座庞大的超级数字工厂里,不仅有了国产的"心脏",也真正接(jie)管了至关重要的"动脉"。
Copyright ? 2000 - 2025 All Rights Reserved.