回上列表
在GLM-5.1 coding生產環境的基準測試中,ZCube實現純粹靠架構調優帶來的跨越,包括GPU、軟件棧及應用保持不變,交換機與光模塊資本支出減少33%;GPU平均推理吞吐提升15%;TTFT P99降低40.6%。
總結來說,對相同規模和配置的GPU及服務器硬件,在不修改任何應用的前提下,組網架構升級為ZCube之後,不但節省三分一的光模塊和交換機硬件,而且集群每秒能多服務15%的推理請求。這在當前推理業務暴增、算力資源緊缺的背景下,顯得非常具有實用價值。當前,該ZCube集群已穩定運行兩周多,在GLM-5.1 coding推理服務中發揮著重要作用。(jl/da)~
阿思達克財經新聞
網址: www.aastocks.com
智譜(02513.HK)落地ZCube組網架構 相同規模和配置硬件投入下算力多出15%
2026/05/21 12:19
智譜(02513.HK)公布,針對PD分離部署中日益嚴峻的結構性網絡擁塞難題,智譜、馭馴網絡與清華大學開展聯合攻關,提出並在線上生產環境落地ZCube組網架構。在GLM-5.1 coding生產環境的基準測試中,ZCube實現純粹靠架構調優帶來的跨越,包括GPU、軟件棧及應用保持不變,交換機與光模塊資本支出減少33%;GPU平均推理吞吐提升15%;TTFT P99降低40.6%。
總結來說,對相同規模和配置的GPU及服務器硬件,在不修改任何應用的前提下,組網架構升級為ZCube之後,不但節省三分一的光模塊和交換機硬件,而且集群每秒能多服務15%的推理請求。這在當前推理業務暴增、算力資源緊缺的背景下,顯得非常具有實用價值。當前,該ZCube集群已穩定運行兩周多,在GLM-5.1 coding推理服務中發揮著重要作用。(jl/da)~
阿思達克財經新聞
網址: www.aastocks.com
![]() |

