中興通訊:構建高效、開放、高穩、易維的電信級智算基礎設施,讓大模型和GenAl更普惠

責任編輯:包建羽 2024.05.17 14:10 來源:通信世界全媒體

通信世界網消息(CWW)2024年5月16日,中興通訊產品規劃首席科學家王衛斌在浙江寧波舉辦的2024世界電信和信息社會日大會智算融合創新發展論壇上發表了題為《構建開放解耦的電信級智算基礎設施》的演講,闡述了中興通訊在電信級智算基礎設施領域的創新成果和戰略布局。

image.png

中興通訊產品規劃首席科學家王衛斌發言

王衛斌強調,智算基礎設施是“Al+”時代的動力引擎,對于推動全行業智能化轉型至關重要。面對大模型參數規模的快速增長,構建千卡乃至超萬卡級別的xLSC(Large Scale Cluster)智算集群成為智算基礎設施發展的必然選擇。

中興通訊提出Al Booster電信級智算基礎設施解決方案,旨在應對xLSC千卡萬卡智算集群在高效、開放、高穩、易維等方面的挑戰,以支撐大模型發展和GenAI廣泛應用。

在“高效”方面,王衛斌表示,提升單機算力密度是構建LSC (Large Scale Cluster) /vLSC (Very Large ScaleCluster)大規模算力集群的基石。中興通訊采用了交換架構互聯和大TP(>8)技術,有效構建千卡/萬卡規模智算基礎設施。同時,異構并行調度技術是uLSC(Ultra Large ScaleCluster)超大規模算力集群的,通過CoHC(Cluster of Heterogeneous Compute) 異構算力集群和CoDC(Cluster of Data Center)跨DC集群混池訓練實現向十萬卡智算基礎設施的演進。

在“開放”方面,王衛斌強調,開放的技術生態才能構建共贏的商業生態,端到端開放解耦智算方案是產業良性發展的關鍵。為此,中興通訊提出了“三解耦一協同”的主張,即軟硬解耦、訓推解耦、模型應用解耦和算網協同。AI Booster的eMIG跨平臺模型遷移套件,提供包括精度對齊、算子對齊、代碼遷移和性能優化等工具,可大大減少模型遷移時間。

在“高穩”方面,AI Booster引入多級故障檢測、冗余Bypass、實時分布式緩存等技術,通過WLET(WorkLoad Elastic Training)彈性訓練支持千卡無感自動斷點續訓,實現了超大規模集群的周級長穩訓練,大大減少了訓練回滾時間。

在“易維“方面,Al Booste用Al管理AI,實現了智算基礎設施的高效運維。通過全局可視化和管控動化,Al Booster大大提高了運維效率??鐚佣说蕉嗽O計、腳本自動生成、跨層拓撲實時還原等功能,使得運維工作更加簡化和高效。

王衛斌表示,中興通訊致力于構建高效、開放、高穩、易維的電信級智算基礎設施,以促進大模型和GenAI的普及與發展。中興通訊將通過持續創新和開放合作,繁榮智算產業生態,筑路數字經濟,推動AI+新質生產力的發展。

通信世界網版權及免責聲明:
1、凡本網注明“來源:通信世界全媒體”及標有原創的所有作品,版權均屬于通信世界網。未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載我方內容的單位,也必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和本站來源。
2、凡本網注明“來源:XXX(非通信世界網)”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。
3、如因作品內容、版權和其它問題需要同本網聯系的,請在相關作品刊發之日起30日內進行。
發表評論請先登錄
...
熱點文章
    暫無內容
r男女牲交45分钟a片,夜夜添无码试看一区二区三区,人妻老妇乱子伦精品无码专区