(資料圖片僅供參考)
9月5日,在百度云智大會(huì)上,百度智能云聯(lián)合度小滿推出《智算中心網(wǎng)絡(luò)架構(gòu)白皮書》。白皮書由百度智能云和度小滿負(fù)責(zé)高性能網(wǎng)絡(luò)落地的一線專家撰寫,內(nèi)容覆蓋了高性能網(wǎng)絡(luò)建設(shè)的各個(gè)方面,包括不同規(guī)模集群的架構(gòu)選擇、云平臺(tái)上的可視化運(yùn)維工具建設(shè)、多租戶的運(yùn)營(yíng)方案設(shè)計(jì)等,為同業(yè)提供全流程指導(dǎo),讓復(fù)雜的高性能網(wǎng)絡(luò)建設(shè)變得簡(jiǎn)單。
大模型需要大算力,如何建設(shè)高性能網(wǎng)絡(luò)是其中最為關(guān)鍵的一步。度小滿今年5月正式開源了國(guó)內(nèi)首個(gè)千億參數(shù)金融大模型——“軒轅”。在金融場(chǎng)景中的任務(wù)評(píng)測(cè)中,軒轅全面超越了市場(chǎng)上的主流開源大模型,贏得了150次回答中63.33%的勝率。隨著大模型的迅猛發(fā)展,模型對(duì)于底層算力的需求呈指數(shù)性增長(zhǎng),智能算力規(guī)模的持續(xù)擴(kuò)大帶來(lái)的是GPU算力部署規(guī)模日益膨脹,對(duì)于高性能網(wǎng)絡(luò)的要求也日益增多。
隨著度小滿模型參數(shù)規(guī)模超過(guò)千億,為滿足不斷增加的算力需求、度小滿私有云模式的智算中心也在不斷升級(jí),低時(shí)延、大帶寬、穩(wěn)定性運(yùn)行、可運(yùn)維性高的大規(guī)模智算網(wǎng)絡(luò)正是智算中心搭建的重要基石。在建設(shè)私有云模式的智算中心的過(guò)程中,度小滿聯(lián)合百度智能云,構(gòu)建了一套私有云智算網(wǎng)絡(luò),在支撐萬(wàn)卡GPU規(guī)模的同時(shí),相較于業(yè)內(nèi)常見的Dragonfly、Tours網(wǎng)絡(luò)拓?fù)?,網(wǎng)絡(luò)帶寬更充足,節(jié)點(diǎn)間跳步數(shù)更穩(wěn)定性,網(wǎng)絡(luò)延時(shí)指標(biāo)縮短到3微秒以內(nèi),具備端到端的可觀測(cè)性能力與故障自愈能力,無(wú)阻塞、低時(shí)延、高可靠的網(wǎng)絡(luò)設(shè)計(jì)有效支撐了上層智算應(yīng)用的快速迭代和發(fā)展,為“軒轅”大模型的訓(xùn)練提供了穩(wěn)定的網(wǎng)絡(luò)保障。
目前,度小滿智算網(wǎng)絡(luò)中心已建設(shè)成為國(guó)內(nèi)金融行業(yè)首批私有云模式下的萬(wàn)卡規(guī)模智算中心,為“軒轅”大模型的訓(xùn)練提供了穩(wěn)定的網(wǎng)絡(luò)保障。
推廣
關(guān)鍵詞: