(相關(guān)資料圖)
8月31日,商湯科技日日新大模型旗下自然語(yǔ)言應(yīng)用“商量SenseChat”正式面向廣大用戶(hù)開(kāi)放服務(wù)。
商湯“商量SenseChat”今年4月正式推出,是國(guó)內(nèi)最早的基于千億參數(shù)大語(yǔ)言模型之一,并不斷迭代更新。目前,基模型為商湯聯(lián)合多家國(guó)內(nèi)頂級(jí)科研機(jī)構(gòu)發(fā)布的書(shū)生·浦語(yǔ)InternLM-123B,擁有1230億參數(shù),在語(yǔ)言、知識(shí)、理解、推理和學(xué)科五大能力上均處于行業(yè)領(lǐng)先水平,并在全球51個(gè)知名評(píng)測(cè)集(包括MMLU,AGIEVAL,ARC,CEval,Race,GSM8K等)共計(jì)30萬(wàn)道問(wèn)題集合上測(cè)試成績(jī)整體排名全球第二,超過(guò)GPT-3.5-turbo以及Meta新發(fā)布的LLaMA2-70B等模型,在主要評(píng)測(cè)中12項(xiàng)成績(jī)超越GPT-4,排名第一。
商量SenseChat背后依托商湯AI大裝置SenseCore,其上線GPU數(shù)量由2023年3月底的27000塊提升至日前的約30000塊,算力規(guī)模提升20%至6ExaFLOPS,可有效支持語(yǔ)言大模型的訓(xùn)練、升級(jí)迭代和服務(wù)。
在訓(xùn)練數(shù)據(jù)方面,商湯每月可產(chǎn)出約2萬(wàn)億token的高質(zhì)量數(shù)據(jù),支持更加強(qiáng)大的基模型的訓(xùn)練,預(yù)計(jì)年底高質(zhì)量數(shù)據(jù)儲(chǔ)備將突破10萬(wàn)億token。同時(shí),商湯還投入了數(shù)百臺(tái)服務(wù)器搭載千卡GPU的計(jì)算資源,采用算法結(jié)合人工的方法對(duì)原始語(yǔ)料數(shù)據(jù)進(jìn)行分門(mén)別類(lèi)的精細(xì)化清洗,以確保數(shù)據(jù)的質(zhì)量、安全性和價(jià)值觀都符合要求。
截至目前,商湯商量在金融、醫(yī)療、汽車(chē)、地產(chǎn)、能源、傳媒、工業(yè)制造等眾多垂直行業(yè)與超過(guò)500家客戶(hù)建立了深度合作,通過(guò)提供多種靈活的API接口和服務(wù),為客戶(hù)提供大模型的各項(xiàng)AI技術(shù)和服務(wù),低門(mén)檻、低成本、高效率地實(shí)現(xiàn)各類(lèi)生成式AI應(yīng)用。
商湯“日日新SenseNova”大模型體系和生成式AI產(chǎn)品系列,包括商量、秒畫(huà)、如影、瓊宇、格物,分別對(duì)應(yīng)著自然語(yǔ)言交互、AI文生圖、數(shù)字人、3D大場(chǎng)景重建、3D小物體生成這五個(gè)主流的生成式AI應(yīng)用。未來(lái),商湯將依托強(qiáng)大的基模型,以及在算力、數(shù)據(jù)、算法基礎(chǔ)上的積累和豐富Know-how,持續(xù)升級(jí)商湯日日新大模型體系下的多種生成式AI產(chǎn)品,滿(mǎn)足各類(lèi)用戶(hù)的需求。
(編輯 李波)
關(guān)鍵詞: