人工智能行業(yè)現(xiàn)狀
人工智能已經(jīng)歷十幾年的快速發(fā)展,尤其是近些年,人工智能在大數(shù)據(jù)、大模型的深度學(xué)習(xí)之路上一路高歌猛進(jìn),目前已經(jīng)形成了用大數(shù)據(jù)代替經(jīng)驗(yàn)、用算法挖掘知識(shí)、用并行計(jì)算確保模型訓(xùn)練的可行性的基本范式。
現(xiàn)在有大量的基于感知能力的AI模型已經(jīng)廣泛應(yīng)用于各行各業(yè),但是目前人工智能還只是“弱人工智能”,很多核心問題依然沒有解決,比如如何讓模型具備真正的理解能力。
從技術(shù)上看,人工智能的應(yīng)用呈現(xiàn)出工程化的趨勢(shì)。由于多元的人工智能應(yīng)用場(chǎng)景日益增多,用戶體驗(yàn)要求越來越高,對(duì)于迭代速度的要求也有所提升,傳統(tǒng)的開發(fā)方式已經(jīng)無法滿足企業(yè)客戶的需求,同時(shí)由于遷移能力的限制,不同場(chǎng)景的問題仍需要大量的定制模型的開發(fā)。
為適應(yīng)人工智能工程化的需求,人工智能勢(shì)必將和數(shù)據(jù)有更加緊密的聯(lián)系?,F(xiàn)在70%-90%的AI工程師把時(shí)間和精力都用在數(shù)據(jù)而不是模型代碼上,模型已經(jīng)不再是工程應(yīng)用方面的最大瓶頸,而訓(xùn)練數(shù)據(jù)已成為機(jī)器學(xué)習(xí)工程師全新的挑戰(zhàn)。
與此同時(shí),新算法不斷涌現(xiàn),預(yù)訓(xùn)練模型正在蓬勃發(fā)展,推動(dòng)了技術(shù)效果不斷提升,雖然降低了標(biāo)注數(shù)據(jù)的門檻,但計(jì)算成本有所上升。另外,大規(guī)模模型近年也成為研究熱點(diǎn)之一,模型參數(shù)規(guī)模指數(shù)從億級(jí)發(fā)展到萬億級(jí)的增長(zhǎng),算法模型大量開源,使得云計(jì)算的成本下降,而人力成本逐漸飆升。
Data-Centric MLOps
在這樣一個(gè)大背景下,倍賽科技CTO劉世林博士應(yīng)邀在第四屆智能制造創(chuàng)新高峰論壇活動(dòng)中,進(jìn)行了以“打造Data-Centric MLOps基礎(chǔ)設(shè)施,助力AI提效”為主題的演講分享,總結(jié)了企業(yè)在人工智能工程應(yīng)用方面的兩大實(shí)踐方向。
一個(gè)是基于中小型的模型,配合較多的“好數(shù)據(jù)”和較低的計(jì)算資源;另一個(gè)方向則是使用大模型,用較少的“好數(shù)據(jù)”和較多的計(jì)算資源??梢钥闯觯瑑蓚€(gè)實(shí)踐方向的核心都離不開“好數(shù)據(jù)”,所以,劉世林博士推薦企業(yè)AI的工程實(shí)踐圍繞Data-Centric MLOps的應(yīng)用策略展開,更加便捷、高效地實(shí)現(xiàn)人工智能落地應(yīng)用和產(chǎn)品交付。
Gartner預(yù)測(cè):“到2025年,人工智能和數(shù)據(jù)科學(xué)平臺(tái)市場(chǎng)將以21.6%的復(fù)合年增長(zhǎng)率增長(zhǎng)到超過100億美元,基于Data-Centric MLOps的巨大市場(chǎng)潛力,倍賽科技重新定義了企業(yè)戰(zhàn)略方向,將面向全球提供AI賦能的Data-Centric MLOps軟件基礎(chǔ)設(shè)施,從數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注、數(shù)據(jù)治理、模型驗(yàn)證和模型開發(fā)的各個(gè)環(huán)節(jié),提供了一體化、全方位的技術(shù)軟件與服務(wù)體系,使用AI的能力加強(qiáng)軟件實(shí)力的同時(shí),加強(qiáng)高質(zhì)量數(shù)據(jù)的處理和生產(chǎn),幫助客戶快速完成數(shù)據(jù)與模型迭代,高質(zhì)量、高效率實(shí)現(xiàn)AI場(chǎng)景落地。
作為公司實(shí)施Data-Centric MLOps戰(zhàn)略的第一步,倍賽科技重新設(shè)計(jì)并研發(fā)了新一代多模態(tài)數(shù)據(jù)標(biāo)注平臺(tái)X1。X1平臺(tái)集成了大量的AI能力,提供了完整且功能強(qiáng)大的“數(shù)據(jù)標(biāo)注工具集”, 可同時(shí)滿足自動(dòng)駕駛、遙感、醫(yī)療等精細(xì)化、高量級(jí)的數(shù)據(jù)需求,工具集及AI質(zhì)檢及預(yù)標(biāo)注模塊可提升至少30%的效率。同時(shí),平臺(tái)內(nèi)置了數(shù)十套模型庫(kù),一鍵訓(xùn)練及部署模型,打破從數(shù)據(jù)到模型的技術(shù)鴻溝,底層海量存儲(chǔ)及傳輸積累了大量原創(chuàng)技術(shù),成為建模業(yè)務(wù)堅(jiān)實(shí)產(chǎn)品基礎(chǔ),助力企業(yè)AI快速落地,落地周期縮短75%,成本節(jié)省65%。
目前倍賽科技已經(jīng)完成了從“標(biāo)注平臺(tái)”到“一體化AI基礎(chǔ)設(shè)施方向”的晉階,后續(xù)會(huì)在練好“產(chǎn)品功”的基礎(chǔ)上,探索更上層的“垂直解決方案”,構(gòu)建最易于訪問的Data-Centric MLOps,用于連接人、模型和數(shù)據(jù)。
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。
關(guān)鍵詞: