以百融云創(chuàng)為例,百融云創(chuàng)基于深度學(xué)習(xí)Transformer框架,結(jié)合NLP、智能語音等技術(shù),打造了場景驅(qū)動(dòng)的產(chǎn)業(yè)大模型——BR-LLM。百融云創(chuàng)自主搭建了大模型底層框架,通過深度微調(diào)能支持百億級(jí)參數(shù)的訓(xùn)練。
與普通模型相比,大模型具有更加復(fù)雜和龐大的網(wǎng)絡(luò)結(jié)構(gòu)、更多的參數(shù)和更深的層數(shù)。但更大規(guī)模,并不等于更強(qiáng)模型能力。垂直領(lǐng)域大模型考驗(yàn)的是算力+行業(yè)knowhow+模型精調(diào)的綜合能力。其中行業(yè)knowhow尤為關(guān)鍵,這是專家經(jīng)驗(yàn)、行業(yè)數(shù)據(jù)、組織能力、工程能力的綜合體,而這也恰恰是垂直企業(yè)的競爭優(yōu)勢所在。
比如,在銀行運(yùn)營環(huán)節(jié),由于模型都是黑盒模式,由模型制定出的營銷策略,很難讓一線執(zhí)行的客戶經(jīng)理完全信服,當(dāng)模型制定的策略置于現(xiàn)實(shí)情況產(chǎn)生了偏差,此時(shí)該如何協(xié)調(diào)客戶經(jīng)理與AI之間的關(guān)系?或者由于外部環(huán)境發(fā)生變化, 如疫情對(duì)居民收入帶來了影響,金融機(jī)構(gòu)原有的信貸模型與現(xiàn)實(shí)情況就會(huì)產(chǎn)生偏差,此時(shí)要如何優(yōu)化原有的參數(shù)?如果僅有大模型而沒有足夠深入的產(chǎn)業(yè)knowhow,是遠(yuǎn)遠(yuǎn)不夠的。
比如,在某中小銀行的服務(wù)中,百融云創(chuàng)要從數(shù)字化轉(zhuǎn)型總體規(guī)劃入手,逐步深入到,產(chǎn)品和業(yè)務(wù)等多個(gè)層面。有時(shí)要協(xié)同科技部門、業(yè)務(wù)部門等多個(gè)部門,并搭配非常深厚的產(chǎn)業(yè)視野,才能真正深入場景,直抵產(chǎn)業(yè)的核心。