
文/周雄飛
編輯/子夜
過(guò)去半年,大模型在延續(xù)火熱態(tài)勢(shì)的同時(shí),也在加速分化。
一個(gè)明顯的特征是,除了通用大模型之外,業(yè)界對(duì)行業(yè)大模型的布局,也變得火熱起來(lái)了。
7月6日-8日召開(kāi)的2023世界人工智能大會(huì)上,騰訊研究院發(fā)布了《人機(jī)共生——大模型時(shí)代的十大AI趨勢(shì)觀察》報(bào)告,報(bào)告中有兩點(diǎn)趨勢(shì)尤其值得關(guān)注:
第一,未來(lái)將形成模型即服務(wù)的MaaS生態(tài);
第二,行業(yè)應(yīng)用是大模型的主戰(zhàn)場(chǎng)。
報(bào)告指出,一方面,大模型為AI標(biāo)準(zhǔn)化、模塊化、自動(dòng)化的實(shí)現(xiàn)提供了路徑,正在重構(gòu)現(xiàn)有的商業(yè)模式;另一方面,在金融、零售、政府、制造、物流等多個(gè)行業(yè)及應(yīng)用場(chǎng)景,生成式AI技術(shù)已經(jīng)展現(xiàn)出了出色的能力,接下來(lái)各行各業(yè)都將迅速整合大模型的能力,創(chuàng)造出全新的商業(yè)價(jià)值。
結(jié)合這兩點(diǎn),不難發(fā)現(xiàn),隨著大模型產(chǎn)業(yè)從混沌走向成熟,其在產(chǎn)業(yè)場(chǎng)景的應(yīng)用落地,將成為接下來(lái)業(yè)界的一個(gè)關(guān)鍵命題。
行業(yè)大模型熱潮下,騰訊是布局行業(yè)大模型的最具代表性的一個(gè)玩家。
上個(gè)月,騰訊云已經(jīng)公布了自己的方向——服務(wù)產(chǎn)業(yè)界,洞悉不同產(chǎn)業(yè)對(duì)大模型的需求,向更多產(chǎn)業(yè)場(chǎng)景的用戶提供MaaS(Model as a service)服務(wù)。

在回答了做什么以后,現(xiàn)在騰訊云要回答怎么做的問(wèn)題:
在具體深入產(chǎn)業(yè)的過(guò)程中,騰訊云如何按需提供大模型解決方案?
騰訊云的技術(shù)優(yōu)勢(shì)體現(xiàn)在哪里?憑什么為各個(gè)產(chǎn)業(yè)的用戶“量體裁衣”?
目前落地的效果如何,是否達(dá)到客戶預(yù)期?
也就是說(shuō),選擇先做行業(yè)大模型這一路徑后,騰訊云實(shí)際上完成了“面子”的整體搭建,這基于它布局大模型的思路,指導(dǎo)著騰訊云行業(yè)大模型的布局方向。
但比“面子”更重要的是“里子”,即在大方向確定下來(lái)之后,如何在接下來(lái)一步一步腳印,給出場(chǎng)景落地的最佳答案。畢竟,產(chǎn)業(yè)場(chǎng)景,才是大模型的最佳練兵場(chǎng)。
1、騰訊云做行業(yè)大模型,扎根產(chǎn)業(yè)場(chǎng)景
目前,中國(guó)大模型產(chǎn)業(yè)目前還處于發(fā)展初期,未形成穩(wěn)定格局,不過(guò),探索大模型技術(shù)的產(chǎn)業(yè)化應(yīng)用,已經(jīng)是行業(yè)的一大共識(shí)。
這一共識(shí)下,最近一段時(shí)間,越來(lái)越多的垂直行業(yè)大模型開(kāi)始涌現(xiàn)。
比如毫未智行發(fā)布了自動(dòng)駕駛生成式大模型DriveGPT、我愛(ài)我家聯(lián)合第四范式推出了行業(yè)首個(gè)房產(chǎn)經(jīng)紀(jì)大模型 1.0?版本、互聯(lián)網(wǎng)醫(yī)療公司醫(yī)聯(lián)也發(fā)布了自研的醫(yī)療大預(yù)言模型MedGPT等等。
除了企業(yè)親自下場(chǎng),研發(fā)專(zhuān)屬的行業(yè)大模型之外,還有一個(gè)玩家尤其值得關(guān)注。
騰訊云在6月份發(fā)布了行業(yè)大模型解決方案,其依托騰訊云TI平臺(tái)打造了行業(yè)大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務(wù),幫助客戶構(gòu)建專(zhuān)屬大模型及智能應(yīng)用。

騰訊云MaaS全景圖,圖源騰訊云公眾號(hào)
簡(jiǎn)單來(lái)說(shuō),如果一家企業(yè)想要擁有自己的大模型,他們不必親自下場(chǎng)做,而是可以依托騰訊云的行業(yè)大模型解決方案達(dá)成訴求。
據(jù)連線Insight了解,騰訊云TI平臺(tái)內(nèi)置了多個(gè)高質(zhì)量行業(yè)大模型,涵蓋了金融、傳媒、文旅、政務(wù)、教育等多個(gè)行業(yè)場(chǎng)景,企業(yè)可以結(jié)合自身場(chǎng)景數(shù)據(jù)按需定制精調(diào),也可以根據(jù)自身需求開(kāi)展多模型訓(xùn)練任務(wù)。
不難發(fā)現(xiàn),在做大模型這條路上,騰訊選擇了一條有著明顯差異化的路徑:
它把重心放在了行業(yè)大模型上,試圖在不同的場(chǎng)景中落地,它站在了產(chǎn)業(yè)互聯(lián)網(wǎng)的視角,思路是要幫助更多的企業(yè)更方便、快捷、實(shí)惠地用上行業(yè)大模型。
在2023世界人工智能大會(huì)現(xiàn)場(chǎng),騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示,通用大模型有很強(qiáng)的能力,但并不能解決很多企業(yè)的具體問(wèn)題。
“企業(yè)的大模型應(yīng)用需要綜合考慮行業(yè)專(zhuān)業(yè)性、數(shù)據(jù)安全、持續(xù)迭代和綜合成本等因素?;谛袠I(yè)大模型,構(gòu)建自己的專(zhuān)屬模型,也許是企業(yè)更優(yōu)的選項(xiàng)?!睖郎硎?。
實(shí)際上,騰訊云是第一批下場(chǎng)做行業(yè)大模型的玩家、同時(shí)是最先打造行業(yè)大模型生態(tài)的玩家。
“大模型時(shí)代,開(kāi)放是非常重要的一個(gè)特點(diǎn)。我們觀察到,底層的技術(shù)變化太快,技術(shù)的外延能力也會(huì)非常廣,大模型要結(jié)合到一個(gè)行業(yè)里面,要發(fā)揮最大的價(jià)值,只有開(kāi)放,通過(guò)開(kāi)放讓行業(yè)專(zhuān)家等各類(lèi)角色人員加入進(jìn)來(lái),才能讓生態(tài)更加健康,產(chǎn)生更多可能性?!彬v訊云副總裁、云智能負(fù)責(zé)人、優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲提到。
這背后,是騰訊云對(duì)大模型以及產(chǎn)業(yè)互聯(lián)網(wǎng)的深度思考。
一方面,騰訊云觀察到,相比于通用大模型,行業(yè)大模型更加具象,可以貼近企業(yè)的實(shí)際需要。吳運(yùn)聲表示,大模型的技術(shù)跟騰訊在產(chǎn)業(yè)互聯(lián)網(wǎng)多年的經(jīng)驗(yàn)和數(shù)據(jù)結(jié)合之后,能夠用跟以往不一樣的方式,解決很多行業(yè)遇到的問(wèn)題。
另一方面,騰訊云推出行業(yè)大模型,也與其以往的業(yè)務(wù)邏輯相關(guān)聯(lián)。騰訊CSIG(云與智慧產(chǎn)業(yè)事業(yè)群)在產(chǎn)業(yè)互聯(lián)網(wǎng)領(lǐng)域深耕多年,積累起了大量客戶和行業(yè)knowhow,使得騰訊云在垂直行業(yè)打造行業(yè)大模型解決方案時(shí),有著天然優(yōu)勢(shì)。
這條路徑,同時(shí)與騰訊在推動(dòng)B端企業(yè)數(shù)字化轉(zhuǎn)型過(guò)程中秉承的“務(wù)實(shí)”理念一脈相承——即大模型需要深入到產(chǎn)業(yè)中去、需要在各行各業(yè)落地實(shí)踐,才能發(fā)揮出最大的效用,并不斷迭代及進(jìn)化。
這也是為什么,騰訊云的行業(yè)大模型解決方案,其實(shí)就做了一件事:讓更多的企業(yè)通過(guò)騰訊云,用更低的成本、更高效地加速大模型在更多產(chǎn)業(yè)場(chǎng)景的落地。
2、為行業(yè)用戶“量體裁衣”,究竟怎么做?
《人機(jī)共生——大模型時(shí)代的十大AI趨勢(shì)觀察》中提到,隨著生成式人工智能技術(shù)的飛速發(fā)展,已經(jīng)在多個(gè)領(lǐng)域催生出全新的商業(yè)價(jià)值。
一個(gè)現(xiàn)象是,在全球范圍內(nèi),第一批跨功能的應(yīng)用已經(jīng)出現(xiàn)。比如金融行業(yè)的Stripe、Bloomberg;零售行業(yè)的可口可樂(lè);生命科學(xué)領(lǐng)域的 Profluent、absci等,在這些落地中,生成式AI被應(yīng)用到內(nèi)容創(chuàng)建、知識(shí)發(fā)現(xiàn)、智能客服等場(chǎng)景。
在中國(guó)市場(chǎng),這種趨勢(shì)同樣明顯。以騰訊云為代表的一眾廠商,已經(jīng)在積極推動(dòng)大模型在產(chǎn)業(yè)場(chǎng)景的落地。
在騰訊云的MaaS一站式服務(wù)下,企業(yè)可以從大模型精選商店中按需取用,可以在解決方案基礎(chǔ)上加入獨(dú)有的場(chǎng)景、數(shù)據(jù),快速精調(diào)生成專(zhuān)屬模型,還可以根據(jù)業(yè)務(wù)場(chǎng)景需求,按需定制不同參數(shù)、規(guī)格的模型。
與此同時(shí),騰訊云TI平臺(tái)提供完善的大模型平臺(tái)和工具鏈,企業(yè)可以根據(jù)自身業(yè)務(wù)需要進(jìn)行數(shù)據(jù)精調(diào);騰訊云還提供本地化的訓(xùn)練、落地及陪跑優(yōu)化服務(wù)。
在這一系列布局之下,騰訊云在無(wú)形中降低了普通客戶使用大模型的門(mén)檻——正如騰訊云所希望的那樣,大模型需要更懂行業(yè)、更易落地。
吳運(yùn)聲告訴我們,騰訊云希望在每個(gè)特定場(chǎng)景里面100%解決客戶的問(wèn)題,而不是找100個(gè)產(chǎn)品解決70%到80%的問(wèn)題,因此會(huì)聚焦于找一些特定的行業(yè),跟客戶深入打磨,解決行業(yè)問(wèn)題。
我們不妨來(lái)看看,騰訊云在金融行業(yè)的大模型,實(shí)際的落地表現(xiàn)如何。
相比其他行業(yè),金融行業(yè)的數(shù)字化難度更大、場(chǎng)景更復(fù)雜。
一方面,金融行業(yè)是強(qiáng)監(jiān)管行業(yè),對(duì)安全性和可靠性要求極高;另一方面,金融業(yè)數(shù)字化場(chǎng)景和需求極其豐富、極其碎片化。
以票據(jù)處理場(chǎng)景為例,2017 年、2018 年前后,各大銀行開(kāi)始紛紛引入OCR模型,輔助人工,讓銀行票據(jù)處理效率得到了大幅提升,這也是騰訊云智能起初切入金融行業(yè)數(shù)字化時(shí)率先布局的場(chǎng)景。
不過(guò)隨著時(shí)間推移,銀行票據(jù)種類(lèi)、版式多的特征愈發(fā)明顯,銀行對(duì)長(zhǎng)尾場(chǎng)景偏復(fù)雜的識(shí)別需求也逐漸增多,這導(dǎo)致原來(lái)普通的OCR技術(shù)不夠用了。尤其是由于票據(jù)版式不固定、樣本量少、數(shù)據(jù)標(biāo)注質(zhì)量不佳、排版復(fù)雜,或者文檔中含有手寫(xiě)體、多種語(yǔ)言、特殊字符等情況下,OCR的識(shí)別準(zhǔn)確率開(kāi)始大大降低。
解決這一問(wèn)題的一種方式是,銀行在前端繼續(xù)投入人力進(jìn)行錄入和校驗(yàn),在后端則增加開(kāi)發(fā)人員,對(duì)新出現(xiàn)的版式重新配置模型。
但這種方式顯然過(guò)于低效、且所耗費(fèi)的在人力等方面的資源較重。
騰訊云的解法是,通過(guò)提升OCR模型的泛化能力,推出了多模態(tài)融合技術(shù)以及TI-OCR訓(xùn)練平臺(tái)。

騰訊云TI平臺(tái)產(chǎn)品特性,圖源騰訊云官網(wǎng)
簡(jiǎn)單來(lái)說(shuō),騰訊云利用文本、圖像和布局三個(gè)天然對(duì)齊的模態(tài)信息,在多模態(tài)文檔預(yù)訓(xùn)練的基礎(chǔ)上,進(jìn)一步統(tǒng)一了文檔結(jié)構(gòu)化信息提取范式,形成了智能結(jié)構(gòu)化基礎(chǔ)模型,使得單一模型能夠支持 5000?種以上版式。無(wú)論是銀行單據(jù)、票證、憑證等,這一模型都能進(jìn)行高精度信息提取。
而推出TI-OCR平臺(tái),則是騰訊云選擇將能力開(kāi)放,通過(guò)提供低門(mén)檻的訓(xùn)練工具,讓客戶自己也可以訓(xùn)練非標(biāo)準(zhǔn)化文檔的OCR模型。
一家國(guó)家首批股份制商業(yè)銀行,利用騰訊云TI-OCR大模型,最終實(shí)現(xiàn)了對(duì)各種格式數(shù)據(jù)的高精度識(shí)別,識(shí)別準(zhǔn)確率高達(dá)95%以上。同時(shí)客戶還減少了低價(jià)值高耗時(shí)的手工作業(yè),節(jié)省了運(yùn)營(yíng)、人力成本,實(shí)現(xiàn)了多元業(yè)務(wù)數(shù)據(jù)處理的標(biāo)準(zhǔn)化、線上化、自動(dòng)化。
同樣值得注意的是,先切實(shí)解決某個(gè)行業(yè)的一個(gè)問(wèn)題,再將沉淀下來(lái)的能力對(duì)外開(kāi)放,是騰訊云智能的一條落地路線,比如除了TI-OCR平臺(tái)之外,騰訊云智能還推出了針對(duì)工業(yè)質(zhì)檢場(chǎng)景的TI-AOI。
再來(lái)看另外一個(gè)案例,騰訊云TI平臺(tái)能力在金融場(chǎng)景下的創(chuàng)新。
2016年以來(lái),上海金融期貨信息技術(shù)有限公司(以下簡(jiǎn)稱:中金所技術(shù)公司)不斷探索AI技術(shù)在結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)中的應(yīng)用實(shí)踐,也產(chǎn)出了一定的學(xué)術(shù)成果。
但長(zhǎng)達(dá)幾年的時(shí)間里,這些研究始終缺乏一個(gè)統(tǒng)一落地的平臺(tái)。這給客戶帶來(lái)了一定困擾。
比如無(wú)法實(shí)時(shí)獲知算法服務(wù)的監(jiān)控和資源占用情況,導(dǎo)致算法服務(wù)運(yùn)維成本高,資源分配不合理;再比如,傳統(tǒng)的開(kāi)發(fā)模式下,算法框架重復(fù)構(gòu)建,運(yùn)行環(huán)境中的版本沖突等問(wèn)題。
與此同時(shí),由于AI開(kāi)發(fā)的成果和資產(chǎn)分別需要集成至不同系統(tǒng),因此帶來(lái)了管理和復(fù)用的問(wèn)題。
2020年底,中金所技術(shù)公司開(kāi)始引入騰訊云TI平臺(tái)。其相關(guān)負(fù)責(zé)人告訴連線Insight,目前他們使用最多的模塊有兩個(gè)。

騰訊云TI平臺(tái)泛互聯(lián)網(wǎng)客戶TI解決方案,圖源騰訊云官網(wǎng)
第一個(gè)是訓(xùn)練工坊,也就是訓(xùn)練模型的。
在騰訊云TI平臺(tái),通過(guò)訓(xùn)練工坊,可以使用任務(wù)式建模構(gòu)建模型,以向?qū)降挠?xùn)練任務(wù)提交方式進(jìn)行模型構(gòu)建,支持基于多種算法來(lái)源進(jìn)行訓(xùn)練任務(wù)提交,同時(shí)還可以直接通過(guò)代碼包綁定主流訓(xùn)練框架啟動(dòng)訓(xùn)練任務(wù),也可以快速使用主流高性能及分布式訓(xùn)練框架提交訓(xùn)練任務(wù)。
在這一過(guò)程中,由于平臺(tái)內(nèi)置了通用算法框架和上百算子,在某種程度上降低了企業(yè)算法框架的搭建成本和人力投入。同時(shí),可視化建模的方式,也減少了開(kāi)發(fā)基礎(chǔ)算子的時(shí)間和編碼工作量,加速了模型開(kāi)發(fā)及訓(xùn)練過(guò)程。
第二個(gè)是模型服務(wù)功能,是用于對(duì)外服務(wù)的。
騰訊云TI平臺(tái)同時(shí)支持客戶發(fā)布和調(diào)用模型。簡(jiǎn)單來(lái)說(shuō),客戶可以將第三方模型導(dǎo)入平臺(tái),并部署在線服務(wù),也可以將平臺(tái)訓(xùn)練出來(lái)的模型部署為在線服務(wù)。
中金所技術(shù)公司由于業(yè)務(wù)需要,主要將自己開(kāi)發(fā)的算法導(dǎo)入到平臺(tái),緊接著以服務(wù)化的方式提供給其他部門(mén)使用,提供restful服務(wù)。
這位負(fù)責(zé)人告訴我們,在這一過(guò)程中,他們與騰訊云緊密合作實(shí)現(xiàn)了平臺(tái)的定制化功能,從而使平臺(tái)可以支持靈活的基礎(chǔ)環(huán)境拓展及自定義,實(shí)現(xiàn)了算法框架的持續(xù)更新迭代。
值得注意的是,平臺(tái)除了支持基于客戶本身開(kāi)發(fā)的模型之外,還納管了上線前的OCR、ASR、TTS等模型和算子,從而實(shí)現(xiàn)了AI資產(chǎn)的統(tǒng)一管理,提升了開(kāi)發(fā)效率和資源復(fù)用。
最后,在實(shí)際應(yīng)用中,騰訊云TI平臺(tái)已成功支持了包括中金所及技術(shù)公司內(nèi)部的智慧屏和三大平臺(tái)系統(tǒng),每日調(diào)用峰值高達(dá) 1 億次,整體調(diào)用成功率超過(guò)了 99%。
3、有技術(shù)和TO?B經(jīng)驗(yàn),才能做好行業(yè)大模型
除了推動(dòng)行業(yè)大模型在金融行業(yè)加速落地外,在文旅、媒體、教育、政務(wù)等多個(gè)垂直賽道,騰訊云行業(yè)大模型也在加速落地。
比如央視基于騰訊云智能媒體AI中臺(tái),部署了TI平臺(tái)原生模型服務(wù),打造人工智能開(kāi)放平臺(tái),通過(guò)引入自研“標(biāo)簽權(quán)重引擎”,讓內(nèi)容標(biāo)簽的顆粒度更細(xì)、理解度更深、泛化性更高。
騰訊云行業(yè)大模型不斷落地背后,有兩個(gè)不容忽視的關(guān)鍵要素。
第一個(gè)要素是技術(shù)。
騰訊云打造的模型精選商店,基于大模型高性能計(jì)算集群和大模型能力,依托的則是騰訊云TI平臺(tái)。
當(dāng)前,騰訊云TI平臺(tái)集合了AI應(yīng)用服務(wù)平臺(tái)TI-Matrix、機(jī)器學(xué)習(xí)平臺(tái)TI-ONE、數(shù)據(jù)標(biāo)注平臺(tái)TI-DataTruth,各平臺(tái)功能模塊可以解耦按需交付部署,持續(xù)降低構(gòu)建、應(yīng)用AI能力的成本。
在此基礎(chǔ)上,騰訊云TI平臺(tái)可以打通從數(shù)據(jù)獲取、數(shù)據(jù)處理、算法構(gòu)建、模型訓(xùn)練、模型評(píng)估、模型部署、到AI應(yīng)用開(kāi)發(fā)的全流程。

最近,騰訊云還正式發(fā)布了新一代HCC高性能計(jì)算集群,采用騰訊云星星海自研服務(wù)器,為大模型訓(xùn)練、自動(dòng)駕駛、科學(xué)計(jì)算等提供高性能、高帶寬和低延遲的集群算力。數(shù)據(jù)顯示,騰訊云新一代集群的算力性能較前代提升了 3倍,是當(dāng)前國(guó)內(nèi)性能最強(qiáng)的大模型計(jì)算集群。
與此同時(shí),7月4日,騰訊云正式發(fā)布了AI原生向量數(shù)據(jù)庫(kù),能夠被廣泛應(yīng)用于大模型的訓(xùn)練、推理和知識(shí)庫(kù)補(bǔ)充等場(chǎng)景,也是國(guó)內(nèi)首個(gè)從接入層、計(jì)算層、到存儲(chǔ)層提供全生命周期AI化的向量數(shù)據(jù)庫(kù)。
不難發(fā)現(xiàn),騰訊云在這些基礎(chǔ)設(shè)施側(cè)的技術(shù)累積,是支撐其行業(yè)大模型加速落地的一大關(guān)鍵。
第二個(gè)要素是賦能TO B的經(jīng)驗(yàn)。
行業(yè)大模型要想真正做到賦能、改造甚至顛覆行業(yè),一個(gè)必要的前提在于,需要對(duì)技術(shù)應(yīng)用場(chǎng)景、業(yè)務(wù)等有深刻的認(rèn)識(shí),對(duì)特定行業(yè)的痛點(diǎn)有深刻理解。
在這一層面,騰訊自“930變革”后加速向產(chǎn)業(yè)互聯(lián)網(wǎng)轉(zhuǎn)型,至今已經(jīng)積累起了豐富的產(chǎn)業(yè)數(shù)字化賦能經(jīng)驗(yàn),并持續(xù)深化“務(wù)實(shí)”這一思路。
“在內(nèi)部,我們團(tuán)隊(duì)不斷增加協(xié)同性、行業(yè) know-how,以前金融、傳媒的架構(gòu)師從只售賣(mài)AI產(chǎn)品,后來(lái)他們會(huì)主動(dòng)了解客戶的痛點(diǎn),不斷適配相應(yīng)的產(chǎn)品解決方案?!眳沁\(yùn)聲如此表示。
可以預(yù)見(jiàn)的是,隨著大模型深入產(chǎn)業(yè)的熱潮持續(xù)下去,以及MaaS化帶來(lái)的新一輪商業(yè)模式變革下,TO B領(lǐng)域也將進(jìn)入新的競(jìng)爭(zhēng)階段。
在這一趨勢(shì)下,騰訊率先推動(dòng)行業(yè)大模型,無(wú)疑是一個(gè)正確的決定。而在大模型落地、賦能各行各業(yè)的過(guò)程中,又會(huì)反過(guò)來(lái)對(duì)騰訊云的自身能力產(chǎn)生正反饋,形成飛輪效應(yīng)。
本文來(lái)自投稿,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.allfloridahomeinspectors.com/quan/101426.html