作者|思航
出品|產(chǎn)業(yè)家
“Adept做的這件事,我感覺你們能做得更好”。
Adept是海外一家成立僅一年時(shí)間估值便突破10億美元的AI Agent(智能體)獨(dú)角獸公司,甚至在此期間,還獲得了英偉達(dá)、微軟和包括特斯拉自動(dòng)駕駛負(fù)責(zé)人Andrej Karpathy在內(nèi)的行業(yè)大佬,以及不少知名風(fēng)投的站臺(tái)。這家公司的使命便是,“創(chuàng)建能夠像人類一樣使用各種電腦軟件完成工作的AI智能體”。
接到西湖大學(xué)科學(xué)家藍(lán)振忠博士這通電話后,早已對(duì)Agent有所感知的孫林君發(fā)現(xiàn),這與自己正在做的事不謀而合。
在大數(shù)據(jù)智能領(lǐng)域有著近20年經(jīng)驗(yàn)的孫林君,先后任職于摩托羅拉和阿里巴巴的資深算法專家。2018年,就在大模型進(jìn)入頂峰期的前幾年,孫林君離開阿里,創(chuàng)立了實(shí)在智能。
彼時(shí)他所瞄準(zhǔn)的賽道是數(shù)字員工,只不過在當(dāng)時(shí),數(shù)字員工還停留在RPA階段,在孫林君看來,“Agent將會(huì)是是數(shù)字員工的終極形式”。
RPA做了一年后,孫林君便意識(shí)到RPA自身帶有局限性,于是在2019年開始嘗試RPA+AI融合的方式,即IPA來突破局限性,但這種融合終歸還是“做加法”,想要徹底突破局限性,需要重構(gòu)底層架構(gòu)。
直到ChatGPT的發(fā)布,讓這個(gè)有著阿里系和谷歌系的創(chuàng)始團(tuán)隊(duì)嗅到了屬于他們的機(jī)會(huì),用孫林君的原話說,“數(shù)字員工的終極愿景可能很快就要到來了”。
半年時(shí)間,這個(gè)有著強(qiáng)AI基因的團(tuán)隊(duì)便將行業(yè)首款A(yù)gent形式的產(chǎn)品發(fā)布出來。與此同時(shí),實(shí)在智能也進(jìn)入到關(guān)鍵一年。2023年,是實(shí)在智能完成轉(zhuǎn)型的一年,也是國(guó)內(nèi)Agent元年。
從比爾蓋茨到李飛飛、吳恩達(dá),無一不表達(dá)出對(duì)AI Agent的極大興趣,甚至比爾蓋茨還公開發(fā)文表示Agent智能體對(duì)未來工作的顛覆作用。據(jù)統(tǒng)計(jì),過去一年,硅谷至少有100個(gè)項(xiàng)目有關(guān)Agent商業(yè)化,而國(guó)內(nèi)也有700多億人民幣進(jìn)入到Agent賽道。
而對(duì)于踩中風(fēng)口的實(shí)在智能而言,Agent是他們終于等到的機(jī)會(huì),也是實(shí)現(xiàn)自我突破的關(guān)鍵分水嶺。
一、蛻變:看見數(shù)字員工的終極愿景
自大模型出現(xiàn)以后,一個(gè)最常聽到的說法便是,大模型引領(lǐng)新的工業(yè)革命,甚至夸張一點(diǎn),還有的把大模型比做蒸汽機(jī)。在科技圈內(nèi),一度出現(xiàn)兩派觀點(diǎn),一方認(rèn)為大模型早晚會(huì)取代人類工作;另一方認(rèn)為大模型只能代替人類完成簡(jiǎn)單、重復(fù)性工作。
但如果嚴(yán)謹(jǐn)?shù)卣f,大模型本身無法代替任何人類工作。由于其本身并不存在于真實(shí)世界中,因此大模型無異于“缸中之腦”,即它的邏輯鏈不能觸及物理世界,永遠(yuǎn)無法與現(xiàn)實(shí)產(chǎn)生連接。
真正能代替人類工作的,并非大模型本身;而是讓大模型長(zhǎng)出“手和腳”的智能體Agent。
一個(gè)在財(cái)務(wù)場(chǎng)景真實(shí)發(fā)生的例子是,企業(yè)下載資金流水,需要登錄到銀行,選中對(duì)應(yīng)時(shí)期,查詢?cè)龠M(jìn)行下載。其實(shí)這樣一套簡(jiǎn)單、重復(fù)性的操作完全可以用機(jī)器完成。
在過去,它依靠機(jī)器人半自動(dòng)化的方式,但在這背后軟件交付工程師需要將這一套流程的代碼打出來,或者企業(yè)內(nèi)部用拖拉拽的方式在獨(dú)立的機(jī)器人上才能夠完成;而如今在智能體上,一句自然語言口令便可以輕松搞定。
這種演進(jìn),也正是實(shí)在智能從過去RPA走向如今Agent的發(fā)展路線。
RPA做了一年后,孫林君發(fā)現(xiàn)RPA本身存在很強(qiáng)的局限性。局限之一在于有些工作純通過RPA完不成,比如文字識(shí)別,這其中就涉及到通過自然語言處理來提取摘要或找關(guān)鍵詞;再比如,在控制能力上,RPA的底層操作系統(tǒng)已經(jīng)很難滿足復(fù)雜環(huán)境要求,對(duì)此,實(shí)在智能的做法是將AI和計(jì)算機(jī)視覺(CV)融合進(jìn)來。
自此,實(shí)在智能也正式從RPA階段跨越至RPA+AI,即IPA階段。在孫林君看來,“推出IPA的同時(shí),也意味著實(shí)在智能從跟隨走向引領(lǐng)”。
具體來看,從2022年末,實(shí)在智能發(fā)布智能屏幕語義理解技術(shù)ISSUT;到2023年中旬,發(fā)布自研垂直“塔斯(TARS)大語言模型”;緊接著,國(guó)內(nèi)首個(gè)基于大模型的Agent智能體產(chǎn)品“實(shí)在Agent——你說PC做”在實(shí)在智能誕生。2023年末,實(shí)在智能獲近2億元C輪融資,與此同時(shí),也標(biāo)志著Agent的商業(yè)化。
從上述一系列產(chǎn)品發(fā)布的節(jié)點(diǎn)可以看出,從ISSUT到TARS,再到Agent發(fā)布,實(shí)際上,實(shí)在智能在過去一年時(shí)間里已然完成了對(duì)Agent底層架構(gòu)的顛覆?!皬腞PA過渡到Agent,底層架構(gòu)的確發(fā)生了深刻的變化”,孫林君告訴產(chǎn)業(yè)家。
對(duì)此,實(shí)在智能還做了一個(gè)形象生動(dòng)的比喻,在Agent智能體當(dāng)中,TARS大模型就相當(dāng)于“腦”,而ISSUT則相當(dāng)于“眼”,IPA則是“手和腳”。
而在問到“為什么選擇自研大模型”的時(shí)候,孫林君給出的答案是,“因?yàn)槭忻嫔系哪P蜔o法滿足實(shí)在智能的需求”。從RPA本身性質(zhì)出發(fā),它需要與各種軟件進(jìn)行打通,比如實(shí)在智能目前已經(jīng)與市面上1000多款常見軟件進(jìn)行打通。
而對(duì)此,實(shí)在智能并非選擇用API接口的方式,而是通過ISSUT這個(gè)“眼睛”的作用,可以自動(dòng)識(shí)別任何軟件的UI界面,再利用大模型的自主學(xué)習(xí)來完成一系列操作。
在這過程中,它所需要的是,底層的大模型要具備多模態(tài)能力。然而,在2023年8月,Agent發(fā)布之際,國(guó)內(nèi)還并沒有任何一家大模型有類似能力。
可以說,從底層架構(gòu)的重塑,到自研大模型,種種信號(hào)仿佛都在表明,實(shí)在智能對(duì)AI有著極強(qiáng)的“掌控力”。一份成績(jī)單同樣也是最好的證明——過去六年時(shí)間里,實(shí)在智能已獲超70項(xiàng)實(shí)授發(fā)明專利,其中就包括CV、ISSUT等等。
二、躍進(jìn):智能體的想象力有多大?
數(shù)據(jù)飛輪,是被大模型帶火的一個(gè)詞。
要知道大模型的三大要素便是算力、算法和數(shù)據(jù)。幾乎所有大模型企業(yè)都非??粗?cái)?shù)據(jù)資產(chǎn)。
一個(gè)最明顯的例子便是,OpenAI于2024上半年宣布向用戶免費(fèi)提供GPT-4和4o模型,與此同時(shí),也標(biāo)注了通過用戶對(duì)話數(shù)據(jù)訓(xùn)練模型,用戶可以自行選擇是否允許。
除了OpenAI,包括火山引擎在內(nèi)的不少大模型廠商也都在提數(shù)據(jù)飛輪。而在大模型時(shí)代下,數(shù)據(jù)帶給企業(yè)的作用就更加明顯了。
對(duì)于為B端場(chǎng)景提供服務(wù)的企業(yè)而言,數(shù)據(jù)飛輪會(huì)幫助企業(yè)更快地“轉(zhuǎn)起來”。比如在特定的金融、客服等場(chǎng)景下,在數(shù)據(jù)飛輪的作用下,流程操作會(huì)變得更加標(biāo)準(zhǔn)化,從而反哺給Agent企業(yè)。
圖注:AWS數(shù)據(jù)飛輪,來源:AWS
“在軟件上積累的大量數(shù)據(jù)都會(huì)讓任務(wù)完成的更絲滑、順暢。如果把世界想象成一個(gè)元宇宙,那么未來連鍵盤和鼠標(biāo)都可能消失,就像星際穿越里的塔斯,只需要和他講話可以完成很多的事情?!?/p>
這是孫林君賦予數(shù)字員工的終極愿景,而談到這,它也是實(shí)在智能自研大模型TARS(塔斯)的命名由來。
“目前,智能體離這樣的暢想還有一段距離?!?/strong>孫林君坦率地講到。然而,從星際穿越跳回到現(xiàn)實(shí)世界,智能體的想象力還能有多大?
年初,顛覆人機(jī)交互模式的AI電腦來了。2024年3月,英特爾的AI PC高調(diào)亮相,而AI PC所在的工作正是前文中提到的代替人類工作,對(duì)此,比爾蓋茨也在公開信中表達(dá)了對(duì)AI PC小助手的美好暢想。
讓AI PC真正照進(jìn)現(xiàn)實(shí)的正是這家從RPA蛻變過來的實(shí)在智能。而在英特爾的發(fā)布會(huì)上,這款A(yù)I PC還是面向大量企業(yè)客戶,尤其是政企客戶。
值得一提的是,實(shí)在智能在政企客戶也有長(zhǎng)期積累。在其服務(wù)的超2000家客戶中,有上百家都是國(guó)央企及世界500強(qiáng)企業(yè)。
另外,在最近剛落幕的世界人工智能大會(huì)上,實(shí)在智能還參與了“昇騰原生開發(fā)合作簽約儀式”,基于華為昇騰開發(fā),從而幫助更好地服務(wù)政企客戶。
而現(xiàn)如今,實(shí)在智能的想象力則從B端走到了C端。
按常理講,在B端深耕多年貿(mào)然轉(zhuǎn)向to C,無論是從產(chǎn)品形態(tài)、組織架構(gòu),還管理理念和商業(yè)模式,思維上都有巨大的差異。然而不同的是,實(shí)在智能的使命是數(shù)字員工,從現(xiàn)階段講就是為員工打造一個(gè)“數(shù)字分身”。那么,實(shí)際上,實(shí)在智能的面向人群則是KP(Key Person),本質(zhì)上依舊是C端。
而從產(chǎn)品的邏輯來講,B端產(chǎn)品與C端產(chǎn)品最大的不同則在于,后者更注重用戶體驗(yàn)。以實(shí)在智能為例,很多人不會(huì)寫代碼,需要上網(wǎng)查詢。而對(duì)于實(shí)在智能而言,它能感知到的是大量用戶的需求,因此這也很容易演變?yōu)樯虡I(yè)化產(chǎn)品。
不僅如此,“數(shù)字員工”的愿景甚至從國(guó)內(nèi)傳到了世界各地。2024年是在實(shí)在智能完成Agent轉(zhuǎn)型的關(guān)鍵一年,與此同時(shí),數(shù)字員工也正在走向日本、新加坡、東南亞、北美以及歐洲等地。
從星際穿越到服務(wù)政企客戶,從C端的想象力再到海外客戶的認(rèn)可,可以看到實(shí)在智能正在將數(shù)字員工的終極遠(yuǎn)景照進(jìn)現(xiàn)實(shí)。也許,“人人都可以有屬于自己的Agent”,就在不遠(yuǎn)的將來。
三、曙光:如何在SaaS淘汰賽和AI卡位賽中,實(shí)現(xiàn)雙贏?
從2023年Agent元年,到2024年Agent商業(yè)化元年,近兩年在這條賽道上發(fā)力的有互聯(lián)網(wǎng)大廠,有大模型公司,有初創(chuàng)企業(yè),也有從其他賽道上轉(zhuǎn)行而來的企業(yè)。
似乎對(duì)于Agent這件事,大家的理解都各不相同。對(duì)于既有算力也有數(shù)據(jù)的云廠商而言,他們做Agent的思路是基于大模型構(gòu)建智能體,相當(dāng)于大模型的“子集”,讓他扮演你想要的角色。
第二種則是像用友、金蝶等服務(wù)商為企業(yè)構(gòu)建的企業(yè)級(jí)AI應(yīng)用平臺(tái);第三種則是像釘釘、飛書這種將大模型能力集成在本身的協(xié)同辦公軟件上,而上述這些都可以稱之為Agent智能體。
然而,對(duì)實(shí)在智能而言,Agent智能體的定義還有些不一樣。正如前文所說,實(shí)在智能的使命在于打造數(shù)字員工,因此其所打造的Agent也是針對(duì)特定場(chǎng)景的智能體,比如在政務(wù)、銀行、電商、保險(xiǎn)、運(yùn)營(yíng)商等等場(chǎng)景,打造更為標(biāo)準(zhǔn)化的智能體。
與過去RPA相同的點(diǎn)在于,都是基于特定場(chǎng)景下的服務(wù),只是用自然語言口令更為便捷;而不同點(diǎn)在于,基于底層架構(gòu)上的重構(gòu),Agent智能體需要企業(yè)與客戶共同構(gòu)建RAG,從而保證更個(gè)性化地滿足客戶需求。
實(shí)際上,近兩年,在Agent這條賽道上,有不少企業(yè)之前都是和實(shí)在智能并肩作戰(zhàn)的RPA企業(yè),比如壹沓科技;再比如從弘璣RPA離職創(chuàng)業(yè)的瀾碼科技,他們都帶著些許的Agent基因。
那么,一個(gè)問題是,如果Agent是RPA的終極方向,那么這條賽道上,未來又將會(huì)呈現(xiàn)怎樣的競(jìng)爭(zhēng)格局?
如果站在Agent這條讓AI創(chuàng)業(yè)者前仆后繼想要涌入的賽道上而言,基于大家對(duì)于Agent的不同理解,短期來看未必會(huì)呈現(xiàn)出“競(jìng)爭(zhēng)”關(guān)系,而是“強(qiáng)強(qiáng)聯(lián)手”。
比如年初,實(shí)在智能就與同樣是作為“AI超級(jí)助理”的釘釘達(dá)成合作,目前實(shí)在智能Agent應(yīng)用已上架釘釘AI助理市場(chǎng)。
但與此同時(shí),實(shí)在智能又不僅僅是新生代Agent企業(yè),它更是從RPA進(jìn)化而來的企業(yè)。
從這一角度來看,實(shí)在智能可以說既屬于SaaS企業(yè),又屬于新時(shí)代的AI企業(yè)。然而,同樣擺在實(shí)在智能面前的還有雙重競(jìng)爭(zhēng),一邊是SaaS企業(yè)的末位淘汰賽,另一邊是AI公司的卡位賽。
有人說,大模型加速了國(guó)內(nèi)數(shù)字化的轉(zhuǎn)型,所以對(duì)于SaaS企業(yè)而言,AI是機(jī)會(huì),但同時(shí)它也是挑戰(zhàn)。
機(jī)會(huì)在于,用AI將SaaS重構(gòu)一遍,勢(shì)必會(huì)加速國(guó)內(nèi)數(shù)字化轉(zhuǎn)型,也會(huì)加速企業(yè)的數(shù)字化進(jìn)程,而過去“大家對(duì)SaaS付費(fèi)意愿不強(qiáng)”類似的問題也將不復(fù)存在;
但挑戰(zhàn)也正在于SaaS企業(yè)自身的基因,是在SaaS的基礎(chǔ)上加AI,還是用AI用重構(gòu)一遍,將成為新時(shí)代背景下,SaaS企業(yè)的“末位淘汰賽”。
那么,AI對(duì)SaaS企業(yè)究竟意味著什么?在孫林君看來,“如果對(duì)于AI有一定掌控力或者有積累的企業(yè),那么這個(gè)時(shí)代則正是構(gòu)建護(hù)城河的最佳時(shí)機(jī)?!?/p>
與此同時(shí),在AI這個(gè)新賽道,還會(huì)出現(xiàn)更多的競(jìng)爭(zhēng)者??梢哉f,對(duì)于國(guó)內(nèi)已經(jīng)發(fā)展了十年的SaaS行業(yè)而言,目前已經(jīng)有不少企業(yè)走向IPO,行業(yè)know-how的積淀也足夠深,如果在此基礎(chǔ)上加上AI能力,則足以構(gòu)建起屬于SaaS企業(yè)自身的護(hù)城河。
從目前的市場(chǎng)格局看,大部分已上市的SaaS企業(yè)和SaaS獨(dú)角獸都已經(jīng)在做SaaS+AI這件事,只是目前都處于試水階段,還未有一家有顯露出行業(yè)壁壘,現(xiàn)在能看到的都是“想象力”。
但對(duì)于這個(gè)在Agent賽道上屢屢先發(fā)制人的實(shí)在智能而言,從創(chuàng)始團(tuán)隊(duì)的AI基因,到其六年來所積累的行業(yè)經(jīng)驗(yàn),都在散發(fā)著一種獨(dú)有的強(qiáng)者風(fēng)范。
本文來自投稿,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.allfloridahomeinspectors.com/cgo/coo/121422.html