
文/王慧瑩
編輯/子夜
什么是更接近AGI的形態(tài),是能用腦子思考的大模型,還是能用行動互動的Agent?
隨著技術不斷進步,應用不斷落地,人與機器的互動方式正在發(fā)生范式轉(zhuǎn)變,這個答案成了兩者的結(jié)合——AI Agent。
AI Agent,又被稱作是AI智能體,即一種能通過對環(huán)境的感知,進行思考決策并執(zhí)行的智能體。與GPT等應用相比,AI Agent在思考與行動方式上和人類很相似,是人工智能機器人的初級形態(tài)。
在過去三年中,大模型在自然語言處理、圖像生成等領域展現(xiàn)出驚人能力,但隨著參數(shù)規(guī)模突破千億級,技術邊際效益遞減的魔咒開始顯現(xiàn):模型理解能力停留在表層語義,復雜任務執(zhí)行依賴人工指令拆解,應用落地陷入 “玩具化” 困境。
更重要的是,用戶對AI的期待早已超越簡單問答,他們需要一個能主動思考的助手,這種供需錯位給了AI Agent爆發(fā)的機會。AI Agent就像一個能感知、能理解、能行動的AI助手。

尤其是伴隨大模型應用元年的到來,技術落地是個備受關注的問題,AI Agent被很多人看作是這輪AI技術落地的最終范式。
去年,市場研究機構(gòu)Research and Market發(fā)布的報告中指出,未來五年AI智能體的市場規(guī)模將增加420億美元。麥肯錫也表示,AI智能體將是生成式AI的下一個前沿。
進入2025年,從OpenAI的Operator到中國AI公司蝴蝶效應研發(fā)的Manus,再到大廠和獨角獸的競相加速,一場圍繞AI Agent的競逐賽悄然拉開帷幕。
這場競速賽注定不容易。算力成本的指數(shù)級增長、多輪對話中的幻覺誤差、場景落地的復雜程度……一如每一場技術風暴來臨之時,這些都是行業(yè)玩家們面臨的共同難題。
就像比爾·蓋茨曾說的,“誰能主宰AI Agent,那才是大事。因為你將永遠不用去搜索網(wǎng)站或者亞馬遜”。
從實驗室走向產(chǎn)業(yè)前線,AI Agent的想象力很大,在技術與現(xiàn)實的博弈之間,精準迅速地落地,給用戶一個可靠的AI助手,才是這場比賽的賽點。
1、從Operator到Manus,AI Agent為何令人興奮?
“求一個Manus邀請碼”。
上周,科技圈對這個名字一定不陌生。一如ChatGPT和DeepSeek在模型層的爆火,應用層也發(fā)生了新的爆點。
這款號稱是“全球首款通用型AI Agent產(chǎn)品”,由中國AI創(chuàng)業(yè)公司推出。據(jù)團隊介紹,Manus是一個真正自主的AI Agent,能夠解決各類復雜多變的任務。
該產(chǎn)品尚未完全對外開放,內(nèi)測碼一碼難求,市場對Manus的好奇度已然達到頂峰。這是一種什么魔力?
很重要的一點在于,Manus展現(xiàn)出了更“類人”的能力。

Manus完全在獨立虛擬機中,能夠獨立思考、規(guī)劃并執(zhí)行復雜任務,直接交付完整成果。在接到用戶指令后,它可以直接操作電腦完成一系列報告撰寫、表格制作等工作,并在最后導出符合用戶需求的產(chǎn)品。
在篩選簡歷時,Manus會自動解壓文件、上傳簡歷、瀏覽簡歷,并記錄重要信息,給出自動排名建議,還能根據(jù)工作經(jīng)驗等重要維度,將候選人分為不同等級。
換句話說,Manus展現(xiàn)出了更進一步的自我思考和自我規(guī)劃能力。與普通大模型不同,Manus不只是提供想法,還能幫用戶把想法變?yōu)楝F(xiàn)實,解決實際問題。
這背后,Manus的核心競爭力在于其全鏈路自主執(zhí)行能力——Multiple Agent架構(gòu)。Manus通過“規(guī)劃-執(zhí)行-驗證”的多代理協(xié)同架構(gòu),用戶不需要去對話引導,也不需要提供建議,只需要等待Manus直接交付完整的任務成果。
一夜之間,Manus仿佛革了OpenAI和Anthropic的命。
實際上,市場對AI Agent更早的感知,來自于OpenAI和Anthropic。
今年1月,OpenAI推出了首款AI智能體Operator,基于Computer-Using Agent模型,Operator可以根據(jù)用戶指令,在云端執(zhí)行任務,如訂餐、制定計劃、購物等。
一個月后,OpenAI又推出了面向深度思考領域的智能體Deep Research,相比于Operator AI助手的定位,Deep Research像是一個“AI研究員“,它能將原本人類需要8小時的任務縮減到5分鐘,幫助人們在工作中節(jié)省幾小時甚至幾天。
由OpenAI前研究副總裁達里奧·阿莫迪、大語言模型GPT-3論文的第一作者湯姆·布朗等人共同創(chuàng)立的企業(yè)Anthropic,布局AI Agent的動作更早。去年10月,Anthropic基于Claude模型,推出了擴展功能Computer Use,用戶能夠像指揮人類一樣指導Claude操作電腦,包括移動光標、點擊按鈕和輸入文本。
值得注意的是,Manus的出現(xiàn)讓大家紛紛想起了Devin。這個在去年由Cognition AI推出的全球首個AI軟件工程師。Devin也是一個自主Agent,能自主學習不熟悉的技術,端到端地構(gòu)建和部署應用程序,自己改bug,甚至還能訓練和微調(diào)自己的AI模型。
在一個新興賽道,先發(fā)優(yōu)勢固然重要,但大家都在發(fā)力時,好用就成為一個新的評判標準。
AI智能體的工作原理無外乎四個步驟:感知、信息處理、執(zhí)行、輸出。其中,想讓AI智能體真正化身人類的AI助手,效率和準確度都很重要,這也是Manus此輪火爆的原因。
據(jù)Manus官方介紹,Manus在GAIA基準測試中取得突破性成績,其解決復雜問題的準確率比Open AI同類產(chǎn)品高出12%。
從Operator,到Maunus,AI Agent這把火顯然越燒越旺。本質(zhì)上,AI Agent之所以讓市場如此激動,是因為它讓AI完成了從被動響應,到主動執(zhí)行的躍遷。當AI開始突破認知層,轉(zhuǎn)向行動層,AI時代或許才真正到來。
2、大廠、獨角獸集體加速,AI Agent今年是爆發(fā)元年?
今年,ChatGPT掀起的大模型浪潮尚未平息,AI Agent也迎來爆發(fā)元年。
前不久,百度創(chuàng)始人李彥宏提出觀點,2025年可能會成為AI智能體爆發(fā)的元年。推理大模型涌現(xiàn)出讓人驚嘆的深度思考能力,這將推動人工智能的一個重要應用方向,即“AI智能體”的落地。
放眼整個行業(yè),AI Agent處于風口之上也是共識。市場研究機構(gòu)Gartner將Agentic AI列為2025年十大技術趨勢之一,并預測到2028年至少有15%的日常工作決策將由Agentic AI自主完成。德勤AI研究院稱,AI智能體將改變基礎業(yè)務模式,實現(xiàn)新的工作、運營和價值交付方式。
與GPT等對話式AI不同,AI Agent能像人類助手般獨立規(guī)劃任務、調(diào)用工具并交付成果。如果說大模型讓AI長出了“腦”,那AI Agent就是讓AI長出了“手和腳”。
悄然間,AI領域的競爭已悄然轉(zhuǎn)向更具想象力的戰(zhàn)場——AI Agent。國內(nèi)這場競速賽中,科技大廠和AI獨角獸依舊是兩大主角。
大廠們的思路在于,利用AI智能體賦能業(yè)務,完善AI應用生態(tài),提高業(yè)務及自身在AI時代的競爭力。
在AI領域強勢的百度,動作莫過于最多。尤其是去年以來,百度多次公布AI的進展,智能體是反復提到的關鍵詞。百度已將智能體應用到移動生態(tài)的各個場景,包括百度新搜索、百度文庫、百度電商、文小言等產(chǎn)品。
其中,以文心智能體為代表,目前已經(jīng)吸引了15萬家企業(yè)和80萬名開發(fā)者參與。據(jù)百度透露,文心智能體為百度搜索帶來了多輪對話、超級外腦、創(chuàng)意升級、擬人體驗和多元推薦等五大新能力。
另一邊,阿里近期將AI智能體重點放在了To C領域,發(fā)布并開源推理模型通義千問QwQ-32B沒多久,阿里將其融入到通義APP中。3月10日,阿里通義App全新升級,上線超級智能體。通義App以超級智能體作為交互中樞,用戶在通義首頁能問、能聊,通義超級智能體還能理解圖片、生成圖片,翻譯、寫作等復雜功能。
同樣聚焦C端的還有騰訊。今年1月的騰訊2024員工大會上,騰訊創(chuàng)始人馬化騰表示,騰訊會持續(xù)投入資源進行算力的儲備,希望各個事業(yè)部都能擁抱大模型的產(chǎn)品化落地場景。其中,包括微信、QQ、輸入法、瀏覽器等產(chǎn)品都將推出AI智能體,游戲、微信讀書、騰訊視頻等產(chǎn)品也將基于混元做更多AI探索。
相比于BAT結(jié)合自身深度思考大模型推出智能體,字節(jié)跳動的智能體更像是追著OpenAI打。早在Operator發(fā)布前兩天,字節(jié)跳動豆包大模型團隊就已經(jīng)公布了同類型智能體UI-TARS,和Operator的功能基本差不多。識別過程基于視覺模型和推理實現(xiàn),能夠一步一步自動完成跨應用的復雜操作,并兼容各種系統(tǒng)。
不僅如此,憑借算力、數(shù)據(jù)等優(yōu)勢,大廠基本都是在模型端、應用端、智能體開發(fā)平臺協(xié)同三個領域閉環(huán)發(fā)展。
一站式智能體開發(fā)平臺方面,字節(jié)跳動的扣子、騰訊云的騰訊元器、百度智能云千帆AgentBuilder、阿里云大模型平臺百煉均已上線。
而在AI獨角獸中,智譜是最早探索Agent的初創(chuàng)企業(yè)。去年10月,推出自主智能體AutoGLM ;一個月后的Agent OpenDay上,智譜展示了AI Agent的最新成果,包括AutoGLM、AutoGLM-Web、GLM-PC三個版本,對應手機、瀏覽器、電腦的應用場景。

據(jù)悉,新升級的AutoGLM能夠理解超長指令,執(zhí)行超長任務,在多步、循環(huán)任務中,AutoGLM的速度表現(xiàn)超過人手動操作。今年1月,Agent GLM-PC 1.1正式版上線,操作速度和任務成功率均有提升。
需要注意的是,經(jīng)過2023年的百模大戰(zhàn),2024年的應用之爭,行業(yè)淘汰賽加劇,2025年對于初創(chuàng)企業(yè)而言,落地路線的選擇至關重要。
2月21日,階躍星辰宣布發(fā)力智能終端Agent方向。階躍星辰與吉利汽車集團、OPPO、智元機器人等企業(yè)深化合作關系,尤其是智能終端Agent的開發(fā),同時還展示了在金融財經(jīng)、內(nèi)容創(chuàng)作、新零售、數(shù)字人等領域的創(chuàng)新和應用。
去年5月,月之暗面的Kimi上線了Kimi+智能體商店,旗下有20多個由官方提供的智能體。
相較于互聯(lián)網(wǎng)大廠而言,AI初創(chuàng)企業(yè)布局智能體的思路在于,通過自身模型能力與智能體的結(jié)合,推出更多可場景化的落地方案,尋找商業(yè)變現(xiàn)的路徑。
隨著技術的不斷發(fā)展和市場的逐漸成熟,AI Agent 領域的競爭將愈發(fā)激烈,各企業(yè)的產(chǎn)品也將不斷迭代升級,以滿足用戶日益增長的需求。
3、想象力大,落地卻不易
Manus的火爆很突然,以至于Manus的團隊低估了市場的熱情。
Manus AI團隊產(chǎn)品負責人張濤近日在朋友圈發(fā)文表示,“這本是一個產(chǎn)品探索過程中的階段性收獲分享,因此服務器資源是對標demo水平來準備,不曾想過會引起巨大波瀾?!?/p>
這段話的背景在于,Manus爆火之后,關于Manus通用型的“套殼”嫌疑、官網(wǎng)卡頓等質(zhì)疑聲層出不窮。所謂“套殼”,即Manus沒有自研底層大模型的能力,其模型能力主要來自Anthropic的Claude。
Manus團隊已聲明,當前的Manus距離正式版想交付給大家的體驗還差很遠。“像模型幻覺、交付物友好度、運行速度等方面都還有很大的提升空間?!?/p>
事實上,Manus的困境是當下AI Agent賽道的縮影。
首當其沖的就是AI幻覺問題。OpenAI的Operator可能因數(shù)據(jù)污染生成錯誤結(jié)論;Manus在演示中雖流暢,實際應用中卻常因系統(tǒng)權(quán)限限制無法完成訂餐、支付等任務。
這些所謂的幻覺問題是目前的AI技術無法避免的。DeepSeek-R1幻覺率高達14.3%,GPT-4.5幻覺率為7.1%,某種程度上,AI幻覺能力與其推理能力正相關。也就是說,越聰明的AI大概率幻覺越強。
這對AI Agent無疑是個老大難。作為提高效率的AI助手,用戶的終極需求莫過于準確性,而幻覺問題可能為用戶帶來了包括檢查、復查等多個環(huán)節(jié),勢必成為AI Agent爆發(fā)的主要障礙。
尤其是在金融、醫(yī)療、法律等高風險領域,任何誤差都可能引發(fā)暴風雨,這也就限制了AI Agent的場景落地。
更重要的是,相比于對話式的GPT,AI Agent的一個重要進步在于“有記憶”。Manus通用型Agent就具備“記憶能力”,若用戶曾要求“用表格呈現(xiàn)結(jié)果”,下次任務中它會主動生成Excel文件。一旦出現(xiàn)幻覺問題,AI Agent作為工具的實用性也要受到質(zhì)疑。
本質(zhì)上,幻覺問題的來源于數(shù)據(jù)的缺乏。正如人類通過理論和實踐在社會發(fā)展過程中的不斷學習和進化,AI則需要源源不斷的數(shù)據(jù)反饋來進化,而數(shù)據(jù)的訓練離不開實際的應用落地。
就目前實際應用而言,C端智能體大多定位智能助手,可通過讀取語音指令理解用戶意圖,并模擬人類行為,完成訂機票、點外賣、篩簡歷等基礎日常需求和工作。
這時候,用戶留存和心智培養(yǎng)是個問題。像Manus這類主打通用的Agent,或許很難在垂直場景下發(fā)揮作用。而人類社會正是由一個個具體的場景構(gòu)成的,復雜程度難以想象,通用型Agent最終能在用戶生活實際起到多大作用,還是未知。
另一邊,B端智能體則需要提供更為專業(yè)和定制化的服務。在B端場景下,Agent可充當數(shù)字員工、個人助理、營銷客服等工種,真正為企業(yè)創(chuàng)造價值。
一些聲音認為,B端Agent市場有望率先起量。具體到玩家身上,據(jù)The Information報道,OpenAI計劃為專業(yè)人士推出量身定制版Agent,用于執(zhí)行銷售線索分類、軟件工程和博士級研究等高級任務。針對“高收入知識工作者”,每月2000美元;用于軟件開發(fā)的,每月1萬美元;博士級研究代理,每月2萬美元。
從目前的發(fā)展趨勢來看,AI Agent 最有可能在企業(yè)服務和辦公場景中率先落地。在企業(yè)服務領域,AI Agent可以幫助企業(yè)實現(xiàn)業(yè)務流程的自動化和智能化,降低人力成本,提高工作效率。在辦公場景中,AI Agent可以成為員工的智能助手,協(xié)助完成各種辦公任務,提升辦公體驗。
IDC發(fā)布預測稱,到2026年將有50%的中國500強數(shù)據(jù)團隊使用AI Agent來實現(xiàn)數(shù)據(jù)準備和分析,并成為重要組織者和協(xié)調(diào)者;40%的中國500強企業(yè)將實現(xiàn)數(shù)據(jù)智能與AI模型智能的結(jié)合,以統(tǒng)一AI模型和數(shù)據(jù)的綜合治理政策、實踐和技術。
不過,想要真正作為AI助手對接企業(yè)也有不少難題。企業(yè)的業(yè)務流程和需求各不相同,如何將AI Agent與企業(yè)的現(xiàn)有系統(tǒng)和業(yè)務流程進行無縫集成,是一個關鍵問題。
這需要AI Agent具備高度的定制化能力和兼容性,能夠根據(jù)企業(yè)的具體需求進行靈活配置和調(diào)整。同時,企業(yè)對數(shù)據(jù)安全和隱私保護也非常重視,AI Agent 在處理企業(yè)數(shù)據(jù)時,必須確保數(shù)據(jù)的安全性和保密性,防止數(shù)據(jù)泄露和濫用。
落地當然是不容易的,這需要不斷擴展的算力、數(shù)據(jù)、場景做支撐,好在市場的熱情已經(jīng)被點燃,玩家都在為“讓AI幫人做事”而努力。
當大模型與Agent深度融合,一個更智能、更主動、更個性化的AI時代正加速到來,這一次,獨角獸和大廠們都在加速奔跑,沒有一個甘心落后于時代。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://m.allfloridahomeinspectors.com/cgo/model/132134.html