我有個(gè)犟種朋友,喜歡各類科技花活,每次網(wǎng)上有新東西他都要試試。這個(gè)十一他要嘗試的是靠旅游行業(yè)垂直大模型——攜程問道,實(shí)現(xiàn)AI旅游。
我告訴他,AI旅游這事現(xiàn)在不靠譜。
整個(gè)大模型行業(yè)目前公認(rèn)的事實(shí)是,AI大模型在發(fā)散性的內(nèi)容上可能會(huì)超出預(yù)期,但在實(shí)際規(guī)劃和落地的任務(wù)上,基本只能處于copilot的角色,人力還是主導(dǎo)。問吃喝、本地游玩、出規(guī)劃,還不如大眾點(diǎn)評(píng)、小紅書高效。
甚至不如問我。
因?yàn)橛脩粼谒^的靠AI旅游這件事上,需要的是一個(gè)AI Agent(AI智能體/助理/助手)。而AI Agent要求的是精確性,但目前AI大模型的發(fā)散性大于精確性,因此AI旅游在當(dāng)下還是一個(gè)悖論。
比如說想在上海玩,AI會(huì)搜索歷史數(shù)據(jù)和信息,告訴你外灘、石庫門、武康路、東方明珠、豫園、淮海路你都值得逛逛。但如果需要一個(gè)符合自己喜好的專屬行程,AI提供不了。你只能在AI提供的信息資料里做二次的人工篩選。
如果你想玩的更local一點(diǎn),比如想找一家有品位的精釀吧,演繹水平高的劇本殺店,小姐姐多套路少的夜店,AI更推薦不出來。也就是說,攜程問道目前成不了AI Agent。
但顯然,我的犟種朋友不想聽我嗶嗶賴賴。
于是我們直接進(jìn)入測(cè)試,讓攜程問道出一個(gè)10月2號(hào)—10月6號(hào)在上海的行程規(guī)劃。結(jié)果攜程問道只幫我們把行程規(guī)劃到了10月4號(hào),10月5號(hào)和10月6號(hào)的行程它讓我們自己發(fā)揮。嗯……我上一個(gè)00后實(shí)習(xí)生,是領(lǐng)導(dǎo)家親戚,也差不多是這個(gè)味兒。
我們又問了下武康路到底有點(diǎn)什么獨(dú)特魅力,究竟能玩點(diǎn)啥?得出的結(jié)論是Citywalk。然后我們告訴攜程問道,如果不想在上海Citywalk,是否有更好的行程推薦。
結(jié)果攜程問道把之前推給我們的行程又重復(fù)了一遍。
好吧,黔驢技窮。
最后我們告訴攜程問道,想住在中山公園附近,讓他推薦幾家酒店??赡苡捎跊]有精確的告訴它是上海中山公園,所以攜程問道給我推薦了天南地北,各個(gè)地方中山公園附近的酒店。這就很迷,咱們和攜程問道聊了半天,不一直都在聊上海旅游的事么?這點(diǎn)前后文語義的識(shí)別也這么困難么?
大模型行業(yè)里有個(gè)詞叫“AI幻覺”,即人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實(shí)數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象。
說白了就是,用戶問前門樓子,AI答胯骨軸子。
短短三四個(gè)問題,我們看到攜程問道一直沉浸在AI幻覺中,離需要準(zhǔn)確性的AI Agent還有不少距離。誠(chéng)然,造成AI幻覺的的原因有很多,從數(shù)據(jù)質(zhì)量差到算法缺陷,再到缺乏接地和過度擬合,都會(huì)導(dǎo)致AI幻覺。
然而,所有這些原因的核心是:AI 模型的輸出取決于它們的輸入,或它們?yōu)樘幚硭鲚斎攵O(shè)計(jì)的方式。歸根結(jié)底,AI 模型無法自我推理、研究或事實(shí)核查。因此,需要準(zhǔn)確性的AI Agent,在當(dāng)下還無法完美實(shí)現(xiàn)。
理想狀態(tài)下的AI Agent是,大多數(shù)時(shí)候你只需給它一個(gè)最終你想要達(dá)成的目標(biāo),它能直接交付結(jié)果,過程你啥都不用管。
康奈爾大學(xué)、華盛頓大學(xué)和滑鐵盧大學(xué)以及非營(yíng)利研究機(jī)構(gòu)AI2的研究人員,最近進(jìn)行了一項(xiàng)研究,測(cè)試了GPT-4o、Meta的Llama370B、Mistral的Mixtral 8x22B、Cohere的Command R+,以及調(diào)用API的模型,比如Perplexity的Sonar Large(基于Llama)、Google的Gemini 1.5 Pro和 Anthropic的Claude 3 Opus等多個(gè)開源模型,
實(shí)驗(yàn)證明,各家模型產(chǎn)生的AI幻覺半斤八兩。在答案來源不是維基百科的情況下,每個(gè)模型的平均回答事實(shí)性都較低。當(dāng)然,從另一個(gè)維度看,沒有AI幻覺,大模型就沒有發(fā)展可言。
但在目前這種AI幻覺泛濫的環(huán)境下,用戶想要一個(gè)規(guī)劃行程的Agent,或是某個(gè)行業(yè)的最新資訊和報(bào)告,幻覺就是致命缺陷。很明顯在這種情況下,以AI Agent為目標(biāo)的AI旅游大模型,目前基本都是悖論。最多只是一個(gè)網(wǎng)絡(luò)素材整合工具。
這種窘態(tài)不止出現(xiàn)在攜程問道身上。字節(jié)的豆包、百度的文心一言等等,在AI旅游的表現(xiàn)上都挺一般。尤其是在理解復(fù)雜用戶需求和提供精準(zhǔn)個(gè)性化服務(wù)方面。要么行程過于空洞,不知無謂。要么AI幻覺爆發(fā),自己加戲太多,甚至一些AI模型連門票價(jià)格都會(huì)報(bào)錯(cuò)。
目前行業(yè)的共識(shí)是,基于大模型的發(fā)散性產(chǎn)生的AI幻覺是沒法解決的,所以必須要通過恰當(dāng)?shù)奈⒄{(diào)形成行業(yè)專用的深模型。但當(dāng)下,即使在ChatGpt的GPTs應(yīng)用或是字節(jié)的Coze平臺(tái),也很少有真正可用的,更好解決問題的Agent。
如果AI Agent無法基于用戶目標(biāo)形成個(gè)性化推薦,AI旅游大模型又當(dāng)如何?攜程問道目前在這上面抖了一個(gè)小聰明,即提供了一個(gè)涵蓋酒店、景點(diǎn)、餐飲及夜生活等多維度的“攜程口碑榜”,供用戶出游參考。
也就是攜程集團(tuán)聯(lián)合創(chuàng)始人梁建章所謂的:利用攜程自己長(zhǎng)年積累的數(shù)據(jù)和榜單,為用戶做推薦。直白點(diǎn)說就是,這些東西攜程的用戶玩了都說好,相信你也會(huì)覺得好。至于個(gè)性化,暫且不聊。
比如,我們問“上海最好的酒店是哪家?”
攜程問道基于“上海豪華酒店榜”得出結(jié)論,前灘香格里拉大酒店是上海最好的酒店。
略讓人驚訝,因?yàn)檫@酒店我住過。不差,只不過馬桶有點(diǎn)智能了,智能到半夜會(huì)自己工作。很卷,但瑕不掩瑜。可要說在一眾奢華酒店云集的上海,前灘香格里拉是TOP1,這個(gè)確實(shí)有點(diǎn)出乎意料。
于是我讓他問問這個(gè)“上海豪華酒店榜”是什么機(jī)構(gòu)評(píng)定的,基于什么標(biāo)準(zhǔn)評(píng)定的?結(jié)果得出了一個(gè)比較好笑的結(jié)論。
實(shí)際上這個(gè)“上海豪華酒店榜”,就是攜程自己推出的“攜程口碑榜”其中一部分,會(huì)根據(jù)口碑、銷量等幾個(gè)維度來篩選,還有一些下榜規(guī)則。不過攜程點(diǎn)評(píng)現(xiàn)在避免不了人工干預(yù)成分在,且目前來看,下榜規(guī)則執(zhí)行的也并不嚴(yán)格。
比如9月份剛被曝出來“1天2次6700元”事件的長(zhǎng)春高新益田福朋喜來登,目前仍在“長(zhǎng)春豪華酒店榜”名列第14,并沒有下榜。
實(shí)際上在整個(gè)AI服務(wù)流程中,攜程并沒有體現(xiàn)出來其所謂的,“通用AI大模型所沒有的旅游產(chǎn)品資源庫優(yōu)勢(shì)”。這份“攜程口碑榜”也從一開始就彌漫著一股濃郁的商業(yè)氣息,看不出與大眾點(diǎn)評(píng)必吃榜、必玩榜有什么明顯的產(chǎn)品差異。
換句話說,即便今天沒有AI大模型,也不影響攜程推出一份“攜程口碑榜”。兩者之間沒有任何因果關(guān)系,以及強(qiáng)關(guān)聯(lián)性。
事實(shí)上,對(duì)于AI旅游大模型來說,真的可用的Agent一定不是簡(jiǎn)單模塊組合可實(shí)現(xiàn)的,如果有,也只是曇花一現(xiàn)。AI大模型催生了Prompt Engineer的工作角色,AI Agent理應(yīng)催生Flow Engineer一類崗位,需要一批兼具產(chǎn)品和編程思維能力的角色。
但在攜程的公開招聘中,目前沒有看到明顯具有Flow Engineer性質(zhì)的崗位。
而在所有可公開查詢到的信息中,攜程距離AI Agent最近的一次,則是今年二季度財(cái)報(bào)的時(shí)候,攜程集團(tuán)聯(lián)合創(chuàng)始人、董事局主席梁建章,CEO孫潔、CFO王肖璠等公司高管,首次以AI Agent形象,在財(cái)報(bào)會(huì)議上與投資人交流。
但很明顯,此AI Agent并非AI大模型行業(yè)的AI Agent,說穿了不過是類似數(shù)字人的奇技淫巧。
圖片來源于攝圖網(wǎng)和網(wǎng)絡(luò)截圖
本文來自投稿,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.allfloridahomeinspectors.com/cgo/market/124876.html