文|商業(yè)數(shù)據(jù)派,作者|劉俊宏
4月10日,昆侖萬維宣布聯(lián)合奇點(diǎn)智源,共同研發(fā)了號稱“中國第一個(gè)真正實(shí)現(xiàn)智能涌現(xiàn)”的國產(chǎn)大語言模型——“天工”3.5,甚至還注冊了chatgpt.cn作為域名。
隔天,4月11日,昆侖萬維就收到了來自深交所的關(guān)注函。要求結(jié)合行業(yè)政策風(fēng)險(xiǎn)、該項(xiàng)目研發(fā)進(jìn)度、產(chǎn)品落地可行性、預(yù)計(jì)上線時(shí)間、市場需求情況、對公司財(cái)務(wù)影響等情況,說明“天工”3.5可能面臨的風(fēng)險(xiǎn),相當(dāng)于是深交所在懷疑昆侖萬維在“蹭熱點(diǎn)”。
在4月17日,天工大模型開放了內(nèi)部測試并做了直播演示后,效果并不太好。
在開場問過一些常見問題之后,在問到蒸包子問題時(shí),回答效果開始不盡如人意。蒸一個(gè)包子需要10分鐘,蒸10個(gè)呢?第一輪直接回答是10分鐘;當(dāng)再問100個(gè)的時(shí)候,卻回答道因?yàn)檎舭訒r(shí)間是固定的,所以還是10分鐘。
同樣的問題交給New Bing,很顯然New Bing考慮到了問題中的陷阱,按照鍋的大小做出了回答。
此外,在一些測試者在公開平臺(tái)上上傳的測試情況來看,天工大模型的問題,不僅是在邏輯,在表格上也不太嚴(yán)謹(jǐn)。測試者要求制作一個(gè)工資表格,天工大模型給出了案例和計(jì)算規(guī)則,但最后的結(jié)論(實(shí)發(fā)工資一欄)全部都是不正確的。
從當(dāng)前展示結(jié)果上看,天工大模型的表現(xiàn)無疑是差強(qiáng)人意的。實(shí)際上,從昆侖萬維宣布發(fā)布大模型之時(shí),就值得細(xì)細(xì)推敲。
01 疑點(diǎn)重重的大模型
不論大模型能不能給出市場一個(gè)滿意的答案,昆侖萬維已經(jīng)在股市上“贏麻了”。
2023年春節(jié)后開始,“數(shù)字經(jīng)濟(jì)熱潮”從數(shù)據(jù)要素開始輪動(dòng),昆侖萬維的市值就借上了AIGC+游戲的東風(fēng),如今其市值到現(xiàn)在已然翻了兩倍有余。而現(xiàn)在,昆侖萬維借著天工大模型準(zhǔn)備再添一把火。
但如果細(xì)細(xì)思索昆侖萬維大模型的真實(shí)性,有不少蹊蹺。
首先,昆侖萬維大模型的實(shí)力存疑。
第一是,按照昆侖萬維在4月10日官方公眾號的一份模型排位截圖顯示,其自研百億級模型「瑤光」在2021年4月的數(shù)據(jù)表現(xiàn)領(lǐng)先其他玩家,并且在2022年12月的行業(yè)評測中仍處于領(lǐng)先水平。
如圖所示,昆侖萬維號稱,2021年采用瑤光大模型訓(xùn)練的大語言模型“天工妙筆”,在續(xù)寫、擴(kuò)寫、摘要等能力上都超過瀾舟科技、智源研究院等幾家AI公司的水平。
但實(shí)際上,這個(gè)能力與模型參數(shù)量相關(guān),并不能完全體現(xiàn)算法水平。比如昆侖萬維的為瑤光大模型參數(shù)量為140億,而瀾舟科技的孟子兩個(gè)大模型參數(shù)僅分別為14~64億。
另一邊,大模型的發(fā)布背后應(yīng)該是豐富的技術(shù)積累,可以大致用AI專利數(shù)去衡量。例如,在百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司下面,會(huì)有文本生成方法、數(shù)據(jù)處理方法等相關(guān)技術(shù)專利。
但昆侖萬維根本找不到相關(guān)的專利。經(jīng)查詢,在昆侖萬維科技股份有限公司下面并未發(fā)現(xiàn)任何與大模型直接相關(guān)的專利,奇點(diǎn)智源下面不存在任何專利。如果將搜索條件放寬到奇點(diǎn)智源大股東關(guān)聯(lián)的奇點(diǎn)智能,還是找不到任何專利信息。
其次,昆侖萬維公司主體對AI的持續(xù)推進(jìn)能力不足。
從財(cái)務(wù)角度來看,昆侖萬維當(dāng)前的資金不太寬裕。2022年報(bào)顯示,昆侖萬維賬上貨幣資金+交易性金融資產(chǎn)-短期借款為18.82億,除開賬上可用資金,昆侖萬維在應(yīng)收、應(yīng)付票據(jù)及應(yīng)收賬款之間存在8.22億的缺口,換算下來,較為自由使用的資金在10億人民幣左右。
另一邊,從開支層面來說,支撐AI最直接的就是算力設(shè)備,當(dāng)前昆侖萬維有用200張卡的訓(xùn)練集群,且已合計(jì)采購約4400萬美金的硬件設(shè)備。事實(shí)上,按照現(xiàn)在主流對大模型的理解,200張卡只是杯水車薪,如果僅以文本生成對比,近似體量的例子是復(fù)旦大學(xué)研發(fā),采用了128張卡、200億參數(shù)“MOSS”。雖然名字蹭了《流浪地球》的熱度,引得眾人期待,但還是因?yàn)楹罄m(xù)表現(xiàn)差強(qiáng)人意,最終“泯于眾人”。
昆侖萬維未來如果對標(biāo)百度文心一言,約1000張卡的開支,從設(shè)備角度推測,昆侖萬維短期內(nèi)需要四倍4400萬美元的硬件開支來彌補(bǔ)算力差距,這對應(yīng)約12億人民幣,差不多是公司一年的凈利潤。再進(jìn)一步,如果按照4月6號公司CEO方漢的談話,認(rèn)為如果要繼續(xù)開展視頻和圖片的訓(xùn)練需要再翻10倍的算力需求推算,117億人民幣的長期開支差不多對應(yīng)的是昆侖萬維兩年半的營收。
以上這還僅僅是硬件成本的推算。據(jù)國盛證券報(bào)告《ChatGPT需要多少算力》估算,GPT-3訓(xùn)練一次的成本約為140萬美元,對于一些更大的模型,訓(xùn)練成本介于200萬美元至1200萬美元之間。以ChatGPT在1月的獨(dú)立訪客平均數(shù)1300萬計(jì)算,其對應(yīng)芯片需求為3萬多片英偉達(dá)A100 GPU,初始投入成本約為8億美元,每日電費(fèi)在5萬美元左右。
另一邊,在AI模型轉(zhuǎn)化的收入端,根據(jù)昆侖萬維在3月24號對深交所的回復(fù)函表示:目前公司AIGC、人工智能等業(yè)務(wù)產(chǎn)品尚未產(chǎn)生實(shí)際收入,預(yù)計(jì)不會(huì)對2023年財(cái)務(wù)狀況產(chǎn)生較大影響。這也就意味著,如果昆侖萬維執(zhí)行了AI模型的投入,公司將難以面對短期可能出現(xiàn)的虧損。
最后,昆侖萬維大模型缺少訓(xùn)練數(shù)據(jù)。
通觀市面上的國產(chǎn)大模型,其內(nèi)在語料庫基本都基于公司業(yè)務(wù)。例如文心一言基于百度的語料庫、騰訊基于QQ和微信聊天語義庫、阿里基于電商數(shù)據(jù)等,這些語料庫不僅龐大,而且也都是互聯(lián)網(wǎng)數(shù)據(jù)流通的高頻領(lǐng)域。而昆侖萬維的直接預(yù)料來源只有Opera瀏覽器,而Opera瀏覽器是昆侖萬維在2020年10月完成收購的挪威公司。
縱然有直接購買訓(xùn)練數(shù)據(jù)集作為豐富語料庫的解決方案,但這種方式,昆侖萬維根本無法與其他大廠的云計(jì)算、數(shù)據(jù)標(biāo)注、數(shù)據(jù)清洗等體系化能力相抗衡。畢竟初始語料庫越豐富,模型的訓(xùn)練集就越好,語料庫更新速度越快,模型迭代速度也隨之加快。面對大廠在數(shù)據(jù)實(shí)力上的飛輪,可以預(yù)見昆侖萬維的大模型最終還是會(huì)表現(xiàn)為落后一步。
以上問題,雖不能直接指出天工模型的存在與否,但來自技術(shù)、資金、語料庫的種種限制無疑直接揭示了該模型的效果不會(huì)太好。
那么,昆侖萬維又是為何要在當(dāng)下的節(jié)點(diǎn)準(zhǔn)備發(fā)布呢?
02 強(qiáng)行發(fā)布大模型,昆侖萬維“急了”
從基本面上看,昆侖萬維的確需要強(qiáng)而有力的新增長。
昆侖萬維2022年實(shí)現(xiàn)營業(yè)收入47.36億元,同比下滑25.49%,實(shí)現(xiàn)歸母凈利潤11.53億元,同比下滑2.35%,論盈利規(guī)模,這是昆侖萬維2019年以來最差的財(cái)報(bào)。
昆侖萬維的主要營收來自于社交和廣告,其商業(yè)模式是通過向用戶提供社交平臺(tái)、搜索和游戲服務(wù)獲取流量,再將流量轉(zhuǎn)化成為廣告的閉環(huán),但現(xiàn)在這種流量變現(xiàn)的模式正在面臨危機(jī)。
在Opera瀏覽器這邊,業(yè)務(wù)則主要面向歐美、非洲及東南亞地區(qū)。業(yè)務(wù)在海外的部分更多,并且市場占比很小。
用戶數(shù)量上,昆侖萬維在2022年報(bào)中表示全球月活躍用戶為3.24億。但從相對值的角度觀察,根據(jù)statcounter發(fā)布2022年3月-2023年3月,國內(nèi)和國外手機(jī)瀏覽器市場占有率排名顯示,全球opera瀏覽器的占比為3.06%,國內(nèi)在PC端和手機(jī)端的占比均為“其他”,分別歸類占比為8.31%和0.2%。
從業(yè)務(wù)的角度來看,昆侖萬維的營收主要也來自海外(占比77.54%)。值得注意的是,從2019年以來,昆侖萬維的境內(nèi)業(yè)務(wù)營收就在不斷下滑,2022年昆侖萬維的海外業(yè)務(wù)營收增長7.15%,而境內(nèi)業(yè)務(wù)營收下滑25.23%,未來預(yù)計(jì)昆侖萬維極有可能在國內(nèi)的營收及占比進(jìn)一步下滑,這也意味著未來Opera直接收集的中文語料也將會(huì)越來越少。
縱然搜索業(yè)務(wù)在增長,但通盤看待昆侖萬維的商業(yè)模式,維護(hù)用戶留存的游戲、社交業(yè)務(wù)的下滑,無疑是非常危險(xiǎn)的信號。
為了解決如此困境,昆侖萬維的解決方案是風(fēng)口投資,甚至被追捧者奉為“投資高手”。
2020年,昆侖萬維收購了Opera瀏覽器;2021年,收購了海外社交平臺(tái)Star Group;2022年喊出了元宇宙AIGC并入住了新能源儲(chǔ)能領(lǐng)域(包括綠釩新能源、蜂巢能源、東岳氫能、纖納光電、星環(huán)聚能等)。其中也不乏有項(xiàng)目收益頗豐,2020年參投公司DADA在美國掛牌上市;2021年心通醫(yī)療在港交所主板上市。接連的并購,為公司帶來了高達(dá)39.34億的商譽(yù),占總資產(chǎn)比例為22.4%。
而現(xiàn)在,昆侖萬維又將新的賭注下在了大模型之上。
以博弈論的視角,當(dāng)前發(fā)布大模型確實(shí)是昆侖萬維最好的選擇。如果模型效果匹配市場預(yù)期,那水漲船高的估值,會(huì)為公司今后的投資帶來金融工具的便利;如果模型效果不好,那就重回原點(diǎn),一切就當(dāng)無事發(fā)生。
不論如何,4月17日發(fā)布的天工大模型,不會(huì)是國產(chǎn)大模型熱潮的終點(diǎn),但一定是昆侖萬維市值的轉(zhuǎn)折點(diǎn)。
注:本文目的為行業(yè)研究,不作為投資參考。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://m.allfloridahomeinspectors.com/quan/95613.html