?自象限原創(chuàng)
訪談丨程心
生成式AI的爆發(fā),帶領(lǐng)全民到達(dá)AIGC的新時代。
在這個新時代,虛擬人作為一種新興的內(nèi)容載體,不僅在娛樂、教育、零售等領(lǐng)域中扮演著越來越重要的角色,也成為了品牌與消費(fèi)者之間互動的新媒介。
在去年虛擬人技術(shù)發(fā)展的一年中,3D虛擬人與2D虛擬人成為了行業(yè)一道極為明顯的分水嶺。2D虛擬人通常限于平面的視覺表現(xiàn),適用于傳統(tǒng)的社交媒體和網(wǎng)頁內(nèi)容。相比之下,3D虛擬人則提供了一個三維的、可以與之互動的世界,它們不僅能夠提供更加真實(shí)的視覺體驗(yàn),更是未來“入口級的應(yīng)用”。
從技術(shù)的發(fā)展來看,虛擬人正從單一的形象展示向更加綜合和多元的“虛擬人+”階段過渡。這一階段的虛擬人不再僅僅是一個靜態(tài)的形象,而是成為了一個具備多種功能和服務(wù)能力的智能實(shí)體。它們可以是虛擬客服、虛擬教師、虛擬主播,甚至是虛擬健康顧問。同時,虛擬人的應(yīng)用場景正在迅速擴(kuò)展,從而推動了相關(guān)行業(yè)的創(chuàng)新和變革。
在2024年開年,「自象限」關(guān)注到虛擬人已經(jīng)在和其他技術(shù)進(jìn)行結(jié)合。以3D虛擬人頭部廠商魔琺科技為例,在其近期迭代的產(chǎn)品“有言”中,3D虛擬人進(jìn)入了3D視頻空間,用戶可以直接利用該平臺制作3D視頻,包括腳本、虛擬人形象、AI語音合成、燈光布景等多維度的綜合體現(xiàn)。
這也引出了另一個發(fā)人深省的問題,在技術(shù)發(fā)展的早期階段,企業(yè)面臨著技術(shù)驅(qū)動與產(chǎn)品驅(qū)動的戰(zhàn)略選擇。技術(shù)驅(qū)動的路徑強(qiáng)調(diào)技術(shù)創(chuàng)新和突破,可能會帶來顛覆性的變革,但也存在市場接受度和商業(yè)化應(yīng)用的不確定性。產(chǎn)品驅(qū)動則更注重市場需求和用戶體驗(yàn),通過滿足用戶的實(shí)際需求來推動技術(shù)的商業(yè)化。這兩種策略的選擇將直接影響企業(yè)的發(fā)展軌跡和市場競爭力。
在這個行業(yè)發(fā)展的關(guān)鍵時期,魔琺科技作為擁有3D虛擬人及全棧AIGC技術(shù)的廠商,選擇了一條產(chǎn)品驅(qū)動的發(fā)展路徑。在《逐浪100人》的第二期,「自象限」對話魔琺科技創(chuàng)始人柴金祥,探討AIGC時代,虛擬人的邊界以及技術(shù)和產(chǎn)品的平衡。
有言,有話說
自象限:先聊聊這次有言的升級吧,我們能夠感受到這是一款不一樣的產(chǎn)品,和以往的產(chǎn)品相比,這一次升級特殊在哪?
柴金祥:與傳統(tǒng)的2D視頻生成工具不同,有言具有全棧的AIGC技術(shù),能夠一鍵生成高質(zhì)量的3D視頻內(nèi)容。這意味著用戶無需繁瑣的拍攝和后期制作流程,就能夠創(chuàng)造出具有深度和真實(shí)感的視頻體驗(yàn)。我們的3D虛擬人角色庫豐富多樣,用戶可以根據(jù)需要選擇不同的角色和場景,實(shí)現(xiàn)個性化的視頻創(chuàng)作。
在操作方面,這次升級加強(qiáng)了內(nèi)容的可控性和編輯能力。過去,視頻創(chuàng)作者往往受限于視頻素材的可用性和編輯難度。而現(xiàn)在,有言提供了從角色動作、表情到場景、燈光、聲音等全方位的編輯功能,使得創(chuàng)作者可以精準(zhǔn)控制每一個細(xì)節(jié),確保視頻內(nèi)容完全符合他們的創(chuàng)意和需求。
并且我們針對了多場景的應(yīng)用進(jìn)行了優(yōu)化。有言支持團(tuán)隊協(xié)作、多語言輸出,可以生成多語言視頻助力產(chǎn)品出海,這對于全球化的市場環(huán)境尤為重要。無論是知識分享、教育培訓(xùn)還是品牌宣傳,有言都能提供強(qiáng)大的支持。
此外,我們還關(guān)注到了3D內(nèi)容與未來技術(shù)如VR/AR的結(jié)合。有言生成的3D視頻內(nèi)容可以直接適配未來的虛擬3D世界,這意味著我們的產(chǎn)品不僅僅是為了當(dāng)前的市場,更是為了即將到來的元宇宙時代做準(zhǔn)備。
自象限:技術(shù)上的難度體現(xiàn)在哪?相較于以往的虛擬人或者3D視頻產(chǎn)品有哪些創(chuàng)新?
柴金祥:在這個用戶使用簡單的產(chǎn)品中,是很多種復(fù)合型技術(shù)形成的一個綜合型的創(chuàng)新解決方案,舉幾個例子:
三維內(nèi)容的AIGC化:傳統(tǒng)的3D內(nèi)容制作依賴于專業(yè)團(tuán)隊和復(fù)雜的軟件工具,有言實(shí)現(xiàn)了從3D虛擬人形象建模、綁定、動作、表情的AIGC化,比如說人肌肉手工制作的過程是非常困難的,但是我們做到了AIGC化,一個人的能力,他的表情、眼神、手勢、動作,聲音是 AIGC。另外燈光、鏡頭也需要通過最佳實(shí)踐,比如發(fā)布會的鏡頭切換需要用專業(yè)攝影師專業(yè)的方式,其實(shí)也是三維鏡頭,燈光模擬了專業(yè)燈光師進(jìn)行調(diào)控,這些都是AIGC。
目前來說,我們把最難的部分AIGC化,少部分采用模板庫的方式,比如說視頻包裝的片頭片尾、BGM、字幕展示、貼紙文字等,隨著數(shù)據(jù)增多會逐步實(shí)現(xiàn)從UGC到AIGC的轉(zhuǎn)化。
它的難點(diǎn)其實(shí)還是在于高質(zhì)量3D數(shù)據(jù)的缺乏,3D內(nèi)容的生成需要大量的高質(zhì)量數(shù)據(jù)作為訓(xùn)練基礎(chǔ)。魔琺科技通過多年的積累,建立了龐大的3D數(shù)據(jù)庫,這些數(shù)據(jù)不僅包括角色模型,還包括動作、表情、場景等,還要滿足用戶的實(shí)時渲染與編輯需求,這要求后端系統(tǒng)具備高效的渲染能力和靈活的編輯接口,技術(shù)上的挑戰(zhàn)在于如何保證渲染速度和視頻質(zhì)量的同時,提供流暢的用戶體驗(yàn)。
自象限:我們認(rèn)為虛擬人正在走向虛擬人+,您怎么看,未來魔琺會探索更多+之外的邊界么?
柴金祥:其實(shí)我們真正在做的是3D 超寫實(shí)虛擬 AIGC + X, 這一趨勢意味著虛擬人技術(shù)將不再局限于單一的應(yīng)用場景,而是會與更多行業(yè)、領(lǐng)域和技術(shù)相結(jié)合,形成更加豐富和多元的產(chǎn)品和服務(wù)。虛擬人+的概念代表了一種開放性和擴(kuò)展性,它不僅能夠增強(qiáng)現(xiàn)有的業(yè)務(wù)流程,還能夠創(chuàng)造全新的用戶體驗(yàn)和商業(yè)模式。
有言生成的3D視頻,如果你今天放在Vision Pro 里面, AR/VR 中看到的就是3D的景象,虛擬人可能就在站在你面前,這就是3D視頻+VR/AR的一個應(yīng)用。今天本質(zhì)上是因?yàn)槲覀冎荒茉?PC 端或移動端看到3D視頻,因此視覺上3D場景與2D場景的感受沒有那么強(qiáng)烈。
對于未來,魔琺科技將持續(xù)探索虛擬人技術(shù)的各種可能性,并推動其在更多“+”之外的邊界的應(yīng)用。半年以后我們可能也會把內(nèi)部3D 超寫實(shí)虛擬人AIGC全棧能力做成開放平臺,就像 ChatGPT的API接口調(diào)用一樣,無論是C端、 B端都可以調(diào)用API,使用背后的技術(shù)能力。
什么是魔琺?
自象限:您不斷提到產(chǎn)品戰(zhàn)略,所以魔琺是一家產(chǎn)品公司么?
柴金祥:是的,魔琺科技是一家以3D虛擬人和AIGC為核心的AI科技公司。我們的戰(zhàn)略重點(diǎn)在于利用人工智能AIGC技術(shù),創(chuàng)造出能夠?yàn)橛脩魩韺?shí)際價值的產(chǎn)品。所以你會發(fā)現(xiàn)我們從來不發(fā)Demo,我們推向市場時就是以產(chǎn)品的形態(tài)落地,技術(shù)有沒有用,最終要落在產(chǎn)品中,看是否能給用戶帶來價值。
我認(rèn)為不僅要關(guān)注技術(shù)的先進(jìn)性,還注重產(chǎn)品的實(shí)用性、易用性和市場適應(yīng)性。我覺得將復(fù)雜的技術(shù)轉(zhuǎn)化為簡單、直觀且高效的用戶體驗(yàn),這個才是最重要的。無論是3D虛擬人、AIGC技術(shù)還是VR/AR集成,我們的最終目標(biāo)都是打造出能夠被廣泛接受和使用的產(chǎn)品。
其實(shí)我們產(chǎn)品戰(zhàn)略是“1 + 3”,“1”是我們底層有技術(shù)的基礎(chǔ)設(shè)施,以3D 超寫實(shí)虛擬人AIGC操作系統(tǒng)為核心,讓所有人都能夠即插即用?!?”是指有言、有靈、有光三個消費(fèi)級產(chǎn)品平臺,后面會有我們的直播產(chǎn)品和有靈一對一的交互虛擬人產(chǎn)品,越來越精細(xì)化。
自象限:為什么是產(chǎn)品驅(qū)動而不是技術(shù)驅(qū)動?背后的邏輯是是什么?
柴金祥:技術(shù)驅(qū)動的公司可能會面臨技術(shù)過時或市場需求變化的風(fēng)險,而產(chǎn)品驅(qū)動的公司本質(zhì)上是以用戶需求為核心,將用戶的需求轉(zhuǎn)換實(shí)際的價值,技術(shù)在進(jìn)步,但用戶的需求和行業(yè)kown-how有跡可循。比如3D視頻制作過程中的團(tuán)隊協(xié)作能力幾乎是一個剛需能力,無論技術(shù)怎么變,這個場景是不會變的。
相比于Sora這樣的2D視頻生成的產(chǎn)品,首先他要用戶具備一定的技術(shù)背景,或者需要通過反復(fù)嘗試和調(diào)整輸入?yún)?shù)來生成滿意的視頻內(nèi)容,其次它不可編輯,視頻中一旦發(fā)生錯誤是不可更改的,在內(nèi)容生成自由度方面有一定的限制,而且Sora目前還是還是以生成“作品”為主,沒有辦法在商業(yè)的場景中使用,也就無法變成生產(chǎn)力。
從技術(shù)的角度來看,我之前提到了3D視頻AIGC的一個技術(shù)難點(diǎn)在于高質(zhì)量數(shù)據(jù)的不足,那么我們以產(chǎn)品的形式向行業(yè)提供生產(chǎn)力工具,我們的客戶也通過有言自主生成了很多高質(zhì)量的3D視頻數(shù)據(jù)來反哺我們的模型,去解決數(shù)據(jù)源頭不足的問題,生產(chǎn)力工具像是一個“鉤子”,以此形成飛輪效應(yīng)。
過去十年,無論是B端還是C端,ChatGPT、Canva、還是Figma,你會發(fā)現(xiàn)一旦到了產(chǎn)品和市場需求匹配,增長就特別快,就是這個道理。
自象限:如今AIGC產(chǎn)品的核心能力還是體現(xiàn)在降本增效的方面,有哪些具體的數(shù)據(jù)可以分享?
柴金祥:首先肯定是虛擬人制作的成本會逐漸變低。我們最早的時候企業(yè)設(shè)計專屬的虛擬人形象實(shí)際成交單價都是大幾十萬,我們自己的成本肯定也要幾十萬,但是就像上面講的,我們的客戶越來越多,數(shù)據(jù)越來越豐富,技術(shù)的進(jìn)步使得內(nèi)容生產(chǎn)變得越來越簡單,從PGC到UGC再到AIGC,門檻越來越低,但質(zhì)量會越來越好。
下一個版本現(xiàn)在我們把定制化的形象轉(zhuǎn)化成了虛擬人生成的產(chǎn)品,企業(yè)可以自己“捏臉”,這個成本就是很低的了。到今年下半年,當(dāng)一個普通人就能通過AIGC定制一個3D虛擬人的時候,AIGC的核心是使得內(nèi)容創(chuàng)作的邊際成本接近于零。
其次是3D視頻的制作的成本在降低,親身經(jīng)歷過動畫行業(yè)的就知道,像有言生成的高質(zhì)量動畫一秒鐘的成本在500塊錢左右,如今我們已經(jīng)把它AIGC化了,企業(yè)用戶通過按月付費(fèi)的方式就可以讓所有的員工使用。
舉一個頭部客戶的案例,這個集團(tuán)客戶要了100個賬號,實(shí)現(xiàn)每天生產(chǎn)30多個視頻,每一個賬號背后有4個人輪換在用,兩個月不到的時間里,做了近600條視頻總計近3000分鐘,這個成本和效率在以前是絕對想象不到的。
自象限:關(guān)于魔琺商業(yè)化的部分,您剛提到從項目定制化轉(zhuǎn)向標(biāo)準(zhǔn)化,這中間有什么契機(jī),是如何考慮的?
柴金祥:其實(shí)從公司一成立我們就想做產(chǎn)品化,只是我們那時候能力沒有到,做 business 到 eventually,這不是一種契機(jī)反而是一種堅持,我們的美術(shù)水平在逐漸提升、技術(shù)在提升、算法在優(yōu)化,當(dāng)技術(shù)達(dá)到一定成熟期以及公司規(guī)模到一定體量的時候,才能實(shí)現(xiàn)標(biāo)準(zhǔn)化的產(chǎn)品落地。
反過來講,當(dāng)ChatGPT剛開始做的時候,1.0、2.0時期沒有人相信它,只有到了3.5的時候它的能力達(dá)到了,大家才會覺得“噢,這個很了不起”,就像換做十幾年前的電動車,所有都覺得馬斯克就是個瘋子。凡事只能先做到證明可行性,才有可能落到用戶層面。
其次隨著時間的推移,我們發(fā)現(xiàn)市場上對于高效、低成本、易于使用的視頻制作解決方案的需求日益增長??蛻舨粌H需要高質(zhì)量的定制服務(wù),還需要能夠快速響應(yīng)市場變化、靈活調(diào)整內(nèi)容生產(chǎn)的標(biāo)準(zhǔn)化產(chǎn)品,我認(rèn)為這是一種“雙向奔赴”,最重要的難點(diǎn)是能不能實(shí)現(xiàn)。
早期我們自己的成本無論是研發(fā)成本還是人才成本都很高,我們自己也在攻克這些問題,但是現(xiàn)在有言最大的成本其實(shí)就是算力成本,所以我們需要更多的用戶來對算力成本進(jìn)行攤薄,用戶增長,我的PMF自然就能達(dá)到。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://m.allfloridahomeinspectors.com/cgo/model/115665.html