?自象限原創(chuàng)

訪談丨程心

生成式AI的爆發(fā)，帶領(lǐng)全民到達(dá)AIGC的新時代。

在這個新時代，虛擬人作為一種新興的內(nèi)容載體，不僅在娛樂、教育、零售等領(lǐng)域中扮演著越來越重要的角色，也成為了品牌與消費(fèi)者之間互動的新媒介。

在去年虛擬人技術(shù)發(fā)展的一年中，3D虛擬人與2D虛擬人成為了行業(yè)一道極為明顯的分水嶺。2D虛擬人通常限于平面的視覺表現(xiàn)，適用于傳統(tǒng)的社交媒體和網(wǎng)頁內(nèi)容。相比之下，3D虛擬人則提供了一個三維的、可以與之互動的世界，它們不僅能夠提供更加真實(shí)的視覺體驗(yàn)，更是未來“入口級的應(yīng)用”。

從技術(shù)的發(fā)展來看，虛擬人正從單一的形象展示向更加綜合和多元的“虛擬人+”階段過渡。這一階段的虛擬人不再僅僅是一個靜態(tài)的形象，而是成為了一個具備多種功能和服務(wù)能力的智能實(shí)體。它們可以是虛擬客服、虛擬教師、虛擬主播，甚至是虛擬健康顧問。同時，虛擬人的應(yīng)用場景正在迅速擴(kuò)展，從而推動了相關(guān)行業(yè)的創(chuàng)新和變革。

在2024年開年，「自象限」關(guān)注到虛擬人已經(jīng)在和其他技術(shù)進(jìn)行結(jié)合。以3D虛擬人頭部廠商魔琺科技為例，在其近期迭代的產(chǎn)品“有言”中，3D虛擬人進(jìn)入了3D視頻空間，用戶可以直接利用該平臺制作3D視頻，包括腳本、虛擬人形象、AI語音合成、燈光布景等多維度的綜合體現(xiàn)。

這也引出了另一個發(fā)人深省的問題，在技術(shù)發(fā)展的早期階段，企業(yè)面臨著技術(shù)驅(qū)動與產(chǎn)品驅(qū)動的戰(zhàn)略選擇。技術(shù)驅(qū)動的路徑強(qiáng)調(diào)技術(shù)創(chuàng)新和突破，可能會帶來顛覆性的變革，但也存在市場接受度和商業(yè)化應(yīng)用的不確定性。產(chǎn)品驅(qū)動則更注重市場需求和用戶體驗(yàn)，通過滿足用戶的實(shí)際需求來推動技術(shù)的商業(yè)化。這兩種策略的選擇將直接影響企業(yè)的發(fā)展軌跡和市場競爭力。

在這個行業(yè)發(fā)展的關(guān)鍵時期，魔琺科技作為擁有3D虛擬人及全棧AIGC技術(shù)的廠商，選擇了一條產(chǎn)品驅(qū)動的發(fā)展路徑。在《逐浪100人》的第二期，「自象限」對話魔琺科技創(chuàng)始人柴金祥，探討AIGC時代，虛擬人的邊界以及技術(shù)和產(chǎn)品的平衡。

▲魔琺科技創(chuàng)始人兼CEO柴金祥受訪者提供

有言，有話說

自象限：先聊聊這次有言的升級吧，我們能夠感受到這是一款不一樣的產(chǎn)品，和以往的產(chǎn)品相比，這一次升級特殊在哪？

柴金祥：與傳統(tǒng)的2D視頻生成工具不同，有言具有全棧的AIGC技術(shù)，能夠一鍵生成高質(zhì)量的3D視頻內(nèi)容。這意味著用戶無需繁瑣的拍攝和后期制作流程，就能夠創(chuàng)造出具有深度和真實(shí)感的視頻體驗(yàn)。我們的3D虛擬人角色庫豐富多樣，用戶可以根據(jù)需要選擇不同的角色和場景，實(shí)現(xiàn)個性化的視頻創(chuàng)作。

在操作方面，這次升級加強(qiáng)了內(nèi)容的可控性和編輯能力。過去，視頻創(chuàng)作者往往受限于視頻素材的可用性和編輯難度。而現(xiàn)在，有言提供了從角色動作、表情到場景、燈光、聲音等全方位的編輯功能，使得創(chuàng)作者可以精準(zhǔn)控制每一個細(xì)節(jié)，確保視頻內(nèi)容完全符合他們的創(chuàng)意和需求。

并且我們針對了多場景的應(yīng)用進(jìn)行了優(yōu)化。有言支持團(tuán)隊協(xié)作、多語言輸出，可以生成多語言視頻助力產(chǎn)品出海，這對于全球化的市場環(huán)境尤為重要。無論是知識分享、教育培訓(xùn)還是品牌宣傳，有言都能提供強(qiáng)大的支持。

此外，我們還關(guān)注到了3D內(nèi)容與未來技術(shù)如VR/AR的結(jié)合。有言生成的3D視頻內(nèi)容可以直接適配未來的虛擬3D世界，這意味著我們的產(chǎn)品不僅僅是為了當(dāng)前的市場，更是為了即將到來的元宇宙時代做準(zhǔn)備。

自象限：技術(shù)上的難度體現(xiàn)在哪？相較于以往的虛擬人或者3D視頻產(chǎn)品有哪些創(chuàng)新？

柴金祥：在這個用戶使用簡單的產(chǎn)品中，是很多種復(fù)合型技術(shù)形成的一個綜合型的創(chuàng)新解決方案，舉幾個例子：

三維內(nèi)容的AIGC化：傳統(tǒng)的3D內(nèi)容制作依賴于專業(yè)團(tuán)隊和復(fù)雜的軟件工具，有言實(shí)現(xiàn)了從3D虛擬人形象建模、綁定、動作、表情的AIGC化，比如說人肌肉手工制作的過程是非常困難的，但是我們做到了AIGC化，一個人的能力，他的表情、眼神、手勢、動作，聲音是 AIGC。另外燈光、鏡頭也需要通過最佳實(shí)踐，比如發(fā)布會的鏡頭切換需要用專業(yè)攝影師專業(yè)的方式，其實(shí)也是三維鏡頭，燈光模擬了專業(yè)燈光師進(jìn)行調(diào)控，這些都是AIGC。

目前來說，我們把最難的部分AIGC化，少部分采用模板庫的方式，比如說視頻包裝的片頭片尾、BGM、字幕展示、貼紙文字等，隨著數(shù)據(jù)增多會逐步實(shí)現(xiàn)從UGC到AIGC的轉(zhuǎn)化。

它的難點(diǎn)其實(shí)還是在于高質(zhì)量3D數(shù)據(jù)的缺乏，3D內(nèi)容的生成需要大量的高質(zhì)量數(shù)據(jù)作為訓(xùn)練基礎(chǔ)。魔琺科技通過多年的積累，建立了龐大的3D數(shù)據(jù)庫，這些數(shù)據(jù)不僅包括角色模型，還包括動作、表情、場景等，還要滿足用戶的實(shí)時渲染與編輯需求，這要求后端系統(tǒng)具備高效的渲染能力和靈活的編輯接口，技術(shù)上的挑戰(zhàn)在于如何保證渲染速度和視頻質(zhì)量的同時，提供流暢的用戶體驗(yàn)。

自象限：我們認(rèn)為虛擬人正在走向虛擬人＋，您怎么看，未來魔琺會探索更多＋之外的邊界么？

柴金祥：其實(shí)我們真正在做的是3D 超寫實(shí)虛擬 AIGC + X，這一趨勢意味著虛擬人技術(shù)將不再局限于單一的應(yīng)用場景，而是會與更多行業(yè)、領(lǐng)域和技術(shù)相結(jié)合，形成更加豐富和多元的產(chǎn)品和服務(wù)。虛擬人+的概念代表了一種開放性和擴(kuò)展性，它不僅能夠增強(qiáng)現(xiàn)有的業(yè)務(wù)流程，還能夠創(chuàng)造全新的用戶體驗(yàn)和商業(yè)模式。

有言生成的3D視頻，如果你今天放在Vision Pro 里面， AR/VR 中看到的就是3D的景象，虛擬人可能就在站在你面前，這就是3D視頻＋VR/AR的一個應(yīng)用。今天本質(zhì)上是因?yàn)槲覀冎荒茉?PC 端或移動端看到3D視頻，因此視覺上3D場景與2D場景的感受沒有那么強(qiáng)烈。

對于未來，魔琺科技將持續(xù)探索虛擬人技術(shù)的各種可能性，并推動其在更多“+”之外的邊界的應(yīng)用。半年以后我們可能也會把內(nèi)部3D 超寫實(shí)虛擬人AIGC全棧能力做成開放平臺，就像 ChatGPT的API接口調(diào)用一樣，無論是C端、 B端都可以調(diào)用API，使用背后的技術(shù)能力。

什么是魔琺？

自象限：您不斷提到產(chǎn)品戰(zhàn)略，所以魔琺是一家產(chǎn)品公司么？

柴金祥：是的，魔琺科技是一家以3D虛擬人和AIGC為核心的AI科技公司。我們的戰(zhàn)略重點(diǎn)在于利用人工智能AIGC技術(shù)，創(chuàng)造出能夠?yàn)橛脩魩韺?shí)際價值的產(chǎn)品。所以你會發(fā)現(xiàn)我們從來不發(fā)Demo，我們推向市場時就是以產(chǎn)品的形態(tài)落地，技術(shù)有沒有用，最終要落在產(chǎn)品中，看是否能給用戶帶來價值。

我認(rèn)為不僅要關(guān)注技術(shù)的先進(jìn)性，還注重產(chǎn)品的實(shí)用性、易用性和市場適應(yīng)性。我覺得將復(fù)雜的技術(shù)轉(zhuǎn)化為簡單、直觀且高效的用戶體驗(yàn)，這個才是最重要的。無論是3D虛擬人、AIGC技術(shù)還是VR/AR集成，我們的最終目標(biāo)都是打造出能夠被廣泛接受和使用的產(chǎn)品。

其實(shí)我們產(chǎn)品戰(zhàn)略是“1 + 3”，“1”是我們底層有技術(shù)的基礎(chǔ)設(shè)施，以3D 超寫實(shí)虛擬人AIGC操作系統(tǒng)為核心，讓所有人都能夠即插即用?！?”是指有言、有靈、有光三個消費(fèi)級產(chǎn)品平臺，后面會有我們的直播產(chǎn)品和有靈一對一的交互虛擬人產(chǎn)品，越來越精細(xì)化。

自象限：為什么是產(chǎn)品驅(qū)動而不是技術(shù)驅(qū)動？背后的邏輯是是什么？

柴金祥：技術(shù)驅(qū)動的公司可能會面臨技術(shù)過時或市場需求變化的風(fēng)險，而產(chǎn)品驅(qū)動的公司本質(zhì)上是以用戶需求為核心，將用戶的需求轉(zhuǎn)換實(shí)際的價值，技術(shù)在進(jìn)步，但用戶的需求和行業(yè)kown-how有跡可循。比如3D視頻制作過程中的團(tuán)隊協(xié)作能力幾乎是一個剛需能力，無論技術(shù)怎么變，這個場景是不會變的。

相比于Sora這樣的2D視頻生成的產(chǎn)品，首先他要用戶具備一定的技術(shù)背景，或者需要通過反復(fù)嘗試和調(diào)整輸入?yún)?shù)來生成滿意的視頻內(nèi)容，其次它不可編輯，視頻中一旦發(fā)生錯誤是不可更改的，在內(nèi)容生成自由度方面有一定的限制，而且Sora目前還是還是以生成“作品”為主，沒有辦法在商業(yè)的場景中使用，也就無法變成生產(chǎn)力。

從技術(shù)的角度來看，我之前提到了3D視頻AIGC的一個技術(shù)難點(diǎn)在于高質(zhì)量數(shù)據(jù)的不足，那么我們以產(chǎn)品的形式向行業(yè)提供生產(chǎn)力工具，我們的客戶也通過有言自主生成了很多高質(zhì)量的3D視頻數(shù)據(jù)來反哺我們的模型，去解決數(shù)據(jù)源頭不足的問題，生產(chǎn)力工具像是一個“鉤子”，以此形成飛輪效應(yīng)。

過去十年，無論是B端還是C端，ChatGPT、Canva、還是Figma，你會發(fā)現(xiàn)一旦到了產(chǎn)品和市場需求匹配，增長就特別快，就是這個道理。

自象限：如今AIGC產(chǎn)品的核心能力還是體現(xiàn)在降本增效的方面，有哪些具體的數(shù)據(jù)可以分享？

柴金祥：首先肯定是虛擬人制作的成本會逐漸變低。我們最早的時候企業(yè)設(shè)計專屬的虛擬人形象實(shí)際成交單價都是大幾十萬，我們自己的成本肯定也要幾十萬，但是就像上面講的，我們的客戶越來越多，數(shù)據(jù)越來越豐富，技術(shù)的進(jìn)步使得內(nèi)容生產(chǎn)變得越來越簡單，從PGC到UGC再到AIGC，門檻越來越低，但質(zhì)量會越來越好。

下一個版本現(xiàn)在我們把定制化的形象轉(zhuǎn)化成了虛擬人生成的產(chǎn)品，企業(yè)可以自己“捏臉”，這個成本就是很低的了。到今年下半年，當(dāng)一個普通人就能通過AIGC定制一個3D虛擬人的時候，AIGC的核心是使得內(nèi)容創(chuàng)作的邊際成本接近于零。

其次是3D視頻的制作的成本在降低，親身經(jīng)歷過動畫行業(yè)的就知道，像有言生成的高質(zhì)量動畫一秒鐘的成本在500塊錢左右，如今我們已經(jīng)把它AIGC化了，企業(yè)用戶通過按月付費(fèi)的方式就可以讓所有的員工使用。

舉一個頭部客戶的案例，這個集團(tuán)客戶要了100個賬號，實(shí)現(xiàn)每天生產(chǎn)30多個視頻，每一個賬號背后有4個人輪換在用，兩個月不到的時間里，做了近600條視頻總計近3000分鐘，這個成本和效率在以前是絕對想象不到的。

自象限：關(guān)于魔琺商業(yè)化的部分，您剛提到從項目定制化轉(zhuǎn)向標(biāo)準(zhǔn)化，這中間有什么契機(jī)，是如何考慮的？

柴金祥：其實(shí)從公司一成立我們就想做產(chǎn)品化，只是我們那時候能力沒有到，做 business 到 eventually，這不是一種契機(jī)反而是一種堅持，我們的美術(shù)水平在逐漸提升、技術(shù)在提升、算法在優(yōu)化，當(dāng)技術(shù)達(dá)到一定成熟期以及公司規(guī)模到一定體量的時候，才能實(shí)現(xiàn)標(biāo)準(zhǔn)化的產(chǎn)品落地。

反過來講，當(dāng)ChatGPT剛開始做的時候，1.0、2.0時期沒有人相信它，只有到了3.5的時候它的能力達(dá)到了，大家才會覺得“噢，這個很了不起”，就像換做十幾年前的電動車，所有都覺得馬斯克就是個瘋子。凡事只能先做到證明可行性，才有可能落到用戶層面。

其次隨著時間的推移，我們發(fā)現(xiàn)市場上對于高效、低成本、易于使用的視頻制作解決方案的需求日益增長?？蛻舨粌H需要高質(zhì)量的定制服務(wù)，還需要能夠快速響應(yīng)市場變化、靈活調(diào)整內(nèi)容生產(chǎn)的標(biāo)準(zhǔn)化產(chǎn)品，我認(rèn)為這是一種“雙向奔赴”，最重要的難點(diǎn)是能不能實(shí)現(xiàn)。

早期我們自己的成本無論是研發(fā)成本還是人才成本都很高，我們自己也在攻克這些問題，但是現(xiàn)在有言最大的成本其實(shí)就是算力成本，所以我們需要更多的用戶來對算力成本進(jìn)行攤薄，用戶增長，我的PMF自然就能達(dá)到。

本文來自投稿，不代表增長黑客立場，如若轉(zhuǎn)載，請注明出處：http://m.allfloridahomeinspectors.com/cgo/model/115665.html

逐浪100人丨對話魔琺科技CEO柴金祥：AI時代，虛擬人的邊界在哪？

有言，有話說

什么是魔琺？

關(guān)于作者

自象限

發(fā)表回復(fù)

逐浪100人丨對話魔琺科技CEO柴金祥：AI時代，虛擬人的邊界在哪？

有言，有話說

什么是魔琺？

關(guān)于作者

自象限

增長黑客Growthhk.cn薦讀更多>>

義工旅行：省錢，但不一定自由

連續(xù)六年保持增長的思樂，如何穿越玩具行業(yè)寒冬？

受ChatGPT影響：松松軟文第一個客戶退款266元

不足兩年“失血”35億，用友網(wǎng)絡(luò)轉(zhuǎn)型之路在何方？

為什么別人能取得15億的估值，而你不行？忽略了這兩大關(guān)鍵要素！

平價品牌翻身：以漲價的方式卷價格

發(fā)表回復(fù)

逐浪100人丨對話魔琺科技CEO柴金祥：AI時代，虛擬人的邊界在哪？

有言，有話說

什么是魔琺？

連續(xù)六年保持增長的思樂，如何穿越玩具行業(yè)寒冬？

不足兩年“失血”35億，用友網(wǎng)絡(luò)轉(zhuǎn)型之路在何方？

為什么別人能取得15億的估值，而你不行？忽略了這兩大關(guān)鍵要素！