<cite id="1ndtl"></cite>
<ruby id="1ndtl"></ruby>
<strike id="1ndtl"></strike>
<span id="1ndtl"><dl id="1ndtl"></dl></span><span id="1ndtl"><dl id="1ndtl"></dl></span>
<strike id="1ndtl"></strike>
<strike id="1ndtl"><dl id="1ndtl"><del id="1ndtl"></del></dl></strike>
<span id="1ndtl"></span>
<span id="1ndtl"><dl id="1ndtl"></dl></span>
<strike id="1ndtl"></strike>
<strike id="1ndtl"></strike><span id="1ndtl"><dl id="1ndtl"></dl></span>
<strike id="1ndtl"></strike><strike id="1ndtl"></strike>
<strike id="1ndtl"></strike>
<span id="1ndtl"></span>
<span id="1ndtl"><dl id="1ndtl"></dl></span>
<th id="1ndtl"><noframes id="1ndtl"><span id="1ndtl"><video id="1ndtl"><strike id="1ndtl"></strike></video></span> <strike id="1ndtl"></strike>
<strike id="1ndtl"></strike>
<span id="1ndtl"><dl id="1ndtl"></dl></span>
  1. 首頁
  2. 元宇宙歌爾股份(36氪專訪 格子互動創始人凌天格:開發元宇宙的聲音“皮膚”,讓聲音在未來成為貨幣)

元宇宙歌爾股份(36氪專訪 格子互動創始人凌天格:開發元宇宙的聲音“皮膚”,讓聲音在未來成為貨幣)

文 | 周鑫雨

編輯 | 蘇建勛

今年年初,源碼資本種子業務源碼一粟投中了一家“玩聲音”的公司“格子互動”。

劇本殺是格子互動發軔的起點。2022年初,格子互動上線了HALO劇本殺。目前Halo每個月的在線劇本殺局數都在1萬左右,相當于上百家劇本殺門店的規模。

而作為成長在新風口迭出的一代,格子互動創始人凌天格對格子互動的期許遠不止做好線上劇本殺。利用HALO劇本殺積累的DM(主持人)聲音資源,他希望格子互動開發的虛擬聲音引擎,能夠成為元宇宙社交中的虛擬聲音infra,“就像柯南里的蝴蝶結變聲器一樣,不僅完全改變音色,還能保留人說話的自然語氣”。

除了實時音色轉換,天格的團隊也正在研發小樣本聲音克隆,聲音編輯,甚至結合機器翻譯做實時語言轉換,類似于海外AI配音技術公司Deepdub的業務。

現階段,格子互動的虛擬聲音引擎主要瞄準游戲、配音、影視公司,通過離線語音合成實現自動配音。未來,凌天格計劃將聲音引擎做成API,出售給實時語音交互場景較為豐富的游戲、社交,甚至元宇宙社交軟件。

今年年初,格子互動已完成天使輪融資,投資方為源碼一粟,原力資本擔任本輪融資顧問。目前,格子互動已經發展成了40個人的完整團隊。聯合創始人徐潁曾任阿里巴巴語音算法專家,劉建俊也有豐富的互聯網運營與市場經驗,曾擔任愷英網絡市場VP。

以下是與凌天格的對話:

做聲音的“皮膚”

Q:為什么選擇聲音infra賽道?

A:因為我覺得95后、00后的年輕人還是比較容易emo的,而聲音是能夠很好引起年輕人共鳴的一個切入點。比如說看無聲電影,你是很難看哭的,但是配上了一個好BGM,能夠起到的情感共鳴是完全不一樣的。過去十年來,聲音確實不如視覺有市場影響力,但再看未來十年,我覺得聲音在這一代年輕人當中的影響力會不斷提升。另外,靜態視覺領域誕生了美圖,視頻領域火了抖音,但聲音領域還有足夠的空間和機會。

Q:十多年前,初音未來這樣的虛擬角色就已經運用了聲音合成技術。格子互動做的聲音infra有什么獨特之處?

A:區別特別大。視覺的發展其實經歷了這樣一個過程:從傳統的純靠建模驅動角色,到現在由中之人操控虛擬形象,他們笑,角色就笑。

聲音也會經歷這樣一個變革。我們做的其實是類似于“皮膚”一樣的東西,即便改變音色和語言,但是你說話的抑揚頓挫和語音語調會被保留。傳統的語音合成ASR(語音識別)和TTS(語音合成)的輸出是相對固定的,但我們做的方向,就是把聲音做成一個完全可以穿戴的“皮膚”,改變音色的同時,保留你自身說話的一些方式——這是從產品化的角度來區分。

從技術上來說,想要直接實現聲音轉聲音的算法,需要高效、高質的提取音色這個特征值,提取的質量越高,對于聲源本身的語氣、頓挫、和其他內容保存的就更完整。提取的效率更高,算法的實時率就能更高,用著整體就更順暢。當然需要商用的話還需要考慮魯棒性,降低使用門檻。在高質高效的基礎上,再實現高魯棒性就更難了。目前音色特征值提取這塊沒有一個很好的解決方案,我們填補的就是這塊的技術空白。

Q:如果互聯網公司也入局這樣一個賽道,格子互動能招架的住嗎?

A:大廠想要全力做聲音賽道的話,純技術板塊我相信肯定也能做。錢和人是他們的優勢,但切入點、堅持度、專注度和開放度反而可能是大廠會面對的挑戰,不然世界早被一個公司壟斷了。

作為一家創業公司,我們的團隊對于做聲音infra這件事是有共識的,也會全力focus在上面,就是小團隊的優勢,靈活,迅猛。同時我們產品化的進程很快很輕量,比如為了積累聲音資源,我們很快推出了HALO劇本殺,同時這也是一個讓我們不斷打磨技術的試驗田,有什么新想法都可以在上面推出產品做嘗試。況且從BD的角度來說,創業公司也會有自己獨有的資源和方式。相對于那些一切需要考慮ROI效益,同時架構瘋狂內卷的大廠來說,我們反而更占優勢。

Q:未來格子互動的聲音引擎會有怎樣的應用場景?

A:其實像早期的字節,他們基于頭條就能把推薦算法打磨得特別好。后續他們推出了火山引擎,不僅做toB,也基于此不斷推出toC的產品。我們的聲音引擎也不僅僅會做toB的SaaS,toC應用是更長期的一個方向。沒有人知道下一個產品會有多牛。

我們的聲音引擎現在還在研發階段,但已經有了產品化的初步方向。我們打算做一個非實時聲音合成的SaaS后臺,提供給游戲、影視、配音等團隊。比如一個有100個角色的游戲,如果找100個配音演員來配,成本就很高,但如果我們提供了一個事先有500個聲優的聲音模型的SaaS后臺,那公司一個人就能用至少500種音色配音了。就能節省很多成本。后續我還想把聲音引擎做成一個API,賣給有很多語音交互的游戲,社交,甚至元宇宙社交軟件,或者直接找RTC廠商合作。

不止線上劇本殺

Q:外界許多報道會把格子互動定義為“線上劇本殺”創業公司,你覺得這個定義是正確的嗎?

A:最早也許是,但我們一直在快速迭代。我對格子互動的要求是“持續地小步快跑”,所以為了達到這個要求,我覺得要有兩個東西,一是要有持續跑的明確方向,二是跑道也要不錯。我們的方向很明確,要打造屬于未來的聲音引擎。

HALO劇本殺就是一個很好跑道和試驗田,讓我們把所有的最新的聲音玩法,也就是最新的聲音技術用到跑道上去。為什么我強調HALO劇本殺是“很好”的,有以下兩個原因:

首先HALO是一個有穩定收入的App,一個月能有幾百萬元的營收,這意味著通過HALO,我們可以擁有自負盈虧的能力。其次,HALO劇本殺也不斷地在給我們積累大量的聲音資源,提升對于優質聲音的認知,完善聲音和場景的匹配邏輯。通過招募劇本殺DM,我們也能持續發現優秀、有潛力的聲源。如此往復,就形成了從應用場景產生資源,從資源形成工具,再從工具滿足應用場景需求的向上飛輪。所以,我們在做線上劇本殺,但又不至于如此而已。

HALO劇本殺

Q:你會把公司定義為元宇宙公司嗎?未來有怎樣的玩法?

A:會。之前我就表達了,創業的初期我們就是按照元宇宙來的,只是我對元宇宙的理解更偏向于體驗層面,聲音的加入會讓你的體驗更加豐富更好玩。雖然我們的元宇宙好像修煉法門和別人不大一樣,但內核和目標是一致的。

HALO劇本殺本身就是一種元宇宙的探索。當初我們在討論要做如何的產品和面向什么樣人群的時候,首先瞄準了和我們自己一樣的95后、00后人群。就好像我本人一樣,是社交需求和社恐的矛盾結合體,一方面喜歡劇本殺這種新鮮的內容社交方式,但同時面對陌生人又會產生社交壓力。

元宇宙在我看來,撇開技術和概念,至少要實現用戶心理的2個核心需求,一個是我在元宇宙干嘛,另外一個是我在元宇宙里是誰。而劇本殺提供的元宇宙的社交內容,你是來沉浸故事的,是來扮演角色的,是來和其他“角色”互動和社交的,我們在一個個故事里體驗“自己”,帶入感受,延展“劇情”。而聲音,可以幫助你更好的進入“角色”,不會因為一個很不匹配角色的聲線而出戲,不會因為自己的聲音沒有別人動聽而產生壓力。“劇本殺+聲音”的產品特色,讓人擁有更多遐想的空間,真正做到100個演員就有100個哈姆雷特的效果,這可能是我們切入元宇宙的一個小入口。

未來我也計劃把聲音引擎和NFT相結合。比如你做了一個API,別人訪問是需要有Token的,比如我做了某個明星的聲音“皮膚”,面向公眾我只發行100個Token,那就只有100個人擁有這個API,這個邏輯是能夠跑通的。

Q:你會怎么評價目前公司的效益?比如HALO劇本殺的DAU。

A:可能一個純toC的產品會用DAU,但我們有平臺屬性,作為垂直賽道,既然主導用戶體驗,那用戶忠誠度和付費意愿對我們來說更重要,所以我們核心是看ARPU值。如果ARPU值足夠高,或者在持續提升,說明用戶對平臺就有多認可。這個指標能說明我們做的是件對了的,有價值且可持續的事。

Q:現在還有繼續接觸資本嗎?未來的融資計劃是怎樣的?

A:現在持續都有資本來接觸我,我覺得這也是對項目的一種肯定。我們不會說想要急于融資,但也不會刻意去定義一個節奏。

Q:有考慮過如何規避變聲帶來的法律和倫理風險嗎?

A:我們先不想這么長遠,創業公司來不及顧慮太多!

我覺得這就和自動駕駛一樣,肯定是先把技術跑通,再解決倫理的問題。等到技術跑通的時候,也許就能成長為一家超級牛的公司了。

相關文章
美女网站色