文生視頻落地加速,用AI生成虛擬人視頻只需百元了
分類: 最新資訊
簽名詞典
編輯 : 簽名大全
發(fā)布 : 03-28
閱讀 :389
界面新聞記者 | 佘曉晨界面新聞編輯 | 劉方遠自AI爆火以來,技術(shù)取代人類勞動力的討論就不絕于耳。如今這樣的現(xiàn)實確實在發(fā)生——企業(yè)用一套AI工具生成3D虛擬人視頻,比采用人工制作的成本要低上20倍。實踐者之一來自于金融行業(yè)。東吳證券每天需要更新大量資訊類視頻,平均每天產(chǎn)出一條熱門板塊點評、大盤回顧、財經(jīng)早報等等。類比同類券商,其使用模版的價格達到平均每條2000元,定制一條則需2到3萬元。使用魔琺科技的文生視頻產(chǎn)品“有言”后,東吳證券生產(chǎn)一條2分鐘的視頻,成本可以降到百元左右。 圖片來源:截取自東吳證券產(chǎn)品發(fā)布視頻在一些公司喊出“追趕Sora”的口號時,另一些從應用出發(fā)做產(chǎn)品的國內(nèi)公司,開始探索自己的AIGC路徑,上述案例就此誕生。魔琺科技專注于3D虛擬人業(yè)務,超寫實國風虛擬人“翎Ling”就出自該公司之手。公司創(chuàng)始人兼CEO柴金祥畢業(yè)于美國卡內(nèi)基梅隆大學人工智能&機器人學專業(yè),是計算機視覺、計算機圖形學以及智能交互領域的專家。此前魔琺科技已經(jīng)搭建了3D虛擬人AIGC開放平臺,今年3月,公司正式發(fā)布原生3D內(nèi)容AIGC產(chǎn)品“有言”。“有言”產(chǎn)出3D視頻的流程是生成內(nèi)容、編輯鏡頭和視頻包裝,通過AI手段,做到一鍵輸出三維動畫、三維超寫實形象、三維運鏡和聲音等。據(jù)公司向界面新聞介紹,截至目前,該產(chǎn)品已積累了近50家公司的落地案例。企業(yè)用“有言”來生產(chǎn)虛擬人視頻的需求集中在營銷、培訓等不同的場景,但核心的訴求都圍繞“降本增效”。例如東吳證券,除了用“有言”生產(chǎn)資訊播報類視頻之外,還會在線下活動中使用3D虛擬人視頻進行技術(shù)發(fā)布和路演,在提升宣傳效果的同時,節(jié)省人工拍攝和準備的成本。事實上,“有言”代表了一類國內(nèi)科技公司探尋技術(shù)應用的方式:做低門檻產(chǎn)品,優(yōu)先注重落地和可上手。而在文生視頻領域,這和Sora的探索屬于不同的路徑。柴金祥在接受界面新聞等媒體采訪時表示,有言主打的是高效率、低門檻,希望在信息傳達類場景中落地,例如產(chǎn)品發(fā)布、品牌宣傳、新聞播報。其技術(shù)路徑是AI生成3D內(nèi)容,通過引擎的方式渲染出視頻。而Stable Diffusion、Runway、Pika和Sora屬于另一類AI文生視頻產(chǎn)品:用大量的視頻數(shù)據(jù)訓練大模型。Sora面世之時,行業(yè)對其的討論就包含了應用上的質(zhì)疑——它離真正的商業(yè)化落地還有些距離。浙商證券也在研報中提出,對于業(yè)態(tài)更加復雜的長視頻和游戲,受限于模型還無法準確理解因果關(guān)系及其他技術(shù)難點,現(xiàn)階段Sora及同類產(chǎn)品或以提供美術(shù)靈感支持為主。 柴金祥解釋稱,Sora在一定程度上解決了時空的一致性,并且在時長上有了較大提升,但它走2D視頻生成路線,更適合創(chuàng)意類視頻生成,不適合“高信息密度”以及“內(nèi)容需要精準控制”的視頻內(nèi)容。這是“有言”希望填補的場景。而在具體實踐中,有言的能力和當下企業(yè)的使用場景是否適配?事實上,自虛擬人火爆之后,企業(yè)使用產(chǎn)品自己生成虛擬人視頻的需求就一直存在,畢竟定制一個虛擬人需要付出的成本極高——根據(jù)不同的精細程度,需要花費幾萬到幾十萬不等的價格。但過去的數(shù)據(jù)和技術(shù)能力不足。做超寫實虛擬人時,魔琺科技服務了幾百家B端(企業(yè))客戶,公司在這一過程中積累大量3D數(shù)據(jù),憑借此逐步開發(fā)出AIGC產(chǎn)品,產(chǎn)出質(zhì)量也有所提升。“坦白說,我們以前用純手工做的,還沒有現(xiàn)在AIGC的效果好。”柴金祥稱。 目前,“有言”的應用集中在金融證券、3C家電、美妝快消和廣電領域。對虛擬人視頻的需求相對簡單和規(guī)范化的客戶,更愿意買單。以海爾集團為例,過往企業(yè)采用圖文剪輯或者真人拍攝的形式制作不同類型的視頻,現(xiàn)在可以實現(xiàn)平均每天生產(chǎn)30多條視頻,用于經(jīng)銷商培訓、產(chǎn)品介紹等。美妝品牌自然堂使用“有言”生產(chǎn)大量種草視頻、產(chǎn)品講解視頻以及內(nèi)部培訓視頻,使用產(chǎn)品2周多,各部門的視頻生產(chǎn)量達到數(shù)百支。回到文生視頻的大賽道上,其落地的潛力已經(jīng)為外界認可。中信證券在研報中指出,在生成式AI的諸多發(fā)展方向中,文生圖、文生視頻有望率先迎來商業(yè)化落地。根據(jù)華泰證券研報,2023年實際誕生文生視頻大模型達到數(shù)十個,全球用戶數(shù)量超過百萬級別。這讓市場競爭變得集中而激烈。國內(nèi)公司多數(shù)在B端進行文生視頻的商業(yè)化嘗試,探索落地可能性。已在軟件上布局的公司早就聞風而動,3月以來,一眾創(chuàng)業(yè)公司也陸續(xù)收獲融資。但這些公司亦有不同的發(fā)力方向。如A股上市公司萬興科技瞄準泛娛樂垂直市場,發(fā)布的產(chǎn)品包含文生視頻、視頻AI配樂等,核心是以音視頻生成式AI技術(shù)為基礎的多媒體創(chuàng)作垂類大模型,落地領域集中在游戲和影視行業(yè),將產(chǎn)品提供給B端企業(yè)。創(chuàng)業(yè)公司也有各自的選擇。文生視頻AI公司愛詩科技在3月完成億元級人民幣A1輪融資,主要研發(fā)視頻大模型和國民級AI應用,大規(guī)模的C端(消費者)應用是其努力的方向。在3月12日完成新一輪數(shù)億元融資的生數(shù)科技則用“兩條腿走路”,一方面以API的形式向B端提供模型能力,另一方面也研發(fā)垂類應用產(chǎn)品,以訂閱等形式推出AIGC平臺。在推出B端服務后,今年魔琺科技同樣要在“有言”的C端版本上加大投入。長期來看,這些產(chǎn)品要面臨的共同難題是盈利。即使上述路徑已經(jīng)有明確的落地案例,什么樣的產(chǎn)品會最先成為商業(yè)化的排頭兵,答案還未清晰。柴金祥認為,到了產(chǎn)品化的階段,所有的成本就是GPU的成本,無論服務C端消費者還是B端企業(yè)都一樣。因此他認為,對所有的科技企業(yè)來說,最重要的是找到PMF(Product Market Fit,產(chǎn)品市場匹配度)和產(chǎn)品壁壘。