文生視頻落地加速，用AI生成虛擬人視頻只需百元了

分類: 最新資訊 簽名詞典 編輯 : 簽名大全發(fā)布 : 03-28

閱讀 :389

界面新聞記者 | 佘曉晨界面新聞編輯 | 劉方遠自AI爆火以來，技術(shù)取代人類勞動力的討論就不絕于耳。如今這樣的現(xiàn)實確實在發(fā)生——企業(yè)用一套AI工具生成3D虛擬人視頻，比采用人工制作的成本要低上20倍。實踐者之一來自于金融行業(yè)。東吳證券每天需要更新大量資訊類視頻，平均每天產(chǎn)出一條熱門板塊點評、大盤回顧、財經(jīng)早報等等。類比同類券商，其使用模版的價格達到平均每條2000元，定制一條則需2到3萬元。使用魔琺科技的文生視頻產(chǎn)品“有言”后，東吳證券生產(chǎn)一條2分鐘的視頻，成本可以降到百元左右。圖片來源：截取自東吳證券產(chǎn)品發(fā)布視頻在一些公司喊出“追趕Sora”的口號時，另一些從應用出發(fā)做產(chǎn)品的國內(nèi)公司，開始探索自己的AIGC路徑，上述案例就此誕生。魔琺科技專注于3D虛擬人業(yè)務，超寫實國風虛擬人“翎Ling”就出自該公司之手。公司創(chuàng)始人兼CEO柴金祥畢業(yè)于美國卡內(nèi)基梅隆大學人工智能&機器人學專業(yè)，是計算機視覺、計算機圖形學以及智能交互領域的專家。此前魔琺科技已經(jīng)搭建了3D虛擬人AIGC開放平臺，今年3月，公司正式發(fā)布原生3D內(nèi)容AIGC產(chǎn)品“有言”。“有言”產(chǎn)出3D視頻的流程是生成內(nèi)容、編輯鏡頭和視頻包裝，通過AI手段，做到一鍵輸出三維動畫、三維超寫實形象、三維運鏡和聲音等。據(jù)公司向界面新聞介紹，截至目前，該產(chǎn)品已積累了近50家公司的落地案例。企業(yè)用“有言”來生產(chǎn)虛擬人視頻的需求集中在營銷、培訓等不同的場景，但核心的訴求都圍繞“降本增效”。例如東吳證券，除了用“有言”生產(chǎn)資訊播報類視頻之外，還會在線下活動中使用3D虛擬人視頻進行技術(shù)發(fā)布和路演，在提升宣傳效果的同時，節(jié)省人工拍攝和準備的成本。事實上，“有言”代表了一類國內(nèi)科技公司探尋技術(shù)應用的方式：做低門檻產(chǎn)品，優(yōu)先注重落地和可上手。而在文生視頻領域，這和Sora的探索屬于不同的路徑。柴金祥在接受界面新聞等媒體采訪時表示，有言主打的是高效率、低門檻，希望在信息傳達類場景中落地，例如產(chǎn)品發(fā)布、品牌宣傳、新聞播報。其技術(shù)路徑是AI生成3D內(nèi)容，通過引擎的方式渲染出視頻。而Stable Diffusion、Runway、Pika和Sora屬于另一類AI文生視頻產(chǎn)品：用大量的視頻數(shù)據(jù)訓練大模型。Sora面世之時，行業(yè)對其的討論就包含了應用上的質(zhì)疑——它離真正的商業(yè)化落地還有些距離。浙商證券也在研報中提出，對于業(yè)態(tài)更加復雜的長視頻和游戲，受限于模型還無法準確理解因果關(guān)系及其他技術(shù)難點，現(xiàn)階段Sora及同類產(chǎn)品或以提供美術(shù)靈感支持為主。柴金祥解釋稱，Sora在一定程度上解決了時空的一致性，并且在時長上有了較大提升，但它走2D視頻生成路線，更適合創(chuàng)意類視頻生成，不適合“高信息密度”以及“內(nèi)容需要精準控制”的視頻內(nèi)容。這是“有言”希望填補的場景。而在具體實踐中，有言的能力和當下企業(yè)的使用場景是否適配？事實上，自虛擬人火爆之后，企業(yè)使用產(chǎn)品自己生成虛擬人視頻的需求就一直存在，畢竟定制一個虛擬人需要付出的成本極高——根據(jù)不同的精細程度，需要花費幾萬到幾十萬不等的價格。但過去的數(shù)據(jù)和技術(shù)能力不足。做超寫實虛擬人時，魔琺科技服務了幾百家B端（企業(yè)）客戶，公司在這一過程中積累大量3D數(shù)據(jù)，憑借此逐步開發(fā)出AIGC產(chǎn)品，產(chǎn)出質(zhì)量也有所提升。“坦白說，我們以前用純手工做的，還沒有現(xiàn)在AIGC的效果好。”柴金祥稱。目前，“有言”的應用集中在金融證券、3C家電、美妝快消和廣電領域。對虛擬人視頻的需求相對簡單和規(guī)范化的客戶，更愿意買單。以海爾集團為例，過往企業(yè)采用圖文剪輯或者真人拍攝的形式制作不同類型的視頻，現(xiàn)在可以實現(xiàn)平均每天生產(chǎn)30多條視頻，用于經(jīng)銷商培訓、產(chǎn)品介紹等。美妝品牌自然堂使用“有言”生產(chǎn)大量種草視頻、產(chǎn)品講解視頻以及內(nèi)部培訓視頻，使用產(chǎn)品2周多，各部門的視頻生產(chǎn)量達到數(shù)百支。回到文生視頻的大賽道上，其落地的潛力已經(jīng)為外界認可。中信證券在研報中指出，在生成式AI的諸多發(fā)展方向中，文生圖、文生視頻有望率先迎來商業(yè)化落地。根據(jù)華泰證券研報，2023年實際誕生文生視頻大模型達到數(shù)十個，全球用戶數(shù)量超過百萬級別。這讓市場競爭變得集中而激烈。國內(nèi)公司多數(shù)在B端進行文生視頻的商業(yè)化嘗試，探索落地可能性。已在軟件上布局的公司早就聞風而動，3月以來，一眾創(chuàng)業(yè)公司也陸續(xù)收獲融資。但這些公司亦有不同的發(fā)力方向。如A股上市公司萬興科技瞄準泛娛樂垂直市場，發(fā)布的產(chǎn)品包含文生視頻、視頻AI配樂等，核心是以音視頻生成式AI技術(shù)為基礎的多媒體創(chuàng)作垂類大模型，落地領域集中在游戲和影視行業(yè)，將產(chǎn)品提供給B端企業(yè)。創(chuàng)業(yè)公司也有各自的選擇。文生視頻AI公司愛詩科技在3月完成億元級人民幣A1輪融資，主要研發(fā)視頻大模型和國民級AI應用，大規(guī)模的C端（消費者）應用是其努力的方向。在3月12日完成新一輪數(shù)億元融資的生數(shù)科技則用“兩條腿走路”，一方面以API的形式向B端提供模型能力，另一方面也研發(fā)垂類應用產(chǎn)品，以訂閱等形式推出AIGC平臺。在推出B端服務后，今年魔琺科技同樣要在“有言”的C端版本上加大投入。長期來看，這些產(chǎn)品要面臨的共同難題是盈利。即使上述路徑已經(jīng)有明確的落地案例，什么樣的產(chǎn)品會最先成為商業(yè)化的排頭兵，答案還未清晰。柴金祥認為，到了產(chǎn)品化的階段，所有的成本就是GPU的成本，無論服務C端消費者還是B端企業(yè)都一樣。因此他認為，對所有的科技企業(yè)來說，最重要的是找到PMF（Product Market Fit，產(chǎn)品市場匹配度）和產(chǎn)品壁壘。

標簽 : 最新資訊 03-28

下一篇:汽車智能化下半場換擋提速：車企搶灘AI大模型，誰先突圍？下一篇 【方向鍵 ( → )下一篇】

上一篇:專訪｜張偉潮：最年輕的龍頭專職制造者上一篇 【方向鍵 ( ← )上一篇】

欄目列表

最新資訊最新推文最新資訊

欧美福利第一页-欧美福利视频-欧美福利视频网站-欧美福利网-国产福利不卡-国产福利二区

最新資訊

文生視頻落地加速，用AI生成虛擬人視頻只需百元了

欄目列表

相關(guān)簽名

最新簽名