數(shù)字人主播退潮了?
數(shù)字人主播的贏利邏輯和真人主播已十分不同,使用者大多不太期待直播間產(chǎn)生實際的成交額,而是看重平臺露出價值
數(shù)字人主播熱潮漸退,這是件好事,行業(yè)發(fā)展像大浪淘沙,核心技術(shù)、研發(fā)實力被留下,蹭熱點、掙快錢的投機者終將被淘汰
今年上半年,直播行業(yè)里,數(shù)字人主播一度火爆。不過才短短半年,這股熱乎勁已有些退去了。
童寧就職于杭州一家電商服務公司。今年3月,公司入局數(shù)字人主播業(yè)務,招聘了十多位技術(shù)人員進行研發(fā)攻關(guān),級別最高的技術(shù)負責人每月底薪4萬元。資本市場反饋積極,靠著這項新業(yè)務,今年5月和7月,公司分別獲得一輪百萬元融資,數(shù)字人主播產(chǎn)品賣得也好,每月入賬幾千萬元。最興旺的時候,公司共有100多名員工。
10月之后,情況急轉(zhuǎn)直下。不僅產(chǎn)品賣不動,融資也困難重重。此前高薪聘請的研發(fā)人員都離職了,技術(shù)部門僅剩2人,只負責系統(tǒng)維護,不再迭代更新,公司目前不到40名員工,幾乎全是運營人員。
主播這碗飯,數(shù)字人能吃得上嗎?
市場機會
一臺電腦和一套軟件設備,便能打造全天候直播的數(shù)字人直播間——其內(nèi)核是人工智能技術(shù),通過采集真人的圖像、聲音,經(jīng)過機器學習,制作數(shù)字人形象,再在相關(guān)設備輸入文本話術(shù),利用唇形驅(qū)動、動作驅(qū)動等算法,生成有表情、有動作、能實時互動的數(shù)字人主播。
記者找到了幾位數(shù)字人主播的使用者,咨詢感受。一位直播運營吐槽,“沒啥用,一看就是假人,開播后直播間根本沒流量。”也有人對數(shù)字人本就期待不高,“錦上添花,能曝光就行。”記者特意找了幾個虛擬直播間,數(shù)字人主播的講解一刻不停,停留在直播間的粉絲卻只有個位數(shù)。
既然效果平平,帶貨成績不佳,為何要用數(shù)字人直播?
嚴希是數(shù)字人的銷售代理,之前,她做過兩年主播。“帶貨主播根本就不能做。”嚴希說,她兩年掙了60萬元,收入可觀,代價也大,“聲音都是嘶啞的,每天含潤喉糖,嗓子恢復不過來,容易發(fā)炎感冒。”
嚴希的老家在江蘇連云港,那里有全國最大的水晶市場。“那個樓有四層,最上面一層是電商基地,全都是直播間。”2021年,直播間開播,除了主播嚴希,還有配合話術(shù)的副播和觀察數(shù)據(jù)的運營。直播間主要賣鐲子,嚴希用燈照著講解成色和圈號,有時得演戲,模仿實際的柜臺情況,有人來看貨還價,再發(fā)生爭吵。
“壓力很大。”嚴希說,“說話速度必須要練出來,別人進入直播間三五秒,還不知道你在干嗎,肯定劃走了,老板砸錢買了200個人進場,主播留不住其中50個,會被扣工資。”直播間突發(fā)狀況也要趕緊解決,聲卡沒聲音了,電腦沒電了,鐲子一下沒拿住從手里滑出去掉在地上,都可能導致卡頓、斷播。
后來,嚴希到浙江平湖做主播,開始賣課程。“晚上8點之后,大主播進場,小直播間沒流量,等到次日凌晨1點,大主播全部下播,我們再開始賣情感類和勵志類課程,一般會播到天亮。”嚴希說,“只有這個時間段,小主播才有機會。”
直播間地方很大,一邊放直播設備,另一邊就是高低床,3位主播輪流播,輪流休息。其他人播到規(guī)定時長,或者堅持不了了,趕緊由下一位主播補上,“冬天起來冷颼颼的,雞也沒叫,鳥也沒叫,就得上播。”
直播越來越難做了,這是行業(yè)共識。彭瑞所在的公司原本以直播運營為主要業(yè)務,“前期投入巨大,且很難贏利。”幾百元的東西免費送,戒指賣一分錢,面膜賣一角錢,售出價格連包裝成本都不夠,起號階段,公司每個月只在貨品上就要虧十幾萬元。
另外,主播狀態(tài)不穩(wěn)定,流動性大,“今天有事不來了,明天身體不舒服,后天可能被其他公司挖走了。”彭瑞說,換主播會對直播間流量產(chǎn)生非常糟糕的影響。
數(shù)字人主播能解決很多問題。比如,不再搭建真實直播間,節(jié)省設備費用;不再需要雇用主播,節(jié)省人力成本;且數(shù)字人每天24小時開播,不眠不休,狀態(tài)穩(wěn)定。
至于帶貨效果,大家也都心知肚明,自然和真人主播沒法比,“但要算的是投入產(chǎn)出比。”童寧算了一筆賬:目前市場主流的數(shù)字人主播產(chǎn)品售價為2萬元左右,一年內(nèi)不限時長使用,每個月平均不到2000元,每天直播24小時;在杭州,真人主播每月工資起碼1萬元,2位主播輪流,每天開播16個小時,每月就要2萬元。
“真人主播成本是數(shù)字人的20倍,帶貨效果能差上20倍嗎?大概率不能。”童寧說,這便是數(shù)字人主播的市場機會。
賺錢門路
去年10月,南京一家科技企業(yè)硅基智能賣出第一個數(shù)字人直播間,到現(xiàn)在為止,售出數(shù)量已超過5萬。而行業(yè)內(nèi)少說有幾百家數(shù)字人公司,虛擬主播的數(shù)量可想而知。
不過,數(shù)字人主播誕生剛滿一年,行業(yè)發(fā)展良莠不齊。
在電商平臺上,搜索關(guān)鍵詞“數(shù)字人主播”,單價普遍顯示在100元上下,甚至1.5元便可不限時使用數(shù)字人。不少商家把數(shù)字人買回去直播,叫苦連天,沒播多長時間便被封號。“封號是因為數(shù)字人形象重復。”彭瑞說,廠家1個系統(tǒng)中的10個數(shù)字人賣給100個客戶,被平臺識別出來,涉嫌公共形象混淆。
嚴希把她代理的數(shù)字人產(chǎn)品擺在記者面前——4980元就能定制1個克隆數(shù)字人;購買29800元的產(chǎn)品,能定制7個克隆數(shù)字人,并成為城市合伙人,也就是銷售代理;而9.8萬元便可開一家分公司,成為所謂的源頭廠家。
10萬元甚至無法加盟一家連鎖小吃店。現(xiàn)在,不到10萬元,就能成立一家人工智能領域的科技公司。
低成本吸引了很多人。據(jù)童寧觀察,今年上半年,購買數(shù)字人主播的用戶中,很大一部分是互聯(lián)網(wǎng)投機者。投機者們四處找項目,主要做“倒賣”生意,每隔幾天便舉辦所謂的沙龍,或者大會,在會上宣講銷售,賺取批發(fā)和零售之間的差價。入局者多了,想真正買來直播的商家難以辨別好壞真?zhèn)危袠I(yè)名聲也走下坡路。
數(shù)字人主播問世時,的確是種科技產(chǎn)品。硅基智能是行業(yè)龍頭,也是最早將數(shù)字人技術(shù)落地直播間的公司之一。業(yè)務發(fā)展初期,推廣團隊聯(lián)系各類博主推薦數(shù)字人產(chǎn)品,吃了不少閉門羹,即便提出免費使用,愿意嘗試者仍是寥寥無幾。
直到去年11月,ChatGPT出現(xiàn),人機互動效果令人驚嘆,這也讓人們認識到數(shù)字人的可能性。后來,財經(jīng)博主劉潤在他的年度演講中推薦數(shù)字人主播,他后續(xù)的短視頻作品中,很多都標注了“本視頻部分畫面使用AI技術(shù)制作”,說明視頻中出鏡的形象,是他的克隆數(shù)字人。
今年初,賣券直播間大量出現(xiàn),在本地生活、旅游娛樂等領域,銷售代金券、折扣券或門票,數(shù)字人很合適,表達內(nèi)容重復,互動性低,不需要處理物流問題。直播逐漸出成績,幾場成交額破萬元甚至10萬元的數(shù)字人直播在行業(yè)內(nèi)廣為流傳。
既降本又提效,人們覺得這個方法可行,蜂擁而上。同一時間,彭瑞所在的直播運營公司轉(zhuǎn)型,成為傳媒科技公司,“投入成本很高,英偉達A100的顯卡,13萬元一張,買了將近200張;每個月給研發(fā)人員開工資將近80萬元。”
在童寧看來,真人克隆的技術(shù)入行門檻不高。“海外都能找到源代碼,聘請一些技術(shù)人員,從網(wǎng)站上扒下來,再進行二次加工,只不過有些人加工得比較精細,有些人加工得粗糙。”今年3月,他所在的電商服務公司開辟數(shù)字人主播業(yè)務,“形象克隆,聲音克隆,都有科研人員在各自領域研究突破,把好的技術(shù)購買來用就行了,大家都在做組裝的事,然后貼自己的品牌。”
今年4月,投入超過500萬元后,數(shù)字人主播產(chǎn)品相對成熟,彭瑞也開始對外輸出技術(shù),“貼牌模式,客戶直接采購技術(shù),在銷售時可以說是自己研發(fā),同樣做一家科技公司。”他補充說,“這是軟件行業(yè)普遍的玩法。”
短時間內(nèi),很多家數(shù)字人公司涌了出來。直播運營公司或者達人孵化公司紛紛成立技術(shù)部門,聘請一些技術(shù)人員,一兩個月便能開發(fā)出來。“對數(shù)字人在技術(shù)層面要求不高,能用就行。”童寧說,目前數(shù)字人形象相對固定,只有站姿和坐姿,動作幅度也有限,“從1.0到2.0需要很大投入,這項工作不是我們這樣拿了幾百萬元融資的公司能做的。”
數(shù)字人產(chǎn)品之間的競爭脫離技術(shù)范疇,開始“卷”運營模式,這是各類直播公司的老本行。“工具用得好不好,能不能適配各類平臺,落地運營的贏利板塊是什么,需要廣大從業(yè)者創(chuàng)造。”彭瑞接觸的客戶中,有人建了170個數(shù)字人本地生活賣券直播間,把直播間的鏈接作為廣告位賣給實體商戶;還有客戶是本地裝修公司,為了抓住同城流量,分區(qū)建立數(shù)字人直播間,每天獲客十幾條。
嚴希在直播平臺刷到過一個數(shù)字人直播間,賣網(wǎng)絡設備,數(shù)字人主播旁邊還坐了一位真人助播,“我在評論里留言問價格,小伙子看到問題,好像按了個按鈕,數(shù)字人一下就不說話了,他回答我的問題,我們的互動結(jié)束后,數(shù)字人繼續(xù)直播,小伙子在一邊坐著玩手機。”嚴希評價,“多么省力,這是大勢所趨。”
至此,數(shù)字人主播的贏利邏輯和真人主播已十分不同,使用者大多不太期待直播間產(chǎn)生實際的成交額,而是看重平臺露出價值。畢竟在直播平臺上爭奪流量愈發(fā)艱難,增加直播間數(shù)量、拉長直播時間或許有機會,數(shù)字人能成為不錯的幫手。
“千人千面”
面對現(xiàn)在的行業(yè)情況,硅基智能首席技術(shù)官林會杰有心理準備。2017年,硅基智能推出AI電話機器人,提高人工客服打電話的工作效率。隨著應用逐漸成熟,騷擾電話甚至電信詐騙也用上了這項技術(shù)。
“無論是電話機器人還是數(shù)字人主播,都只是為人服務的一種工具。”林會杰說。最近數(shù)字人主播熱潮漸退,這是件好事,行業(yè)發(fā)展像大浪淘沙,核心技術(shù)、研發(fā)實力被留下,蹭熱點、掙快錢的投機者終將被淘汰。
數(shù)字人主播只是人工智能領域?qū)崿F(xiàn)商業(yè)化應用的一個案例。“技術(shù)本身不算新鮮。”林會杰說。2008年,他還在讀大學時,便在實驗室里嘗試人機語音交互,“輸入一張照片,合成面部說話時的口型、眼部動作和表情。”2010年前后,實驗室研發(fā)出一款產(chǎn)品,叫“小黃雞”,在校園網(wǎng)上線,可以調(diào)教它,再讓它去跟別人對話。
實驗室還研發(fā)了一款3D建模的數(shù)字人形象,取名“晶晶”,起初是半身模型,后來拓展到全身。通過合作項目,“晶晶”去了企業(yè)成為前臺接待,能和來訪者對話,介紹公司情況,還去過旅游景區(qū),成為導游,承擔景點講解和指路引路的任務。
“人工智能的技術(shù)已經(jīng)出現(xiàn)70多年了,上世紀六七十年代,人們便開始用計算機合成語音、合成圖像,只不過技術(shù)的精細程度不夠,聲音機械,面部表情呆滯。”林會杰說。這些年,技術(shù)發(fā)展明顯加速:2007年,siri人機語音交互出現(xiàn);2016年,“小愛同學”“小度”出現(xiàn);同年,AlphaGo大戰(zhàn)圍棋冠軍李世石引發(fā)全球關(guān)注;2019年,機器人翻譯能生成有表現(xiàn)力的答案……非常明顯,幾乎每隔幾年便有新的代表性產(chǎn)品誕生。
“現(xiàn)在的技術(shù)和十多年前的技術(shù)相比,另外加入了深度學習的部分,整體方向上沒有太大變化。”林會杰說,技術(shù)之外,人工智能正在尋找相應的商業(yè)閉環(huán),把人機對話的能力轉(zhuǎn)化為能夠?qū)θ祟惿鐣?chuàng)造價值的能力,這和技術(shù)進步本身同樣關(guān)鍵。
硅基智能仍是創(chuàng)業(yè)型科技企業(yè)的模樣——公司研發(fā)人員占比70%以上,為了保密,即使在內(nèi)部系統(tǒng)中也看不到具體人員名單,連林會杰入職都以半秘密的形式進行;林會杰的辦公室布置十分簡單,接待來訪者的椅子甚至型號不一,兩塊能寫能畫的白板占去大部分空間;他和記者約了下午5點的采訪,辦公桌上擺著一份盒飯,那是他的晚飯。
林會杰仍在推進的工作是數(shù)字人的“千人千面”,不僅電商主播,數(shù)字人可以扮演各種角色,“適應不同場景,不同年齡,不同性別,不同地域,數(shù)字人的形象也應當有差別,比如,新聞播報和知識分享,風格就十分不同。”若要實現(xiàn),聲音克隆的音色要舒適清晰,表達抑揚頓挫,肢體動作和面部表情得真實流暢,聲音和畫面也需要一致協(xié)同,配合自然。
除了豐富場景,還要提高效率。以前制作一個數(shù)字人的時間以“月”為單位,后來壓縮到“周”,現(xiàn)在是“天”,進一步壓縮到幾個小時,或者幾分鐘;以前運營一個數(shù)字人需要一臺價值百萬元的服務器,現(xiàn)在一臺普通的電腦,甚至一部手機就可以。
企業(yè)都有更大的野心。硅基智能喊出口號,提供1億個硅基勞動力,讓人回歸人的價值。童寧和彭瑞已經(jīng)決定轉(zhuǎn)型,或者說是升級,從以真人形象為主的2D克隆數(shù)字人,轉(zhuǎn)變?yōu)樯a(chǎn)超寫實形象的3D動畫建模數(shù)字人。剛結(jié)束不久的杭州亞運會上,開幕式和閉幕式出現(xiàn)的數(shù)字人火炬手,便可算在3D數(shù)字人之列。“推出3D形象數(shù)字人,打造成知名博主,切入元宇宙賽道,短視頻或開直播變現(xiàn),搭一個虛擬直播間,照樣賣貨。”彭瑞說。(記者:鞏持平 來源:解放日報)