當前位置：首頁 > 科技 > 資訊

高擬真數(shù)字人直播帶貨有多強

來源：責編：時間：2025-11-11 09:20:44 9觀看

導讀　　當直播時長逼近6個小時、大多數(shù)電商主播顯露疲態(tài)時，直播間里的主播仍然可以情緒飽滿地回答觀眾提問，時不時還能講兩句“段子”，吸引觀眾下單。　　隨著人工智能技術快速發(fā)展，大模型向多模態(tài)加速演進，數(shù)字人成為融合大

　　當直播時長逼近6個小時、大多數(shù)電商主播顯露疲態(tài)時，直播間里的主播仍然可以情緒飽滿地回答觀眾提問，時不時還能講兩句“段子”，吸引觀眾下單。

　　隨著人工智能技術快速發(fā)展，大模型向多模態(tài)加速演進，數(shù)字人成為融合大語言模型與多模態(tài)技術的創(chuàng)新應用，電商直播是數(shù)字人落地的極佳場景。數(shù)字人技術使商家無需投入大量人力、物力進行現(xiàn)場直播，能顯著降低場地租賃、設備采購、人員培訓等費用。同時，數(shù)字人可以24小時不間斷直播，進一步增加商品曝光時間和銷售機會，提升經濟效益。

　　但傳統(tǒng)數(shù)字人生成技術常面臨語音、語言、視覺多模態(tài)割裂的問題，表現(xiàn)為臺詞生硬、語音語調與臺詞情感匹配不佳、表情手勢單一等。百度首席技術官王海峰說，針對數(shù)字人應用痛點，百度創(chuàng)新研發(fā)了劇本驅動多模協(xié)同的高擬真數(shù)字人技術。

　　劇本的基礎是臺詞。臺詞生成不僅是內容輸出，還要貼合主播人設與語言風格，確保語言表達的個性化與一致性；在多主播場景中，還需實現(xiàn)語義邏輯、語調節(jié)奏和情感風格的整體協(xié)調。同時，為提升臺詞的內容深度，還要引入內容規(guī)劃、知識增強與事實校驗機制，以降低人工智能幻覺風險。基于臺詞，大模型可以直接生成一份數(shù)字人直播劇本。劇本自帶“視覺標簽”和“語音標簽”，它能夠告訴系統(tǒng)，對應臺詞人物要做出哪些動作。

　　互動性強是電商直播場景的一大特點。在與觀眾互動過程中，語音合成的自然度是決定用戶沉浸感的關鍵因素。觀眾希望聽到主播有情緒、有起伏的聲音，而不是生硬機械的朗讀。王海峰介紹，針對這一需求，百度提出了“文本自控的語音合成”方案。文本自控的語音合成大模型不僅具備高復原的語音合成能力，還能夠結合直播臺詞及主播個人特征，把這些文本內容轉化為自然、有感染力的聲音，讓數(shù)字人不僅能發(fā)出聲音，更能精準傳遞出調侃、得意、強調等細微情緒。

　　除了要和用戶交互，數(shù)字人主播在直播時還要與商品和所在空間進行符合物理邏輯的互動。如何做到這一點？高一致性超擬真數(shù)字人長視頻生成技術，能對輸入的歷史視頻數(shù)據(jù)、劇本腳本、語音信息以及骨骼驅動等多模態(tài)信號進行分析與理解，并基于此分別生成高表現(xiàn)力片段、復雜“人—物—場”交互片段以及大動作大表情片段。系統(tǒng)能夠對這些片段在較長時間跨度上進行統(tǒng)一調度，確保語音、口型、表情與動作始終保持高度一致且同步。

　　如今，數(shù)字人正逐漸從實驗室走向各類應用場景，商業(yè)化進程顯著加快。可以預見，隨著深度思考、多模態(tài)交互等關鍵能力的躍升，還將有越來越多數(shù)字人出現(xiàn)在屏幕上，走進人們的生活中。同時，業(yè)內專家提醒，《直播電商監(jiān)督管理辦法（征求意見稿）》提出，使用人工智能等技術生成的人物圖像、視頻從事直播營銷活動的，直播間運營者應當在直播頁面進行顯著標識，持續(xù)向消費者提示該人物圖像、視頻屬于人工智能等技術生成，以與自然人名義或者形象進行明顯區(qū)分。

　　中國科學院信息工程研究所正高級工程師韓冀中說，人們在擁抱數(shù)字人技術的同時，也需設立清晰的邊界，必須防止利用高擬真技術以假亂真進行欺詐或虛假宣傳。技術的發(fā)展必須與法律、倫理的約束并行，確保創(chuàng)新在正確的軌道上行穩(wěn)致遠。（記者都芃）

本文鏈接：http://m.www897cc.com/showinfo-16-186241-0.html高擬真數(shù)字人直播帶貨有多強

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：超10萬億Tokens數(shù)據(jù)集煉成記：中國電信天翼AI如何構建AI發(fā)展基石

下一篇：財經聚焦·第八屆進博會丨在進博會上感受人形機器人發(fā)展前沿脈動

標簽：

熱門焦點

Find N3入網：最高支持16+1TB

OPPO將于近期登場的Find N3折疊屏目前已經正式入網，型號為PHN110。本次Find N3在外觀方面相比前兩代有很大的變化，不再是小號的橫向折疊屏，而是跟別的廠商一樣采用了較為常見的
MIX Fold3包裝盒泄露新機本月登場

小米的全新折疊屏旗艦MIX Fold3將于本月發(fā)布，近日該機的真機包裝盒在網上泄露。從圖上來看，新的MIX Fold3包裝盒在外觀設計方面延續(xù)了之前的方案，變化不大，這也是目前小米旗艦
5月安卓手機好評榜：魅族20 Pro奪冠

性能榜和性價比榜之后，我們來看最后的安卓手機好評榜，數(shù)據(jù)來源安兔兔評測，收集時間2023年5月1日至5月31日，僅限國內市場。第一名：魅族20 Pro好評率：97.50%不得不感慨魅族老品牌還
太卷！Redmi MAX 100英寸電視便宜了：12999元買Redmi史上最大屏

8月5日消息，從小米商城了解到，Redmi MAX 100英寸巨屏電視日前迎來官方優(yōu)惠，到手價12999元，比發(fā)布價便宜了7000元，在大屏電視市場開卷。據(jù)了解，Redmi MAX 100
這款新興工具平臺，讓你的電腦效率翻倍

隨著信息技術的發(fā)展,我們獲取信息的渠道越來越多,但是處理信息的效率卻成為一個瓶頸。于是各種工具應運而生,都在爭相解決我們的工作效率問題。今天我要給大家介紹一款效率
重估百度丨“晚熟”的百度云，能等到春天嗎？

©自象限原創(chuàng)作者｜程心排版｜王喻可2016年7月13日，百度云計算戰(zhàn)略發(fā)布會在北京舉行，宣告著百度智能云的正式啟程。彼時的會場座無虛席，甚至排隊排到了門外，在場的所有人幾乎都
蘋果、三星、惠普等暫停向印度出口筆記本和平板電腦

集微網消息，據(jù)彭博社報道，在8月3日印度突然禁止在沒有許可證的情況下向印度進口電腦/平板及顯示器等產品后，蘋果、三星電子和惠普等大公司暫停向印度
引領旗艦級影像能力向中端機普及 OPPO K11 系列發(fā)布 1799 元起

7月25日，OPPO正式發(fā)布K系列新品—— OPPO K11 。此次 K11 在中端手機市場長期被忽視的影像板塊發(fā)力，突破性地搭載索尼 IMX890 旗艦大底主攝，支持 OIS
Counterpoint ：OPPO雙旗艦戰(zhàn)略全面落地高端產品銷量增長22%

2023年6月30日，全球行業(yè)分析機構Counterpoint Research發(fā)布的《中國智能手機高端市場白皮書》顯示，中國智能手機品牌正在尋求高質量發(fā)展，中國高端智能

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

高擬真數(shù)字人直播帶貨有多強

Find N3入網：最高支持16+1TB

MIX Fold3包裝盒泄露新機本月登場

5月安卓手機好評榜：魅族20 Pro奪冠

太卷！Redmi MAX 100英寸電視便宜了：12999元買Redmi史上最大屏

這款新興工具平臺，讓你的電腦效率翻倍

重估百度丨“晚熟”的百度云，能等到春天嗎？

蘋果、三星、惠普等暫停向印度出口筆記本和平板電腦

引領旗艦級影像能力向中端機普及 OPPO K11 系列發(fā)布 1799 元起

Counterpoint ：OPPO雙旗艦戰(zhàn)略全面落地高端產品銷量增長22%

最新推薦

猜你喜歡

熱門推薦

相關資訊