日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 軟件

T·Club技術開放日杭州站精彩回顧:音視頻技術創新探索與應用實踐 T·Club

來源: 責編: 時間:2023-09-18 21:40:30 377觀看
導讀近日,51CTO面向區域城市,重磅推出的技術沙龍T·Club技術開放日杭州站成功舉辦!8月26日,杭州站技術沙龍以“音視頻技術創新探索與應用實踐”為主題,邀請到來自快手、火山語音、網易云音樂和Rokid四位大型互聯網企業技術專家

近日,51CTO面向區域城市,重磅推出的技術沙龍T·Club技術開放日杭州站成功舉辦!sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

8月26日,杭州站技術沙龍以“音視頻技術創新探索與應用實踐”為主題,邀請到來自快手、火山語音、網易云音樂和Rokid四位大型互聯網企業技術專家,從音視頻質量、語音識別模型、用戶視聽體驗以及音視頻技術在AR場景落地等維度出發,結合自身企業業務和應用,分享了音視頻技術在不同應用場景的落地實踐,使在場的開發者們受益匪淺。sUa28資訊網——每日最新資訊28at.com

1、KVQ:基于AI的快手視頻質量評價

sUa28資訊網——每日最新資訊28at.com

快手圖像視頻處理分析負責人孫明首先為大家分享了主題為“KVQ:基于AI的快手視頻質量評價”的演講。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

快手平臺視頻內容豐富多樣,這些視頻記錄了世界,分享了不同的生活方式,與此同時也面臨著視頻質量參差不齊的問題。業界常見的工具并不能滿足UGC場景的需求,如何全面有效評估畫質是一個亟待解決的問題。而快手視頻質量模型KVQ,可以針對復雜的視頻內容和低質成因提供一致性的客觀質量打分,從而能有效監控UGC視頻全生命周期的清晰度狀況。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

孫明團隊基于先驗的弱標注方法 (PC、PG) ,以較低的成本構建了一個千萬級的異構數據集,其中異構包括單刺激標注(SS)、樣本對標注(PC)、先驗樣本對標注(PG)這三種數據,并針對海量數據提出QPT訓練方式。  sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

首先,團隊引入模擬線上生產消費鏈路的退化方式(Degradation Type)進行質量數據的生成,覆蓋各種場景,且利用退化空間包含的2x107 種組合形式,對應生成千萬級別的無標簽畫質數據,進而利用PG生成的數據做對比學習,來構建無監督訓練模型;其次,團隊進一步引入無監督學習(Self-supervised Learning),提出QPT預訓練方式,通過質量維度的相關性來獲取畫質特征,提升跨場景感知能力,奠定了異構數據建模的基礎。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

同時,無監督學習在公開數據集上將SOTA提升5%,快手場景下平均提升10%;最后,團隊引入多任務學習(Multi-task Learning),將上述基于PG數據預訓練的模型作為初始化權重,針對SS標注數據采用回歸損失函數,針對PC數據采用排序損失函數進行優化,從而用SS+PC數據聯合訓練的方式對質量數據進行利用,發揮大模型的真正效用,使得模型在不同分數段的預測保序性得到顯著提升,快手場景下平均SRCC提升5%。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

此外,快手音視頻技術團隊對快手視頻失真分布情況也進行了分析與思考,并發現一個比較重要的現象,將其稱之為多峰效應,即畫質在時序上呈現多峰分布。團隊提出多分支時序網絡,并行KL注意力機制模塊,高效建模時空分布存在差異的不同失真類型,有效應對針對視頻分類任務設計的通用Transformer結構采樣較為均勻,不能有效建模少數包含失真幀的技術難點,使公開數據集上提升3%,快手場景下提升5%,并且針對720P/30s/30FPS的視頻,處理僅需0.5s,在快手點播或直播能每日執行約7500萬次視頻質量評價。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

快手質量分析大模型KVQ也成為業界首次構建千萬級別的異構標注VQA數據集、業界首個QPT預訓練模型,提升跨場景感知能力及業界首次在UGC場景勝過商用軟件,并大規模落地的視頻質量分析大模型。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

(完整分享視頻請點擊閱讀原文查看)(完整分享視頻請點擊閱讀原文查看)sUa28資訊網——每日最新資訊28at.com

2、端到端語音識別中的語言模型融合技術創新與落地實踐

sUa28資訊網——每日最新資訊28at.com

語言模型融合是端到端語音識別模型實現領域自適應的核心技術。近年來,“內部語言模型估計”(Internal Language Model Estimation, ILME)方法顯著提升了語言模型融合的性能。火山語音針對ILME技術提出了一系列算法改進,語音識別算法研究員陳智鵬就基于此話題為技術沙龍的開發者們帶來了主題為“端到端語音識別中的語言模型融合技術創新與落地實踐”的演講。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

傳統的語言模型是基于深度神經網絡的Hybrid語音識別模型,是將聲學模型和語言模型獨立建模,在解碼時,再把兩部分的分數相加,形成聯合解碼。在通用的語音識別場景中,語音識別發揮了重要作用,但對于一些垂直領域或者專業術語,它的準確率并不理想,且單獨訓練ASR模型的算力成本很高。為了進一步改善智能字幕的用戶體驗,并節省ASR模型訓練的算力成本和數據成本,在語音識別里做語言模型的融合成為一項技術改進重點。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

火山語音團隊逐個擊破當前技術方案中存在的問題,面對經典ILME方法直接將context vector置0,在一些模型上效果不佳的問題,提出標簽同步的上下文向量學習方法,把解碼過程中每一步中間的隱狀態H送到一個非常小、非常輕量FFN網絡里,并讓這個網絡學會預測一個合理的C,再將合理的C送回,達到優化內部語言模型估計的目的。因為FFN網絡可以做到非常小,所以對于整體的計算量也沒有太明顯的影響。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

此外,面對融合垂直領域語言模型之后,對通用場景識別效果有負面影響的問題,火山語音團隊提出自適應語言模型融合技術;面對引入外部和內部語言模型之后,推理計算量大幅增加,成本上漲的問題,火山語音團隊提出內部&外部語言模型壓縮方案。總結起來,端到端語音識別的語言模型融合技術方面,主要有三個維度的工作,分別是效果更好、更加實用和成本更低。sUa28資訊網——每日最新資訊28at.com

3、用戶視聽體驗的優化實踐

sUa28資訊網——每日最新資訊28at.com

隨著視聽終端設備(IoT)和AI技術的發展,用戶能體驗到極致的視聽體驗可能性得到拓展,網易云音樂音視頻實驗室負責人劉華平帶來了以“用戶視聽體驗的優化實踐”為主題的演講,分享了通過解構音樂流媒體平臺視聽場景中端到端的視聽體驗鏈路環節,分析影響視聽的各個要素并介紹保障高質量視聽的相關實施技術細節。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

圖片sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

在話題分享之前,劉華平為大家介紹了一些有關音質的概念,包括量化位數、聲道、音質評估等。隨后劉華平從數字音樂典型應用場景鏈路:流式點播場景切入,就內容源、播放引擎、后處理、觀眾側這四個流式點播鏈路展開,為大家分享了其團隊為提升音質在各環節所做的努力。其中,對內容源進行分析處理,包括真假無損檢測、噪聲檢測、內容補全等,以確保源內容的質量;播放引擎最關鍵的目的是保證解碼沒有損失,同時支持一些HiFi的特性。在進行解碼方案調整時,還會考慮到不同播放設備、不同聽覺曲線對音質的影響。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

此外,除了點播場景,劉華平還向大家介紹了云音樂里面的直播場景,主要包括主播側、網絡和觀眾側等三個環節。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

在主播側,劉華平團隊就聲音采集、處理、編碼等環節進行了優化。例如,針對高質量手機聲音采集問題,劉華平提出四點優化方向:sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

(1)錄制采集率選擇:

手機硬件有默認采樣率,這個采樣率下工作是最優的,設置其他采樣率的音頻會從默認的采樣率重采樣到目標采樣率,所以按實際需求,一般直接選擇默認采樣率。一般老機器可能是44100,但是新機器大部分是48000。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

(2)錄制接口選擇:

通常需要選擇最常用的錄制接口,也是測試最多的接口,這樣穩定性最好,兼容性也最好。且能保證錄制的音頻沒有兼容性問題而導致的噪音或者左右聲道聲音完全不對的問題。Android 一般選擇 Java的audiorecord, iOS一般選擇audiounit。這兩個目前兼容性最好的錄制接口。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

(3)錄制線程優化:

主要有兩點,主要的目的就是保證錄制不受性能影響,不丟數據,保證數據完整性。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

(4)錄制參數選擇:

OS錄制設置的模式可以選擇AVAudioSessionModeDefault,默認模式兼容所有category;sUa28資訊網——每日最新資訊28at.com

AVAudioSessionModeVoiceChat適用于語音聊天VoIP;sUa28資訊網——每日最新資訊28at.com

AVAudioSessionModeGameChat適用于游戲模式,不需要主動設置(若不想用GKVoiceChat但希望達到類似功能,可以使用AVAudioSessionModeVoiceChat);sUa28資訊網——每日最新資訊28at.com

AVAudioSessionModeVideoRecording 適用于使用攝像頭采集視頻的應用。(完整分享視頻請點擊閱讀原文查看)sUa28資訊網——每日最新資訊28at.com

4、透明視頻在AR場景中的應用實踐

sUa28資訊網——每日最新資訊28at.com

在AR應用里,透明視頻屏蔽了無關的背景,使用戶更專注于核心內容,也能夠更自然地和場景融合,提升沉浸感。Rokid 應用平臺音視頻負責人黨予博便為大家帶來了以“透明視頻在AR場景中的應用實踐”為主題的演講,從AR應用需要什么樣的視頻體驗、透明視頻如何編碼、透明視頻的應用場景角度切入話題,分享了Rokid 應用平臺應用透明視頻的實踐落地與相關成果。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

在演講中,黨予博首先介紹了AR在工業上的應用,包括通過AR合影功能來進行空間建圖等,從而總結出AR應用的三個特征:sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

(1)虛實融合:將虛擬的物體投入到真實的場景,增強對現實世界的理解;sUa28資訊網——每日最新資訊28at.com

(2)實時互動:增強的內容必須滿足實時的交互;sUa28資訊網——每日最新資訊28at.com

(3)空間對齊:幾何一致性、時間一致性、光照一致性。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

以及AR應用視頻的進化方向:sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

(1)如何和現實場景融合;sUa28資訊網——每日最新資訊28at.com

(2)如何實時響應用戶操作;sUa28資訊網——每日最新資訊28at.com

(3)展示哪些內容,直播、云渲染、三維重建。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

談到透明視頻的編碼,黨予博認為這涉及到alpha通道的編碼、傳輸和儲存問題。流行的編碼器中,谷歌的Libvpx和蘋果2009年推出的HEVC with alpha都支持透明視頻的編碼,兩個編碼器的性能特點存在差異,但黨予博表示透明視頻本身并不重要,重要的是需要探索那些適合用這個方式展現出來的內容或場景,例如:AR 三方錄制、云端渲染推流、透明視頻直播等應用場景。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

總之,AR應用對視頻的要求和其他的視頻并不一樣,AR應用需要融合需求,打造沉浸感,實現實時互動。AR應用的發展需要我們創建更多內容,不斷突破,以此來豐富AR視頻體驗,賦能產業升級,商業落地。sUa28資訊網——每日最新資訊28at.com

sUa28資訊網——每日最新資訊28at.com

以上是51CTO T·Club技術沙龍杭州站的大致分享內容,完整沙龍視頻請點擊閱讀原文查看。 sUa28資訊網——每日最新資訊28at.com

本文鏈接:http://m.www897cc.com/showinfo-26-10422-0.htmlT·Club技術開放日杭州站精彩回顧:音視頻技術創新探索與應用實踐 T·Club

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: AIoTel下視頻編碼(一)--移動看家視頻水印溯源技術

下一篇: 五分鐘技術趣談 | 業務系統常用限流算法淺析

標簽:
  • 熱門焦點
  • K60 Pro官方停產 第三方瞬間漲價

    雖然沒有官方宣布,但Redmi的一些高管也已經透露了,Redmi K60 Pro已經停產且不會補貨,這一切都是為了即將到來的K60 Ultra鋪路,屬于廠家的正常操作。但有意思的是該機在停產之后
  • 5月安卓手機好評榜:魅族20 Pro奪冠

    性能榜和性價比榜之后,我們來看最后的安卓手機好評榜,數據來源安兔兔評測,收集時間2023年5月1日至5月31日,僅限國內市場。第一名:魅族20 Pro好評率:97.50%不得不感慨魅族老品牌還
  • 分布式系統中的CAP理論,面試必問,你理解了嘛?

    對于剛剛接觸分布式系統的小伙伴們來說,一提起分布式系統,就感覺高大上,深不可測。而且看了很多書和視頻還是一臉懵逼。這篇文章主要使用大白話的方式,帶你理解一下分布式系統
  • 一篇聊聊Go錯誤封裝機制

    %w 是用于錯誤包裝(Error Wrapping)的格式化動詞。它是用于 fmt.Errorf 和 fmt.Sprintf 函數中的一個特殊格式化動詞,用于將一個錯誤(或其他可打印的值)包裝在一個新的錯誤中。使
  • 學習JavaScript的10個理由...

    作者 | Simplilearn編譯 | 王瑞平當你決心學習一門語言的時候,很難選擇到底應該學習哪一門,常用的語言有Python、Java、JavaScript、C/CPP、PHP、Swift、C#、Ruby、Objective-
  • JVM優化:實戰OutOfMemoryError異常

    一、Java堆溢出堆內存中主要存放對象、數組等,只要不斷地創建這些對象,并且保證 GC Roots 到對象之間有可達路徑來避免垃 圾收集回收機制清除這些對象,當這些對象所占空間超過
  • 破圈是B站頭上的緊箍咒

    來源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之每年的暑期檔都少不了瞄準追劇女孩們的古偶劇集,2021年有優酷的《山河令》,2022年有愛奇藝的《蒼蘭訣》,今年卻輪到小破站抓住了追
  • iQOO Neo8 Pro評測:旗艦雙芯加持 最強性能游戲旗艦

    【Techweb評測】去年10月,iQOO推出了一款Neo7手機,該機搭載了聯發科天璣9000+,配備獨顯芯片Pro+,帶來了同價位段最佳的游戲體驗,一經上市便受到了諸多用
  • 上海舉辦人工智能大會活動,建設人工智能新高地

    人工智能大會在上海浦江兩岸隆重拉開帷幕,人工智能新技術、新產品、新應用、新理念集中亮相。8月30日晚,作為大會的特色活動之一的上海人工智能發展盛典人工
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
久久蜜桃av一区精品变态类天堂| 欧美区日韩区| 亚洲在线观看免费| 亚洲美女中文字幕| 亚洲在线视频网站| 开元免费观看欧美电视剧网站| 亚洲影院一区| 在线中文字幕一区| 亚洲美女中出| 亚洲精品综合久久中文字幕| 亚洲深夜激情| 久久久久9999亚洲精品| 欧美精品123区| 欧美成人久久| 欧美成人精品激情在线观看| 暖暖成人免费视频| 国产精品av免费在线观看| 国产亚洲欧美激情| 亚洲精品视频一区| 亚洲欧美在线一区| 男人的天堂亚洲在线| 欧美v国产在线一区二区三区| 欧美四级在线观看| 激情久久一区| 亚洲国产另类久久精品| 亚洲一区二区三区高清不卡| 亚洲欧美韩国| 性做久久久久久免费观看欧美| 亚洲综合视频1区| 先锋影音网一区二区| 欧美亚洲视频在线观看| 欧美激情小视频| 国产一区在线播放| 一本色道久久综合亚洲91| 久久久人成影片一区二区三区 | 在线亚洲电影| 久久夜色精品国产亚洲aⅴ| 国产精品都在这里| 91久久精品网| 久久久99精品免费观看不卡| 国产精品久久久久久久久久免费看| 国产精品一卡| 在线观看成人小视频| 亚洲宅男天堂在线观看无病毒| 欧美电影免费观看高清完整版| 欧美日韩国产高清| 韩国欧美一区| 午夜精品久久| 欧美视频免费| 国产一区二区三区久久久久久久久| 一二美女精品欧洲| 香蕉久久久久久久av网站| 久久久国产一区二区| 国产精品电影网站| 国产主播一区二区三区四区| 亚洲在线视频免费观看| 欧美日韩网址| 国际精品欧美精品| 亚洲影音一区| 欧美少妇一区| 极品少妇一区二区三区| 日韩午夜激情av| 毛片基地黄久久久久久天堂| 欧美视频中文一区二区三区在线观看 | 国产精品国产一区二区 | 欧美伊人久久| 国产精品一卡| 亚洲综合色激情五月| 久久人人97超碰国产公开结果| 国产精品免费一区二区三区在线观看| 红桃视频国产精品| 欧美日韩一区在线播放| 亚洲激情不卡| 亚洲一区在线视频| 欧美日韩卡一卡二| 亚洲免费高清| 欧美在线观看www| 欧美精品一区二区三区蜜臀| 亚洲精品1区2区| 欧美不卡在线| 国产亚洲精品美女| 日韩视频一区二区三区在线播放 | 欧美久久影院| 国产综合视频在线观看| 日韩视频免费| 欧美精品一区视频| 国内精品久久久久久 | 国产精品人成在线观看免费| 亚洲自拍偷拍一区| 欧美激情精品久久久久久大尺度| 亚洲国产精品久久人人爱蜜臀 | 国产精品vvv| 亚洲综合色激情五月| 国产亚洲激情视频在线| 久久久久久一区二区| 在线观看日韩精品| 欧美一级网站| 国产丝袜一区二区| 亚洲一区二区三区午夜| 国产精品一区=区| 一区二区三区鲁丝不卡| 欧美系列亚洲系列| 亚洲看片一区| 久久理论片午夜琪琪电影网| 亚洲大片在线| 久久久久久尹人网香蕉| 久久三级视频| 亚洲精品久久嫩草网站秘色| 久久亚洲欧美国产精品乐播| 国产精品亚洲产品| 这里只有视频精品| 国产美女精品人人做人人爽| 久久精品国产精品亚洲综合| 亚洲大黄网站| 欧美日韩亚洲综合| 日韩一区二区精品葵司在线| 国产精品国产三级国产aⅴ无密码| 欧美在线观看视频一区二区| 1024成人网色www| 久久一区中文字幕| 亚洲精品中文字幕有码专区| 国产精品久久久久毛片大屁完整版| 久久成人精品无人区| 亚洲国产精品激情在线观看| 欧美日韩一级片在线观看| 日韩一区二区免费看| 欧美区二区三区| 亚洲欧美综合网| 亚洲第一在线视频| 美日韩精品免费观看视频| 亚洲美女av电影| 欧美日韩精品在线观看| 亚洲最新合集| 欧美日韩综合精品| 欧美一级播放| 国产一区视频在线看| 欧美精品麻豆| 久久成人国产精品| 伊人精品在线| 免费视频亚洲| 亚洲三级视频| 国产欧美一区二区三区视频| 欧美黄色日本| 一区二区欧美精品| 欧美性一区二区| 亚洲欧美激情视频在线观看一区二区三区 | 性色一区二区| 国语自产在线不卡| 久久中文在线| 亚洲一区二区少妇| 亚洲第一在线视频| 国产精品婷婷午夜在线观看| 欧美在线黄色| 在线观看欧美精品| 欧美精品日本| 久久久91精品国产| 亚洲一区尤物| 亚洲精品欧美一区二区三区| 国产亚洲欧洲| 欧美大片18| 亚洲无亚洲人成网站77777| 国产精品亚洲综合久久| 欧美精品在线视频观看| 亚洲图片欧洲图片日韩av| 亚洲电影免费在线 | 国产一区二区高清不卡| 免费观看30秒视频久久| 亚洲免费av网站| 国产精品人人做人人爽人人添| 你懂的网址国产 欧美| 宅男精品视频| 亚洲人成精品久久久久| 国产精品高潮呻吟久久| 久久成人在线| 亚洲激情在线| 好男人免费精品视频| 国产精品一区一区| 欧美视频在线一区| 久久久久国产精品一区| 午夜精品久久久久久99热| 中文日韩欧美| 日韩一级在线| 国产日韩一区二区三区| 欧美私人网站| 欧美日韩国产精品自在自线| 久久xxxx精品视频| 亚洲日本aⅴ片在线观看香蕉| 欧美日韩免费视频| 欧美夫妇交换俱乐部在线观看| 亚洲欧美福利一区二区| 中国成人亚色综合网站| 激情亚洲网站| 韩国成人福利片在线播放| 国产欧美日韩精品在线| 国产精品色在线| 国产精品视频精品| 欧美—级在线免费片| 欧美一区激情| 日韩亚洲欧美成人一区| 日韩视频免费| 99国产精品国产精品久久| 亚洲毛片网站| 精品成人乱色一区二区| 国语自产精品视频在线看|