谷歌今日正式發布新一代視頻生成模型Veo 3.1,在畫面真實度、敘事控制及多模態生成能力方面實現突破。該模型同步賦能旗下AI影視創作平臺Flow,新增音頻生成功能,支持從文本到"聲畫合一"的完整創作流程。
Flow平臺此次升級聚焦三大核心功能:素材生視頻(Ingredients to Video)支持多圖參考生成定制化視頻,首尾幀(frames to Video)可自動生成過渡鏡頭,視頻延展(Extend)功能則能將短片擴展至分鐘級長視頻。最引人注目的是AI音頻生成系統的加入,該系統可根據畫面內容自動匹配環境音、動作音效及氛圍配樂,實現真正的多媒體創作。
針對后期編輯需求,Flow新增智能元素插入工具,可自然融入人物、動物等新元素并自動調整光影效果。即將上線的一鍵移除功能支持無痕刪除對象,系統會自動重建背景畫面。這些工具使創作者能更精準地控制最終效果。
技術測試顯示,Veo 3.1在復雜光影場景中表現突出,能準確還原清晨光線的暖色調與自然氛圍。實測生成的小溪畫面水流平滑,反光細節處理得當,配音與畫面內容高度契合。模型提供快速版(30秒-1分鐘生成)和高質量版兩種模式,滿足不同創作需求。
但在高難度動態場景測試中,模型暴露出明顯局限。當嘗試生成體操動作視頻時,輸出畫面出現嚴重扭曲,無法準確呈現人體結構。名人肖像測試也顯示保護機制生效,上傳OpenAI CEO照片生成的畫面存在顯著差異,系統提示不支持使用特定人物形象。
目前Veo 3.1已通過Flow平臺、Gemini API、Vertex AI及Gemini應用全面開放,免費用戶每月可獲100個AI點數,約可生成5條視頻。廣告短片測試表明,模型能根據咖啡杯、人像等素材生成符合品牌調性的商業內容,廣告詞呈現效果達到預期要求。
本文鏈接:http://m.www897cc.com/showinfo-24-185528-0.html谷歌Veo 3.1視頻生成模型上線,AI創作“聲畫合一”,實測體驗有亮點也有局限
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com