谷歌新技术可用AI模型为无声视频配音
稀土掘金
发表于 2024-6-19 10:33:26
165
0
0
当前DeepMind 这款AI模型依然存在局限性,需要开发者使用提示词为模型预先“介绍”视频可能的声音,暂时不能直接根据视频画面添加具体音效。
据悉,该模型首先会将用户输入的视频进行拆解,此后结合用户的用户文字提示,利用扩散模型反复运算,最终以生成与视频画面协调的背景声音,例如输入一条“在黑暗中行走”的无声视频,再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文字提示,相关模型就能生成恐怖风格的背景音效。
DeepMind同时表示,该“video-to-audio”模型可以为任何视频生成无限数量的音轨,还能够通过提示词内容判断生成的音频“正向性”或“反向性”,从而令生成的声音更贴近某些特定场景。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- 谷歌大模型被盯上!欧盟监管机构就数据隐私对PaLM2模型展开调查
- 大模型加速落地 百度智能云发布千帆大模型平台3.0
- 百度李彦宏:现在距离大模型的理想情况还差很远 未来模型之间的差距会变大
- 欧洲隐私监管机构调查谷歌将数据用于人工智能模型的情况
- 欧洲隐私监管机构调查谷歌将数据用于人工智能模型的情况
- 爱奇艺王晓晖:长、短视频融合之路上 长视频的火焰依然在熊熊燃烧
- 百度沈抖:面向10万卡算力集群升级计算平台能力 文心大模型日调用量超7亿次
- Meta发布重磅新品:299美元的Quest 3S头显、AR眼镜原型、多模态AI模型
- 百度世界2024宣布定档11月12日 文心大模型日调用量已超7亿
- 百度世界2024将于11月12日召开 文心大模型日均调用量已超7亿次
-
继小鹏汽车将其智驾车型MONA M03切入A级车市场后,广汽埃安也迅速跟进,推出了同类智驾车型AION RT。据悉,AION RT作为广汽埃安的第二款全球车型,依据续航里程和智能驾驶能力,共推出了四个版本:520智享版、65 ...
- moonlightplay
- 昨天 18:45
- 支持
- 反对
- 回复
- 收藏
-
财联社9月27日讯(编辑赵昊)据媒体报道,美国人工智能公司OpenAI首席财务官Sarah Friar告诉投资者,尽管本周失去了多位顶尖人才,公司仍处于强劲地位,并有望很快完成一轮大规模的融资。 媒体看到了Friar向 ...
- Hidden2
- 前天 10:54
- 支持
- 反对
- 回复
- 收藏
-
近段时间处于舆论漩涡中的永辉超市(601933.SH),又有了新“烦恼”。 9月28日,永辉超市新浪微博发布《关于永辉超市股份有限公司股权变更的情况说明》,强调创始人兼董事长张轩松先生的股权比例未发生任何 ...
- ppkknn
- 昨天 13:18
- 支持
- 反对
- 回复
- 收藏
-
当地时间9月26日,美国食品药品监督管理局(FDA)宣布批准百时美施贵宝(BMS)公司精神分裂药物Cobenfy(KarXT, xanomeline and trospium chloride)上市,用于成人精神分裂症患者的治疗。 这是数十年来首 ...
- dj2003gc
- 3 天前
- 支持
- 反对
- 回复
- 收藏