首页 美股新闻 正文

谷歌新技术可用AI模型为无声视频配音

稀土掘金
182 0 0
  谷歌DeepMind近日公布了一项利用AI为无声视频生成背景音乐的“video-to-audio”技术。

  当前DeepMind 这款AI模型依然存在局限性,需要开发者使用提示词为模型预先“介绍”视频可能的声音,暂时不能直接根据视频画面添加具体音效。
  据悉,该模型首先会将用户输入的视频进行拆解,此后结合用户的用户文字提示,利用扩散模型反复运算,最终以生成与视频画面协调的背景声音,例如输入一条“在黑暗中行走”的无声视频,再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文字提示,相关模型就能生成恐怖风格的背景音效。
  DeepMind同时表示,该“video-to-audio”模型可以为任何视频生成无限数量的音轨,还能够通过提示词内容判断生成的音频“正向性”或“反向性”,从而令生成的声音更贴近某些特定场景。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  • 【科技记者古尔曼:苹果计划于12月第一周发布iOS 18.2系统更新 带来更多人工智能功能】科技记者古尔曼透露,苹果计划于12月第一周发布iOS 18.2系统更新。iOS 18.2将为iPhone 15 Pro机型和所有iPhone 16机型带来更多 ...
    cristianna
    昨天 17:32
    支持
    反对
    回复
    收藏
  •   近日,爱立信中国区总裁方迎在接受《经济参考报》记者采访时表示,5G技术在全球范围内得到了迅速发展,但面临商业潜力未能充分挖掘、网络运营难度较以往更高两大挑战。因此,运营商在继续5G网络部署的同时,应关 ...
    blueskybb
    昨天 15:05
    支持
    反对
    回复
    收藏
  • 【特斯拉首次聘请了一位品牌大使】特斯拉近日公布了首位品牌大使韩国奥运射击选手金艺智,这一举动有些出人意料,毕竟它曾经对广告的态度十分不屑。 ...
    xyyg
    昨天 13:34
    支持
    反对
    回复
    收藏
  •   证券时报网讯,纽约州共同退休基金在第三季度对一些科技巨头的股票进行了调整。该基金是美国第三大公共养老金,管理着2677亿美元的资产。该基金三季度出售了231,600股Palantir 股票,将其持股数量降至110万股。 ...
    LEMONKEITH
    昨天 15:12
    支持
    反对
    回复
    收藏
稀土掘金 注册会员
  • 粉丝

    0

  • 关注

    0

  • 主题

    32