首页 美股新闻 正文

谷歌新技术可用AI模型为无声视频配音

稀土掘金
165 0 0
  谷歌DeepMind近日公布了一项利用AI为无声视频生成背景音乐的“video-to-audio”技术。

  当前DeepMind 这款AI模型依然存在局限性,需要开发者使用提示词为模型预先“介绍”视频可能的声音,暂时不能直接根据视频画面添加具体音效。
  据悉,该模型首先会将用户输入的视频进行拆解,此后结合用户的用户文字提示,利用扩散模型反复运算,最终以生成与视频画面协调的背景声音,例如输入一条“在黑暗中行走”的无声视频,再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文字提示,相关模型就能生成恐怖风格的背景音效。
  DeepMind同时表示,该“video-to-audio”模型可以为任何视频生成无限数量的音轨,还能够通过提示词内容判断生成的音频“正向性”或“反向性”,从而令生成的声音更贴近某些特定场景。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  •   继小鹏汽车将其智驾车型MONA M03切入A级车市场后,广汽埃安也迅速跟进,推出了同类智驾车型AION RT。据悉,AION RT作为广汽埃安的第二款全球车型,依据续航里程和智能驾驶能力,共推出了四个版本:520智享版、65 ...
    moonlightplay
    昨天 18:45
    支持
    反对
    回复
    收藏
  •   财联社9月27日讯(编辑赵昊)据媒体报道,美国人工智能公司OpenAI首席财务官Sarah Friar告诉投资者,尽管本周失去了多位顶尖人才,公司仍处于强劲地位,并有望很快完成一轮大规模的融资。   媒体看到了Friar向 ...
    Hidden2
    前天 10:54
    支持
    反对
    回复
    收藏
  •   近段时间处于舆论漩涡中的永辉超市(601933.SH),又有了新“烦恼”。   9月28日,永辉超市新浪微博发布《关于永辉超市股份有限公司股权变更的情况说明》,强调创始人兼董事长张轩松先生的股权比例未发生任何 ...
    ppkknn
    昨天 13:18
    支持
    反对
    回复
    收藏
  •   当地时间9月26日,美国食品药品监督管理局(FDA)宣布批准百时美施贵宝(BMS)公司精神分裂药物Cobenfy(KarXT, xanomeline and trospium chloride)上市,用于成人精神分裂症患者的治疗。   这是数十年来首 ...
    dj2003gc
    3 天前
    支持
    反对
    回复
    收藏
稀土掘金 注册会员
  • 粉丝

    0

  • 关注

    0

  • 主题

    32