AI 语音克隆初创公司 ElevenLabs 由前 Google 机器学习工程师 Piotr Dabkowski 和前 Palantir 部署策略师 Mati Staniszewski 于 2022 年共同创立,此后推出了由 AI 驱动的文本转语音软件和旨在自动翻译的 AI 配音工具将视频中的演讲翻译成 20 多种语言,“保持原来的语气和风格现在,该公司正在开发一种新产品,据报道,它可以根据用户给出的场景描述生成声音,以伴随原本无声的视频片段。

这是一个盒子里的音效/拟音团队,为了展示其实力,Elevenlabs 在一些 Sora 生成的内容上释放了它。

“我们使用‘海浪撞击’、‘金属叮当作响’、‘鸟鸣’和‘赛车引擎’等文本提示来生成音频,并将其叠加到 OpenAI Sora 公告中我们最喜欢的一些剪辑上,”ElevenLabs 的音效的细节尚未透露,但演示展示了一堆 Sora 生成的视频剪辑,并伴有相当逼真的背景声音 - 从繁忙街道上的脚步声和城市的嗡嗡声到嘟嘟声和未来双足机器人的机械无人机以好莱坞风格的宣传声音呈现电影般的叙事。所有这些显然都是由文本到音频提示产生的。

与 Sora 一样,毫无疑问会有一些问题需要解决,以及防止欺诈和安全协议的保护,但随着人工智能发展的步伐如此之快,我们是否可以期待奥斯卡奖颁发给一切最好的东西在不久的将来人工智能?有趣的(也可能是可怕的)时代即将到来。原文链接:https://newatlas.com/technology/elevenlabs-sound-effects-ai-audio/

发表评论