来认识一下 Sora — OpenAI 的新文本到视频生成器。这家旧金山公司周四推出的该工具使用生成人工智能,根据书面命令立即创建短视频。

Sora 并不是第1个展示这种技术的人。但行业分析师指出,该工具迄今为止展示的视频质量很高,并指出它的推出标志着 OpenAI 和文本到视频生成的未来的整体重大飞跃。

尽管如此,与当今快速发展的人工智能领域的所有事物一样,此类技术也引发了人们对潜在道德和社会影响的担忧。这是您需要了解的内容。

Sora 是一款文本到视频生成器 - 使用生成式 AI 根据书面提示创建长达 60 秒的视频。该模型还可以从现有的静态图像生成视频。生成式人工智能是人工智能的一个分支,可以创造新的东西。示例包括聊天机器人(如 OpenAI 的 ChatGPT)以及图像生成器(如 DALL-E 和 Midjourney)。让人工智能系统生成视频是更新的、更具挑战性的,但依赖于一些相同的技术。

Sora 尚未可供公众使用(OpenAI 表示,在正式发布该工具之前,它正在与政策制定者和艺术家进行接触),而且还有非常多我们不知道的事情。但自周四宣布以来,该公司已经分享了一些 Sora 生成的视频示例,以展示其功能。

OpenAI 首席执行官 Sam Altman 还利用 X(以前称为Twitter 的平台)要求社交媒体用户及时发送想法。后来,他分享了逼真详细的视频,这些视频响应了“两只金毛猎犬在山顶上播客”和“在海洋上与不同动物进行自行车比赛,运动员在无人机摄像机视图下骑自行车”等提示。

虽然 Sora 生成的视频可以描绘复杂、极其详细的场景,但 OpenAI 指出仍然存在一些弱点,包括一些空间和因果元素。例如,OpenAI 在其网站上补充道,“一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。”

OpenAI 的 Sora 并不是同类产品中的第1个。谷歌、Meta 和初创公司 Runway ML 等公司都展示了类似的技术。尽管如此,行业分析师还是强调了迄今为止分享的 Sora 视频的显然质量和令人印象深刻的长度。麦格理美国人工智能和软件研究主管 Fred Havemeyer 表示,Sora 的推出标志着该行业向前迈出了一大步。

“你不仅可以制作更长的视频,据我所知最长可达 60 秒,而且所创建的视频看起来更正常,而且似乎实际上更尊重物理和现实世界,”哈夫梅尔说。“你不会在视频源上看到那么多看起来……不自然的‘恐怖谷’视频或片段。”

尽管去年人工智能生成的视频取得了“巨大进步”(包括去年 11 月推出的稳定视频扩散),但 Forrester 高级分析师 Rowan Curran 表示,此类视频需要更多的“拼接”以实现角色和场景的一致性。

然而,Sora 视频的一致性和长度代表着“创意人员有新的机会将人工智能生成的视频元素融入到更传统的内容中,现在甚至可以根据一个或几个提示生成完整的叙事视频,”Curran 告诉《The》杂志。美联社周五通过电子邮件。

尽管自周四发布以来,Sora 的能力令观察人士感到震惊,但对人工智能生成视频使用的道德和社会影响的担忧仍然存在。例如,哈夫梅尔指出了 2024 年可能充满挑战的选举周期中存在的巨大风险。他补充说,通过一种“潜在神奇”的方式来生成看起来和听起来都逼真的视频会带来政治内外的许多问题,并指出欺诈、宣传和错误信息的担忧。

Havemeyer 表示:“生成式人工智能的负面外部性将成为 2024 年争论的一个关键话题。” “这是今年每个企业和每个人都需要面对的重大问题。”

随着世界各国政府努力迎头赶上,科技公司仍在管理人工智能及其风险方面发号施令。去年12月,欧盟就世界上第1个全面的人工智能规则达成协议,但该法案要在最终批准两年后才会生效。

周四,OpenAI 表示,在广泛使用 Sora 之前,它正在采取重要的安全措施。

该公司写道:“我们正在与红队成员合作,他们是错误信息、仇恨内容和偏见等领域的领域专家,他们将以对抗性方式测试该模型。” “我们还在构建工具来帮助检测误导性内容,例如检测分类器,可以判断 Sora 何时生成视频。”

OpenAI 全球事务副总裁 Anna Makanju 周五在慕尼黑安全会议上发表讲话时重申了这一点,OpenAI 和其他 19 家科技公司承诺自愿合作,打击人工智能生成的选举深度造假。她指出,公司“以相当谨慎的方式”发布 Sora。

同时,OpenAI 透露了有关 Sora 如何构建的有限信息。OpenAI 的技术报告没有透露使用哪些图像和视频源来训练 Sora,该公司周五也没有立即回应进一步置评的请求。

Sora 的发布也是在一些作者和《纽约时报》对 OpenAI 及其商业合作伙伴微软提起诉讼的背景下发布的,原因是 OpenAI 使用受版权保护的写作作品来训练 ChatGPT。OpenAI 向美联社支付了一笔未公开的费用,以获取其文本新闻档案的许可。原文链接;https://abcnews.go.com/US/wireStory/sora-chatgpt-maker-openais-new-text-video-generator-107300294

发表评论