OpenAI发布最新大型模型Sora，能够将文本转化为视频

据外媒报道，OpenAI发布了一款名为Sora的新型AI模型，据称该模型能够利用简短文本提示快速生成具有“逼真”和“富有想象力”的60秒视频。

OpenAI在一篇博客文章中指出，Sora可以根据文本命令生成长达60秒的视频，展现多个角色、特定动作以及丰富背景细节的场景。

一篇博客文章指出，这个模型不仅能理解用户的需求，还能将这些需求与现实世界中的情况联系起来。

OpenAI表示，计划训练AI模型，使其能够“帮助人们解决需要现实世界互动的问题”。

市场研究公司ABI Research的高级分析师Reece Hayden指出，尽管“多模态模型”并非新概念，文本到视频的模型早已存在，但OpenAI声称Sora所具备的长度和准确性是其独特之处。

Hayden指出，这些人工智能模型可能会在数字娱乐市场带来重大变革，因为个性化内容将通过各种渠道广泛传播。

Hayden指出，电视是一个明显的用例，通过创造简短的场景来支持叙事。尽管这种模式仍存在局限性，但它展示了市场发展的方向。

同时，OpenAI提到Sora仍处于开发阶段，存在一些明显的“缺陷”，尤其是在处理空间细节方面。举例来说，他们展示了一个视频，其中有人咬了一口饼干，但随后却没有留下咬痕。

OpenAI目前的重点仍然在确保信息的安全性。该公司计划与专家团队合作，测试最新的模型，并关注错误信息、仇恨内容和偏见等领域。此外，OpenAI正在努力开发工具，帮助检测误导性信息，以提高信息的准确性和可信度。

Sora将首先提供给被称为“红队”的网络安全教授，他们可以评估产品的危害或风险。它还向一些视觉艺术家、设计师和电影制作人提供访问权限，以收集关于创意专业人士如何使用它的反馈。