
据外媒报道,OpenAI发布了一款名为Sora的新型AI模型,据称该模型能够利用简短文本提示快速生成具有“逼真”和“富有想象力”的60秒视频。
OpenAI在一篇博客文章中指出,Sora可以根据文本命令生成长达60秒的视频,展现多个角色、特定动作以及丰富背景细节的场景。
一篇博客文章指出,这个模型不仅能理解用户的需求,还能将这些需求与现实世界中的情况联系起来。
OpenAI表示,计划训练AI模型,使其能够“帮助人们解决需要现实世界互动的问题”。
市场研究公司ABI Research的高级分析师Reece Hayden指出,尽管“多模态模型”并非新概念,文本到视频的模型早已存在,但OpenAI声称Sora所具备的长度和准确性是其独特之处。
Hayden指出,这些人工智能模型可能会在数字娱乐市场带来重大变革,因为个性化内容将通过各种渠道广泛传播。
Hayden指出,电视是一个明显的用例,通过创造简短的场景来支持叙事。尽管这种模式仍存在局限性,但它展示了市场发展的方向。
同时,OpenAI提到Sora仍处于开发阶段,存在一些明显的“缺陷”,尤其是在处理空间细节方面。举例来说,他们展示了一个视频,其中有人咬了一口饼干,但随后却没有留下咬痕。
OpenAI目前的重点仍然在确保信息的安全性。该公司计划与专家团队合作,测试最新的模型,并关注错误信息、仇恨内容和偏见等领域。此外,OpenAI正在努力开发工具,帮助检测误导性信息,以提高信息的准确性和可信度。
Sora将首先提供给被称为“红队”的网络安全教授,他们可以评估产品的危害或风险。它还向一些视觉艺术家、设计师和电影制作人提供访问权限,以收集关于创意专业人士如何使用它的反馈。
