OpenAI向用户开放AI视频生成模型 Sora将如何演绎“鲇鱼效应”?

  12月10日,OpenAI(美国人工智能研究公司宣布正式向用户开放人工智能AI视频生成模型Sora,该系统可以根据文本提示生成逼真的视频。截至当日,距离OpenAI首次公开预览这款产品已过去了10个月时间。

  OpenAI相关负责人表示,Sora将于当天晚些时候向美国及其他市场的ChatGPT付费用户开放。新版工具SoraTurbo可以生成最长达20秒的视频,并且可以提供这些视频的多种变体。

  据悉,Sora的发布是OpenAI为期12天的产品直播活动的一部分。作为视频生成领域龙头,Sora发挥着“鲇鱼效应”。据《证券日报》记者不完全统计,自Sora发布以来,国内外已有近20家公司发布或更新了视频生成模型。

  美股视频巨头遭冲击

  据了解,Sora能够根据用户输入的描述性提示快速生成视频,并及时向前或向后扩展现有视频。

  Sora引发了全球科技产业的震动,尤其是在视频生成领域。Sora以其极高的生成质量、快速的响应时间和低成本的生成方式,一度让一些传统视频公司面临巨大压力。

  以Adobe Systems Incorporated(以下简称“Adobe”为例,其股价曾在Sora首次发布的次日(2月16日大跌了7.41%,创去年11月1日以来的新低,市值在短短一个交易日蒸发了近198亿美元。

  Adobe长期以来在图像处理、视频编辑软件等领域占据领先地位,而OpenAI此次发布的Sora技术,将视频生成的门槛大大降低。市场普遍认为,Sora的发布可能会改变视频创作的格局,Adobe的市场份额受到威胁。

  不过,市场上也有另一种观点,认为像Sora这样的开放式模型,无法为专业人士提供同等的安全保障,Sora的主要使用场景可能仅限于社交媒体平台。在专业用户市场上,Adobe的领导地位依然无法撼动。

  面对Sora的冲击,国外企业加速布局AI视频生成领域。2024年Runway AI,Inc.发布Gen-2模型,在视频生成领域迅速重回第一梯队阵营。用户只需输入文字描述,即可生成一段4秒的视频,并且可以根据需求调整分辨率和帧率。

  而就在Sora正式向用户开放的几天前,当地时间12月4日,谷歌旗下人工智能研究机构DeepMind Technologies Limited发布了一款名为Genie2的新型模型,可通过单张图片和文字描述生成“无限”种类的可玩3D世界。

  贝恩咨询公司商品战略顾问总监潘俊在接受《证券日报》记者采访时表示,Sora的发布将对现有的视频生成模型生态产生重大影响。它将打破传统视频制作的技术壁垒,为视频生成领域带来新的竞争格局。其他视频生成模型公司可能会面临来自Sora的竞争压力,需要调整其产品和服务以适应新的市场需求和技术趋势。未来,视频生成领域的竞争格局可能会更加激烈,创新和差异化将成为关键。

  国内企业积极布局

  Sora的发布也促使国内科技巨头纷纷加紧文生视频大模型的研发。

  中国电信集团有限公司在2024数字科技生态大会上发布及更新了昆仑云网能力开放平台、“息壤”算力服务、视觉大模型及文生视频大模型等方面的进展;12月3日,深圳市腾讯计算机系统有限公司旗下腾讯混元大模型(以下简称“腾讯混元大模型”官微发布消息称,腾讯混元大模型正式上线视频生成能力,参数量130亿,是当前最大的视频开源模型;北京快手科技有限公司推出可灵AI,这款AI视频生成模型可以生成长达两分钟的1080p视频,还支持多种视频输出比例,并可以模拟现实世界的物理特性。

  清华大学战略新兴产业研究中心副主任胡麒牧在接受《证券日报》记者采访时表示,虽然目前这些国内公司推出的视频生成技术在部分功能上与Sora尚有差距,但它们的迅速跟进显示出国内企业对AI视频生成技术的重视。自Sora发布以来,国内视频大模型的生成效果显著提升,与Sora的差距在不断缩小,部分功能甚至已实现赶超。

  例如,北京智谱领航科技有限公司全新迭代的AI视频模型“新清影”,在文生视频性能上实现了进一步提升,支持10秒时长及4K、60帧超高清画质,以及任意尺寸的视频输出,并自带音效和更好的人体动作及物理世界模拟。

  北京火山引擎科技有限公司总裁谭待表示,视频大模型的技术突破十分困难,需要大模型能理解复杂指令,包括对多镜头语言的运用,实现多个主题的交互视频,保持风格的一致性等。当前视频生成功能仍有很多难关亟待突破。豆包两款模型会持续演进,在解决关键问题上探索更多可能性,加速拓展AI视频的创作空间和应用落地。

  推动多模态大模型创新

  在文生视频算法领域,国内也取得了显著进展。中国国家互联网信息办公室公开信息显示,今年以来国内共有2277个深度合成服务算法通过备案。其中,主要用途描述中带有可实现文生视频能力的算法共34个,备案名称中明确界定为“文生视频算法”的仅有6个。

  例如,商汤集团有限公司通过备案的商汤V-ME视频合成算法支持已有人物视频、动画、声音、文字等多种元素进行驱动。天娱数字科技(大连集团股份有限公司子公司北京智境云创科技有限公司在今年6月份一次性通过了“智境云创人脸融合算法”“智境云创文本生成视频算法”“智者千问大语言模型算法”三项算法备案。

  德邦证券股份有限公司分析师陈涵泊表示,Sora的正式开放,有望成为全球视频生成领域的新标杆,加速多模态大模型的迭代与应用。

  在潘俊看来,Sora的推出有望加速AI在视频生成领域的商业化进程。由于Sora具有高度的创新性和广泛的应用潜力,预计将吸引许多企业投资和合作,包括内容创作者、广告公司、电影制作公司等。随着商业化的推进,Sora可能会为视频生成领域带来新的商业模式。

  “不过,Sora远未达到替代人类内容创作的程度,其发展水平仅相当于GPT-1,尚处于起步阶段。对于其他视频生成模型公司而言,真正的竞争才刚刚开始。它们将在算力、数据和算法这三个关键领域展开角逐。”工业和信息化部信息通信经济专家委员会委员盘和林向《证券日报》记者表示。

  此外,胡麒牧表示:“技术创新与安全伦理之间的平衡是AI技术发展中的重要问题。在推动技术发展的同时,我们必须充分关注其可能带来的社会影响,如隐私保护、版权争议以及滥用风险等问题,确保技术在符合伦理和社会责任的基础上得到合理应用。”

王擎宇本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 support1012@126.com 举报,一经查实,本站将立刻删除。
标签: /
上一篇2024-12-19
下一篇 2024-12-19

相关推荐

  • 灰度迷你比特币信托自推出以来净流入超10亿美元

    灰度宣布旗下迷你比特币信托(BTC)2024 年净流入超过 10 亿美元。截至 12 月 17 日,该 ETF 资管规模超过 40 亿美元。 7 月份,灰度从其较旧的 BTC 和 ETH 基金中分拆出

    2024-12-19 04:03:23
    2022
  • 去年以工代赈吸纳就业总数同比增长31%

    2024年,国家发展改革委支持各地围绕农村小微型基础设施实施2726个以工代赈项目,吸纳36万名农村脱贫人口等低收入群众务工。各地围绕交通水利、农业农村、生态建设、

    2024-12-19 04:03:23
    2002
  • 2025年春风行动已举办4.1万场招聘活动

    人力资源社会保障部今天(3月13日)发布数据,截至3月5日,全国已累计举办各类招聘活动4.1万场,发布岗位3100万个;发出务工人员专车、专列、包机2.9万辆(列、架)次,输送劳

    2024-12-19 04:03:23
    2001
  • 落实增储任务、加强精益管理 中央储备粮安全保障能力增强

    增加小麦、玉米等品种收储规模,跨地区平衡、跨周期调节能力和应急保供水平进一步提升。不断加强储粮精益化管理,中央战略储备粮综合储存损耗率持续控制在1%以内。

    2024-12-19 04:03:23
    2001
  • 被动投资“大时代”来临!

    有公募人士认为,ETF大发展因素较为复杂,核心原因是曾经追捧主动权益明星基金经理的基民,大家的投资体验都不太好,进而也对主动权益的超额创造能力产生了一些质疑,因此

    2024-12-19 04:03:23
    2001
  • 证监会:权益类ETF规模突破3万亿元大关

    证监会19日发布的公告称,今年9月,证监会会同中央金融办出台了推动中长期资金入市的指导意见,着力打通社保、保险、理财等资金入市的堵点痛点,建设培育鼓励长期投资的

    2024-12-19 04:03:23
    2001
  • 宝莱特:前10个月已回购297.06万股股份 耗资2000万元

    针对产品研发和新业务布局,宝莱特还表示,2023 年,公司推出了S系列输注液 泵、电子尿量计量仪、遥测监护系统等全新系列产品,目前公司紧密推进G系列监护仪、CRRT、AED

    2024-12-19 04:03:23
    2001
  • 今年前10月新疆霍尔果斯口岸进出口货运量超3800万吨

    视频无法播放,请升级浏览器至最新版。 据霍尔果斯海关统计,霍尔果斯口岸今年前10月进出口货运量达3801.1万吨,同比增加10%。 从商品种类来看,进口商品主要为机电产品

    2024-12-19 04:03:23
    2001
1213