对话头部大模型企业:“三力”齐发开新局

  大模型产业的发展离不开“三力”:AI大模型的能力正在日新月异地迭代,算力始终是大模型的一条生命线,产品力则成为市场竞争的新焦点。大模型产业如何围绕这“三力”作答,如何开创新局面?日前,上海证券报记者采访了腾讯、阿里、稀宇科技MiniMax等国内头部大模型公司相关人士。

  大模型能力如何演进?

  业内认为,大模型发展有三条路:一是使用更多数据和算力,让模型具有更大参数;二是多模态,即大模型可以理解和生成文字、图像、音频、视频等多模态内容;三是增添复杂推理和逻辑自我纠正功能,提升准确性。

  “这三条路径并不冲突,可以同时选择。大模型厂商仍朝着这三个方向进行投入。大模型每季度都有较大的版本更新。”阿里云智能科技研究中心主任安琳说。

  参数量大是大模型最突出、最早为人所关注的特点。近两年来,规模扩张是大模型企业迭代的主要路径。主流大模型的参数从百亿级逐渐迭代至数千亿,甚至万亿规模。然而,扩大参数量的瓶颈已开始显现。国内外权威专家和组织已经有大量报告表示,Scaling Law(缩放定律开始显示出边际效益递减的现象。这意味着单纯增加计算资源、提高参数规模或数据量不再能如以往那样显著提升模型性能。

  在多模态和全模态方面,文生图、文生3D和文生视频等各种模态的模型层出不穷。2024年,腾讯在文生图领域推出首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿。

  时至今日,OpenAI迟迟未推出参数量巨大的GPT-5,而是开辟了o1、o3模型系列,聚焦“深度思考”。这些模型可以“思考”(推理更长的时间来获得更可靠的响应,在数据科学、编程等领域有更佳表现。

  从大模型能力来看,AGI(通用人工智能代表了业内对于高度智能、通用的追求。“AI不仅能理解世界,而且能创造出全新的文字、图像甚至是视频等内容。这对于以知识为生产力的新型生产关系来说,无疑提供了一种变革性的动力。”腾讯混元大模型的负责人说。

  如何破解算力紧缺难题?

  算力相当于大模型的生命线。在全球算力供不应求的背景下,如何让算力够用?专家认为,这并不意味着无限的GPU。大模型的架构、训练平台、算力网络……各环节的创新与迭代,均可以有效提升算力利用效率,降低算力成本。

  MoE(混合专家架构体系已成为主流大模型采用的技术架构,其优势在于在模型研发成本、训练与推理效率、整体性能之间实现最佳平衡。MiniMax、腾讯等均在国内率先采用MoE架构。

  MiniMax副总裁刘华介绍,MoE为大模型提供了一条降低算力消耗的路径。在这一架构下,大模型的上万亿参数被分成了若干“专家模型”。在处理任务的时候,大模型只调用相关“专家模型”,减少了不必要的计算。

  采用线性注意力机制也是提高计算效率的一种方式。2025年1月中旬,MiniMax发布并开源了MiniMax-01全新系列模型,能够高效处理全球最长400万token的上下文,综合性能比肩海外顶尖模型。

  腾讯混元大模型负责人强调,大模型是一个集合了应用、算法、平台、算力的系统工程,全链路自研的能力是竞争的关键。腾讯目前拥有万卡规模的算力集群,并且自研了星脉算力网络,具备业界最高的3.2T通信带宽,通信性能提升30%,成本下降70%。

  随着AI应用在全社会的普及,模型应用过程中所需的算力可能将超过模型训练所需,云计算是高效利用社会算力资源的最佳途径。

  “云计算与大模型的关系可以说是一枚硬币的两面。”安琳表示,AI计算有两个典型特征:一是AI大规模计算的特性,需要几万张GPU协同工作,与云计算的本质相契合;二是AI算力价格高,通过云计算共享算力可以有效提高算力利用率,降低算力成本。

  产品力如何出圈?

  字节跳动的豆包、腾讯元宝、阿里夸克、MiniMax的Talkie、月之暗面的Kimi……或包罗万象,或小而精美,面向普通用户的App是大模型公司绕不开的选项。

  中信建投证券根据AI产品榜数据统计,2024年12月全球前20的AI产品App端月活合计近8亿,同比增长7.35%;国内前20的AI产品App端月活合计达到1.66亿,同比增长17.65%。

  夸克业务负责人表示,大模型从“写诗作画”走向“解决问题”,在这个过程中,AI能力不仅仅存在于某一个场景和功能里,而是要打造“一站式AI服务”和“系统级全场景AI”能力。“我们希望装上夸克就能让用户的电脑立马升级成AI电脑。用户能用最自然的交互方式享受到高效的信息服务,告别过去在各软件应用间反复切换的体验。”

  此外,互联网大厂本身拥有丰富的数字生活场景。AI大模型在这些场景中落地,有效升级了这些场景的体验。据腾讯混元大模型负责人介绍,腾讯已在超过700个业务场景中接入了混元大模型,服务了数以亿计的用户。

  例如,微信读书基于腾讯混元大模型推出了“AI问书”“AI大纲”等新功能。用户在看电子书时,遇到不懂的名词和概念,如果复制到搜索引擎中去寻找答案,注意力会被分散。AI问书让用户可以直接“划词提问”,由内嵌在微信读书的混元大模型提供解答。

  与通用性AI工具不同的是,“AI问书”回答的内容是基于多本电子书的数据源,用户还可以跳转到其他相关电子书的对应段落。AI回答的内容将多本电子书关联在一起后,用户可以按主题阅读,体系化地进行研究,在学术领域非常有用。

王擎宇本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 support1012@126.com 举报,一经查实,本站将立刻删除。
标签: /
上一篇2025-02-05
下一篇 2025-02-05

相关推荐

  • 灰度迷你比特币信托自推出以来净流入超10亿美元

    灰度宣布旗下迷你比特币信托(BTC)2024 年净流入超过 10 亿美元。截至 12 月 17 日,该 ETF 资管规模超过 40 亿美元。 7 月份,灰度从其较旧的 BTC 和 ETH 基金中分拆出

    2025-02-05 10:04:18
    2022
  • 去年以工代赈吸纳就业总数同比增长31%

    2024年,国家发展改革委支持各地围绕农村小微型基础设施实施2726个以工代赈项目,吸纳36万名农村脱贫人口等低收入群众务工。各地围绕交通水利、农业农村、生态建设、

    2025-02-05 10:04:18
    2002
  • 2025年春风行动已举办4.1万场招聘活动

    人力资源社会保障部今天(3月13日)发布数据,截至3月5日,全国已累计举办各类招聘活动4.1万场,发布岗位3100万个;发出务工人员专车、专列、包机2.9万辆(列、架)次,输送劳

    2025-02-05 10:04:18
    2001
  • 落实增储任务、加强精益管理 中央储备粮安全保障能力增强

    增加小麦、玉米等品种收储规模,跨地区平衡、跨周期调节能力和应急保供水平进一步提升。不断加强储粮精益化管理,中央战略储备粮综合储存损耗率持续控制在1%以内。

    2025-02-05 10:04:18
    2001
  • 被动投资“大时代”来临!

    有公募人士认为,ETF大发展因素较为复杂,核心原因是曾经追捧主动权益明星基金经理的基民,大家的投资体验都不太好,进而也对主动权益的超额创造能力产生了一些质疑,因此

    2025-02-05 10:04:18
    2001
  • 证监会:权益类ETF规模突破3万亿元大关

    证监会19日发布的公告称,今年9月,证监会会同中央金融办出台了推动中长期资金入市的指导意见,着力打通社保、保险、理财等资金入市的堵点痛点,建设培育鼓励长期投资的

    2025-02-05 10:04:18
    2001
  • 宝莱特:前10个月已回购297.06万股股份 耗资2000万元

    针对产品研发和新业务布局,宝莱特还表示,2023 年,公司推出了S系列输注液 泵、电子尿量计量仪、遥测监护系统等全新系列产品,目前公司紧密推进G系列监护仪、CRRT、AED

    2025-02-05 10:04:18
    2001
  • 今年前10月新疆霍尔果斯口岸进出口货运量超3800万吨

    视频无法播放,请升级浏览器至最新版。 据霍尔果斯海关统计,霍尔果斯口岸今年前10月进出口货运量达3801.1万吨,同比增加10%。 从商品种类来看,进口商品主要为机电产品

    2025-02-05 10:04:18
    2001