模型训练提速72倍,NUS与字节合作成果入选AAAI2023杰出论文

近日,人工智能国际顶会AAAI 2023公布评选结果。新加坡国立大学(NUS)与字节跳动机器学习团队(AML)合作的CowClip技术论文入围杰出论文(Distinguished Papers)。CowClip是一项模型训练优化策略,可以在保证模型精度的前提下,实现在单张GPU上的模型训练速度提升72倍,相关代码现已开源。


论文地址:https://arxiv.org/abs/2204.06240

开源地址:https://github.com/bytedance/LargeBatchCTR

AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久的顶级学术会议之一。AAAI 2023共收到8777篇论文投稿,其中1721篇论文被录用,录用率为19.6%。牛津大学计算机科学系获得此次大会的最高奖项(Outstanding Paper Award),北大等机构合作论文则获得学生论文奖(Outstanding Student Paper)。此外,大会还评选出12篇杰出论文(Distinguished Papers),内容涵盖模型训练策略优化、图神经网络优化、神经架构搜索等多个方向。

如何提升模型训练速度是机器学习领域永恒的课题。自从谷歌在2018年提出首个预训练大模型BERT,大模型训练逐渐成为深度学习领域的潮流和趋势。然而,模型体量越来越大也意味着一次完整的训练要花费大量的时间和计算成本。根据此前谷歌发布的信息,训练110亿参数的 T5(谷歌 2019 年推出的预训练模型)变体时,单次运行成本超过130万美元。

入选杰出论文的CowClip模型训练优化策略,通过保障更大批量大小(batch size)的模型精度,可以实现更加充分的GPU性能挖掘,达到提高训练速度的目的。实验显示,利用 CowClip 训练的模型比其它方法不仅精度更高,训练速度也大幅提升,在单张GPU上训练Deep FM模型可以针对公开数据集的数据,将训练时间从12小时压缩至10分钟,一次性将模型训练速度提升72倍。

凭借高效的计算和更加精准的分析与决策能力,人工智能技术正越来越广泛地应用到医疗、金融、制造、教育和电商等领域,而模型训练的精度和效率将持续成为影响人工智能产业发展的关键因素。

据介绍,字节跳动机器学习团队(AML)已将CowClip的核心技术在公司部分业务中落地实践。该团队为公司提供机器学习中台服务,包括为今日头条、抖音、西瓜视频等产品的推荐、广告、搜索等业务场景提供大规模训练系统和推理系统,并通过火山引擎向企业客户提供简单易用、稳定可靠的机器学习平台。


标签:
上一篇2025-08-21

相关推荐

  • 模型训练提速72倍,NUS与字节合作成果入选AAAI2023杰出论文

    近日,人工智能国际顶会AAAI2023公布评选结果。新加坡国立大学(NUS)与字节跳动机器学习团队(AML)合作的CowClip技术论文入围杰出论文(DistinguishedPapers)。CowClip是

    2025-08-21 11:56:57
    854
  • 阿里GPT 15天训出「鸟鸟」嘴替,比ChatGPT Siri刺激多了!

    说来你可能不信,我们这两天都和脱口秀演员「鸟鸟」在一起。咱们来问问ta,去年笑果文化最出圈的梗之一:「你知道虾系男友吗?」ta立即秒答:「听说最近网上流行的虾系男友

    2025-08-21 11:56:57
    959
  • 人工智能基础:人工智能云服务(Alaas)

    1、概念介绍人工智能云服务(AIasaService)是目前主流的人工智能平台的服务方式,它会把几个常见的人工智能服务进行准确划分,并通过云端提供单独或者打包的服务。模式

    2025-08-21 11:56:57
    1437
  • 大模型精准反哺小模型,知识蒸馏助力提高 AI 算法性能

    01知识蒸馏诞生的背景来,深度神经网络(DNN)在工业界和学术界都取得了巨大成功,尤其是在计算机视觉任务方面。深度学习的成功很大程度上归功于其具有数十亿参数的用于

    2025-08-21 11:56:57
    183
  • 从科幻到现实,自动驾驶发展还面临哪些问题?

    近年来,随着自动驾驶的关注度越来越高,低速自动驾驶的商用化也逐渐成为现实。未来,高速自动驾驶一定会得到普及,自动驾驶也必将在交通运输中扮演至关重要的角色。然而

    2025-08-21 11:56:57
    1993
  • 应对全球气候危机,人工智能能做些什么?

    通货膨胀是个全球性的问题,而且随着气候变化正在加剧。这是因为极端天气事件的频率和严重程度的增加导致了食品、能源和其他必需品的价格上涨。但希望还是存在的:人

    2025-08-21 11:56:57
    1059
  • 图计算的学习与思考

    好的软件不是靠程序分析、查错查出来的,而是由正确的人构建出来的。图成为日益重要的运算对象,图结构是对群体关系的一种抽象,可以描述丰富的对象和关系。图计算的核

    2025-08-21 11:56:57
    266
  • 泰达币/usdt钱包下载|usdt泰达币钱包官网下载

    泰达币/usdt钱包有丰富经验的金融风控团队,98%比特币资产存储多重签名快钱包,还有业内专业级操盘工具,更有闪电手充值提取金币快速到账,比特币也是实时到账,还有7×24

    2025-08-21 11:56:57
    952