DeepSeek开源FlashMLA 意味着什么?

  国产AI公司深度求索(DeepSeek开源周正式启动,并公布首个开源代码。

  2月24日,DeepSeek宣布启动“开源周”,首个开源的代码库为FlashMLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化,目前已投入生产。


  此前2月21日午间,DeepSeek宣布,从下周开始,他们将开源5个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展,每日都有新内容解锁,进一步分享新的进展,并将这一计划定义为“Open Source Week”。

  根据DeepSeek在社交媒体上的内容,在H800上可以实现每秒处理3000GB数据,每秒执行580万亿次浮点运算。

  Hopper是英伟达的GPU(图形处理芯片架构,例如H100和H800,发布于2022年,主要用于AI计算。

  有意思的是,如果把这段内容交给DeepSeek网页版,询问开源意义,DeepSeek回答称,可以理解为专门给高性能显卡(比如英伟达的Hopper系列GPU设计的“加速神器”,用来提高AI处理任务的效率。

  DeepSeek举例,假如开了一家快递分拣站,每天要处理不同大小的包裹,传统方法是用固定大小的筐子装,小包裹浪费空间,大包裹又得分筐装,效率很低。而FlashMLA就像一套“智能分拣系统”,能自动根据包裹大小调整筐子尺寸,让所有包裹快速、整齐地装车,既省时间又省钱。

  马斯克旗下xAI的大模型Grok3则评价称,FlashMLA表明DeepSeek在AI硬件加速领域有深厚积累。MLA本身是他们的创新,而 FlashMLA则是将这种创新落地到硬件的具体实现,性能指标(3000GB/s和580TFLOPS足以媲美业界顶尖方案(如 FlashAttention。

  Grok3 称,”想象你有个超级聪明的 AI,但它跑得不够快,因为每次处理句子时都要浪费很多时间搬数据和算复杂的数学题。FlashMLA 就像给AI加了个‘涡轮增压引擎’,专门装在英伟达的Hopper GPU上。它能让AI用更少的内存、更快的速度处理各种长短不一的句子,开源之后,AI开发会变得更快、更省钱。”

  作为开源大模型,DeepSeek的火爆已经带动了开源成为如今的AI产业新趋势。

  香港科技大学校董会主席、美国国家工程院外籍院士沈向洋在2025全球开发者先锋大会(GDC上表示,尽管当前闭源的份额仍然超过开源的份额,但接下来一两年将剧烈变化,平衡开源与闭源,引领未来。“大模型时代,开源并没有像以往那么多、那么快,我想,通过上海的努力,我相信开源这件事情会越做越好。中国的团队、上海的团队一定会引领开源潮流。”

  头部大厂纷纷跟进开源潮流。2月21日,据阿里巴巴通义实验室科学家黄斐介绍,到目前为止,整个通义千问(Qwen系列模型的下载量达到了1.8亿,累计衍生模型总数达到9万个,衍生模型数已经超越Meta的Llama系列,成为了全球第一大开源模型系列。

  百度宣布将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源;文心一言自4月1日起全面免费,所有PC端和APP端用户均可体验文心系列最新模型。

王擎宇本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 support1012@126.com 举报,一经查实,本站将立刻删除。
标签: /
上一篇2025-02-24
下一篇 2025-02-24

相关推荐

  • 灰度迷你比特币信托自推出以来净流入超10亿美元

    灰度宣布旗下迷你比特币信托(BTC)2024 年净流入超过 10 亿美元。截至 12 月 17 日,该 ETF 资管规模超过 40 亿美元。 7 月份,灰度从其较旧的 BTC 和 ETH 基金中分拆出

    2025-02-24 16:02:50
    2022
  • 去年以工代赈吸纳就业总数同比增长31%

    2024年,国家发展改革委支持各地围绕农村小微型基础设施实施2726个以工代赈项目,吸纳36万名农村脱贫人口等低收入群众务工。各地围绕交通水利、农业农村、生态建设、

    2025-02-24 16:02:50
    2002
  • 2025年春风行动已举办4.1万场招聘活动

    人力资源社会保障部今天(3月13日)发布数据,截至3月5日,全国已累计举办各类招聘活动4.1万场,发布岗位3100万个;发出务工人员专车、专列、包机2.9万辆(列、架)次,输送劳

    2025-02-24 16:02:50
    2001
  • 落实增储任务、加强精益管理 中央储备粮安全保障能力增强

    增加小麦、玉米等品种收储规模,跨地区平衡、跨周期调节能力和应急保供水平进一步提升。不断加强储粮精益化管理,中央战略储备粮综合储存损耗率持续控制在1%以内。

    2025-02-24 16:02:50
    2001
  • 被动投资“大时代”来临!

    有公募人士认为,ETF大发展因素较为复杂,核心原因是曾经追捧主动权益明星基金经理的基民,大家的投资体验都不太好,进而也对主动权益的超额创造能力产生了一些质疑,因此

    2025-02-24 16:02:50
    2001
  • 证监会:权益类ETF规模突破3万亿元大关

    证监会19日发布的公告称,今年9月,证监会会同中央金融办出台了推动中长期资金入市的指导意见,着力打通社保、保险、理财等资金入市的堵点痛点,建设培育鼓励长期投资的

    2025-02-24 16:02:50
    2001
  • 宝莱特:前10个月已回购297.06万股股份 耗资2000万元

    针对产品研发和新业务布局,宝莱特还表示,2023 年,公司推出了S系列输注液 泵、电子尿量计量仪、遥测监护系统等全新系列产品,目前公司紧密推进G系列监护仪、CRRT、AED

    2025-02-24 16:02:50
    2001
  • 今年前10月新疆霍尔果斯口岸进出口货运量超3800万吨

    视频无法播放,请升级浏览器至最新版。 据霍尔果斯海关统计,霍尔果斯口岸今年前10月进出口货运量达3801.1万吨,同比增加10%。 从商品种类来看,进口商品主要为机电产品

    2025-02-24 16:02:50
    2001