百亿私募大动作 成立AI公司!与高校合作撰写涉及大模型论文

  来源:中国基金报

  百亿量化私募,纷纷加入人工智能(AI“军备竞赛”。

  记者从业内获悉,近期,沪上百亿量化私募念空科技成立了上海全频思维人工智能科技有限公司(中文简称全频思维,英文简称AllMind,探索AI的前沿课题。该公司还和上海交通大学计算机学院合作撰写论文《面向特定任务大型语言模型的监督微调与强化学习分步式自适应集成》,于今年5月投向NIPS(神经信息处理系统大会。

  今年截至目前,九坤、宽德、鸣石、黑翼等多家百亿私募积极布局AI。业内人士认为,DeepSeek火爆,量化行业备受鼓舞。机构依靠自身人才和技术方面的优势,积极探索AI领域。此举不仅能提升自身竞争力,而且可以拓展业务边界,为科技创新出力。

  成立人工智能科技公司

  与高校合作撰写涉及大模型论文

  5月19日,念空科技成立了全频思维(AllMind,为一家专注于研究通用大语言模型(LLM相关底层算法和工程技术的创新型科技公司。

  念空科技创始人王啸告诉记者,AllMind更着眼于大模型的基础学术研究和应用,短期内并不以盈利为目的,“公司致力于探索人工智能的前沿课题,短期内会着眼于训练一个基于金融数据的专项大模型,也会着眼于解决当前大模型存在的一些痛点,比如提升其逻辑推理能力,减轻大模型的幻觉问题,探索大模型是否能进行自主创新。未来我们还会和学术及产业界合作,在新材料、医药研发、AI助手等领域尝试大模型的应用。”

  记者还了解到,由念空科技和上海交通大学计算机学院合作撰写的《面向特定任务大型语言模型的监督微调与强化学习分步式自适应集成》(英文名称为“Step-wise Adaptive Integration of Supervised Fine-tuning and Reinforcement Learning for Task-Specific LLMs”,于5月20日投向NIPS,目前尚未发表。

  王啸表示,ChatGPT的诞生依赖于大量的预训练和监督微调(SFT,2025年DeepSeek问世,表明了大量基于强化学习(RL的后训练对大模型的推理能力非常重要,在DeepSeek的论文中介绍了整个训练过程被分成SFT-RL-SFT-RL四个过程。“就像我们人类学习一样,SFT相当于刷题,RL相当于把做过的题举一反三,总结经验。一边刷题、一边思考总结的学生,往往成绩更好。对过往经验的总结思考对人类的学习效率非常重要,这是大模型训练中RL能大幅提升模型推理能力的原因。”

  关于该论文,王啸介绍,他们从人类的学习方法中得到启发,如果高频地在刷题和考试经验总结之间切换,可能更有利于学习成绩(推理能力的提高,“所以我们设计了一种Step By Step切换SFT和RL的训练方法,在下一个Step训练之前,根据我们设计的自适应的算法决定下一个Step用SFT还是RL。最终实验发现,在三个不同的公开数据集上,我们提出的新的训练框架明显优于单独的SFT、单独的RL以及简单混合SFT和RL,证明该框架是当下更优的后训练方式。”

  多家量化私募积极探索AI领域

  今年2月,沪上百亿量化私募宽德投资发布招聘信息,为宽德智能学习实验室招聘AI人才,专注于研发通用性,其主要招聘岗位包括AI研究员和AI工程师。

  宽德投资表示,该实验室的成立源于公司对AI的战略思考,在宽德的支持下,其将作为独立孵化、自主运营的创业性实验室,专注于科研领域的超级科技助手。该实验室起步于量化,但不止于金融场景,向着人工智能的星辰大海启航。

  年初,国内量化巨头九坤投资携手微软团队发布了一篇涉及AI领域的论文,其成功复现DeepSeek-R1的工作,还首次发现了语言混合(例如中英文夹杂会显著降低推理能力等问题。

  据了解,九坤投资较早成立了人工智能实验室,致力于前沿AI技术研究,探索通用技术并推动其场景应用,还在多个细分领域开展了多元化研究拓展,加速AI在应用领域落地。

  鸣石基金表示,近年来不断提升AI在量化投研领域的比重,现在AI全流程参与因子挖掘、模型优化、风控、交易等投研环节,提升了投研效率和量化策略迭代。“我们在2021年就成立了AI实验室G-Lab,赋能因子、信号、模型优化、交易算法等,并在此基础上研究AI在金融领域的创新应用。”

  此外,2022年,鸣石基金启动算力硬件基础设施的建设,先后投入运行了鸣石超算一期“仙女座”、二期“英仙座”。2025年,公司“星座计划”超算系列还将进一步扩容。同时,公司正面向全球招聘AI科学家,推动AI技术创新和应用落地,探索深度学习、机器学习等前沿算法,持续迭代和优化预测模型。

  黑翼资产称,目前公司投研体系实现了全流程AI量化投资,即在整个策略研发过程中,包括数据分析、因子挖掘、收益预测、组合优化等环节中,都植入了人工智能技术。“应用大语言模型,能够处理海量的结构化与非结构化数据,能够对研报等复杂的文本数据进行识别、分析和处理,还有使用AI技术提升因子的挖掘精度和效率。交易实现环节,我们靠AI算法来预测市场很短时间之内的价格走势以及流动性变化,最小化交易成本。”

  一位量化私募市场人士表示,目前,量化私募大多数正在提升AI在投研中的比重,以提高投研效率。“除了极少数的量化私募采用全流程AI投研外,其他机构采用AI技术仅作为一种辅助工具参与投研,未来会有越来越多的私募加大AI投入,包括人才招聘、硬件基础设施等,量化行业也会掀起AI人才争夺战。”

叶景本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 support1012@126.com 举报,一经查实,本站将立刻删除。
标签: /
上一篇2025-05-27

相关推荐

  • 灰度迷你比特币信托自推出以来净流入超10亿美元

    灰度宣布旗下迷你比特币信托(BTC)2024 年净流入超过 10 亿美元。截至 12 月 17 日,该 ETF 资管规模超过 40 亿美元。 7 月份,灰度从其较旧的 BTC 和 ETH 基金中分拆出

    2025-05-27 10:04:28
    2024
  • 去年以工代赈吸纳就业总数同比增长31%

    2024年,国家发展改革委支持各地围绕农村小微型基础设施实施2726个以工代赈项目,吸纳36万名农村脱贫人口等低收入群众务工。各地围绕交通水利、农业农村、生态建设、

    2025-05-27 10:04:28
    2004
  • 被动投资“大时代”来临!

    有公募人士认为,ETF大发展因素较为复杂,核心原因是曾经追捧主动权益明星基金经理的基民,大家的投资体验都不太好,进而也对主动权益的超额创造能力产生了一些质疑,因此

    2025-05-27 10:04:28
    2004
  • 证监会:权益类ETF规模突破3万亿元大关

    证监会19日发布的公告称,今年9月,证监会会同中央金融办出台了推动中长期资金入市的指导意见,着力打通社保、保险、理财等资金入市的堵点痛点,建设培育鼓励长期投资的

    2025-05-27 10:04:28
    2004
  • 2025年春风行动已举办4.1万场招聘活动

    人力资源社会保障部今天(3月13日)发布数据,截至3月5日,全国已累计举办各类招聘活动4.1万场,发布岗位3100万个;发出务工人员专车、专列、包机2.9万辆(列、架)次,输送劳

    2025-05-27 10:04:28
    2003
  • 宝莱特:前10个月已回购297.06万股股份 耗资2000万元

    针对产品研发和新业务布局,宝莱特还表示,2023 年,公司推出了S系列输注液 泵、电子尿量计量仪、遥测监护系统等全新系列产品,目前公司紧密推进G系列监护仪、CRRT、AED

    2025-05-27 10:04:28
    2003
  • 落实增储任务、加强精益管理 中央储备粮安全保障能力增强

    增加小麦、玉米等品种收储规模,跨地区平衡、跨周期调节能力和应急保供水平进一步提升。不断加强储粮精益化管理,中央战略储备粮综合储存损耗率持续控制在1%以内。

    2025-05-27 10:04:28
    2002
  • 今年前10月新疆霍尔果斯口岸进出口货运量超3800万吨

    视频无法播放,请升级浏览器至最新版。 据霍尔果斯海关统计,霍尔果斯口岸今年前10月进出口货运量达3801.1万吨,同比增加10%。 从商品种类来看,进口商品主要为机电产品

    2025-05-27 10:04:28
    2002