您的当前位置:首页>科技咨询>资讯详情

提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

发表于:2024-11-04 10:00:04 浏览:57次 发布者: IT之家

IT之家 11 月 3 日消息,字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow

官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。

该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种 RL 算法,显著提升训练吞吐量,降低开发和维护复杂度。

实验结果表明,HybridFlow 在各种模型规模和 RL 算法下,训练吞吐量相比其他框架提升了 1.5 倍至 20 倍

目前,该论文已被 EuroSys 2025 接收,代码仓库也对外公开,IT之家附相关链接如下:

  • 论文链接:https://arxiv.org/abs/2409.19256

  • 代码链接:https://github.com/volcengine/veRL

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

猜你喜欢

阶跃星辰×光影焕像联合打造超强3D生成引擎Step
阶跃星辰×光影焕像联合打造超强3D生成引擎Step
发表于:2025-05-16 浏览:12 发布者: 网易互联网
传滴滴自动驾驶正谋求新融资,估值或将超360亿
传滴滴自动驾驶正谋求新融资,估值或将超360亿
发表于:2025-03-04 浏览:21 发布者: 网易互联网
抖音要对“流量”动刀了
抖音要对“流量”动刀了
发表于:2025-01-09 浏览:30 发布者: 网易互联网
Meta称不会签署欧盟最终版《通用人工智能行为准
Meta称不会签署欧盟最终版《通用人工智能行为准
发表于:2025-07-18 浏览:6 发布者: 网易科技
巨头的战场:外卖行业又变天了
巨头的战场:外卖行业又变天了
发表于:2025-02-17 浏览:23 发布者: 网易互联网
阿里通义千问推出多模态模型Qwen VLo
阿里通义千问推出多模态模型Qwen VLo
发表于:2025-06-29 浏览:7 发布者: 网易互联网
千亿电池明星破产!1400亿融资烧干,“生活费”只够一周,金主大众也难救
千亿电池明星破产!1400亿融资烧干,“生活费”只够一周,金主大众也难救
发表于:2024-11-25 浏览:44 发布者: 智能车参考
速卖通英国站上线“小时达”服务
速卖通英国站上线“小时达”服务
发表于:2025-07-10 浏览:10 发布者: 网易互联网
杨浦V聚场首批大V入驻,UP主“籽岷”:“沪九条
杨浦V聚场首批大V入驻,UP主“籽岷”:“沪九条
发表于:2025-07-18 浏览:6 发布者: 网易互联网
叮咚买菜谈出海:与当地头部零售商合作,做供应
叮咚买菜谈出海:与当地头部零售商合作,做供应
发表于:2025-07-22 浏览:4 发布者: 网易互联网