您的当前位置:首页>科技咨询>资讯详情

提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

发表于:2024-11-04 10:00:04 浏览:52次 发布者: IT之家

IT之家 11 月 3 日消息,字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow

官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。

该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种 RL 算法,显著提升训练吞吐量,降低开发和维护复杂度。

实验结果表明,HybridFlow 在各种模型规模和 RL 算法下,训练吞吐量相比其他框架提升了 1.5 倍至 20 倍

目前,该论文已被 EuroSys 2025 接收,代码仓库也对外公开,IT之家附相关链接如下:

  • 论文链接:https://arxiv.org/abs/2409.19256

  • 代码链接:https://github.com/volcengine/veRL

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

猜你喜欢

【独家】直播吧律师回应与懂球帝App商标争议
【独家】直播吧律师回应与懂球帝App商标争议
发表于:2024-10-31 浏览:37 发布者: 网易互联网
11月27日外媒科学网站摘要:用树叶制造电路板
11月27日外媒科学网站摘要:用树叶制造电路板
发表于:2024-11-27 浏览:35 发布者: 网易科技
晚点独家丨滴滴上线海外聚合出行服务,国际化网
晚点独家丨滴滴上线海外聚合出行服务,国际化网
发表于:2025-01-20 浏览:22 发布者: 网易互联网
再次挑战  小米自研移动芯片预计2025年量产
再次挑战 小米自研移动芯片预计2025年量产
发表于:2024-11-28 浏览:44 发布者: PChome
马上评丨全面取消 “仅退款”,反内卷的必然
马上评丨全面取消 “仅退款”,反内卷的必然
发表于:2025-04-23 浏览:11 发布者: 网易互联网
谷歌DeepMind发布Genie 2模型 可一键生成超逼真
谷歌DeepMind发布Genie 2模型 可一键生成超逼真
发表于:2024-12-18 浏览:34 发布者: 网易IT
1120元买来“问题”二手机遭遇退货难购买“二手
1120元买来“问题”二手机遭遇退货难购买“二手
发表于:2025-04-23 浏览:9 发布者: 网易互联网
谷歌因垄断行为在印尼被罚1200万美元
谷歌因垄断行为在印尼被罚1200万美元
发表于:2025-01-22 浏览:24 发布者: 网易互联网
继接入DeepSeek后,百度APP上线新AI入口
继接入DeepSeek后,百度APP上线新AI入口
发表于:2025-02-24 浏览:15 发布者: 网易互联网
淘宝十亿下注,重塑红人经济新版图
淘宝十亿下注,重塑红人经济新版图
发表于:2025-04-02 浏览:17 发布者: 网易互联网