您的当前位置:首页>科技咨询>资讯详情

小红书开源1420亿参数大模型,性能比肩阿里Qwen

发表于:2025-06-10 13:00:06 浏览:1次 发布者: 网易互联网

6月9日,小红书宣布开源其首个自研大模型dots.llm1,包含1420亿参数的混合专家模型(MoE)和11.2万亿token的高质量训练数据。该模型在部分性能上与阿里Qwen 3模型相当,尤其在中文任务中表现出色,例如在CLUEWSC上取得92.6分,达到业界领先水平。小红书通过引入Interleaved 1F1B with AlltoAll overlap和Grouped GEMM优化,显著提升了计算效率。未来,小红书hi lab团队计划进一步优化模型架构,探索更稀疏的混合专家(MoE)层,并为社区贡献更多全模态大模型。

猜你喜欢

DeepSeek超越ChatGPT 登顶苹果美国区免费APP下
DeepSeek超越ChatGPT 登顶苹果美国区免费APP下
发表于:2025-01-27 浏览:23 发布者: 网易互联网
西藏:加快出台《促进电子商务高质量发展若干措
西藏:加快出台《促进电子商务高质量发展若干措
发表于:2025-02-18 浏览:19 发布者: 网易互联网
Manus向全球用户开放注册
Manus向全球用户开放注册
发表于:2025-05-13 浏览:9 发布者: 网易互联网
蜂助手:已形成服务各种云端生态的AI云手机能力
蜂助手:已形成服务各种云端生态的AI云手机能力
发表于:2025-02-24 浏览:15 发布者: 网易互联网
名创优品窦娜:达成合作的全球IP超150个 销售IP产品超8亿件
名创优品窦娜:达成合作的全球IP超150个 销售IP产品超8亿件
发表于:2024-11-02 浏览:40 发布者: 新浪科技
“双十一”4号消费警示:尾款提价偷袭人
“双十一”4号消费警示:尾款提价偷袭人
发表于:2024-11-10 浏览:59 发布者: 网易互联网
猿辅导素养课官宣课程产品升级,并设立1亿元素
猿辅导素养课官宣课程产品升级,并设立1亿元素
发表于:2024-12-24 浏览:30 发布者: 网易互联网
美团将建立算法公开机制,骑手“超时扣款”将逐
美团将建立算法公开机制,骑手“超时扣款”将逐
发表于:2024-12-30 浏览:22 发布者: 网易互联网
腾讯混元推出5款3D生成模型
腾讯混元推出5款3D生成模型
发表于:2025-03-18 浏览:15 发布者: 网易互联网
拼多多黄峥遭六神磊磊“炮轰”,盗版书问题还曾
拼多多黄峥遭六神磊磊“炮轰”,盗版书问题还曾
发表于:2024-11-12 浏览:43 发布者: 网易互联网