您的当前位置:首页>科技咨询>资讯详情

小红书开源1420亿参数大模型,性能比肩阿里Qwen

发表于:2025-06-10 13:00:06 浏览:12次 发布者: 网易互联网

6月9日,小红书宣布开源其首个自研大模型dots.llm1,包含1420亿参数的混合专家模型(MoE)和11.2万亿token的高质量训练数据。该模型在部分性能上与阿里Qwen 3模型相当,尤其在中文任务中表现出色,例如在CLUEWSC上取得92.6分,达到业界领先水平。小红书通过引入Interleaved 1F1B with AlltoAll overlap和Grouped GEMM优化,显著提升了计算效率。未来,小红书hi lab团队计划进一步优化模型架构,探索更稀疏的混合专家(MoE)层,并为社区贡献更多全模态大模型。

猜你喜欢

16岁的双十一步入新拐点
16岁的双十一步入新拐点
发表于:2024-11-12 浏览:53 发布者: 网易互联网
美团CEO王兴:要不惜代价赢下竞争,外卖行业存在
发表于:2025-05-27 浏览:14 发布者: 网易互联网
消息称阿里巴巴本周将发布其首款自研AI眼镜
消息称阿里巴巴本周将发布其首款自研AI眼镜
发表于:2025-07-23 浏览:3 发布者: 网易科技
海信视像申请基于运动补偿的双目图像显示方法及
海信视像申请基于运动补偿的双目图像显示方法及
发表于:2025-04-22 浏览:13 发布者: 网易科技
曝荣耀Magic7系列备货量提升近2倍,销量信心十足
曝荣耀Magic7系列备货量提升近2倍,销量信心十足
发表于:2024-10-26 浏览:83 发布者: iMobile手机之家
Meta据悉正与Scale AI洽谈超100亿美元投资
Meta据悉正与Scale AI洽谈超100亿美元投资
发表于:2025-06-09 浏览:19 发布者: 网易科技
Qwen3发布!超DeepSeek R1登顶开源榜,还带来了
Qwen3发布!超DeepSeek R1登顶开源榜,还带来了
发表于:2025-04-29 浏览:14 发布者: 网易互联网
京东领投骑手保障战,为骑手系上职业“安全带”
京东领投骑手保障战,为骑手系上职业“安全带”
发表于:2025-02-21 浏览:28 发布者: 网易互联网
DeepSeek,上新!
DeepSeek,上新!
发表于:2025-03-25 浏览:18 发布者: 网易互联网
壹快评丨加速推进滥用算法治理,需要多方面合力
壹快评丨加速推进滥用算法治理,需要多方面合力
发表于:2025-01-01 浏览:33 发布者: 网易互联网