您的当前位置：首页>科技咨询>资讯详情

小红书开源1420亿参数大模型，性能比肩阿里Qwen

发表于：2025-06-10 13:00:06 浏览：1次发布者：网易互联网

6月9日，小红书宣布开源其首个自研大模型dots.llm1，包含1420亿参数的混合专家模型（MoE）和11.2万亿token的高质量训练数据。该模型在部分性能上与阿里Qwen 3模型相当，尤其在中文任务中表现出色，例如在CLUEWSC上取得92.6分，达到业界领先水平。小红书通过引入Interleaved 1F1B with AlltoAll overlap和Grouped GEMM优化，显著提升了计算效率。未来，小红书hi lab团队计划进一步优化模型架构，探索更稀疏的混合专家（MoE）层，并为社区贡献更多全模态大模型。

猜你喜欢

: DeepSeek超越ChatGPT 登顶苹果美国区免费APP下; 发表于：2025-01-27 浏览：23 发布者：网易互联网

: 西藏：加快出台《促进电子商务高质量发展若干措; 发表于：2025-02-18 浏览：19 发布者：网易互联网

: Manus向全球用户开放注册; 发表于：2025-05-13 浏览：9 发布者：网易互联网

: 蜂助手：已形成服务各种云端生态的AI云手机能力; 发表于：2025-02-24 浏览：15 发布者：网易互联网

: 名创优品窦娜：达成合作的全球IP超150个销售IP产品超8亿件; 发表于：2024-11-02 浏览：40 发布者：新浪科技

: “双十一”4号消费警示：尾款提价偷袭人; 发表于：2024-11-10 浏览：59 发布者：网易互联网

: 猿辅导素养课官宣课程产品升级，并设立1亿元素; 发表于：2024-12-24 浏览：30 发布者：网易互联网

: 美团将建立算法公开机制，骑手“超时扣款”将逐; 发表于：2024-12-30 浏览：22 发布者：网易互联网

: 腾讯混元推出5款3D生成模型; 发表于：2025-03-18 浏览：15 发布者：网易互联网

: 拼多多黄峥遭六神磊磊“炮轰”，盗版书问题还曾; 发表于：2024-11-12 浏览：43 发布者：网易互联网

推荐文章

