您的当前位置:首页>科技咨询>资讯详情

月之暗面发布并开源Kimi K2模型

发表于:2025-07-12 14:00:08 浏览:17次 发布者: 网易互联网

来源:环球网

【环球网科技综合报道】7月12日消息,月之暗面于昨日正式发布Kimi K2模型,并同步宣布开源。该模型作为一款采用MoE架构的基础模型,总参数达1T,激活参数为32B,在代码能力与通用Agent任务处理方面表现突出。


在技术性能上,Kimi K2模型展现出强劲实力。在SWE Bench Verified、Tau2、AceBench等多项基准性能测试中,该模型均取得开源模型中的最优成绩,充分彰显了其在代码、Agent及数学推理任务上的领先水平。值得关注的是,在预训练阶段,Kimi K2采用MuonClip优化器,实现了万亿参数模型的稳定高效训练。在当前人类高质量数据成为发展瓶颈的背景下,这一技术有效提升了Token利用效率,为模型找到新的Scaling空间。尤其在自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(Math & Reasoning)三大核心能力维度的基准性能测试中,Kimi K2均收获优秀表现。

除了在基准测试中成绩亮眼,Kimi K2在多个实际应用场景中也体现出更强的能力泛化性和实用价值,进一步验证了其技术落地的潜力。

为方便用户体验与应用,即日起,用户可通过访问官网kimi.com、下载Kimi App,体验全新的Kimi K2模型。同时,其API服务已同步上线,提供兼容OpenAI和Anthropic的Chat API接口,支持最长128K上下文,具备更强的通用性与工具调用能力,用户可将常用的大模型工具便捷切换至Kimi K2,满足多样化的使用需求。(纯钧)

猜你喜欢

豆包深度思考和文生图3.0模型开放API
豆包深度思考和文生图3.0模型开放API
发表于:2025-04-17 浏览:27 发布者: 网易互联网
AI把地球“榨干”,数据中心被迫“上天”?
AI把地球“榨干”,数据中心被迫“上天”?
发表于:2025-06-09 浏览:37 发布者: 网易科技
鸿蒙不怕远征难
鸿蒙不怕远征难
发表于:2025-08-17 浏览:10 发布者: 网易互联网
海能达“情指行一体化实战平台”深度融合DeepSe
海能达“情指行一体化实战平台”深度融合DeepSe
发表于:2025-02-24 浏览:29 发布者: 网易互联网
吞下17亿图片,Meta最强巨兽DINOv3开源!重新定
吞下17亿图片,Meta最强巨兽DINOv3开源!重新定
发表于:2025-08-15 浏览:8 发布者: 网易科技
美团宣布2025年5月起全面免除骑手外卖柜使用费
美团宣布2025年5月起全面免除骑手外卖柜使用费
发表于:2025-05-01 浏览:28 发布者: 网易互联网
仅用8小时,用Vim编辑器手搓BadApple火了!
仅用8小时,用Vim编辑器手搓BadApple火了!
发表于:2025-01-16 浏览:49 发布者: 网易互联网
国家邮政局:目前各快递企业正统筹全网资源,积
国家邮政局:目前各快递企业正统筹全网资源,积
发表于:2025-01-21 浏览:40 发布者: 网易互联网
京东外卖带动京东集团新业务收入增长199%,唯品
京东外卖带动京东集团新业务收入增长199%,唯品
发表于:2025-08-15 浏览:8 发布者: 网易互联网
2月26日外媒科学网站摘要:垃圾食品吃太多会
2月26日外媒科学网站摘要:垃圾食品吃太多会
发表于:2025-02-26 浏览:26 发布者: 网易科技