您的当前位置:首页>科技咨询>资讯详情

京东云全面适配最新版DeepSeek模型,推理速度提

发表于:2025-03-27 00:00:05 浏览:16次 发布者: 网易互联网

来源:中国新闻网

近日,DeepSeek发布了模型更新——DeepSeek-V3-0324,此次升级不仅延续了DeepSeek系列“低成本、高性能”的基因,更凭借MLA(多头潜在注意力)和MTP(多Token预测)两大创新技术,将推理速度显著提升。京东云DeepSeek一体机第一时间完成适配,相比开源版本性能大幅提升50%。

单机支持超千并发:单机支持1000+并发请求,总吞吐突破7200 Token/s,可同时服务超大规模企业级AI应用。

极致数据吞吐保障:500并发时仍保持11.03 Token/s,平衡性能与用户体验。


据悉,此次DeepSeek模型更新,通过MLA技术通过将高维特征压缩至低维潜在空间,显著减少计算资源消耗;MTP技术则提升数据利用效率,实现时间维度的资源优化。二者的结合,使得DeepSeek-V3-0324在复杂任务处理中展现出更快的响应速度与更高的稳定性。

京东云DeepSeek一体机通过融合MLA+MTP双技术,为企业提供无缝适配的推理加速方案。此次支持的DeepSeek-V3-0324版本,延续了“单机即可部署满血版模型”的特性,用户无需复杂配置即可运行完整版大模型,满足千人规模企业的并发需求。

同时,京东云DeepSeek一体机还支持华为昇腾、海光等国产AI芯片,兼顾性能与安全自主可控。并通过采用自研算力池化与智能推理加速引擎,软硬协同下推理速度较开源方案提升高达50%。

当前,京东云DeepSeek一体机已广泛应用于政务、金融、科研、能源、医疗、工业、科研等领域。以“推理加速+算力池化”的双重策略,实现同等硬件规格下、同等参数规格下更高效的推理能力和资源利用率,通过将复杂的AI工程化过程封装为标准化产品,让企业无需纠结于“造轮子”,而是聚焦于“用AI创造价值”,更好地进行AI智能化转型。

猜你喜欢

社交媒体X周一频繁宕机,马斯克称遭遇大规模网
社交媒体X周一频繁宕机,马斯克称遭遇大规模网
发表于:2025-03-11 浏览:21 发布者: 网易互联网
靠发疯反击大数据杀熟,是爽文还是幻想?
靠发疯反击大数据杀熟,是爽文还是幻想?
发表于:2025-01-15 浏览:55 发布者: 网易互联网
“人工智能教父”辛顿公开支持马斯克起诉OpenAI
“人工智能教父”辛顿公开支持马斯克起诉OpenAI
发表于:2024-12-31 浏览:38 发布者: 网易IT
OPEN AI表示将采取“反制措施”以保护其知识产
OPEN AI表示将采取“反制措施”以保护其知识产
发表于:2025-01-29 浏览:24 发布者: 网易互联网
Veo 3全网实测惊艳所有人!DeepMind CTO:规模
Veo 3全网实测惊艳所有人!DeepMind CTO:规模
发表于:2025-05-21 浏览:12 发布者: 网易互联网
厉玲:山姆应该怎么学?
厉玲:山姆应该怎么学?
发表于:2024-11-05 浏览:43 发布者: 联商网linkshop
59家中国眼镜厂商亮相CES,如何解决AI眼镜响应
59家中国眼镜厂商亮相CES,如何解决AI眼镜响应
发表于:2025-01-09 浏览:31 发布者: 网易科技
Net-a-Porter关闭中国线上渠道 奢侈品电商前途
Net-a-Porter关闭中国线上渠道 奢侈品电商前途
发表于:2025-02-16 浏览:28 发布者: 网易互联网
美情报机构攻击中国大型商用密码产品提供商,调
美情报机构攻击中国大型商用密码产品提供商,调
发表于:2025-04-28 浏览:15 发布者: 网易互联网
英伟达周一收盘价创历史新高 市值超过3.4万亿美
英伟达周一收盘价创历史新高 市值超过3.4万亿美
发表于:2024-10-30 浏览:87 发布者: 网易IT