您的当前位置:首页>科技咨询>资讯详情

京东云全面适配最新版DeepSeek模型,推理速度提

发表于:2025-03-27 00:00:05 浏览:15次 发布者: 网易互联网

来源:中国新闻网

近日,DeepSeek发布了模型更新——DeepSeek-V3-0324,此次升级不仅延续了DeepSeek系列“低成本、高性能”的基因,更凭借MLA(多头潜在注意力)和MTP(多Token预测)两大创新技术,将推理速度显著提升。京东云DeepSeek一体机第一时间完成适配,相比开源版本性能大幅提升50%。

单机支持超千并发:单机支持1000+并发请求,总吞吐突破7200 Token/s,可同时服务超大规模企业级AI应用。

极致数据吞吐保障:500并发时仍保持11.03 Token/s,平衡性能与用户体验。


据悉,此次DeepSeek模型更新,通过MLA技术通过将高维特征压缩至低维潜在空间,显著减少计算资源消耗;MTP技术则提升数据利用效率,实现时间维度的资源优化。二者的结合,使得DeepSeek-V3-0324在复杂任务处理中展现出更快的响应速度与更高的稳定性。

京东云DeepSeek一体机通过融合MLA+MTP双技术,为企业提供无缝适配的推理加速方案。此次支持的DeepSeek-V3-0324版本,延续了“单机即可部署满血版模型”的特性,用户无需复杂配置即可运行完整版大模型,满足千人规模企业的并发需求。

同时,京东云DeepSeek一体机还支持华为昇腾、海光等国产AI芯片,兼顾性能与安全自主可控。并通过采用自研算力池化与智能推理加速引擎,软硬协同下推理速度较开源方案提升高达50%。

当前,京东云DeepSeek一体机已广泛应用于政务、金融、科研、能源、医疗、工业、科研等领域。以“推理加速+算力池化”的双重策略,实现同等硬件规格下、同等参数规格下更高效的推理能力和资源利用率,通过将复杂的AI工程化过程封装为标准化产品,让企业无需纠结于“造轮子”,而是聚焦于“用AI创造价值”,更好地进行AI智能化转型。

猜你喜欢

从杭州到长沙,马云在传递哪些信号?
从杭州到长沙,马云在传递哪些信号?
发表于:2025-02-15 浏览:30 发布者: 网易互联网
印尼反垄断机构回应Grab与GoTo合并传闻:开始研
印尼反垄断机构回应Grab与GoTo合并传闻:开始研
发表于:2025-05-21 浏览:13 发布者: 网易互联网
顺丰、德邦发布春节服务公告:将加收资源调节费
顺丰、德邦发布春节服务公告:将加收资源调节费
发表于:2025-01-07 浏览:53 发布者: 网易互联网
腾讯元宝超越豆包 升至中国区免费APP下载排行榜
腾讯元宝超越豆包 升至中国区免费APP下载排行榜
发表于:2025-02-22 浏览:32 发布者: 网易互联网
京东外卖宣布:正式启动“双百计划”
京东外卖宣布:正式启动“双百计划”
发表于:2025-07-08 浏览:7 发布者: 网易互联网
华为、微信,大消息!
华为、微信,大消息!
发表于:2024-12-23 浏览:26 发布者: 网易互联网
台积电创始人张忠谋:美国工厂进展状况良好,但不会有完工典礼
台积电创始人张忠谋:美国工厂进展状况良好,但不会有完工典礼
发表于:2024-11-17 浏览:52 发布者: 砍柴网
欧盟为6G再提供1.27亿欧元资金支持
欧盟为6G再提供1.27亿欧元资金支持
发表于:2024-11-09 浏览:42 发布者: 环球网
京东方“向新2025”年终媒体智享会首站落地上海
京东方“向新2025”年终媒体智享会首站落地上海
发表于:2024-12-19 浏览:31 发布者: 网易互联网
阿里凌晨开源新模型:性能对标DeepSeek-R1,参
阿里凌晨开源新模型:性能对标DeepSeek-R1,参
发表于:2025-03-06 浏览:21 发布者: 网易互联网