您的当前位置:首页>科技咨询>资讯详情

幻方量化旗下DeepSeek发布开源模型,超越阿里Qw

发表于:2024-12-27 12:00:04 浏览:38次 发布者: 网易互联网

蓝鲸新闻12月27日讯 12月26日晚,AI公司深度求索(DeepSeek)正式上线全新系列模型DeepSeek-V3首个版本并同步开源。该模型在多项评测集上超越了阿里Qwen2.5-72B、Meta的Llama-3.1-405B等其他开源模型,并逼近GPT-4o、Claude-3.5-Sonnet等顶尖闭源模型。据官方技术论文披露,v3模型的总训练成本为557.6万美元,GPT-4o等模型的训练成本约为1亿美元。DeepSeek-V3定价为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元,并享有45天的优惠价格体验期。今年5月,DeepSeek是率先发起国内大模型价格战的公司之一。(蓝鲸新闻 朱俊熹)

猜你喜欢

外媒:大模型太烧钱,建议OpenAI在2025年IPO融
外媒:大模型太烧钱,建议OpenAI在2025年IPO融
发表于:2024-12-18 浏览:42 发布者: 网易IT
传岚图旗下多款新车将采用华为方案 开发流程学习理想
传岚图旗下多款新车将采用华为方案 开发流程学习理想
发表于:2024-11-27 浏览:45 发布者: CNMO
饿了么蓝骑士节启动“五个一”服务
饿了么蓝骑士节启动“五个一”服务
发表于:2024-12-18 浏览:37 发布者: 网易互联网
电商竞争转向,天猫小红书再“握手”
电商竞争转向,天猫小红书再“握手”
发表于:2025-05-07 浏览:18 发布者: 网易互联网
电厂 | 搭档华为,科大讯飞让国产大模型落地生根
电厂 | 搭档华为,科大讯飞让国产大模型落地生根
发表于:2024-10-29 浏览:39 发布者: 新浪财经头条
专访昆仑万维方汉:AI不能画饼,“能挣钱这件事
专访昆仑万维方汉:AI不能画饼,“能挣钱这件事
发表于:2025-04-30 浏览:18 发布者: 网易科技
淘宝加速出海,哈萨克斯坦上线俄语版
淘宝加速出海,哈萨克斯坦上线俄语版
发表于:2025-05-15 浏览:12 发布者: 网易互联网
Temu低配版,亚马逊正式测试低价商店“Haul”|
Temu低配版,亚马逊正式测试低价商店“Haul”|
发表于:2024-11-19 浏览:37 发布者: 网易互联网
B站发布2024年Q3财报:首次实现单季度盈利 社区活跃度创新高
B站发布2024年Q3财报:首次实现单季度盈利 社区活跃度创新高
发表于:2024-11-16 浏览:51 发布者: 快科技官方
阿里发布并开源千问3,称成本仅需DeepSeek-R1三
阿里发布并开源千问3,称成本仅需DeepSeek-R1三
发表于:2025-04-29 浏览:14 发布者: 网易互联网