您的当前位置:首页>科技咨询>资讯详情

DeepSeek又更新了!化身更强AI设计师、程序员

发表于:2025-03-25 10:00:19 浏览:13次 发布者: 网易互联网

《科创板日报》3月25日讯(编辑 宋子乔) 3月24日晚间,DeepSeek上线了小版本更新后的DeepSeek-V3模型。新模型的版本号为DeepSeek-V3-0324,模型参数为6850亿,较初代V3版本的6710亿有小幅增长。DeepSeek尚未放出新版模型的系统卡。


开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

值得注意的是,DeepSeek将开源秉持到底,这次将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议,这一协议更为宽松,允许模型蒸馏、商用等行为,给了开发者更多的自主权

在性能上,编程能力的优化成了最大亮点,新版本DeepSeek-V3生成前端代码的能力大大提升


网友让模型设计的天气页面(左由新版DeepSeek-V3生成;右由初代DeepSeek-V3生成)



网友用V3新版本设计的个人网站页面


网友用V3新版本写的小游戏


网友用V3新版本写的文字卡片

据多个博主的测试,新版DeepSeek-V3在网站开发能力、UI设计方面表现优秀,只需要简单的文本提示就能快速开发各种网站、App,审美比肩目前全球最强的闭源代码模型Claude 3.7 Sonnet思维链版本。




由新版DeepSeek-V3生成


由Claude 3.7 Sonnet生成



图1 DeepSeek V3生成


图2 DeepSeek V3 0324生成


图3 Claude Sonnet 3.7生成

《科创板日报》曾报道过初代DeepSeek-V3,该模型甫一上线便以性价比“闻名”。在多项基准测试中,DeepSeek-V3的成绩超越了Qwen2.5-72 B和Llama-3.1-405 B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

幻方量化在已开源的论文中强调其训练成本极低——通过对算法、框架和硬件的优化协同设计,假设H800GPU的租用价格为每块GPU2美元/小时,DeepSeek-V3的全部训练成本总计仅为557.6万美元(注:该成本仅包括DeepSeek-V3的正式训练,不包括与先前在架构、算法或数据上的研究和消融实验相关的成本)。

DeepSeek-V3的API服务定价将上调为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元,按缓存未命中的输入价格计,加总成本是10元人民币。

同类型模型中,OpenAI的GPT 4o定价相当高,输入:5美元/百万Token,输出:15美元/百万Token,加总成本是20美元,约合人民币140元。

猜你喜欢

为什么广告主不愿意在长视频平台投放广告了?
为什么广告主不愿意在长视频平台投放广告了?
发表于:2024-11-11 浏览:47 发布者: 网易互联网
快手:严厉打击“虚假营销不当牟利”等欺诈行为
快手:严厉打击“虚假营销不当牟利”等欺诈行为
发表于:2025-03-13 浏览:14 发布者: 网易互联网
刘强东,大气!外卖骑手的五险一金,个人缴的部
刘强东,大气!外卖骑手的五险一金,个人缴的部
发表于:2025-02-24 浏览:17 发布者: 网易互联网
从“一只蟹”看电商发展如何四季红
从“一只蟹”看电商发展如何四季红
发表于:2024-11-10 浏览:45 发布者: 网易互联网
饿了么紧急入局,补贴大战再升级,外卖市场进入
饿了么紧急入局,补贴大战再升级,外卖市场进入
发表于:2025-05-01 浏览:9 发布者: 网易互联网
小马智行:L4级别自动驾驶行业洗牌暂告段落,明
小马智行:L4级别自动驾驶行业洗牌暂告段落,明
发表于:2024-12-27 浏览:29 发布者: 网易互联网
奇安信:针对DeepSeek的网络攻击再升级
奇安信:针对DeepSeek的网络攻击再升级
发表于:2025-01-30 浏览:22 发布者: 网易互联网
淘宝盯上了小红书的流量
淘宝盯上了小红书的流量
发表于:2025-05-09 浏览:11 发布者: 网易互联网
南威软件:旗下万福信息应用DeepSeek
南威软件:旗下万福信息应用DeepSeek
发表于:2025-02-10 浏览:16 发布者: 网易互联网
巨人网络一季度营收7.24亿元,同比增长3.94%
巨人网络一季度营收7.24亿元,同比增长3.94%
发表于:2025-04-29 浏览:11 发布者: 网易互联网