您的当前位置:首页>科技咨询>资讯详情

DeepSeek又更新了!化身更强AI设计师、程序员

发表于:2025-03-25 10:00:19 浏览:22次 发布者: 网易互联网

《科创板日报》3月25日讯(编辑 宋子乔) 3月24日晚间,DeepSeek上线了小版本更新后的DeepSeek-V3模型。新模型的版本号为DeepSeek-V3-0324,模型参数为6850亿,较初代V3版本的6710亿有小幅增长。DeepSeek尚未放出新版模型的系统卡。


开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

值得注意的是,DeepSeek将开源秉持到底,这次将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议,这一协议更为宽松,允许模型蒸馏、商用等行为,给了开发者更多的自主权

在性能上,编程能力的优化成了最大亮点,新版本DeepSeek-V3生成前端代码的能力大大提升


网友让模型设计的天气页面(左由新版DeepSeek-V3生成;右由初代DeepSeek-V3生成)



网友用V3新版本设计的个人网站页面


网友用V3新版本写的小游戏


网友用V3新版本写的文字卡片

据多个博主的测试,新版DeepSeek-V3在网站开发能力、UI设计方面表现优秀,只需要简单的文本提示就能快速开发各种网站、App,审美比肩目前全球最强的闭源代码模型Claude 3.7 Sonnet思维链版本。




由新版DeepSeek-V3生成


由Claude 3.7 Sonnet生成



图1 DeepSeek V3生成


图2 DeepSeek V3 0324生成


图3 Claude Sonnet 3.7生成

《科创板日报》曾报道过初代DeepSeek-V3,该模型甫一上线便以性价比“闻名”。在多项基准测试中,DeepSeek-V3的成绩超越了Qwen2.5-72 B和Llama-3.1-405 B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

幻方量化在已开源的论文中强调其训练成本极低——通过对算法、框架和硬件的优化协同设计,假设H800GPU的租用价格为每块GPU2美元/小时,DeepSeek-V3的全部训练成本总计仅为557.6万美元(注:该成本仅包括DeepSeek-V3的正式训练,不包括与先前在架构、算法或数据上的研究和消融实验相关的成本)。

DeepSeek-V3的API服务定价将上调为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元,按缓存未命中的输入价格计,加总成本是10元人民币。

同类型模型中,OpenAI的GPT 4o定价相当高,输入:5美元/百万Token,输出:15美元/百万Token,加总成本是20美元,约合人民币140元。

猜你喜欢

早资道丨DeepSeek下调API调用价格 2024年全球应
早资道丨DeepSeek下调API调用价格 2024年全球应
发表于:2025-02-27 浏览:24 发布者: 网易互联网
微信新功能来了
微信新功能来了
发表于:2025-01-13 浏览:65 发布者: 网易互联网
超越DeepSeek,腾讯元宝登顶苹果中国区免费APP
超越DeepSeek,腾讯元宝登顶苹果中国区免费APP
发表于:2025-03-03 浏览:17 发布者: 网易互联网
盒马终于想通了,猛踩油门
盒马终于想通了,猛踩油门
发表于:2025-03-04 浏览:20 发布者: 网易互联网
扣子空间一手实测:字节的第一个 Agent,比 Man
扣子空间一手实测:字节的第一个 Agent,比 Man
发表于:2025-04-19 浏览:15 发布者: 网易互联网
开年聊一波,唠唠B站财报那些事儿
开年聊一波,唠唠B站财报那些事儿
发表于:2025-02-21 浏览:26 发布者: 网易互联网
市说新语丨京东入局如何改变外卖市场格局
市说新语丨京东入局如何改变外卖市场格局
发表于:2025-02-27 浏览:21 发布者: 网易互联网
深圳市东景盛电子技术有限公司取得用于AR智能穿
深圳市东景盛电子技术有限公司取得用于AR智能穿
发表于:2025-01-20 浏览:32 发布者: 网易科技
月底新机发布会扎堆!华OV米齐发力 Mate70系列领衔
月底新机发布会扎堆!华OV米齐发力 Mate70系列领衔
发表于:2024-11-21 浏览:37 发布者: CNMO
哔哩哔哩2024年总收入突破268亿元,广告和手游
哔哩哔哩2024年总收入突破268亿元,广告和手游
发表于:2025-02-21 浏览:19 发布者: 网易互联网