您的当前位置:首页>科技咨询>资讯详情

华泰证券:DeepSeek有望加速模型训练与CUDA解耦

发表于:2025-02-21 10:00:11 浏览:21次 发布者: 网易互联网

每经AI快讯,华泰证券研究认为,DeepSeek在V3中使用了相比CUDA更底层的PTX 来优化硬件算法,PTX是CUDA编译的中间代码,在CUDA和最终机器码之间起到桥梁作用。而NSA则使用了OpenAl提出的Triton编程语言高效编写GPU代码,Triton的底层可调用CUDA,也可调用其他GPU语言,包括AMD的rocm以及国产算力芯片语言,如寒武纪的思元590芯片和海光信息的深算一号(DCU)内置的HYGON ISA指令集。LLM的训练短期内虽未完全脱离CUDA 生态,但DeepSeek NSA的推出使其初步呈现出与CUDA解耦的趋势,并为后续适配更多类型的算力芯片奠定基础。以异腾为代表的国产算力已经很好的适配了DeepSeek-R1 等国产模型,并取得了高效推理的效果,华泰证券认为,伴随海外算力的受限,针对国产算力的优化或将有持续进展,值得重视。

猜你喜欢

利亚德:已研发出基于单色mLED微显示屏的AR/AI
利亚德:已研发出基于单色mLED微显示屏的AR/AI
发表于:2025-01-06 浏览:41 发布者: 网易科技
Meta(META.US)旗舰AI模型Behemoth推迟发布引市
Meta(META.US)旗舰AI模型Behemoth推迟发布引市
发表于:2025-05-16 浏览:16 发布者: 网易科技
真前无古人!问界M9累计大定超17万台:国产豪华第一台
真前无古人!问界M9累计大定超17万台:国产豪华第一台
发表于:2024-11-13 浏览:49 发布者: 快科技官方
引领电商西进,2024年第1500亿件包裹在拼多多诞
引领电商西进,2024年第1500亿件包裹在拼多多诞
发表于:2024-11-18 浏览:44 发布者: 网易互联网
平台赚钱,不是好事吗?
平台赚钱,不是好事吗?
发表于:2024-12-25 浏览:45 发布者: 网易互联网
早资道|腾讯公关总监张军辟谣微信送礼会议纪要
早资道|腾讯公关总监张军辟谣微信送礼会议纪要
发表于:2024-12-25 浏览:57 发布者: 网易互联网
京东外卖已覆盖全国126个城市 超30万商家入驻
京东外卖已覆盖全国126个城市 超30万商家入驻
发表于:2025-03-17 浏览:26 发布者: 网易互联网
将终止开源安卓项目?谷歌回应!
将终止开源安卓项目?谷歌回应!
发表于:2025-03-27 浏览:16 发布者: 网易互联网
马上评|DeepSeek好用,也要警惕蹭热点的无良商
马上评|DeepSeek好用,也要警惕蹭热点的无良商
发表于:2025-02-07 浏览:29 发布者: 网易互联网
外滩FTC启幕之夜,这些收到“集聚区服务包”的
外滩FTC启幕之夜,这些收到“集聚区服务包”的
发表于:2025-07-18 浏览:6 发布者: 网易互联网