您的当前位置:首页>科技咨询>资讯详情

AMD发布首个10亿参数开源AI模型OLMo

发表于:2024-11-09 00:00:05 浏览:41次 发布者: 微资讯

近日,AMD公司宣布推出其首个完全开放的10亿参数语言模型系列——AMD OLMo。这一创新举措为开发者和研究人员提供了强大的AI研究工具,进一步推动了人工智能领域的发展。

据悉,AMD OLMo模型是基于从零开始训练的10亿参数语言模型系列,在AMD Instinct™ MI250 GPU集群上进行了大规模的预训练。训练过程中使用了超过1.3万亿个tokens,确保了模型在处理自然语言任务时具备出色的推理能力。

AMD OLMo采用了解码器(decoder-only)架构,并通过下一个标记预测(next-token prediction)进行训练。这种架构在生成文本和理解上下文方面表现出色,使得OLMo模型在推理能力和聊天能力上相较于其他同类开源模型具有显著优势。在多个基准测试中,OLMo的性能与最新的同类模型相当,但其计算预算仅为后者的一半。

除了数据中心使用外,AMD OLMo还支持配备NPU(Neural Processing Unit,神经处理单元)的AMD Ryzen AI PC进行模型部署。这意味着开发者可以在个人设备上轻松提供AI功能,进一步降低了AI技术的门槛。

值得注意的是,AMD OLMo是完全开源的。这一举措意味着其他开发者和公司可以自由使用和修改这些模型,从而推动AI技术的创新和发展。对于希望探索AI技术替代方案的企业而言,AMD OLMo无疑是一个可行的选择。

AMD此次发布的OLMo模型不仅展示了其在AI领域的强大研发实力,也为开发者和研究人员提供了更为便捷和高效的AI研究工具。随着AI技术的不断发展,AMD OLMo有望在各个领域发挥重要作用,推动人工智能技术的进一步普及和应用。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.com/article/691886.html

猜你喜欢

电商春节线下消费热:“国补”拉动门店销售 家
电商春节线下消费热:“国补”拉动门店销售 家
发表于:2025-02-04 浏览:30 发布者: 网易互联网
独家|2025年百度OKR更新:降本增效、KPI化、鼓
独家|2025年百度OKR更新:降本增效、KPI化、鼓
发表于:2025-01-16 浏览:29 发布者: 网易互联网
【财说明白】为什么酒店钟点房是3、4小时?
【财说明白】为什么酒店钟点房是3、4小时?
发表于:2024-11-23 浏览:42 发布者: 中新经纬
潞晨科技宣布将暂停DeepSeek API服务
潞晨科技宣布将暂停DeepSeek API服务
发表于:2025-03-01 浏览:21 发布者: 网易互联网
华为Mate 70 RS非凡大师镜头盖曝光:八边形镜头设计尘埃落定
华为Mate 70 RS非凡大师镜头盖曝光:八边形镜头设计尘埃落定
发表于:2024-11-02 浏览:38 发布者: 快科技官方
月活快追上优酷的红果短剧,能不能成为字节的下
月活快追上优酷的红果短剧,能不能成为字节的下
发表于:2025-02-19 浏览:22 发布者: 网易互联网
电商平台“花式擦边”不搜也推 网友苦恼:公共
电商平台“花式擦边”不搜也推 网友苦恼:公共
发表于:2025-03-14 浏览:19 发布者: 网易互联网
MSRA清北推出强化预训练!取代传统自监督,14B
MSRA清北推出强化预训练!取代传统自监督,14B
发表于:2025-06-11 浏览:8 发布者: 网易互联网
12月18日外媒科学网站摘要:阅读如何重塑大脑
12月18日外媒科学网站摘要:阅读如何重塑大脑
发表于:2024-12-18 浏览:44 发布者: 网易科技
跨境电商的暴富神话消退了
跨境电商的暴富神话消退了
发表于:2025-05-27 浏览:14 发布者: 网易互联网