您的当前位置:首页>科技咨询>资讯详情

为超越 OpenAI GPT-4,Meta 不惜使用争议数据训

发表于:2025-01-15 18:00:02 浏览:29次 发布者: 网易科技

IT之家 1 月 15 日消息,周二,在一场涉及 Meta 的人工智能版权案件(Kadrey 诉 Meta 案)中,法院公开了 Meta 高管和研究人员的内部通信记录。这些文件显示,Meta 在开发其最新 AI 模型 Llama 3 的过程中,高管和研究人员将超越 OpenAI 的 GPT-4 视为核心目标,并在内部讨论中表现出极强的竞争意识。


Meta 生成式 AI 副总裁 Ahmad Al-Dahle 在 2023 年 10 月发给研究员 Hugo Touvron 的消息中表示:“说实话…… 我们的目标必须是 GPT-4。我们即将拥有 64,000 个 GPU!我们必须学会如何构建前沿技术并赢得这场竞赛。”

尽管 Meta 一直以开源 AI 模型著称,但其 AI 团队显然更关注如何超越那些不公开模型权重的竞争对手,例如 Anthropic 和 OpenAI。Meta 的高管和研究人员将 Anthropic 的 Claude 和 OpenAI 的 GPT-4 视为行业标杆,并以此为目标努力。

在内部讨论中,Meta 对法国 AI 初创公司 Mistral 的态度显得不屑一顾。Mistral 是 Meta 在开源领域的主要竞争对手之一,但 Al-Dahle 在消息中直言:“Mistral 对我们来说不值一提。我们应该能做得更好。”

当前,科技公司正竞相推出尖端 AI 模型,而 Meta 的内部通信进一步揭示了其 AI 领导层的高度竞争心态。在多次交流中,Meta 的 AI 负责人提到,他们在获取训练 Llama 模型所需数据时表现得“非常激进”。一位高管甚至在一封内部邮件中表示:“Llama 3 几乎是我唯一关心的事情。”

然而,这种激进的竞争策略也引发了法律问题。本案检察官指控 Meta 高管在匆忙推出 AI 模型的过程中,存在使用受版权保护的书籍进行训练的行为。Touvron 在一份消息中指出,用于训练 Llama 2 的数据集“质量不佳”,并讨论了如何通过优化数据源来提升 Llama 3 的表现。随后,Touvron 和 Al-Dahle 讨论了使用 LibGen 数据集的可能性,该数据集包含 Cengage Learning、Macmillan Learning、McGraw Hill 和 Pearson Education 等出版商的受版权保护作品。Al-Dahle 在消息中问道:“我们是否有合适的数据集?有没有什么数据是你想用却因为某些愚蠢的原因无法使用的?”

IT之家注意到,Meta 首席执行官马克・扎克伯格此前曾表示,他正致力于缩小 Llama 模型与 OpenAI、谷歌等公司的闭源模型之间的性能差距。内部消息显示,公司内部为实现这一目标承受了巨大压力。扎克伯格在 2024 年 7 月的一封信中写道:“今年,Llama 3 已经能够与最先进的模型竞争,并在某些领域处于领先地位。从明年开始,我们预计未来的 Llama 模型将成为行业中最先进的。”

2024 年 4 月,Meta 正式发布了 Llama 3。这款开源 AI 模型在性能上与谷歌、OpenAI 和 Anthropic 的闭源模型不相上下,并超越了 Mistral 的开源模型。然而,Meta 用于训练模型的数据 —— 尽管扎克伯格据称批准使用这些数据,但其版权状态存疑,正在多起诉讼中面临审查。

猜你喜欢

谁是分众最大的敌人?抖音还是小红书?
谁是分众最大的敌人?抖音还是小红书?
发表于:2024-11-01 浏览:35 发布者: 网易互联网
百度:文心下一代模型6月30日起正式开源
百度:文心下一代模型6月30日起正式开源
发表于:2025-02-14 浏览:25 发布者: 网易互联网
腾讯云不想“拼价格”
腾讯云不想“拼价格”
发表于:2025-01-17 浏览:35 发布者: 网易互联网
Evercore ISI盛赞服务器市场前景:AI基建+传统
Evercore ISI盛赞服务器市场前景:AI基建+传统
发表于:2025-03-31 浏览:20 发布者: 网易互联网
抖音电商店播商家占比近7成
抖音电商店播商家占比近7成
发表于:2025-02-26 浏览:22 发布者: 网易互联网
2025全国网上年货节将于1月7日启动
2025全国网上年货节将于1月7日启动
发表于:2025-01-03 浏览:53 发布者: 网易互联网
阿里吴泳铭:双11表现超出预期,支付渠道打开带
阿里吴泳铭:双11表现超出预期,支付渠道打开带
发表于:2024-11-16 浏览:42 发布者: 网易互联网
交个朋友带货课被指割韭菜,回应:不承诺保底收
交个朋友带货课被指割韭菜,回应:不承诺保底收
发表于:2025-03-13 浏览:18 发布者: 网易互联网
广汽总经理冯兴亚谈“传统车企出卖灵魂”论:自动驾驶现在已不是灵魂
广汽总经理冯兴亚谈“传统车企出卖灵魂”论:自动驾驶现在已不是灵魂
发表于:2024-11-02 浏览:52 发布者: IT之家
海螺新模型海外爆火:一夜之间,猫、羊驼、长颈
海螺新模型海外爆火:一夜之间,猫、羊驼、长颈
发表于:2025-06-23 浏览:8 发布者: 网易互联网