您的当前位置:首页>科技咨询>资讯详情

消息称谷歌使用竞品模型Claude改进Gemini

发表于:2024-12-25 19:00:06 浏览:49次 发布者: 网易IT

12月25日消息,谷歌公司内部沟通信息显示,负责改进其人工智能模型Gemini AI的外包员工正在将其输出答案与Anthropic开发的竞品模型Claude的结果进行比对。

谷歌未透露是否获得了使用Claude模型进行测试的许可。

随着科技公司竞相研发更强大的人工智能模型,通常通过行业基准测试来评估模型性能,而非由外包员工逐一比对竞品模型的回答。对于Gemini项目,外包员工需根据答案的真实性、冗长度等多个标准对模型输出进行评分。据内部资料显示,他们有30分钟的时间判断是Gemini还是Claude的回答更为优越。

最近,外包员工注意到在谷歌内部用于对比Gemini和其他人工智能模型的平台中,出现了与Claude相关的引用内容。媒体所获取的部分答案中甚至明确表示:“我是Claude,由Anthropic开发。”

一份内部聊天记录显示,外包员工发现Claude的回答似乎比Gemini更注重安全性。一名员工指出,“在所有人工智能模型中,Claude的安全设置是最严格的。”某些情况下,Claude拒绝回答其认为不安全的请求,比如扮演其他人工智能助手的角色。而在另一些案例中,Claude选择避开回答,而Gemini的回答则因涉及“裸体和束缚”等内容被标记为“严重违反安全规定”。

Anthropic的商业服务条款明确禁止客户未经授权使用Claude来“构建竞争性产品或服务”或“训练竞争性人工智能模型”。值得注意的是,谷歌是Anthropic的重要投资者。

负责运营Gemini的谷歌DeepMind发言人希拉·麦克纳马拉(Shira McNamara)未说明谷歌是否获得了Anthropic使用Claude的许可。麦克纳马拉强调,DeepMind确实会通过比对模型输出来进行评估,但不会使用Anthropic的模型训练Gemini。

麦克纳马拉表示:“根据行业标准做法,我们在某些情况下将模型输出比对作为评估过程的一部分。但任何关于我们使用Anthropic模型训练Gemini的说法都是不准确的。”

上周有报道称,为谷歌人工智能产品工作的外包员工如今被要求在自己的专业领域之外对Gemini的回答进行评分。内部沟通记录显示,员工担忧Gemini可能在医疗保健等高度敏感的话题上生成不准确的信息。(辰辰)

猜你喜欢

选车如选将,曹操60助网约车司机打赢收益战
选车如选将,曹操60助网约车司机打赢收益战
发表于:2024-11-14 浏览:50 发布者: 网易互联网
雷军回应小米YU7能否冲出重围
雷军回应小米YU7能否冲出重围
发表于:2025-05-21 浏览:19 发布者: 网易互联网
西岗区举办推进中俄跨境电商发展大会
西岗区举办推进中俄跨境电商发展大会
发表于:2025-06-14 浏览:19 发布者: 网易互联网
中国AIGC APP月活破亿,豆包一家独占一半 | 海
中国AIGC APP月活破亿,豆包一家独占一半 | 海
发表于:2025-01-19 浏览:47 发布者: 网易互联网
移远通信:AI+AR眼镜业务已实现量产
移远通信:AI+AR眼镜业务已实现量产
发表于:2024-12-20 浏览:45 发布者: 网易科技
“Google将对安卓闭源”不实,源代码仍会公开但
“Google将对安卓闭源”不实,源代码仍会公开但
发表于:2025-03-28 浏览:28 发布者: 网易互联网
澎湃回声丨实测时发现两家共享充电宝无3C标识,
澎湃回声丨实测时发现两家共享充电宝无3C标识,
发表于:2025-07-03 浏览:19 发布者: 网易互联网
“差评”这门生意,被篡改与被塑造的
“差评”这门生意,被篡改与被塑造的
发表于:2024-11-08 浏览:49 发布者: 新浪财经头条
破浪·新出海记|断单?溢价!爆单!南京跨境电
破浪·新出海记|断单?溢价!爆单!南京跨境电
发表于:2025-05-29 浏览:24 发布者: 网易互联网
京东App上线“国内打车服务”
京东App上线“国内打车服务”
发表于:2025-02-18 浏览:38 发布者: 网易互联网