您的当前位置:首页>科技咨询>资讯详情

斯坦福大学、华盛顿大学研究:1000个AI智能体预测人类行为,准确率最高可达85%

发表于:2024-11-26 00:00:07 浏览:51次 发布者: 砍柴网

11 月 25 日消息,据 The Decoder 今日报道,斯坦福大学、华盛顿大学和 Google DeepMind 的研究人员联合开发了一种 AI 智能体(AI Agent,也称“AI 代理”),能够在社会实验中逼真地模拟人类行为。

研究指出,这类模拟系统可以作为一个虚拟实验室,帮助验证经济学、社会学、组织学和政治科学中的理论。研究团队通过对 1000 多名具有代表性的美国人(覆盖多种年龄、性别、教育背景和政治立场)进行访谈,建立了这些 AI 智能体模型。

系统运行方式是将详细的访谈记录与 GPT-4o 模型结合。当用户向智能体提问时,系统会加载访谈记录并让 AI 模仿受访者的回答。为生成这些记录,研究团队对每位受访者进行了长达两小时的访谈,并通过 OpenAI 的 Whisper 技术将对话转录成文本。

研究团队设计了多个测试,评估 AI 对人类行为的预测能力,涵盖《通用社会调查》、大五人格评估以及若干行为经济学实验。

结果显示,基于访谈数据的 AI 在预测社会调查(GSS)问题时,准确率高达 85%,远超单纯依赖人口统计信息的 AI 智能体。

研究团队在五项社会科学实验中测试了人类与 AI 的表现,其中四项研究显示,AI 的结果与人类高度一致。相关系数高达 0.98,表明 AI 对人类行为有极强的模拟能力。

与传统的人口统计法相比,访谈驱动的 AI 显示出显著的优势,尤其是在处理不同种族群体和政治观点的预测时更加准确,同时也能有效减少人口统计类别之间的偏差。

研究团队已将包含 1000 个 AI 模型的数据集开放至 GitHub,并建立了两层访问机制。综合性数据对研究人员完全开放,而个别参与者的详细数据则需经过特殊审批。

【来源:IT之家

猜你喜欢

腾讯混元3D生成模型正式发布2.5版本新模型
腾讯混元3D生成模型正式发布2.5版本新模型
发表于:2025-04-23 浏览:16 发布者: 网易互联网
华为+DeepSeek,大消息!
华为+DeepSeek,大消息!
发表于:2025-02-05 浏览:28 发布者: 网易互联网
苹果进行一项内部人事变动 高管加入人工智能团
苹果进行一项内部人事变动 高管加入人工智能团
发表于:2025-01-25 浏览:29 发布者: 网易科技
赛博传单,为300多万人的生活托底
赛博传单,为300多万人的生活托底
发表于:2024-12-25 浏览:36 发布者: 网易互联网
01年实习生被曝负责字节RL核心算法!系字节LLM
01年实习生被曝负责字节RL核心算法!系字节LLM
发表于:2025-03-20 浏览:26 发布者: 网易互联网
马斯克怒砸7000亿买OpenAI!阿尔特曼:谢邀,不
发表于:2025-02-11 浏览:24 发布者: 网易互联网
滴滴将重启巴西外卖业务
滴滴将重启巴西外卖业务
发表于:2025-04-05 浏览:16 发布者: 网易互联网
我国提前完成“十四五”5G建设目标;谷歌与三星
我国提前完成“十四五”5G建设目标;谷歌与三星
发表于:2024-12-18 浏览:37 发布者: 网易科技
美团优选,多地停运
美团优选,多地停运
发表于:2025-06-24 浏览:9 发布者: 网易互联网
起底“开盒”背后的“社工库”:处于黑产链中游
起底“开盒”背后的“社工库”:处于黑产链中游
发表于:2025-03-20 浏览:29 发布者: 网易互联网