您的当前位置:首页>科技咨询>资讯详情

Meta AI 推出 LIGER 混合检索 AI 模型,计算效

发表于:2025-01-02 17:00:02 浏览:33次 发布者: 网易科技

IT之家 1 月 2 日消息,Meta AI 的研究人员提出了一种名为 LIGER 的新型 AI 模型,巧妙地结合密集检索和生成检索的优势,显著提升了生成式推荐系统的性能。

LIGER 有效地解决了传统推荐系统在计算资源、存储需求和冷启动项目处理上的难题,为构建更高效、更精准的推荐系统提供了新的思路。

项目背景

想要把用户与相关内容、产品或服务联系起来,推荐系统是其中重要一环。该领域的常规方法是密集检索(Dense retrieval),利用序列建模来计算项目和用户表示。

但这种方法由于要嵌入每个项目,因此需要大量的计算资源和存储。随着数据集的增长,这些要求变得越来越繁重,限制了它们的可扩展性。

而另一种新兴的方法叫做生成检索(Generative retrieval),通过生成模型预测项目索引来减少存储需求,但该方式存在性能问题,在冷启动项目(用户交互有限的新项目)中表现尤为明显。

项目介绍

Meta AI 公司联合威斯康星大学麦迪逊分校、ELLIS Unit、LIT AI Lab、机器学习研究所、JKU Linz 等机构,混合密集检索和生成检索,推出了 LIGER(LeveragIng dense retrieval for GEnerative Retrieval)模型。

该模型混合了生成检索的计算效率和密集检索的精度,利用生成检索生成候选集、语义 ID 和文本属性的项目表示,再通过密集检索技术进行精练,平衡了效率和准确性。


LIGER 采用双向 Transformer 编码器和生成解码器。密集检索部分整合了项目文本表示、语义 ID 和位置嵌入,并使用余弦相似度损失进行优化。生成部分使用波束搜索根据用户交互历史预测后续项目的语义 ID。

通过这种混合推理过程,LIGER 降低了计算需求,同时保持了推荐质量。LIGER 还能很好地泛化到未见过的项目,解决了先前生成模型的关键限制。

LIGER 性能

在 Amazon Beauty、Sports、Toys 和 Steam 等基准数据集上的评估显示,LIGER 的性能持续优于 TIGER 和 UniSRec 等现有最先进模型。

例如,在 Amazon Beauty 数据集上,LIGER 对冷启动项目的 Recall@10 得分为 0.1008,而 TIGER 为 0.0。在 Steam 数据集上,LIGER 的 Recall@10 达到了 0.0147,同样优于 TIGER 的 0.0。



随着生成方法检索的候选数量增加,LIGER 与密集检索的性能差距缩小,展现了其适应性和效率。

IT之家附上参考地址

猜你喜欢

1月2日外媒科学网站摘要:美国倡议对生物医学研
1月2日外媒科学网站摘要:美国倡议对生物医学研
发表于:2025-01-02 浏览:49 发布者: 网易科技
中国电信申请基于 VR 模拟成像的显示装置专利,
中国电信申请基于 VR 模拟成像的显示装置专利,
发表于:2025-04-29 浏览:14 发布者: 网易科技
腾讯混元发布3D建模“全能王”!草图速变3D、一
腾讯混元发布3D建模“全能王”!草图速变3D、一
发表于:2025-01-21 浏览:31 发布者: 网易互联网
百度安全负责人回应高管女儿“开盒”事件:数据
百度安全负责人回应高管女儿“开盒”事件:数据
发表于:2025-03-18 浏览:19 发布者: 网易互联网
华为捐赠!欧拉操作系统市场份额新里程碑下周公布
华为捐赠!欧拉操作系统市场份额新里程碑下周公布
发表于:2024-11-08 浏览:49 发布者: 快科技官方
转让不出去的水果店
转让不出去的水果店
发表于:2024-11-01 浏览:35 发布者: 虎嗅APP
B站盈利背后:优质内容正在成为一种硬通货
B站盈利背后:优质内容正在成为一种硬通货
发表于:2025-05-21 浏览:16 发布者: 网易互联网
“智数据 AI未来”:2024中国数据与存储峰会圆满举行
“智数据 AI未来”:2024中国数据与存储峰会圆满举行
发表于:2024-11-10 浏览:46 发布者: ZOL中关村在线
阿里云:通义灵码上线Qwen3-Coder,免费使用不
阿里云:通义灵码上线Qwen3-Coder,免费使用不
发表于:2025-07-26 浏览:0 发布者: 网易互联网
乌鲁木齐至西安快递电商班列开行达100列
乌鲁木齐至西安快递电商班列开行达100列
发表于:2025-07-19 浏览:8 发布者: 网易互联网