您的当前位置:首页>科技咨询>资讯详情

腾讯云登上国际BIRD榜单前三,刷新国内NL2SQL最

发表于:2025-07-04 19:00:05 浏览:14次 发布者: 网易互联网

国产Agent进入“NL2SQL全球最难榜单”前三。

7月4日,据国际权威评测基准BIRD-Bench官网消息,腾讯云自研的数据分析智能体TCDataAgent斩获全球第三的成绩,超越IBM、Meta等众多国际厂商,同时也是目前国内在该榜单上排名最高的排名。


来源:BIRD-Bench官网

BIRD-Bench以其严苛性被誉为“NL2SQL全球最难榜单”。它不仅要求系统将自然语言问题(如“找出未通过质检的订单”)准确翻译成SQL语句,更要求生成的SQL在真实、庞大且含“脏数据”的企业级数据库上执行结果精准且运行高效,对模型的深层语义理解和数据库真实内容感知能力提出了极高挑战。

在这个以真实业务数据库为基础的测试中,覆盖金融、医疗、体育等37个行业场景,数据库总容量达33GB,查询问题超过1万条。TCDataAgent在官方不公开数据集的封闭测试环境下,最终获得了75.74分,位居全球第三, 国内第一。

相比于传统NL2SQL方案往往只能依赖有限信息“猜测”用户意图,易因数据结构复杂或语义模糊出错。TCDataAgent登榜的技术创新来源于引入了数据库约束验证机制,能够自动识别并修正SQL中潜在的结构性或语义性错误(如错误连接、冗余条件)。

更重要的是,它紧密结合数据库的真实内容对生成的SQL进行优化,显著提升了用户意图识别的准确率和翻译结果的可靠性。值得一提的是,TCDataAgent还引入了后训练(post-training)技术,通过优先筛选并复用效果最优的SQL样本进行模型迭代训练,有效提升了训练样本的质量和模型学习的稳定性。

腾讯云TCDataAgent在NL2SQL领域的技术研究成果也获得了国际学术界的认可,相关论文已被今年的数据库领域顶级国际会议VLDB接收。论文中的实验表明,TCDataAgent的“数据库内容感知”核心技术模块,可以无缝集成到其他NL2SQL系统中,最高能将查询执行准确率提升18.3%,并在多个主流方法上实现了超过5%的性能提升。

作为腾讯云新一代企业级智能分析Agent,TCDataAgent致力于让用户直接使用自然语言对结构化和非结构化数据进行复杂的数据查询、报表生成和趋势分析等任务,目前已开启内测。

猜你喜欢

鸿蒙版微信喜提7大实用功能更新,太实用了!
鸿蒙版微信喜提7大实用功能更新,太实用了!
发表于:2025-07-29 浏览:12 发布者: 网易互联网
润和软件:截至2024年10月 OpenHarmony代码贡献
润和软件:截至2024年10月 OpenHarmony代码贡献
发表于:2024-11-28 浏览:52 发布者: 网易互联网
20多年陪伴即将落幕!突然宣布:终止运营!曾风
20多年陪伴即将落幕!突然宣布:终止运营!曾风
发表于:2025-03-01 浏览:28 发布者: 网易互联网
别等骑手了,你的外卖正坐着无人机飞来
别等骑手了,你的外卖正坐着无人机飞来
发表于:2025-08-07 浏览:10 发布者: 网易互联网
小米赢得与GE公司HEVC/H.265视频编解码专利战
小米赢得与GE公司HEVC/H.265视频编解码专利战
发表于:2025-07-26 浏览:9 发布者: 网易互联网
高德要“商”,抖音要“图”
高德要“商”,抖音要“图”
发表于:2025-01-10 浏览:69 发布者: 网易互联网
京东入局外卖市场:机构称短期冲击有限 美团霸
京东入局外卖市场:机构称短期冲击有限 美团霸
发表于:2025-02-13 浏览:35 发布者: 网易互联网
2025四川网信“数智领航”第七期数据安全治理专
2025四川网信“数智领航”第七期数据安全治理专
发表于:2025-07-26 浏览:10 发布者: 网易互联网
官方通报:三只羊具备恢复经营条件
官方通报:三只羊具备恢复经营条件
发表于:2025-03-24 浏览:31 发布者: 网易互联网
微信“大幅更新”!朋友圈功能升级了
微信“大幅更新”!朋友圈功能升级了
发表于:2025-04-07 浏览:21 发布者: 网易互联网