昆仑万维发布天工超级智能体 “AI版office”8分
5月22日,昆仑万维面向全球市场发布了天工超级智能体(Skywork Super Agents)。据介绍,该产品采用AI agent架构和deep research技术,支持一站式生成文档、PPT、表格(excel)、网页、播客和音视频等多模态内容。昆仑万维方面称,其deep research能力在GAIA基准测试中表现突出,在GAIA榜单上排名全球第一,超过了OpenAI Deep Research和Manus。
昆仑万维宣布,该产品即日起向海内外用户开放注册,无需邀请码。
1. 5种模态,一键生成,用8分钟完成8小时的工作
与Manus这样的拥有广泛功能但缺乏专业深度的AI智能体不同,天工超级智能体包含一个由「5个专家智能体」与「1个通用智能体」组成的系统,旨在提供专业化的内容生成服务:
5个专家智能体,分别负责专业文档(doc)、PPT、表格(excel)、播客和网页的生成。文档、PPT、表格是常见的办公应用。
昆仑万维表示,文档、PPT、表格三个智能体集成了deep research能力,可提供专业内容生成。网页和播客智能体则面向新媒体内容模态。这些专家智能体针对办公和学习场景设计,旨在提供高质量内容。
1个通用智能体,接入了数十个MCP(模型能力提供者),用于处理多模态创意任务,可生成图片、音乐、视频等多种媒体内容。
2. Deep Research技术赋能核心办公应用
此次发布的核心,是天工超级智能体的「文档」、「PPT」和「表格」三大智能体。
在「文档」智能体方面,针对行业研究、学术论文、商业计划等专业写作需求,天工集成了deep research能力。
天工方面表示,其自研的deep research模型通过深度思考和推理提升信息检索的广度、宽度与效率,并通过强化学习增强搜索泛化性,为内容生成提供高质量信息源。据称,该能力在性能上接近OpenAI Deep Research,同时成本只有openAI的40%。
天工的deep research agent框架在Meta和Huggingface联合推出的GAIA的评测集上取得了82.42的高分,超越了OpenAI Deep Research和Manus,位居第一(2025年5月10日数据)。
在OpenAI的SimpleQA评测任务中,Skywork获得94.5分,超过了此前该任务的SOTA(State-of-the-Art)水平。
相比OpenAI的Deep Research,天工「文档」智能体生成的报告包含多种数据图表,如条形图、折线图、饼状图等,以增强内容的可视化呈现。
天工的「PPT」智能体同样集成了deep research技术,旨在通过深度搜索和研究,为用户生成演示文稿内容。据介绍,生成的演示文稿内容支持事实与数据溯源,并包含动态效果。PPT功能支持在线编辑及导出为pptx、pdf格式。
天工的「表格」智能体也支持deep research技术。该智能体可基于用户上传的数据表进行描述性或推论性统计,并生成统计图表,同时支持生成模板型及汇总型表格。生成的表格支持在线浏览和导出为xls格式。
昆仑万维方面表示,其deep research agent框架已在GitHub上开源,供开发者下载。同时,天工的文档、PPT、表格生成能力也已封装成MCP(模型能力提供者),供开发者调用。
3.拓展至网页、播客及音视频等多媒体内容生成
除办公应用外,天工超级智能体还支持多模态内容生产,其生成能力已延伸至网页、播客与音视频领域,旨在提供一站式内容创作支持。
天工的「网页」智能体支持依据用户需求生成网页,可用于创建电商页面、个人博客、信息展示及功能型网站等。据称,该功能旨在降低网页创建的技术门槛。
天工的「播客」智能体可根据用户输入的需求生成脚本,并基于脚本通过语音合成技术制作音频。目前该功能支持生成英文播客,计划后续支持中文及其他语言。
由于目前尚不支持中文内容生成,国内版本(tiangong.cn)暂未上线「播客」智能体。
此外,天工的「通用」智能体集成了数十个MCP,覆盖图像、视频、音乐、语音生成等能力。据介绍,该智能体可将文字转化为视频,并支持自动匹配背景音乐与特效,适用于生成宣传视频、教学课件、创意短片、有声书、绘本等多种内容。(易科)