您的当前位置:首页>科技咨询>资讯详情

微软OmniParser最新版本可将DeepSeek等模型转化

发表于:2025-02-17 10:00:04 浏览:21次 发布者: 网易互联网

2月17日,根据微软官网,微软日前发布视觉Agent解析框架OmniParser最新版本V2.0,可将OpenAI(4o/o1/o3-mini)、DeepSeek(R1)、Qwen(2.5VL)、Anthropic(Sonnet)等大模型,转化为“计算机使用智能体”(Computer Use Agent)。相比前代版本,OmniParser V2在检测更微小可交互元素时精度更高、推理速度更快。具体而言,V2通过使用更大规模的交互元素检测数据集和图标功能描述数据进行训练,并通过缩小图标描述模型的输入图像尺寸,推理延迟较前代降低60%。

猜你喜欢

商业快评|从狂欢到理性 双11成年|封面天天见
商业快评|从狂欢到理性 双11成年|封面天天见
发表于:2024-11-14 浏览:39 发布者: 网易互联网
为什么抖音上90%的品牌都在亏?
为什么抖音上90%的品牌都在亏?
发表于:2025-04-12 浏览:15 发布者: 网易互联网
Nothing CEO暗示将推出AI加持的Nothing OS 挑战iOS
Nothing CEO暗示将推出AI加持的Nothing OS 挑战iOS
发表于:2024-11-03 浏览:58 发布者: CNMO
知情人士:腾讯音乐拟收购喜马拉雅
知情人士:腾讯音乐拟收购喜马拉雅
发表于:2025-04-25 浏览:12 发布者: 网易互联网
停播近4个月后,三只羊旗下账号转战视频号复播
停播近4个月后,三只羊旗下账号转战视频号复播
发表于:2025-01-13 浏览:55 发布者: 网易互联网
为“小哥”减负 给美团点赞|锋评
为“小哥”减负 给美团点赞|锋评
发表于:2025-01-04 浏览:34 发布者: 网易互联网
AMD在CES上发布多款CPU与显卡,覆盖笔电、台式
AMD在CES上发布多款CPU与显卡,覆盖笔电、台式
发表于:2025-01-07 浏览:59 发布者: 网易IT
刘强东内部讲话,刷屏!
刘强东内部讲话,刷屏!
发表于:2025-04-15 浏览:18 发布者: 网易互联网
10分钟发布、半小时抢光!小米AI眼镜硬刚Meta,
10分钟发布、半小时抢光!小米AI眼镜硬刚Meta,
发表于:2025-06-29 浏览:7 发布者: 网易科技
外媒:新款Mac Mini硬件性能可比拼PS/Xbox,但
外媒:新款Mac Mini硬件性能可比拼PS/Xbox,但
发表于:2024-11-04 浏览:45 发布者: 网易IT