您的当前位置：首页>科技咨询>资讯详情

苹果FastVLM视觉语言模型开放试用：视频字幕生

发表于：2025-09-02 15:00:03 浏览：1次发布者：网易互联网

来源：环球网

【环球网科技综合报道】9月2日消息，据外媒9to5Mac报道，苹果此前发布了视觉语言模型FastVLM，现在用户已可以在Hugging Face平台上找到该项目。

据悉，FastVLM能够提供近乎即时的高分辨率图像处理，可将视频字幕生成速度提高 85 倍，同时体积比同类模型小 3 倍以上。

外媒称，现在在 Hugging Face 上，用户可以直接在浏览器内加载更轻量级的 FastVLM-0.5B 版本。根据9to5Mac实测，其在16GB M2 Pro MacBook Pro 上加载需要几分钟，加载完成后，模型就开始准确地描述用户的外貌、身后的房间、周围物体等。

外媒表示，因为它在浏览器本地运行，这意味着数据永远不会离开设备，甚至可以离线运行。这会在可穿戴设备和辅助技术场景展现潜力，因为轻便性和低延迟对于上述应用场景至关重要。（思瀚）

猜你喜欢

: Meta推出新开源旗舰模型Llama 4；特斯拉FSD系统; 发表于：2025-04-07 浏览：23 发布者：网易科技

: 胖东来线上服务：邮费自理，退换货等服务和线下; 发表于：2024-12-18 浏览：41 发布者：网易互联网

: 中国互联网协会成立低空经济工作委员会，公开招; 发表于：2025-06-07 浏览：24 发布者：网易互联网

: 甩出百亿补贴抢夺白牌市场，京喜自营交出一年成; 发表于：2024-11-09 浏览：57 发布者：网易互联网

: 程序员危险了？微软CEO称公司三成代码由AI编写; 发表于：2025-04-30 浏览：25 发布者：网易科技

: 马斯克“大刀阔斧”，X平台员工锐减仅剩1200人; 发表于：2025-08-15 浏览：11 发布者：网易互联网

: 阿里云：今年将在全球节点部署全栈AI能力; 发表于：2025-06-24 浏览：17 发布者：网易互联网

: 京东外卖回应系统崩了：超时20分钟全部免单; 发表于：2025-04-22 浏览：21 发布者：网易互联网

: 字节跳动宣布开源Godel-Rescheduler：适用于云; 发表于：2025-04-18 浏览：26 发布者：网易互联网

: 出货量翻倍，中国AI眼镜超级繁荣的“三重门”; 发表于：2025-06-20 浏览：19 发布者：网易科技

推荐文章

