您的当前位置:首页>科技咨询>资讯详情

谷歌推出新AI视频生成器Veo 2,称表现好于Sora

发表于:2024-12-18 16:12:09 浏览:37次 发布者: 网易IT

12月17日消息,谷歌今日发布最新版本的视频生成模型Veo 2,与OpenAI的Sora展开正面竞争。谷歌表示,Veo 2可以生成更为逼真的视频内容。

与此同时,谷歌还对其图像生成模型Imagen进行了升级,推出了Imagen 3,旨在生成内容更为丰富、细节更为精致的图片。

谷歌指出,Veo 2“对现实世界的物理规律以及人类动作和表情的微妙之处有了更深入的理解”。目前,该模型可在谷歌实验室的VideoFX平台上试用,但用户需通过谷歌表格注册,加入等候名单,并等待谷歌在指定时间内临时开放访问。

谷歌在一篇博客文章中提到:“Veo 2同样精通电影制作手法:只需指定一个类型、镜头以及一些电影特效建议,Veo 2即可生成最高可达4K分辨率的视频。”

Veo 2视频生成


尽管Veo 2目前仅对部分受邀用户开放,但原始版本的Veo仍可在Vertex AI平台上使用。通过Veo 2生成的视频将嵌入谷歌特有的元数据水印SynthID,以此标识这些视频为人工智能生成内容。

谷歌也承认,Veo 2可能仍会偶尔出现如多余手指等“幻觉”,但公司承诺新版本将大幅减少此类现象。

Veo 2将与OpenAI近期推出的Sora视频生成模型直接竞争,争夺电影制作人及内容创作者的市场。值得一提的是,Sora在全面开放给付费用户之前,已进行了预览测试。

在谷歌的内部测试中,Veo在“总体偏好”(即观众更喜欢哪些视频)和“提示依从性”(视频与人类创作者指令的匹配度)两项指标上均超越了Sora及其他竞争对手的AI模型,这一表现尤为亮眼。

今年5月,谷歌在I/O开发者大会上首次公布Veo,并与演员兼音乐人唐纳德·格洛沃(Donald Glover)合作,制作了一段展示视频。

AI视频生成仍需改进

长期以来,人工智能视频生成一直是生成式AI领域的重要分支。谷歌、OpenAI等大模型开发者与RunwayML等较小规模的公司在这一领域展开了激烈竞争,互相追赶。

RunwayML作为AI视频生成的先驱之一,最近推出了Gen-3 Alpha Turbo模型,提供了更强大的控制能力。Pika Labs发布了Pika 2.0,赋予用户更多控制权,并支持在视频中加入自定义角色。此外,Luma AI宣布与亚马逊AWS合作,将其模型引入Bedrock平台,以满足企业级需求,同时扩展了Dream Machine视频生成模型的功能。

尽管如此,AI视频生成技术仍需克服创作者和观众的质疑。例如,Sora发布后仍有用户批评其生成的内容存在违背物理规律和人体结构的问题,结果表现不一致。

在最近的游戏奖颁奖典礼上,观众对所谓“AI劣质内容”(AI slop)的不信任感也有所体现,反映了人们对AI生成内容质量的担忧。

不过,部分电影制作人已开始探索AI视频生成器的潜力。例如,著名导演詹姆斯·卡梅隆(James Cameron)加入了Stability AI的董事会,而演员安迪·瑟金斯(Andy Serkis)也宣布成立一家专注于AI的制作公司。

谷歌表示,许多用户对其AI视频生成工具展现出极大的兴趣。该公司透露,YouTube创作者已开始利用VideoFX平台为YouTube短片制作背景,从而节省时间并提升效率。

Imagen 3更新

谷歌还对其图像生成模型Imagen进行了升级,推出了Imagen 3。该模型最近已通过Gemini聊天机器人提供服务,生成的图像更加逼真且色彩鲜艳。

谷歌表示,Imagen 3能够更准确地渲染多种艺术风格,包括写实主义、印象派、抽象艺术及动画风格。同时,模型在遵循用户提示方面的表现也得到了显著提升。

用户可通过ImageFX平台访问并使用Imagen 3。(小小)

猜你喜欢

“TikTok难民”退潮 小红书低调出海,能与“出
“TikTok难民”退潮 小红书低调出海,能与“出
发表于:2025-03-18 浏览:19 发布者: 网易互联网
首批百台极氪X在香港交付完成
首批百台极氪X在香港交付完成
发表于:2024-11-18 浏览:40 发布者: 网易互联网
电商不能再这么玩下去了
电商不能再这么玩下去了
发表于:2024-11-12 浏览:49 发布者: 网易新闻
抖音电商618数据:超6万个品牌成交额翻倍
抖音电商618数据:超6万个品牌成交额翻倍
发表于:2025-06-20 浏览:9 发布者: 网易互联网
亚马逊正在为其送货司机开发智能眼镜 以提供货
亚马逊正在为其送货司机开发智能眼镜 以提供货
发表于:2024-11-12 浏览:45 发布者: 网易互联网
“对等关税”第二周,跨境电商走向已定
“对等关税”第二周,跨境电商走向已定
发表于:2025-04-16 浏览:19 发布者: 网易互联网
抖音正式上线打车服务,本地生活业务拼图再更新
抖音正式上线打车服务,本地生活业务拼图再更新
发表于:2025-01-24 浏览:28 发布者: 网易互联网
提前免费!百度发布文心大模型4.5及X1
提前免费!百度发布文心大模型4.5及X1
发表于:2025-03-16 浏览:25 发布者: 网易互联网
小米眼镜,要来了!
小米眼镜,要来了!
发表于:2025-02-06 浏览:27 发布者: 网易科技
梁文锋署名DeepSeek新论文:公开V3大模型降本方
梁文锋署名DeepSeek新论文:公开V3大模型降本方
发表于:2025-05-16 浏览:15 发布者: 网易互联网