上手Lovart国内版星流Agent:细节满满,找到了
作者 | 董道力
邮箱 | dongdaoli@pingwest.com
LiblibAI 近日推出了“星流Agent”,一款一站式创意设计智能体,已同步上线移动端和网页端。
简而言之,用户只需用语言描述需求,星流Agent 就能进行分析,生成所需的图片、视频或设计方案。若对生成的图片、视频或方案不满意,同样只需提出修改要求,它便会进行调整。
在官方宣传中,星流Agent 与 Lovart基本被形容为国内版和国际版产品的分别,强调其深度优化了中文语义理解,并融入了东方美学元素,能精准适配本地设计场景,旨在成为“更懂中国设计师”的 AI 伙伴。
我们也第一时间上手深度评测了一下这款热度很高的产品——体验时,这产品一度因为网站流量过大而“崩溃”,可见人们对于它的好奇和需求。
在产品界面上,进入网页端星流Agent工作页面,大致可以分为四个区域。左上角工具栏,包含模式选择、插入画布、添加图片、AI工具等选项。工具栏下方是工具的细节设置区,如生图模型选择、图片尺寸设定等,功能类似于简易版的 Stable Diffusion。中央区域是主要的画布区,用于预览生成的图片、视频等内容,可以在画布上进行快捷编辑。右侧是本次测试的核心功能区——AI对话框,用户的设计和修改需求都在此输入。
我们将结合特定的工作场景,如设计海报、品牌设计、视频生成等,与星流Agent共同协作,从AI对自然语言的理解力;人工参与的二次修改便利性等方向进行测试。
1
网页端:生成海报
我们尝试了一个设计师常见的任务:快速生成活动海报。
Prompts:帮我生成6张未来主义风格海报,描绘面部解构为埃舍尔式悖论建筑:金属与玻璃碎片重组成无限循环楼梯的颧骨、拱门状下颌线、马赛克几何前额,裂缝中流动神经元光带。量子晶体悬浮面部中央折射全息数据流,赛博朋克紫绿渐变光影在宇宙黑幕上投射几何阴影,漂浮的二进制星群营造深度幻觉——中央3D液态金属字'AI产品'散发霓虹光晕,顶部全息'AI',底部光束镌刻'摄影的起点与终点',左侧微缩电路纹字'2025','0606'日期碎片嵌于建筑结构,'AI产品'徽章悬浮,超精细CGI质感结合Beeple式未来主义美学,电影级体积光与极简排版。
星流Agent 并未直接生图,而是先对需求进行理解与梳理,为用户提供了四个优化后的方向供选择。相较于原始提示词,星流Agent 提供的版本更为简练具体,明确了海报主题、元素位置、背景颜色设计等,并包含了“AI产品”、“0606”等关键文字信息。
选择方向一后,星流Agent 开始“工程化”处理该方向,生成包含海报比例、构图、主体元素、配色光效、文字排版、细节要求的设计说明。这使用户能清晰了解最终设计的构成逻辑。随后,它挑选合适的工具(如 kontext 或其他模型)进行生图。
生成的6张海报呈现在中央画布中。审美见仁见智,但图片的主体结构基本符合提示词要求,关键信息如“AI产品”、“0606”也得以生成。
1
网页端:修改图片
我们以第一张海报为例进行微调。图中“摄影的起点与终点”是星流Agent 自行添加的文字,我们尝试:1) 删除该文字;2) 修改该文字。
选中图片后,画布上方出现常用工具(高清放大、扩图、去背景、擦除等)。星流Agent 将每张图片的处理过程打包成工作流,方便用户追溯修改历史。
使用擦除工具选中文字进行删除,这个操作,AI给出的效果非常不错,毕竟LiblibAI做AIGC工具起家。
同样,修改图片也支持自然语言。选中图片后,按下tab键就会进入快速编辑模式,在输入框中提出修改意见,就可以“用嘴来p图”。但“用嘴p图”只能面向整张图片,无法选中某个区域进行修改。
prompts:把图中[摄影的起点与终点]换成[AI产品改变生活]
星流Agent成功定位到需要修改的文字,却把中文修改成英文。
也许是快捷编辑中的AI依然不够智能,我们将图片放在AI对话框中进行处理,但星流仍然把中文改成了英文。
即便在prompts中明确使用中文,星流Agent还是返回了一张英文图片,英文用到的单词和上一张一样,在翻译的一致性上还是很稳定的。
当我再次强调是中文后,星流返回的文字效果异常。
这也体现了老问题,大模型对中文的适配依然不够——对中文进行准确的图片化生成,一直是各路国产模型在解决的一大类任务,并且能用来反过来判断模型各种能力的提高程度。
我们继续又尝试修改图片中的其他元素。
prompts:把模特的眼镜换成红色墨镜
星流Agent 确认了眼镜位置及特征,成功替换为红色墨镜,并保持了原有特征。
1
网页端:电商海报
prompts:让图1中的人物,带上图2中的耳机
我们使用了两张网络素材模拟电商广告场景。星流Agent 初次生成时在人物性别和耳机颜色识别上出了错,但经过第二轮解释后成功完成任务。
相比 Stable Diffusion、ComfyUI 等工具,星流Agent 能帮助用户生成更准确的提示词并选择合适的工具。修改图片时能自动定位元素,节省了用户手动绘制蒙版或使用 context 控制修图效果的时间。
不过,这里也引申出星流这样产品的定位的讨论,因为对于已熟练掌握 ComfyUI 等工具的设计师而言,它们在生成效果上目前并无太大差别,而且星流使用的需求多了会需要支付费用,对于他们来说可能付费意愿会受到影响。不过,这样的商业化产品瞄准的目标本来更多就是普通的没有太多“动手组装AI流水线”经验的人们,目前来看这些功能足够打动他们。与此同时,接下来产品迭代方向里,生成的质量如何比开源和自己搭建的工作流有显著提升,将是关键。
1
网页端:品牌设计
prompts:我有一家名字叫[Hello AI]的咖啡店,帮我做一下品牌设计。
品牌设计是一个很宽泛的概念,相较于生图、做海报,需要AI像设计师一样反复确认甲方需求。
星流Agent在看完需求后会先询问用户是否是要做“一套完整的品牌视觉识别系统,包括标志设计、色彩系统、字体选择以及品牌应用设计”,随后还会从数据库中提供一些参考案例,让用户来选择。
在具体的细节设计中,星流给出了很详细的设计建议,概念风格、主视觉、logo、色彩字体系统等等。
我们毕竟不是专业人士,于是咨询了专业设计师,其对星流Agent 提供的设计方案表示认可。
1
网页端:文生视频
prompts:帮我生成一段10s的视频,内容是一条长着翅膀的粉色哈士奇飞跃教堂。
在纯文生视频任务中,星流Agent 的表现并未超越如可灵、即梦等平台。其对提示词的扩展主要在丰富物品/人物细节层面,并未主动提示用户考虑景别等要素。经多次尝试,它目前能生成5秒视频。
1
网页端:图生视频
prompts:基于这张图生成一段视频,要求红色方块和蓝色方块互换位置
星流Agent 会先分析图片,制定计划(如先生成结束帧图片,再调用视频模型)。生成视频后还会分析是否满足需求,若不满足会再次生成。测试中最多修改一次(生成两个视频)。
相比在其他平台无头绪地修改提示词,星流Agent 通过多轮对话完成任务的方式更有效率。
1
网页:动画短片
prompts:我想做一个动画短片,内容是哈士奇拆家
和品牌设计需求一样,动画短片制作涉及风格、角色、分镜、剧情等多环节,是较为复杂的AIGC任务。
星流Agent将动画短片任务拆的很细,免去了用户在大模型问答软件、文生图软件、图生视频软件等之间的来回切换的操作。
1
移动端:生成壁纸
星流Agent的移动端适合轻量级任务,如调整图片尺寸、制作表情包等。
prompts:把图中蓝色的星球改成太阳,并且修改成适合iphone壁纸的尺寸。
与网页端流程一致,星流Agent 分析需求后选择工具。但在这个案例里,最终结果不尽人意:太阳被添加了星环,生成图片尺寸过长,并没有按需求直接匹配 iPhone壁纸的大小。
此外,在试用过程中,我们发现星流Agent的网页端和移动端项目互通,但目前只通了一半。在网页端后台可以看到移动端端项目,但项目名项目内容都无法显示。而在移动端可以显示并编辑网页端的内容。
这类显示不完全的小问题还有一些,比如在移动端用户积分和新对话的UI重叠。
另外,目前星流Agent还是会有报错的情况,有时会出现扣除点数但不工作,以及内容生成预估时间和实际时间严重不符等。这些都是今天AI 产品快速发布快速迭代的常见问题了。后续期待有所修复。
在定价上,星流Agent的价格并不便宜,我们按照49元4000 Agent点数的连续月包会员为例,相当于1元=80点数。在星流Agent如今半价福利的情况下,80点智能生成6张图片,2.5s视频,还不算需求理解、内容修改等。
试用一圈下来,星流Agent还是有不少让人惊艳的地方,它最打动人的,不是生成了多少张图或视频,而是它努力扮演“设计师”角色的尝试——理解需求、提供方案、迭代修改。而且这些都被体现在了产品的细节里。当然目前它并非万能也不完美,尤其在中文细节处理和性价比上仍有提升空间。
但对于那些“请专业设计师太麻烦,自己动手又太费劲”的轻量级、临时性设计需求,星流Agent确实提供了一个值得考虑的选项:
一杯咖啡的钱,一个能陪你聊需求、出方案、改稿子的“AI设计师”,可能正是这类AI产品面对的市场里的最大公约数。
点个爱心,再走 吧