2026年创始人峰会将于波士顿举行:购票立减最高可达300美元。立即注册。
2026年颠覆者大会门票最高可省680美元。今晚11:59前报名。
AI视频生成初创公司Luma周四推出了Luma Agents,旨在跨文本、图像、视频和音频完成端到端的创意工作。Luma Agents由该公司的“统一智能”家族模型驱动,架构基于单一多模态推理系统训练而成。
Luma Agents被定位为广告代理商、营销团队、设计工作室及企业的一种新的工作方式。据Luma首席执行官兼联合创始人Amit Jain介绍,这些代理能够规划并生成文本、图像、视频和音频内容,并与包括Luma的Ray 3.14、Google的Veo 3和Nano Banana Pro、字节跳动的Seedream以及ElevenLabs的声音模型在内的其他AI模型协同工作。
Luma的代理基于其Uni-1模型,这是“统一智能”家族中首个AI模型。Jain表示,Uni-1模型可以“以语言思考,并在像素或图像中想象和渲染……我们称之为‘智能在像素中的存在’。”其他输出能力如音频、视频将在后续模型版本中推出。
“我们的客户不是购买工具,而是重新定义业务方式,”Jain表示。Luma已开始将新代理平台推广给现有客户,包括全球广告代理商Publicis Groupe和Serviceplan以及品牌Adidas、Mazda和沙特AI公司Humain等。
Jain称,Luma Agents之所以成为改变游戏规则者,是因为它们能够保持资产间的持续上下文,并在协作中进行创意迭代。此外,这些代理能够在自我审查过程中改进结果,不断优化输出质量。
这一评估自身工作的能力使得编码代理变得非常有用。“你需要那种评估、修正并重复循环直到解决方案准确无误的能力。”Jain表示,在创意环境中使用AI工具的当前工作流程并未提供创意行业所期望加速的好处。取而代之的是:“这里有100个模型,学会如何提示它们即可。”他强调,Luma Agents的不同之处在于不需要为每次迭代反复提示,系统会生成大量变体,并通过对话引导用户的方向。
“借助统一智能,由于这些模型不仅能够生成内容还能理解,在此基础上我们构建了一个可以完成这种端到端工作的系统,”Jain表示。例如,建筑师在绘制建筑线条时,正在创建一个内部的心理结构、光线、空间动态和生活体验的内部表征。这与统一智能的设计原理相同。
Jain表示,该系统能够显著加快创意工作流程。在一个演示中,他展示了200字简报和一张产品(口红)图片如何引导系统生成各种广告活动的想法,包括地点、模特及色彩方案等。
另有一次案例显示,Luma Agents将一个品牌历时一年花费1500万美元的广告活动转化为40小时内为不同国家制作了多份本地化广告,并且费用不到2万美元,同时通过了品牌的内部质量控制检查和准确性测试。
虽然Luma Agents现已通过API公开可用,但Jain表示该公司计划逐步推出访问权限以确保用户稳定使用并避免工作流程中断。
推荐意见