行业企业

LTX2.3 3.5视频生产线:10套流程一次装齐

 作者：本站编辑  2026-06-23 15:02:29  0

做 AI 视频，最烦的不是没有模型。而是每做一个需求，就要换一套流程。

流程一多，真正拖慢效率的不是生成速度，而是你每次都要重新找入口、重新接节点、重新调参数。

这次 LTX 2.3 3.5 套件，我直接把常用视频任务整理成了 10 套流程。

一句话：

不是单个工作流更新，而是一整套 LTX 2.3 视频生产线。

一、3.5版本到底改了什么？

这次从 3.0 / 3.1 迭代到 3.5，表面上看只是 0.5 版本更新。

但真正关键的变化，是 LoRA 调权策略变了。

以前很多流程里，LoRA 往往是 1 到 3 阶用同一套权重。

这其实不够合理。

因为一阶、二阶、三阶的任务不一样。

一阶更像打底，负责先把动作、构图、主体关系跑出来。

二阶负责明显提升画面与细节。

三阶则更偏最终质感、清晰度和稳定补强。

所以 3.5 的核心思路是：

不同阶段，用不同 LoRA 权重。

不再一套权重从头压到尾。

这对三阶渲染非常重要。

因为你不能把低分辨率阶段的参数逻辑，原封不动搬到最终高清阶段。

阶段不同，力道就应该不同。

二、为什么所有流程都强调三阶渲染？

因为二阶渲染已经接近官方默认思路。

如果只是做二阶，那意义不够大。

这次套件里，大部分流程都编入了三阶渲染。

目标很明确：

先保证能动。

再提升细节。

最后拉到更高质感。

这对 LTX 2.3 很关键。

因为 LTX 2.3 本身生成速度和视频可控性不错，但如果只停在基础分辨率，成片质感还不够强。

三阶渲染就是为了解决这个问题。

尤其是文生视频、图生视频、数字人、多图参考、导演节点、视频控制这类流程，三阶会明显提高最终可用性。

简单说：

一阶看方向。

二阶看画面。

三阶看成片。

三、10套流程分别解决什么？

这次一共有 10 套流程。

前 9 套主要基于 LTX 2.3。

最后的字幕水印去除，用的是 Bernini。

原因很直接：Bernini 去字幕水印效果太好。

不需要为了统一底模而硬用 LTX。

工具是为结果服务的。

这 10 套流程分别覆盖：

文生视频。

图生视频。

单人数字人。

MSR多图参考视频。

分镜导演节点。

六宫格故事板。

视频扩图。

视频控制。

视频重新对口型。

字幕水印去除。

基本上，LTX 2.3 常见的视频生产需求，这套都覆盖到了。

四、文生视频和图生视频是基础入口

第一套是文生视频。

快速启动就是设置视频宽高、帧率、帧数，再写总提示词、分提示词和反向提示词。

这里继续使用 KJ Smart 节点 来处理分段提示词。

它适合从 0 开始生成一段视频。

第二套是图生视频。

它和文生视频相比，只多了一个首帧图像输入。

加载一张首帧图，设置尺寸、帧率、帧数，再写总提示词、分提示词和反向提示词。

这套适合把一张图拉成视频。

如果你已经有角色图、封面图、场景图，图生视频就是最直接的入口。

这两个流程是整个套件的地基。

一个从文字开拍。

一个从图片开拍。

五、单人数字人重点是音频驱动

第三套是单人数字人。

相比图生视频，它多了一个音频输入。

音频负责驱动角色运动和说话。

你可以设置从音频第几秒开始截取，再设置截取多长时间。

比如从第 20 秒开始，截取 15 秒。

帧数会根据音频时长自动计算。

这个流程适合做：

口播数字人。

角色说话。

音频驱动视频。

短剧情对白。

这次 3.5 里，LoRA 分阶段调权对数字人也很重要。

因为之前版本里，某些 LoRA 组合可能对音频表现造成破坏。

这次通过调权，能明显缓解这类问题。

数字人最怕的就是画面好，但嘴型、动作、音频关系不舒服。

所以 3.5 的调权重点，不只是让画面更漂亮，而是让整体链路更稳。

六、MSR多图参考更适合做故事

第四套是 MSR 多图参考视频。

这个流程可以加载 5 张图。

前 1 到 4 张可以是人物、动物、道具、怪物或其他元素。

第 5 张默认作为背景。

它适合做多元素故事视频。

比如一个男主、一个女主、一只猫、一个怪物，再加一个古村背景。

这类任务普通图生视频很难处理。

因为模型很容易把元素混在一起。

MSR 的价值就在于：

让多张参考图形成可检索的视觉记忆。

这次我没有继续混入 Prompt Relay。

因为测试下来，Prompt Relay 和 MSR 混合在一起表现并不优秀。

所以这个流程只保留单一正向提示词输入框。

更干净。

更直接。

融合效果也比上一版更连贯。

唯一需要注意的是，开头可能出现一些废帧。

这类废帧不必硬修，直接裁掉即可。

让剧情从 1/3 处开始，往往更干净。

七、导演节点和故事板更适合分镜生产

第五套是分镜导演节点。

它的逻辑是：一个图像对应一个提示词。

你可以在中间插入文本，也可以插入图像继续引导。

如果插入图像，也要给它对应提示词。

这个流程适合更复杂的短片控制。

如果你熟练使用导演节点，它其实可以顶替好几个单独流程。

但考虑到很多用户只想用单一流程，所以套件里仍然把它单独列出来。

第六套是六宫格故事板。

它和导演节点很像，只是输入形式更适合六宫格用户。

如果你已经用六宫格生成了故事板，就不需要再拆成 6 张图。

直接加载六宫格图像，就能进入流程。

这套的价值是：

尊重已有工作习惯。

不用为了工作流，反过来改变自己的素材生产方式。

八、视频扩图和视频控制是实用工具流

第七套是视频扩图。

它是二阶渲染流程。

没必要强行做三阶。

因为它本身二阶已经足够强。

它可以把 9:16 扩成 16:9。

适合竖屏转横屏、画面补边、视频重新构图。

快速启动就是加载视频，设置帧率、处理时长和目标比例。

提示词可以写得很简单。

这类任务的重点不是大段提示词，而是模型对画面延展的理解。

第八套是视频控制流程。

这里主要用到 IC-LoRA 运动控制模型，也可以结合 CN 类控制思路。

我这里只单列了骨骼引导，但视频控制不只能做美女跳舞。

它也可以做深度图引导、结构控制、动作迁移等任务。

这套流程也做成了三阶渲染。

目标是让控制视频最终获得更高清的结果。

有些结果尺寸已经能超过 2000 像素级别。

九、对口型和去字幕水印是收尾利器

第九套是视频重新对口型。

它可以让视频人物围绕输入提示词重新说话。

视频长度以秒为单位，帧率默认 24fps。

你可以设置视频截取开始和结束位置，再通过提示词列出人物要说的话。

这套流程相比上一代没有特别大变化。

但它依然是视频二创、角色改口、口播修改里非常重要的一环。

第十套是字幕水印去除。

这套没有强行使用 LTX。

而是使用 Bernini。

原因很简单：

Bernini 去字幕水印效果更好。

加载要处理的视频，设置帧数和帧率，渲染完成后得到结果。

因为 Bernini 基于 Wan 系，速度会偏慢。

如果只是去字幕水印这种相对单一的任务，可以尝试把步数调到 4 和 2 来加快生成。

对于这类简单任务，4 和 2 通常已经够用。

十、最终结论

这次 LTX 2.3 3.5 套件，真正重要的不是单个流程变强。

而是它把 LTX 2.3 常用的视频任务整理成了一套完整生产线。

文生视频负责从文字开拍。

图生视频负责首帧转视频。

数字人负责音频驱动。

MSR负责多图参考讲故事。

导演节点负责复杂分镜。

故事板负责六宫格用户。

视频扩图负责比例重构。

视频控制负责动作和结构引导。

对口型负责人物重说话。

Bernini负责字幕水印清理。

而 3.5 最大的技术变化，就是：

三阶渲染不再一套LoRA权重用到底。

每一阶段都有自己的LoRA调权策略。

一句话总结：

LTX 2.3 3.5不是单个工作流，而是一套视频生产工具箱。

如果你只想快速用，新用户直接看快速启动。

如果你想研究流程，老用户拿到工程文件，就能看出每一次调权、删减和增强的逻辑。

这套东西的价值不只是“能跑”。

而是把 LTX 2.3 的视频能力，整理成了更接近生产线的形态。

【? 限时福利1】 优云智算新用户注册即送 5小时4090算力！

https://passport.compshare.cn/register?referral_code=A7fTQUYY9lCDFJwA6MMvoq

支持一键部署AI镜像，按需租赁，深度学习 / 科学计算更省成本。

?镜像直达链接:https://www.notion.so/2b72459a3ac6808f8282f2c687ed8f52

【? 限时福利2】 RunningHub邀请码输入【rh-v1111】，即可领取1000RH币，每天登录还送100币！

? 中国大陆入口：

https://www.runninghub.cn/user-center/1892566146468511746?inviteCode=rh-v1111

? 非中国大陆入口：

https://www.runninghub.ai/user-center/1892566146468511746?inviteCode=rh-v1111

? 领完关注AIKSK，获取更多高质量工作流与新内容 ! !

?更多平台内容

公众号：AIKSK

抖音：https://v.douyin.com/i2PVpstR/

哔哩哔哩：https://space.bilibili.com/110353151

小红书：https://www.xiaohongshu.com/user/profile/6293ed680000000021022650

YouTube：https://www.youtube.com/channel/UC-DkD5jRo7n8fSI00Q72MQQ

行业企业

LTX2.3 3.5视频生产线:10套流程一次装齐

相关内容查看全部 

安徽省尼龙企业集

行业速报|AI 智能

五粮液文创酒瓶专

陈村首台!免打地

织造行业企业介绍

物料沥水风干全套

书本对接生产线,

奋战二季度|成功

每日科普|哪些行

会员动态|宝鸡九

LTX2.3 3.5视频生产线:10套流程一次装齐

相关内容 查看全部 

相关内容查看全部 