让图片动起来！在ComfyUI中从零开始搭建基于Stable video diffusion xt 1.1视频生成模型的图生视频/文生视频工作流 SVD节点参数详解 Sora未上线之前AI生成视频方法

氪學家

8 Apr 202413:40

TLDR本视频教程介绍了如何在ComfyUI中从零开始搭建基于Stable video diffusion xt 1.1的视频生成模型，实现图生视频和文生视频的工作流。视频详细讲解了SVD节点的参数设置，包括视频尺寸、帧数、FPS、运动幅度和噪声量等，并演示了如何通过调整CFG值来优化视频质量。此外，还探讨了将文生图工作流与SVD模型结合生成文生视频的方法，为AI视频生成领域提供了实用指南。

Takeaways

😀 AI生成视频是一个热门领域，自从OpenAI发布Sora后，视频生成质量有了显著提升。
🔥 尽管Sora还在测试阶段，未公开使用，但其影响已经促使其他视频生成工具如Pika DomoAI、Pixverse等吸引了大量用户。
🌟 StabilityAI发布了开源视频生成模型SVD（Stable video diffusion xt 1.1），为AI视频生成提供了新的解决方案。
🎥 在ComfyUI中搭建基于SVD的视频生成工作流，需要使用特定的节点和模型，这些可以通过端脑云氪学家版获得。
🖼️ 搭建工作流时，需要将SVD conditioning节点与图像输入、模型、正向和反向提示词等节点正确连接。
🔧 调整CFG值（提示词的关联程度）可以改善视频的过拟合现象，提高生成视频的质量。
📊 视频生成的参数设置，如视频尺寸、总帧数、FPS帧速率、motion bucket ID和augmentation level，对最终视频效果有重要影响。
🔄 通过调整视频线性CFG引导节点，可以在视频生成过程中应用动态CFG值，以改善视频的稳定性和质量。
📝 除了图生视频，ComfyUI也支持搭建文生视频工作流，通过将文本描述转换为图像，再由SVD模型生成视频。
🔍 视频教程展示了如何从零开始在ComfyUI中搭建视频生成工作流，并提供了对SVD模型参数的详细解释。

Q & A

什么是AI生成视频，它为什么受到关注？
-AI生成视频是指利用人工智能技术，根据给定的文本描述或图片生成视频内容的过程。这个领域受到关注是因为它能够创造出逼真的视频内容，有潜力改变娱乐、教育、广告等多个行业。
Sora是什么，它在AI生成视频领域有什么重要性？
-Sora是由OpenAI发布的AI生成视频工具，它在AI生成视频领域的重要性在于显著提高了生成视频的质量，代表了该领域技术进步的一个重要里程碑。
StabilityAI发布的SVD模型是什么，它与Sora有什么关系？
-SVD（Stable video diffusion xt）是StabilityAI发布的一个开源视频生成模型。它与Sora的关系在于，虽然两者都是用于生成视频的工具，但SVD是一个开源模型，而Sora是OpenAI的产品，且SVD在Sora发布之前就已经存在，为AI视频生成技术的发展做出了贡献。
什么是ComfyUI，它在AI视频生成中扮演什么角色？
-ComfyUI是一个用户界面，它在AI视频生成中提供了一个可视化的工作环境，让用户能够通过拖放节点的方式搭建工作流，从而生成视频。它简化了视频生成的复杂过程，使得用户即使没有深厚的技术背景也能参与到AI视频生成中。
在ComfyUI中搭建基于SVD的视频生成工作流需要哪些步骤？
-在ComfyUI中搭建基于SVD的视频生成工作流需要以下步骤：1) 更新ComfyUI到最新版本；2) 下载SVD 1.1模型；3) 安装video helper suite插件；4) 在ComfyUI中搜索并添加SVD相关节点；5) 连接节点以构建工作流；6) 上传图片或使用文生图工作流生成图片；7) 调整参数并生成视频。
如何使用ComfyUI生成图生视频？
-在ComfyUI中生成图生视频，首先需要上传一张图片作为视频生成的基础，然后通过SVD conditioning节点调用SVD模型，设置视频的宽高、总帧数、FPS等参数，最后通过video helper suite插件将生成的图片序列合成视频。
文生视频与图生视频有什么区别？
-文生视频是基于文本描述直接生成视频内容，而图生视频则是基于一张图片生成视频，让图片中的内容动起来。在ComfyUI中，可以通过搭建文生图工作流生成图片，然后将这张图片作为输入项提交给图生视频的工作流，从而实现文生视频的生成。
SVD conditioning节点在视频生成中起什么作用？
-SVD conditioning节点是使用SVD模型生成视频的关键节点。它接收图片作为输入，并根据设置的参数生成视频序列。它还负责处理正向提示词、反向提示词以及latent向量，这些因素共同影响视频生成的结果。
如何调整生成视频的质量，避免过拟合现象？
-为了避免生成视频时的过拟合现象，可以通过调整采样器中的CFG值来控制提示词的关联程度。降低CFG值可以减少过拟合，但过低可能导致视频内容与输入图片差异过大。此外，还可以使用video linear CFG guidance节点动态调整CFG值，以改善视频的整体质量。
在ComfyUI中搭建文生视频工作流的步骤是什么？
-在ComfyUI中搭建文生视频工作流的步骤包括：1) 搭建文生图工作流生成图片；2) 将生成的图片作为输入项提交给图生视频的工作流；3) 调整SVD conditioning节点的参数以匹配文生图的输出；4) 使用video helper suite插件合成视频。

Outlines

00:00

🎥 Introduction to AI Video Generation

The paragraph introduces the topic of AI-generated videos, highlighting the impact of OpenAI's Sora on the field. It mentions that Sora has significantly improved AI video quality but is still in the testing phase and not publicly available. The speaker also references other video generation tools like Pika, Domo, AI Pixverse, and StabilityAI's open-source model SVD. The paragraph discusses the release of SVD 1.1 and the recent launch of the online Stable video project. The speaker guides viewers on setting up a video generation workflow in Comfy UI, starting with launching a machine on Brain Cloud and selecting the Comfy UI version integrated with necessary nodes and models. The paragraph concludes with instructions to clear the default workflow and prepare for a hands-on tutorial.

05:00

🛠 Setting Up SVD in Comfy UI

This paragraph delves into the technical process of setting up the SVD model within Comfy UI. It instructs on downloading the official Comfy UI example page for reference, which includes workflows for various applications, including SVD. The speaker emphasizes the importance of this resource for beginners and guides viewers to download a workflow image and upload it into Comfy UI. The paragraph explains how to connect the SVD conditioning node with other necessary nodes for video generation, such as image input and VAE connections. It also touches on the need to update Comfy UI to the latest version and install the 'video helper suite' plugin for video synthesis. The paragraph concludes with a step-by-step guide on connecting the nodes required for the SVD video generation workflow.

10:01

🔧 Adjusting Parameters and Generating Videos

The paragraph focuses on the practical aspects of generating videos using the SVD model in Comfy UI. It discusses the importance of matching the image dimensions with the SVD conditioning node settings and provides a step-by-step guide to generating a video. The speaker addresses the issue of overfitting in generated images and suggests adjusting the CFG value to resolve it. The paragraph also explains the significance of various parameters such as width, height, total frames, FPS, motion bucket ID, and augmentation level. It concludes with a brief mention of the possibility of creating text-to-video workflows in Comfy UI, suggesting that the video generation process can be extended beyond image-based inputs to include text descriptions as well.

Mindmap

Keywords

💡Stable video diffusion xt 1.1

Stable video diffusion xt 1.1（简称SVD 1.1）是由Stability AI发布的开源视频生成模型。它能够根据一张静态图片生成视频，通过扩散模型（diffusion model）的技术，将图片中的元素动态化。SVD 1.1在技术上进行了优化，使得生成的视频在连贯性和细节上有了显著提升。例如，它可以生成25帧的短视频，分辨率为1024x576，并且在固定条件下输出的一致性较高，无需过多调整超参数。这个模型的发布，为视频制作和内容创作领域带来了新的可能性，尤其是在AI辅助的视频创作上。

💡AI生成视频

AI生成视频是指利用人工智能技术，根据文本描述、静态图像或其他视频素材，自动生成新的视频内容的过程。在视频中提到的Sora、SVD 1.1、Pika DomoAI Pixverse等都是AI生成视频领域的代表性工具或模型。这些工具通过深度学习算法，理解输入的文本或图像，并创造出具有连贯动作和场景的视频。AI生成视频技术的发展，为影视制作、游戏设计、虚拟现实等领域带来了革命性的变化，同时也引发了关于内容真实性和版权等方面的讨论。

💡ComfyUI

ComfyUI是一个用户界面平台，它允许用户通过图形化界面来搭建和管理AI模型的工作流。在视频中，ComfyUI被用来展示如何搭建基于SVD 1.1模型的视频生成工作流。用户可以通过ComfyUI的界面，上传图片、设置参数、并触发视频生成过程，而无需直接编写代码或深入理解背后的技术细节。ComfyUI的易用性降低了AI视频生成技术的门槛，使得更多非技术用户也能参与到AI创作中来。

💡Sora

Sora是OpenAI发布的一款AI视频生成模型，它可以根据文本提示生成视频。Sora模型在技术上采用了“扩散+Transformer”的技术路线，能够生成具有复杂场景和角色的视频内容，同时保持故事的逻辑性和连贯性。Sora的发布在AI领域引起了广泛关注，尽管目前还在测试阶段，但它的潜力已经被许多视频创作者和技术开发者所认可。Sora的未来发展可能会对视频制作行业产生深远影响。

💡Pika DomoAI Pixverse

Pika DomoAI Pixverse是市面上可用的AI视频生成工具之一。这些工具虽然在生成视频的质量上可能与Sora等更先进的模型存在差距，但它们提供了用户可以实际体验和使用的解决方案。例如，PixVerse是由国人团队开发的工具，它支持文生视频和图生视频的生成，并且目前是完全免费使用的。这些工具的发展和迭代，使得AI视频生成技术更加亲民和实用。

💡视频防盗

视频防盗是指在视频内容中采取一定的技术手段，以防止未经授权的复制、传播或篡改。在视频制作和分发过程中，原创内容的保护尤为重要。在视频中提到的“视频防盗全网唯一账号 YouTube@氪学家”可能是作者在YouTube平台上对视频内容进行版权保护的一种声明。这表明作者重视自己内容的版权，并采取措施防止他人未经授权使用。

💡端脑云

端脑云在视频中被提及作为开设机器的平台，用于部署和运行AI视频生成模型。它可能是一个提供云计算资源的服务，允许用户远程访问和使用服务器资源，以进行AI模型的训练和推理。在AI视频生成的上下文中，端脑云可以为用户提供必要的计算能力，以便他们可以运行像SVD 1.1这样的复杂模型，而无需自己拥有高性能的硬件设备。

💡GitHub

GitHub是一个广泛使用的代码托管平台，它允许开发者托管代码、管理项目和协作开发。在视频中，GitHub被提及作为获取ComfyUI官方案例页面的资源之一。用户可以通过GitHub访问ComfyUI的官方案例，下载和学习如何搭建基于SVD 1.1模型的视频生成工作流。GitHub在AI开发和社区共享中扮演着重要角色，促进了技术交流和知识传播。

💡模型参数

在AI视频生成模型中，模型参数是指影响模型行为和输出的各种设置。例如，在SVD 1.1模型中，参数可能包括视频的分辨率、帧数、动作幅度等。在视频中，作者详细解释了如何设置这些参数，以及它们如何影响最终生成的视频。理解并正确设置这些参数对于优化视频生成过程和达到预期效果至关重要。

Highlights

AI生成视频是当前热门领域，Sora模型发布后极大提升了视频生成质量。

Sora目前处于测试阶段，未公开使用，但激发了市场对视频生成工具的兴趣。

介绍了市面上可用的AI视频生成工具，如Pika DomoAI、Pixverse等。

StabilityAI发布了开源视频生成模型SVD，是生成视频的关键技术之一。

演示了如何在ComfyUI中搭建基于SVD的视频生成工作流。

介绍了使用端脑云和ComfyUI氪学家版进行视频生成的便捷方式。

详细解释了ComfyUI中SVD节点的搭建和参数设置。

展示了如何将图片上传到ComfyUI并使用SVD模型生成视频。

介绍了如何使用VideoHelperSuite插件将图片合成视频。

讨论了生成视频中过拟合现象的调整方法，特别是CFG值的调整。

解释了SVD conditioning节点的参数意义，包括视频尺寸、帧数、运动幅度等。

探讨了如何基于SVD模型在ComfyUI中搭建文生视频系统。

展示了如何将文生图的输出作为输入项提交给SVD进行视频生成。

介绍了video linear CFG guidance节点，用于动态调整生成视频时的CFG值。

总结了在ComfyUI中从零开始搭建基于SVD的视频生成工作流的过程。

预告了未来将探索SVD更多玩法的教程。

Casual Browsing

🐼 王炸！StabilityAI全新图生视频模型stable video diffusion 介绍&部署&测评目前最强AI生成视频工具 SVD-XT视频稳定性超越runway和pikalabs

2024-03-26 08:10:02

【AI】2024年4款最强AI视频转动漫工具。其中一款完全免费，最后一个青出于蓝 | #AI视频 | #AI生成视频

2024-04-22 20:20:01

最好的AI视频生成工具2024：Invideo AI新手完整教程, 一键生成视频，YouTube新手小白如何做视频，不用说话！AI声音复制模仿克隆你自己的声音制作专业的原创英文长视频赚美金

2024-05-18 13:10:01

ComfyUI图片转视频📽，轻松上手AI视频制作, Image To Video ,用图像讲故事，内容更出彩！ #comfyui #aigc #videogeneration

2024-09-19 07:57:00

2024最新youtube赚钱教程，AI恐怖视频制作教学,从文案到视频到频道简洁昵称，恐怖故事视频新频道完整流程操作。ai赚钱思路。

2024-04-16 14:35:00

【AI视频】革命性突破!最全无闪烁AI视频制作教程真正生产力 Stable diffusion + EbSynth + ControlNet

2024-03-24 17:15:01

让图片动起来！在ComfyUI中从零开始搭建基于Stable video diffusion xt 1.1视频生成模型的图生视频/文生视频工作流 SVD节点参数详解 Sora未上线之前AI生成视频方法

Takeaways

Q & A

什么是AI生成视频，它为什么受到关注？

Sora是什么，它在AI生成视频领域有什么重要性？

StabilityAI发布的SVD模型是什么，它与Sora有什么关系？

什么是ComfyUI，它在AI视频生成中扮演什么角色？

在ComfyUI中搭建基于SVD的视频生成工作流需要哪些步骤？

如何使用ComfyUI生成图生视频？

文生视频与图生视频有什么区别？

SVD conditioning节点在视频生成中起什么作用？

如何调整生成视频的质量，避免过拟合现象？

在ComfyUI中搭建文生视频工作流的步骤是什么？