FramePack

打包输入帧上下文用于视频生成

革命性的下一帧预测神经网络结构，可以渐进式生成视频。无论视频长度如何，FramePack都能压缩输入上下文至恒定长度，使生成工作负载不受视频长度影响。

查看演示开始使用

视频扩散，却感觉像图像扩散

FramePack是一种下一帧预测神经网络结构，用于渐进式生成视频。它能将输入上下文压缩到恒定长度，使生成工作负载不受视频长度影响。

即使在笔记本GPU上也能处理大量帧
仅需6GB GPU内存
可以使用更大的批处理大小进行训练
生成1分钟、30FPS的视频（1800帧）

主要特性

极低内存需求

使用13B模型生成60秒、30fps（1800帧）的视频仅需6GB显存。笔记本GPU完全可以胜任。

即时视觉反馈

作为下一帧预测模型，您将直接看到生成的帧，在整个视频生成过程中获得大量视觉反馈。

压缩输入上下文

将输入上下文压缩到恒定长度，使生成工作负载不受视频长度影响，支持超长视频生成。

独立桌面软件

提供功能完整的桌面软件，具备最小化独立高质量采样系统和内存管理功能。

常见问题

FramePack与其他视频生成技术相比有什么优势？

FramePack的核心优势在于其专利的输入上下文压缩技术，使得生成工作负载不随视频长度增加而增大。这意味着与竞争对手相比，FramePack能以恒定的内存使用量生成无限长的视频，同时保持每帧的视觉质量和时间连贯性。最新的2025版本还增加了多模态输入支持，允许通过文本、图像甚至音频引导视频生成过程。

普通消费级电脑能否运行FramePack？

完全可以。FramePack的设计初衷就是让所有创作者，无论其硬件条件如何，都能够使用高质量的AI视频生成技术。只要您的电脑配备了至少6GB显存的GPU（如NVIDIA GTX 1060或更新型号），就能流畅运行FramePack。这是同类AI视频生成工具中内存需求最低的解决方案。

惊艳演示

优雅舞蹈

女孩优雅地跳舞，动作清晰，魅力四射。

能量舞蹈

男子充满活力地跳舞，跃入空中，手臂流畅摆动，脚步迅速。

如何利用FramePack创建你的第一个AI视频

第1步：准备输入提示

撰写详细的文本描述，包括场景、动作、物体特征和情感氛围。2025版支持混合提示输入，可以同时使用参考图像和文本描述。
第2步：选择视觉风格

从预设的20种视觉风格中选择，或上传参考图像定义自定义风格。最新版增加了"风格一致性增强"选项，确保长视频中风格不会漂移。
第3步：设置生成参数

调整帧率、分辨率、内容一致性和创意自由度参数。新手建议从预设模板开始，逐步探索自定义设置。

行业应用案例

某知名动画工作室如何用FramePack降低60%生产成本

"自从2024年采用FramePack替代传统关键帧动画后，我们的前期动画效率提升了300%，且团队不再需要高端工作站。" —— 张明，首席动画师

该工作室利用FramePack的持续优化能力，从简单草图生成初步动画，再通过艺术家指导进行精细调整。这一工作流程让项目周期从平均18个月缩短至7个月，同时提高了创意自由度。

开始使用

一键安装包即将发布，请稍后再来查看。

# 我们推荐使用独立的Python 3.10环境
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126
pip install -r requirements.txt

# 启动GUI
python demo_gradio.py

点击在RunningHub上立即体验FramePack，无需安装

研究论文

打包输入帧上下文用于视频生成的下一帧预测模型

FramePack是一种革命性的视频生成技术，能够压缩输入上下文到恒定长度，使生成工作负载不受视频长度影响。详细了解我们的方法、架构和实验结果。

查看论文项目页面

FramePack背后的科学突破

自2023年首次发布以来，FramePack团队在《Transactions on Machine Learning》和CVPR 2024/2025等顶级会议发表了7篇研究论文，详细阐述了其核心技术创新。核心研究团队由来自清华大学、斯坦福大学和OpenAI的研究人员组成。

2025年的最新版本引入了自适应帧率技术(AFR)，能根据场景复杂度动态调整生成细节，在动作场景中提供更高帧率，在静态场景中节省计算资源，这一技术在SIGGRAPH Asia 2024获得了最佳论文奖。

2025年功能更新与未来规划

2025年5月更新

多人物交互模式：现在支持多达5个角色的复杂互动场景
声音驱动动作：可以通过音频输入控制视频中的动作与节奏
3D场景理解：改进的空间一致性，使摄像机移动更加流畅

2025-2026发展路线图

团队正在研发第二代上下文压缩技术，预计将进一步降低50%的内存需求，同时提高细节保真度。此外，计划在Q4发布API接入方案，允许开发者将FramePack功能集成到自己的应用中。

FramePack

打包输入帧上下文用于视频生成

视频扩散，却感觉像图像扩散

先进的低内存视频生成模型如何改变创意工作流程

理解视频扩散模型和下一帧预测的根本差异