Cómo Instalar y Ejecutar FramePack en tu PC con GPU NVIDIA (Paso a Paso)


Introducción
FramePack es un modelo de inteligencia artificial de próxima generación desarrollado para generar animaciones fluidas a partir de imágenes estáticas. Diseñado por ByteDance, este proyecto optimiza la predicción de fotogramas sucesivos mediante la compresión de contexto de entrada, permitiendo un rendimiento constante sin importar la longitud del video original. Su código fuente está disponible en GitHub, lo que facilita su instalación y personalización localmente.
Este tutorial está orientado a usuarios de Windows 10/11 con GPU NVIDIA (compatible con CUDA 12.6), 32 GB de RAM y Python 3.10.11, proporcionando un entorno virtual aislado para evitar conflictos de dependencias.

Imagen Original
Ilustración estática en estilo grabado

Resultado Animado
Animación generada por FramePack
Como se puede observar, FramePack logra generar una animación fluida y natural a partir de una única imagen estática, manteniendo la consistencia del estilo artístico y agregando movimientos sutiles que dan vida a la ilustración.
Requisitos del Sistema
Recurso | Mínimo | Recomendado |
---|---|---|
GPU | NVIDIA con soporte CUDA 11.x | NVIDIA RTX 2050 o superior (CUDA 12.6) |
RAM | 16 GB | 32 GB |
Sistema Operativo | Windows 10/11 | Windows 10/11 |
Python | 3.9+ | 3.10.11 |
Espacio libre | +5 GB | +10 GB |
Fuentes oficiales: Python 3.10.11 en python.org y guía de PyTorch para CUDA 12.6 en pytorch.org.
Paso 1: Descargar e Instalar Python 3.10.11
- Ve al sitio oficial:
python.org/downloads/release/python-31011/
- Descarga el instalador de 64 bits para Windows.
- Durante la instalación:
- Marca Add Python to PATH
- Elige Customize installation
- Activa pip, venv, tkinter y otras herramientas estándar
- Selecciona Install for all users e instala en
C:\Python310
- Reinicia el sistema al finalizar.
Paso 2: Crear y Activar un Entorno Virtual
Desde PowerShell o CMD ejecuta:
cd %USERPROFILE%\Documents
mkdir framepack
cd framepack
python -m venv venv
venv\Scripts\activate
Esto crea un entorno aislado para evitar conflictos con otras librerías.
Paso 3: Instalar PyTorch con CUDA 12.6
Actualiza pip e instala PyTorch optimizado para tu GPU:
pip install --upgrade pip
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126
Luego valida la instalación:
import torch
print(torch.cuda.is_available()) # Debe mostrar True
print(torch.cuda.get_device_name(0)) # Ej: NVIDIA GeForce RTX 2050
Estas instrucciones siguen las guías oficiales de PyTorch para soporte con CUDA 12.6.
Paso 4: Clonar e Instalar FramePack
Clona el repositorio oficial:
git clone https://github.com/lllyasviel/FramePack.git
cd FramePack
Instala las dependencias:
pip install -r requirements.txt
Si no tienes git, descarga el ZIP desde GitHub, extráelo y accede a la carpeta manualmente.
Paso 5: Solución de Errores Comunes
Error | Solución |
---|---|
Conflicto con typing-extensions o jinja2 | ejecutar pip install --force-reinstall typing-extensions jinja2 |
PyTorch no detecta GPU | verifica drivers NVIDIA y CUDA Toolkit 12.6, reinicia el sistema |
Fallos con pip o errores de importación | reinstala Python o recrea el entorno virtual |
No se abre la interfaz en navegador | abre manualmente http://localhost:7860 |
Paso 6: Ejecutar FramePack con Interfaz Web
Versión completa:
python demo_gradio.py
Versión ligera (f1):
python demo_gradio_f1.py
Se inicializará un servidor local y se abrirá automáticamente una interfaz web para cargar imágenes y generar animaciones.
Parámetros y Recomendaciones de Uso
Parámetro | Valor sugerido |
---|---|
Resolución | 256–384 px |
FPS | 24–30 |
Max Steps | 15–20 |
Precarga | ON (si está disponible) |
Swap | Mínimo de 64 GB en Windows |
Cierra aplicaciones innecesarias y monitorea el uso de GPU para evitar cuellos de botella.