Juan David Montoya

Introducción

FramePack es un modelo de inteligencia artificial de próxima generación desarrollado para generar animaciones fluidas a partir de imágenes estáticas. Diseñado por ByteDance, este proyecto optimiza la predicción de fotogramas sucesivos mediante la compresión de contexto de entrada, permitiendo un rendimiento constante sin importar la longitud del video original. Su código fuente está disponible en GitHub, lo que facilita su instalación y personalización localmente.

Este tutorial está orientado a usuarios de Windows 10/11 con GPU NVIDIA (compatible con CUDA 12.6), 32 GB de RAM y Python 3.10.11, proporcionando un entorno virtual aislado para evitar conflictos de dependencias.

Imagen Original

Ilustración estática en estilo grabado

Resultado Animado

Animación generada por FramePack

Como se puede observar, FramePack logra generar una animación fluida y natural a partir de una única imagen estática, manteniendo la consistencia del estilo artístico y agregando movimientos sutiles que dan vida a la ilustración.

Requisitos del Sistema

Recurso	Mínimo	Recomendado
GPU	NVIDIA con soporte CUDA 11.x	NVIDIA RTX 2050 o superior (CUDA 12.6)
RAM	16 GB	32 GB
Sistema Operativo	Windows 10/11	Windows 10/11
Python	3.9+	3.10.11
Espacio libre	+5 GB	+10 GB

Fuentes oficiales: Python 3.10.11 en python.org y guía de PyTorch para CUDA 12.6 en pytorch.org.

Paso 1: Descargar e Instalar Python 3.10.11

Ve al sitio oficial: python.org/downloads/release/python-31011/
Descarga el instalador de 64 bits para Windows.
Durante la instalación:
- Marca Add Python to PATH
- Elige Customize installation
- Activa pip, venv, tkinter y otras herramientas estándar
- Selecciona Install for all users e instala en C:\Python310
Reinicia el sistema al finalizar.

Paso 2: Crear y Activar un Entorno Virtual

Desde PowerShell o CMD ejecuta:

cd %USERPROFILE%\Documents

mkdir framepack

cd framepack

python -m venv venv

venv\Scripts\activate

Esto crea un entorno aislado para evitar conflictos con otras librerías.

Paso 3: Instalar PyTorch con CUDA 12.6

Actualiza pip e instala PyTorch optimizado para tu GPU:

pip install --upgrade pip

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

Luego valida la instalación:

import torch

print(torch.cuda.is_available())      # Debe mostrar True

print(torch.cuda.get_device_name(0))  # Ej: NVIDIA GeForce RTX 2050

Estas instrucciones siguen las guías oficiales de PyTorch para soporte con CUDA 12.6.

Paso 4: Clonar e Instalar FramePack

Clona el repositorio oficial:

git clone https://github.com/lllyasviel/FramePack.git

cd FramePack

Instala las dependencias:

pip install -r requirements.txt

Si no tienes git, descarga el ZIP desde GitHub, extráelo y accede a la carpeta manualmente.

Paso 5: Solución de Errores Comunes

Error	Solución
Conflicto con `typing-extensions` o `jinja2`	ejecutar `pip install --force-reinstall typing-extensions jinja2`
PyTorch no detecta GPU	verifica drivers NVIDIA y CUDA Toolkit 12.6, reinicia el sistema
Fallos con pip o errores de importación	reinstala Python o recrea el entorno virtual
No se abre la interfaz en navegador	abre manualmente `http://localhost:7860`

Paso 6: Ejecutar FramePack con Interfaz Web

Versión completa:

python demo_gradio.py

Versión ligera (f1):

python demo_gradio_f1.py

Se inicializará un servidor local y se abrirá automáticamente una interfaz web para cargar imágenes y generar animaciones.

Parámetros y Recomendaciones de Uso

Parámetro	Valor sugerido
Resolución	256–384 px
FPS	24–30
Max Steps	15–20
Precarga	ON (si está disponible)
Swap	Mínimo de 64 GB en Windows

Cierra aplicaciones innecesarias y monitorea el uso de GPU para evitar cuellos de botella.

Cómo Instalar y Ejecutar FramePack en tu PC con GPU NVIDIA (Paso a Paso)