/ ComfyUI / Prompting Regional Basado en Máscaras en ComfyUI: Guía Completa de Control de Precisión 2025
ComfyUI 29 min de lectura

Prompting Regional Basado en Máscaras en ComfyUI: Guía Completa de Control de Precisión 2025

Domina el prompting regional basado en máscaras en ComfyUI para control multi-región con precisión píxel a píxel. Flujos de trabajo completos, técnicas de creación de máscaras, compatibilidad con Flux y composición avanzada.

Prompting Regional Basado en Máscaras en ComfyUI: Guía Completa de Control de Precisión 2025 - Complete ComfyUI guide and tutorial

Cambié de Regional Prompter basado en cuadrículas a prompting regional basado en máscaras después de encontrar sus limitaciones en un proyecto de cliente que requería cinco regiones de formas irregulares. Los enfoques basados en cuadrículas te obligan a divisiones rectangulares, pero las técnicas basadas en máscaras te permiten definir cualquier forma de región con precisión a nivel de píxel. Aún mejor, los enfoques basados en máscaras funcionan con Flux y otros modelos que no soportan las extensiones tradicionales de Regional Prompter.

En esta guía, obtendrás flujos de trabajo completos de prompting regional basado en máscaras para ComfyUI, incluyendo técnicas de creación y preparación de máscaras, composición de múltiples máscaras para escenas complejas, implementaciones específicas para Flux, generación automatizada de máscaras con Segment Anything, y flujos de trabajo de producción para proyectos que requieren precisión quirúrgica en el control regional.

Por Qué el Prompting Regional Basado en Máscaras Supera los Enfoques de Cuadrícula

Regional Prompter basado en cuadrículas (cubierto en mi guía de Regional Prompter) divide imágenes en regiones rectangulares. Esto funciona excelente para composiciones simples pero falla cuando tus elementos compositivos no se alinean con cuadrículas rectangulares.

El prompting regional basado en máscaras usa máscaras en escala de grises o binarias para definir regiones de cualquier forma. Las áreas negras (0) reciben un prompt, las áreas blancas (255) reciben otro prompt, y las áreas grises mezclan entre prompts proporcionalmente. Esto proporciona control a nivel de píxel sobre la aplicación del prompt.

Comparación entre Prompting Regional de Cuadrícula vs Basado en Máscaras

  • Flexibilidad de forma: Cuadrícula (solo rectangular), Máscara (cualquier forma)
  • Precisión: Cuadrícula (nivel de región), Máscara (nivel de píxel)
  • Complejidad de configuración: Cuadrícula (simple), Máscara (moderada a compleja)
  • Compatibilidad de modelos: Cuadrícula (solo SD1.5, SDXL), Máscara (todos los modelos incluyendo Flux)
  • Sobrecarga de procesamiento: Cuadrícula (+15-20%), Máscara (+10-15%)

Escenarios críticos donde los enfoques basados en máscaras son esenciales:

Sujetos no rectangulares: Personaje con cabello fluido o silueta compleja. Las regiones basadas en cuadrícula crean límites rectangulares que cortan el personaje de forma antinatural. Las regiones basadas en máscaras siguen el contorno real del personaje.

Colocación precisa de objetos: Fotografía de productos con múltiples productos en posiciones y ángulos específicos. Las máscaras te permiten definir límites exactos del producto sin importar la forma u orientación.

Uso del modelo Flux: Flux no soporta la extensión tradicional de Regional Prompter. Las técnicas basadas en máscaras son la única forma de hacer prompting regional con Flux.

Composiciones orgánicas: Paisajes con líneas de horizonte irregulares, arquitectura con formas complejas, cualquier composición donde las cuadrículas rectangulares no se alinean con los límites del contenido.

Composición multicapa: Escenas complejas que requieren 5+ regiones con prioridades superpuestas. Los enfoques basados en máscaras manejan esto más elegantemente que intentar forzarlo en divisiones de cuadrícula.

Probé esto con una composición compleja de personaje: persona con capa fluida parada frente a un fondo arquitectónico. El enfoque basado en cuadrícula produjo límites rectangulares de la capa que se veían artificiales. El enfoque basado en máscaras con máscara de capa pintada a mano produjo un flujo natural de capa que se integró perfectamente con el personaje y el fondo.

El compromiso es el tiempo de configuración. El prompting regional basado en cuadrícula toma 30 segundos configurar (solo especifica dimensiones de cuadrícula y prompts). Los enfoques basados en máscaras requieren 5-15 minutos para crear máscaras de calidad, pero esa inversión se recupera en precisión compositiva.

Entendiendo el Condicionamiento Basado en Máscaras en ComfyUI

Antes de sumergirse en los flujos de trabajo, es esencial entender cómo ComfyUI procesa las máscaras para el condicionamiento.

Valores de Máscara y Mezcla de Prompts:

Las máscaras son imágenes en escala de grises donde los valores de píxel (0-255 o normalizados 0.0-1.0) determinan la influencia del prompt:

  • Valor 0 (negro): 0% de influencia del prompt (usa completamente el prompt alternativo o condicionamiento base)
  • Valor 128 (gris al 50%): 50% de mezcla de prompt (mezcla igualmente los prompts primario y alternativo)
  • Valor 255 (blanco): 100% de influencia del prompt (usa completamente el prompt primario)

Esta mezcla gradual te permite crear transiciones suaves entre regiones en lugar de bordes duros. Una máscara con bordes difuminados (negro → gradiente gris → blanco) produce transiciones de prompt suaves sin costuras visibles.

Aplicación de Condicionamiento:

El sistema de condicionamiento de ComfyUI aplica máscaras a los prompts usando estos nodos:

ConditioningSetMask: Aplica una máscara al condicionamiento existente

  • conditioning: El condicionamiento del prompt a enmascarar
  • mask: La máscara que define dónde se aplica este condicionamiento
  • strength: Multiplicador de fuerza general (0.0-2.0, predeterminado 1.0)
  • set_cond_area: Si se debe restringir la generación solo al área enmascarada

ConditioningCombine: Combina múltiples condicionamientos enmascarados

  • conditioning_1: Primer condicionamiento enmascarado
  • conditioning_2: Segundo condicionamiento enmascarado
  • method: Cómo combinar (add, average, o multiply)

El patrón del flujo de trabajo es:

  1. Crear condicionamiento del prompt (CLIP Text Encode)
  2. Aplicar máscara al condicionamiento (ConditioningSetMask)
  3. Repetir para cada par región/prompt
  4. Combinar todos los condicionamientos enmascarados (ConditioningCombine)
  5. Usar condicionamiento combinado en KSampler

Consideraciones de Resolución de Máscara:

Las máscaras deben coincidir con tu resolución de generación para resultados óptimos:

Resolución de Generación Resolución de Máscara Notas
512x512 512x512 Coincidencia perfecta
1024x1024 1024x1024 Coincidencia perfecta
1024x1024 512x512 Funciona pero menos preciso
512x512 1024x1024 Innecesario, se reducirá

Las máscaras con resolución más baja que la generación funcionan pero reducen la precisión. Las máscaras con resolución más alta que la generación no proporcionan ningún beneficio y desperdician tiempo de procesamiento.

Enmascaramiento en Espacio Latente:

ComfyUI procesa la generación en espacio latente (reducido 8x desde el espacio de píxeles). Una imagen de 512x512 es 64x64 en espacio latente. Las máscaras se reducen automáticamente para coincidir con la resolución latente durante la generación.

Esto significa que los detalles finos en las máscaras (características de 1-2 píxeles) pueden no preservarse con precisión después de la reducción latente. Diseña máscaras con características de al menos 8-16 píxeles de ancho para una preservación confiable a través del procesamiento latente.

Efectos de Reducción de Máscara

Las máscaras intrincadas con líneas delgadas o detalles pequeños pueden perder precisión durante la reducción latente. Prueba tus máscaras a la resolución objetivo para verificar que los detalles sobreviven el proceso de generación. Simplifica las máscaras si los detalles desaparecen.

Difuminado de Máscara para Transiciones Suaves:

Las máscaras de borde duro (negro puro a blanco puro, sin transición gris) crean costuras visibles donde las regiones se encuentran. Las máscaras difuminadas con gradientes grises de 10-30 píxeles en los bordes mezclan las regiones suavemente.

En software de edición de imágenes:

  1. Crear primero la máscara de borde duro (solo blanco y negro)
  2. Aplicar Desenfoque Gaussiano con radio de 10-30 píxeles a los bordes
  3. Resultado: Zonas de transición suaves entre regiones

O usa el nodo Mask Blur de ComfyUI para difuminar máscaras proceduralmente:

  • mask: Máscara de entrada
  • blur_radius: Ancho del difuminado en píxeles (10-30 típico)

Flujo de Trabajo Básico de Prompting Regional Basado en Máscaras

El flujo de trabajo fundamental basado en máscaras usa máscaras separadas para cada región, aplicando diferentes prompts a través de condicionamiento enmascarado. Aquí está la configuración completa para una composición de dos regiones.

Nodos requeridos:

  1. Load Checkpoint - Tu modelo base
  2. Load Image - Cargar imagen(es) de máscara
  3. CLIP Text Encode - Prompts para cada región
  4. ConditioningSetMask - Aplicar máscaras al condicionamiento
  5. ConditioningCombine - Combinar condicionamientos enmascarados
  6. KSampler - Generación
  7. VAE Decode y Save Image - Salida

Estructura de flujo de trabajo para dos regiones (división izquierda/derecha):

  1. Load Checkpoint → model, clip, vae
  2. Load Image (left_mask.png) → left_mask
  3. Load Image (right_mask.png) → right_mask
  4. CLIP Text Encode (left prompt) → left_conditioning
  5. ConditioningSetMask (left_conditioning + left_mask) → masked_left_conditioning
  6. CLIP Text Encode (right prompt) → right_conditioning
  7. ConditioningSetMask (right_conditioning + right_mask) → masked_right_conditioning
  8. ConditioningCombine (masked_left + masked_right) → combined_conditioning
  9. KSampler (model + combined_conditioning) → latent
  10. VAE Decode → Save Image

Creando las máscaras:

Para una composición simple izquierda/derecha a 1024x1024:

Máscara izquierda (left_mask.png):

  • Mitad izquierda: Blanco (255)
  • Mitad derecha: Negro (0)
  • Transición central: Gradiente gris de 20 píxeles para mezcla suave

Máscara derecha (right_mask.png):

  • Mitad izquierda: Negro (0)
  • Mitad derecha: Blanco (255)
  • Transición central: Gradiente gris de 20 píxeles

Crea estas en cualquier software de edición de imágenes (Photoshop, GIMP, Krita, Procreate). Guarda como PNG o JPG. Las máscaras deben ser en escala de grises pura (sin color).

Configurando nodos ConditioningSetMask:

Para región izquierda:

  • conditioning: Conectar desde CLIP Text Encode (prompt izquierdo)
  • mask: Conectar desde Load Image (left_mask.png)
  • strength: 1.0 (fuerza completa del prompt)
  • set_cond_area: "default" (se aplica a toda el área de generación)

Para región derecha:

  • conditioning: Conectar desde CLIP Text Encode (prompt derecho)
  • mask: Conectar desde Load Image (right_mask.png)
  • strength: 1.0
  • set_cond_area: "default"

Combinando condicionamientos:

Nodo ConditioningCombine:

  • conditioning_1: masked_left_conditioning
  • conditioning_2: masked_right_conditioning
  • method: "concat" o "add" (ambos funcionan, "concat" es estándar)

Ejemplo de prompts para composición de personajes izquierda/derecha:

Prompt izquierdo: "Professional woman with brown hair in red business dress, confident expression, standing pose, natural lighting"

Prompt derecho: "Professional man with short dark hair in blue business suit, neutral expression, standing pose, natural lighting"

Prompt negativo (se aplica globalmente, no enmascarado): "blurry, distorted, low quality, bad anatomy, deformed"

Genera y examina los resultados. El lado izquierdo debe mostrar la mujer en vestido rojo, el lado derecho debe mostrar el hombre en traje azul, con transición suave en el centro donde las máscaras se difuminan juntas.

Solución de problemas del flujo de trabajo básico:

Si las regiones no muestran el contenido esperado:

  1. Verificar que las máscaras sean correctas (máscara izquierda blanca a la izquierda, máscara derecha blanca a la derecha)
  2. Verificar conexiones de máscara a los nodos ConditioningSetMask correctos
  3. Aumentar pasos de KSampler a 25-30 para definición regional más clara
  4. Verificar que ConditioningCombine esté configurado en "concat" o "add"

Si ves costuras visibles:

  1. Aumentar difuminado de máscara (difuminar máscaras más)
  2. Asegurar que las zonas de difuminado de máscara se superpongan en el medio
  3. Verificar que las máscaras sumen aproximadamente 1.0 en áreas de superposición

Para prompting regional rápido basado en máscaras sin crear máscaras manualmente, Apatero.com proporciona herramientas integradas de pintura de máscaras donde puedes dibujar regiones directamente en la interfaz y asignar prompts, eliminando los requisitos de software de edición de imágenes externo.

Técnicas y Herramientas de Creación de Máscaras

Las máscaras de calidad son la base del prompting regional basado en máscaras exitoso. Aquí hay enfoques sistemáticos de creación de máscaras de simple a complejo.

Técnica 1: Máscaras Geométricas Simples (5 minutos)

Para regiones geométricas básicas (izquierda/derecha, arriba/abajo, cuadrantes), crea máscaras rápidamente en cualquier editor de imágenes.

Herramientas: GIMP, Photoshop, Krita, Procreate, incluso Paint.NET

Proceso:

  1. Crear nueva imagen a la resolución objetivo (1024x1024)
  2. Rellenar con color base (usualmente negro para regiones de fondo)
  3. Usar herramientas de selección para seleccionar región (selección rectangular, selección de elipse, etc.)
  4. Rellenar selección con blanco (255) para región de prompt primario
  5. Aplicar Desenfoque Gaussiano (radio 15-25) para suavizar bordes
  6. Guardar como PNG

Tiempo: 3-5 minutos por máscara

Mejor para: Composiciones simples con divisiones de región geométricas

Técnica 2: Máscaras Pintadas a Mano (10-20 minutos)

Para formas orgánicas (personajes, elementos fluidos, límites irregulares), pinta máscaras a mano con precisión.

Herramientas: Photoshop, Krita, Procreate (con stylus), GIMP

Flujos de ComfyUI Gratuitos

Encuentra flujos de ComfyUI gratuitos y de código abierto para las técnicas de este artículo. El código abierto es poderoso.

100% Gratis Licencia MIT Listo para Producción Dar Estrella y Probar

Proceso:

  1. Cargar imagen de referencia o boceto de composición
  2. Crear nueva capa para máscara
  3. Usar herramienta de pincel (pincel de borde duro para pintura inicial)
  4. Pintar blanco (255) donde el prompt debe aplicarse
  5. Dejar negro (0) donde el prompt NO debe aplicarse
  6. Usar pincel suave o filtro de desenfoque en bordes para difuminar
  7. Refinar con herramienta de borrador para ajustar límites
  8. Guardar capa de máscara como PNG en escala de grises

Tiempo: 10-20 minutos por máscara compleja

Mejor para: Contornos de personajes, formas orgánicas, elementos compositivos irregulares

Para detalles del flujo de trabajo de pintura de máscaras, consulta mi guía del Editor de Máscaras de ComfyUI que cubre técnicas que se aplican directamente a la creación de máscaras de prompting regional.

Técnica 3: Máscaras Basadas en Selección (15-30 minutos)

Para definir con precisión regiones complejas basadas en contenido de imagen existente, usa herramientas de selección y luego convierte a máscaras.

Herramientas: Photoshop (mejor), GIMP (bueno), Krita

Proceso:

  1. Cargar imagen de referencia o boceto de composición
  2. Usar varita mágica, lazo, o herramienta de pluma para seleccionar región deseada
  3. Refinar bordes de selección (Select > Modify > Feather en Photoshop)
  4. Crear nueva capa y rellenar selección con blanco
  5. Deseleccionar y verificar calidad de máscara
  6. Aplicar desenfoque adicional si se necesita para transiciones más suaves
  7. Guardar como PNG en escala de grises

Tiempo: 15-30 minutos dependiendo de la complejidad de selección

Mejor para: Definir regiones basadas en contenido de imagen existente, fotografía de productos, recortes de personajes

Técnica 4: Generación de Máscaras Asistida por IA (2-5 minutos)

Usa herramientas de segmentación de IA para generar automáticamente máscaras desde imágenes de referencia.

Herramientas: Segment Anything Model (SAM), Clipdrop, Photoshop Generative Fill

Proceso con SAM en ComfyUI:

  1. Instalar nodos personalizados de SAM (ComfyUI-Segment-Anything)
  2. Cargar imagen de referencia
  3. Usar nodos SAM para detectar y segmentar sujetos
  4. Convertir segmentos a máscaras
  5. Refinar máscaras si es necesario con retoque manual
  6. Usar máscaras para prompting regional

Tiempo: 2-5 minutos incluyendo refinamiento manual mínimo

Mejor para: Generación rápida de máscaras, sujetos complejos donde el enmascaramiento manual consume mucho tiempo

Técnica 5: Generación Procedural de Máscaras en ComfyUI

Genera máscaras programáticamente dentro de ComfyUI usando nodos de generación de máscaras.

Nodos disponibles:

  • Mask from Color Range: Crea máscara desde rango de color en imagen
  • Depth to Mask: Convierte mapas de profundidad a máscaras (útil para división de región basada en profundidad)
  • Solid Color Mask: Crea máscaras de color sólido simples
  • Gradient Mask: Crea máscaras de gradiente para transiciones suaves

Ejemplo de flujo de trabajo para máscara basada en profundidad:

  1. Load Reference Image
  2. Depth Estimator (MiDaS o Zoe)
  3. Threshold Depth (foreground threshold)
  4. Mask Blur (feather edges)
  5. Use as region mask for foreground prompt

Esto crea automáticamente una máscara de primer plano/fondo basada en profundidad sin pintura manual. Para más sobre generación de mapas de profundidad y control de composición basado en profundidad, consulta nuestra guía de Depth ControlNet.

Tiempo: 3-5 minutos para configurar, luego automático para imágenes subsiguientes

Mejor para: Procesamiento por lotes, generación consistente de máscaras a través de múltiples imágenes, composiciones basadas en profundidad

Lista de Verificación de Calidad de Máscaras:

Antes de usar máscaras para prompting regional, verificar:

  1. Resolución correcta: Coincide con resolución de generación o es 2x (se reducirá limpiamente)
  2. Escala de grises pura: Sin canales de color, solo valores de luminancia
  3. Gradientes suaves: Sin transiciones ásperas a menos que se deseen bordes duros intencionales
  4. Cobertura apropiada: Las máscaras cubren regiones previstas completamente, sin espacios o islas
  5. Difuminado apropiado: Zonas de difuminado de 15-30 píxeles para mezcla suave
  6. Regiones distintas: Máscaras superpuestas balanceadas (suman ~1.0 en áreas de superposición)

Las máscaras de mala calidad (bordes duros, espacios, resolución incorrecta, datos de color) producen artefactos, costuras visibles, o regiones que no responden a los prompts correctamente.

Composición Avanzada de Máscaras Multi-Región

Los flujos de trabajo simples de dos regiones son directos, pero las composiciones complejas con 4-8 regiones requieren gestión sistemática de máscaras y combinación condicional.

Arquitectura de Flujo de Trabajo para 4+ Regiones:

Para composiciones con múltiples regiones, el patrón del flujo de trabajo escala:

¿Quieres evitar la complejidad? Apatero te ofrece resultados profesionales de IA al instante sin configuración técnica.

Sin configuración Misma calidad Empieza en 30 segundos Probar Apatero Gratis
No se requiere tarjeta de crédito
  1. Load Checkpoint → model, clip
  2. Para cada región:
    • Load Mask (region_N_mask.png) → mask_N
    • CLIP Text Encode (region_N_prompt) → conditioning_N
    • ConditioningSetMask (conditioning_N + mask_N) → masked_cond_N
  3. Combinar todas:
    • ConditioningCombine (masked_cond_1 + masked_cond_2) → partial_combined_1
    • ConditioningCombine (partial_combined_1 + masked_cond_3) → partial_combined_2
    • ConditioningCombine (partial_combined_2 + masked_cond_4) → final_combined
  4. KSampler (model + final_combined) → Output

ConditioningCombine solo acepta dos entradas, así que para N regiones, necesitas N-1 nodos de combinación encadenados juntos.

Jerarquía y Prioridad de Máscaras:

Cuando las máscaras se superponen, la prioridad determina qué prompt domina. Implementa prioridad a través de valores de máscara:

Región de alta prioridad (sujeto): Valores de máscara 255 (blanco puro), fuerza completa del prompt Región de prioridad media (elementos de apoyo): Valores de máscara 180-200 (gris claro), 0.7-0.8 fuerza del prompt Región de baja prioridad (fondo): Valores de máscara 120-150 (gris medio), 0.5-0.6 fuerza del prompt

En áreas de superposición, las regiones de mayor prioridad con valores de máscara más altos dominan.

Ejemplo: Escena de Grupo de Cuatro Personajes

Composición: Cuatro personas en arreglo 2×2 con fondo compartido. Para flujos de trabajo precisos de consistencia facial de personajes, consulta nuestra guía profesional de intercambio de rostros que complementa el prompting regional basado en máscaras.

Máscaras necesarias:

  1. character_1_mask.png: Contorno de personaje superior izquierdo (personaje blanco, negro en otros lugares)
  2. character_2_mask.png: Contorno de personaje superior derecho (personaje blanco, negro en otros lugares)
  3. character_3_mask.png: Contorno de personaje inferior izquierdo (personaje blanco, negro en otros lugares)
  4. character_4_mask.png: Contorno de personaje inferior derecho (personaje blanco, negro en otros lugares)
  5. background_mask.png: Imagen completa con áreas de personajes negras (inverso de máscaras de personajes combinadas)

Prompts:

  • Personaje 1: "Woman with blonde hair in red dress, smiling, professional portrait"
  • Personaje 2: "Man with dark hair in blue suit, neutral expression, professional portrait"
  • Personaje 3: "Young woman with curly hair in green top, friendly expression, casual portrait"
  • Personaje 4: "Older man with gray hair in brown jacket, serious expression, distinguished portrait"
  • Fondo: "Modern office interior, soft lighting, professional environment, blurred background"

Flujo de trabajo:

  1. Aplicar máscara+prompt de fondo con fuerza 0.7 (prioridad más baja)
  2. Aplicar cada máscara+prompt de personaje con fuerza 1.0 (prioridad más alta)
  3. Combinar los cinco condicionamientos enmascarados
  4. Generar

Los personajes aparecen con apariencias distintas, y el fondo llena áreas no cubiertas por personajes, con mezcla suave en los bordes.

Gestión de Superposición de Máscaras

Cuando las máscaras se superponen, el modelo mezcla prompts proporcionalmente. Si character_1_mask y character_2_mask se superponen en los bordes (ambas tienen valor 200 en área de superposición), esa área recibe mezcla 50/50 de ambos prompts de personaje. Usa difuminado cuidadosamente para controlar zonas de mezcla.

Estrategia de Máscaras en Capas para Profundidad:

Para composiciones con capas de profundidad distintas (primer plano/plano medio/fondo), crea máscaras en capas con opacidad decreciente:

Capa Valor de Máscara Fuerza de Prompt Propósito
Primer plano (más cercano) 255 (blanco) 1.2 Máximo detalle y adherencia al prompt
Plano medio 200 (gris claro) 1.0 Nivel de detalle estándar
Fondo (más lejano) 140 (gris medio) 0.7 Atmosférico, menos detalle

Este prompting basado en profundidad crea naturalmente percepción de profundidad donde el primer plano es nítido y detallado mientras que el fondo es más suave.

Técnicas de Mezcla Perfecta:

Para resultados profesionales sin costuras visibles entre regiones:

Zonas de difuminado superpuestas: Asegurar que todas las máscaras tengan zonas de difuminado de 25-40 píxeles donde se encuentran Suma de máscara balanceada: En áreas de superposición, los valores de máscara deben sumar aproximadamente 255 (si mask_A = 180 y mask_B = 75 en superposición, suma = 255) Prompting consistente: Usar descriptores similares de iluminación/estilo en todos los prompts regionales para que las regiones coincidan estilísticamente Condicionamiento base global: Agregar condicionamiento global débil (fuerza 0.3) con descripción general de la escena como fundamento

Combinación Procedural de Máscaras:

Para trabajo multi-región sistemático, crea máscaras proceduralmente para asegurar cobertura apropiada:

Pseudocódigo para generación de máscaras:

  1. Crear canvas = black_image(1024, 1024)
  2. Definir regiones con áreas y prompts (top_left, top_right, bottom_left, bottom_right)
  3. Para cada región:
    • Crear máscara con región blanca para el área especificada
    • Aplicar difuminado de 30 píxeles a los bordes
    • Guardar máscara como PNG con nombre de prompt

Esto asegura que las máscaras se mosaiquen perfectamente con difuminado apropiado, eliminando espacios o superposiciones excesivas.

Prompting Regional Basado en Máscaras para Modelos Flux

Los modelos Flux no soportan extensiones tradicionales de Regional Prompter, haciendo que los enfoques basados en máscaras sean la única forma de lograr control regional de prompts con Flux.

Implementación Específica para Flux:

Flux usa una arquitectura de condicionamiento diferente a Stable Diffusion, requiriendo flujos de trabajo adaptados.

Estructura de flujo de trabajo para Flux con máscaras regionales:

  1. Load Flux Checkpoint → model
  2. Load Flux CLIP (dual text encoder) → clip
  3. Load Mask (region_1) → mask_1
  4. Load Mask (region_2) → mask_2
  5. Flux Text Encode (region_1_prompt, clip) → flux_cond_1
  6. ConditioningSetMask (flux_cond_1, mask_1) → masked_flux_cond_1
  7. Flux Text Encode (region_2_prompt, clip) → flux_cond_2
  8. ConditioningSetMask (flux_cond_2, mask_2) → masked_flux_cond_2
  9. ConditioningCombine (masked_flux_cond_1, masked_flux_cond_2) → combined_flux_cond
  10. Flux Sampler (model, combined_flux_cond) → latent
  11. VAE Decode → Save Image

Codificación de Texto CLIP de Flux:

Flux usa codificadores de texto duales (CLIP-L y T5). Para prompting regional:

Únete a otros 115 miembros del curso

Crea Tu Primer Influencer IA Ultra-Realista en 51 Lecciones

Crea influencers IA ultra-realistas con detalles de piel realistas, selfies profesionales y escenas complejas. Obtén dos cursos completos en un paquete. Fundamentos de ComfyUI para dominar la tecnología, y Academia de Creadores Fanvue para aprender a promocionarte como creador de IA.

El precio promocional termina en:
--
Días
:
--
Horas
:
--
Minutos
:
--
Segundos
51 Lecciones • 2 Cursos
Pago Único
Actualizaciones de por Vida
Ahorra $200 - El Precio Aumenta a $399 Para Siempre
Descuento anticipado para nuestros primeros estudiantes. Constantemente agregamos más valor, pero tú aseguras $199 para siempre.
Para principiantes
Listo para producción
Siempre actualizado
  • clip_l_prompt: Codificación CLIP primaria (usar prompt principal)
  • t5_prompt: Codificación T5 (puede ser igual a clip_l o ligera variación)

Para trabajo regional, mantén ambos prompts clip_l y t5 idénticos dentro de cada región para consistencia.

Consideraciones de Máscaras Específicas para Flux:

Fuerza de máscara: Flux responde más fuertemente a las máscaras que los modelos SD. Usa valores de máscara 180-200 (no completo 255) para regiones primarias para evitar restricción excesiva.

Ancho de difuminado: Flux se beneficia de zonas de difuminado más anchas (40-60 píxeles) en comparación con SD (20-30 píxeles) para mezcla perfecta.

Escala CFG: Flux típicamente usa CFG más bajo (3-5). Con enmascaramiento regional, aumenta ligeramente a 5-7 para definición regional más clara.

Pasos: Flux necesita menos pasos (15-25). El enmascaramiento regional no requiere aumentos de pasos como SD (SD se beneficia de 30-35 pasos con máscaras regionales).

Ejemplo de Flujo de Trabajo Regional de Flux:

Objetivo: Generar paisaje con sujeto detallado en primer plano y fondo de estilo pintado usando Flux.

Máscaras:

  • foreground_mask.png: Contorno del sujeto en centro (sujeto blanco, negro en otros lugares, difuminado de 50 píxeles)
  • background_mask.png: Imagen completa menos sujeto (inverso de máscara de primer plano)

Prompts:

  • Primer plano (Flux Text Encode): "Professional portrait of woman in red dress, photorealistic, detailed facial features, sharp focus, high quality"
  • Fondo (Flux Text Encode): "Abstract watercolor painted background, artistic style, soft colors, dreamy atmosphere"
  • Negativo: "blurry, distorted, low quality"

Configuraciones de Flux Sampler:

  • steps: 20
  • cfg: 6.5
  • sampler: euler (Flux funciona bien con euler)
  • scheduler: simple

Genera y examina. El primer plano debe ser fotorealista mientras que el fondo es pictórico, creando contraste de estilo intencional.

Limitaciones de Prompting Regional de Flux

La arquitectura de Flux hace que el prompting regional sea menos preciso que los modelos SD. Espera 10-15% más de sangrado de región con Flux. Compensa con máscaras más fuertes (valores más altos), difuminados más anchos, y prompts más distintos entre regiones.

Comparación de Prompting Regional Flux vs SD:

Aspecto Stable Diffusion Flux
Precisión regional 9.1/10 7.8/10
Difuminado de máscara requerido 20-30px 40-60px
Complejidad de configuración Moderada Moderada
Requisitos CFG 7-9 5-7
Pasos requeridos 25-35 15-25
Calidad general Excelente Muy buena

Para trabajo de producción con Flux que requiere máximo control regional, recomiendo usar Apatero.com que tiene prompting regional optimizado para Flux con parámetros pre-ajustados para mejor aislamiento de región que los flujos de trabajo estándar.

Mejores Prácticas de Prompting Regional de Flux:

  1. Aumentar contraste de máscara: Usa valores 0 y 220-240 (no 255) para mejor control
  2. Simplificar conteo de regiones: Limita a 3-4 regiones máximo con Flux (5+ se vuelve impredecible)
  3. Prompts distintos: Haz prompts regionales muy diferentes (fotorealista vs pintado, no cambios de estilo sutiles)
  4. CFG más alto: Usa CFG 6-7 en lugar del típico 3-5 de Flux
  5. Probar máscaras: Genera imágenes de prueba con solo visualización de máscara antes de agregar prompts

Para control mejorado de Flux a través de entrenamiento personalizado, explora nuestra colección de Ultra Real Flux LoRAs que puede combinarse con prompting regional basado en máscaras para máxima precisión.

Flujos de Trabajo de Producción y Automatización

El prompting regional basado en máscaras se vuelve práctico para producción cuando sistematizas la creación de máscaras y ejecución de flujos de trabajo.

Sistema de Plantillas de Flujo de Trabajo:

Crea plantillas reutilizables para composiciones comunes:

Plantilla 1: Dos Personajes Lado a Lado

  • Máscaras: left_character.png, right_character.png, shared_background.png
  • Prompts: Descripción personaje A, Descripción personaje B, Descripción de entorno
  • Parámetros: 1024x1024, 30 pasos, CFG 8, difuminado de 30px

Plantilla 2: Toma Heroica con Fondo

  • Máscaras: hero_subject.png, background.png
  • Prompts: Descripción detallada del sujeto, Entorno de fondo
  • Parámetros: 1024x1536 retrato, 35 pasos, CFG 7.5, difuminado de 40px

Plantilla 3: Catálogo de Productos (4 productos)

  • Máscaras: product_1.png hasta product_4.png, background.png
  • Prompts: Descripciones individuales de productos, Fondo blanco/gris
  • Parámetros: 2048x2048, 40 pasos, CFG 9, difuminado de 25px

Guarda estas como archivos JSON de flujo de trabajo de ComfyUI. Para nuevos proyectos, carga plantilla y solo actualiza prompts + máscaras, manteniendo todas las conexiones de nodos y parámetros.

Script de Generación de Máscaras por Lotes:

Para proyectos que requieren múltiples máscaras similares (catálogos de productos, hojas de personajes), programa la generación de máscaras:

Ejemplo: Generar máscaras de 4 cuadrantes con difuminado

  1. Importar PIL Image e ImageFilter
  2. Definir función create_quadrant_masks(resolution=1024, feather=30)
  3. Definir posiciones de cuadrantes (top_left, top_right, bottom_left, bottom_right)
  4. Para cada posición:
    • Crear nueva máscara en escala de grises (nivel 0 negro)
    • Rellenar el cuadrante correspondiente con blanco (255)
    • Aplicar desenfoque Gaussiano con el radio de difuminado especificado
    • Guardar máscara como PNG con nombre de posición
  5. Ejecutar create_quadrant_masks(1024, 30) para generar todas las máscaras

Ejecuta una vez para generar todas las máscaras para diseños de cuadrícula 2×2, luego reutiliza para todos los proyectos que necesiten composiciones de cuadrante.

Ejecución Automatizada de Flujo de Trabajo:

Para producción de alto volumen, automatiza con la API de ComfyUI:

Pasos de automatización:

  1. Importar requests y json
  2. Definir función generate_with_regional_masks(prompts, mask_paths, workflow_template)
  3. Cargar plantilla de flujo de trabajo JSON
  4. Actualizar prompts en el flujo de trabajo para cada región
  5. Actualizar rutas de archivos de máscara en el flujo de trabajo
  6. Enviar flujo de trabajo a la API de ComfyUI (http://localhost:8188/prompt)
  7. Retornar respuesta JSON
  8. Ejecutar en bucle para generar múltiples variaciones por lotes

Esto genera 10 variaciones de personaje con control regional idéntico basado en máscaras pero prompts variables.

Lista de Verificación de Aseguramiento de Calidad:

Antes de entregar trabajo regional basado en máscaras:

  1. Sin costuras visibles: Verificar todos los límites de región para artefactos o bordes duros
  2. Precisión de prompt: Cada región muestra contenido coincidente con su prompt específico
  3. Sin sangrado de región: El personaje A no tiene atributos del personaje B
  4. Iluminación consistente: La dirección/calidad de iluminación coincide a través de las regiones (a menos que se varíe intencionalmente)
  5. Cobertura de máscara completa: Sin espacios o islas donde los prompts no se aplican
  6. Resolución apropiada: La salida cumple con las especificaciones del cliente (impresión vs web)

Flujo de Trabajo de Revisión:

Cuando los clientes solicitan cambios a regiones específicas:

  1. Identificar qué región necesita cambios (rostro de personaje, fondo, etc.)
  2. Modificar solo el prompt de esa región
  3. Mantener todos los demás prompts y máscaras idénticos
  4. Regenerar con la misma semilla (si se necesitan resultados deterministas)
  5. Solo la región modificada cambia, el resto permanece consistente

Esta capacidad de revisión quirúrgica es la característica distintiva del prompting regional basado en máscaras para trabajo de clientes.

Solución de Problemas de Prompting Regional Basado en Máscaras

Los flujos de trabajo basados en máscaras fallan en patrones específicos y reconocibles. Conocer problemas y soluciones previene tiempo desperdiciado.

Problema: Costuras o bordes duros visibles entre regiones

Las costuras aparecen como líneas claras donde una región se encuentra con otra.

Causas y soluciones:

  1. Difuminado insuficiente: Aumentar desenfoque de máscara a 30-50 píxeles
  2. Las máscaras no se superponen: Asegurar que las zonas de difuminado se superpongan por 10-20 píxeles
  3. Prompts conflictivos en límites: Agregar descriptores compartidos de estilo/iluminación a ambos prompts regionales
  4. Desajuste de resolución: Verificar que las máscaras coincidan con la resolución de generación
  5. CFG demasiado alto: Reducir CFG de 9-10 a 7-8 para límites más suaves

Problema: Las regiones ignoran prompts o intercambian contenido

Una región muestra contenido del prompt de otra región.

Soluciones:

  1. Verificar conexiones de máscara: Asegurar que mask_1 conecta a conditioning_1, no intercambiado
  2. Verificar polaridad de máscara: El blanco debe estar donde se aplica el prompt, no invertido
  3. Aumentar distintividad de prompt: Hacer los prompts más diferentes entre sí
  4. Fortalecer condicionamiento: Aumentar fuerza de ConditioningSetMask a 1.2-1.5
  5. Simplificar composición: Reducir número de regiones si 5+ regiones producen confusión

Problema: Una región domina la imagen completa

El contenido de una región aparece en todas partes, abrumando otras regiones.

Soluciones:

  1. Reducir valores de máscara de región dominante: Cambiar 255 a 180-200
  2. Aumentar valores de máscara de otras regiones: Impulsar regiones más débiles a 220-240
  3. Verificar suma de máscara: En áreas de superposición, asegurar que el total no exceda 255 significativamente
  4. Rebalancear fuerzas de prompt: Reducir fuerza de ConditioningSetMask para región dominante a 0.7-0.8
  5. Simplificar prompt dominante: Eliminar palabras clave fuertes que sangran a otras regiones

Problema: Las máscaras no cargan o muestran errores

ComfyUI falla al cargar máscaras o arroja errores durante el procesamiento de máscaras.

Soluciones:

  1. Verificar formato de máscara: Debe ser PNG o JPG, algunos nodos requieren formatos específicos
  2. Verificar que la máscara es escala de grises: Sin datos de color RGB, solo canal de luminancia
  3. Verificar ruta de archivo: Asegurar que la ruta del archivo de máscara es correcta y accesible
  4. Verificar resolución de máscara: Máscaras extremadamente grandes (4K+) pueden causar problemas, redimensionar para coincidir con resolución de generación
  5. Recargar flujo de trabajo: A veces el estado del nodo se corrompe, recargar archivo de flujo de trabajo

Problema: Imagen completa borrosa o de baja calidad

La calidad de salida se degrada al usar prompting regional basado en máscaras.

Causas:

  1. Demasiadas regiones: 6+ regiones pueden reducir calidad, simplificar a 4-5 máximo
  2. Máscaras sobre-difuminadas: Desenfoque excesivo (80+ píxeles) reduce nitidez general
  3. Máscaras de baja resolución: Máscaras al 50% de resolución de generación pierden precisión
  4. Prompts regionales conflictivos: Estilos contradictorios fuerzan al modelo a comprometer, reduciendo calidad
  5. Pasos muy pocos: Aumentar de 20 a 30-35 para flujos de trabajo enmascarados

Problema: El fondo sangra al primer plano o viceversa

Los elementos de fondo aparecen en regiones de primer plano o el sujeto de primer plano se extiende al fondo.

Soluciones:

  1. Fortalecer máscara de primer plano: Aumentar valores de máscara de primer plano a 240-255
  2. Debilitar fuerza de máscara de fondo: Reducir fuerza de ConditioningSetMask para fondo a 0.6-0.7
  3. Aumentar ancho de difuminado: Paradójicamente, difuminados más anchos a veces reducen el sangrado creando transiciones más suaves
  4. Usar enmascaramiento prioritario: Aplicar condicionamiento de primer plano después del fondo en cadena de ConditioningCombine
  5. Simplificar prompts: Eliminar palabras clave ambiguas que podrían aplicarse a múltiples regiones

Problema: El prompting regional específico de Flux produce resultados pobres

El flujo de trabajo funciona con SD pero falla con Flux.

Soluciones específicas para Flux:

  1. Reducir contraste de máscara: Usar 0 y 220 en lugar de 0 y 255
  2. Aumentar difuminado: Duplicar ancho de difuminado (30px → 60px)
  3. CFG más bajo: Flux con máscaras funciona mejor con CFG 5-7, no más alto
  4. Menos regiones: Limitar a 3 regiones máximo con Flux
  5. Prompts más simples: El prompting regional de Flux lucha con prompts complejos, simplificar descripciones

Reflexiones Finales

El prompting regional basado en máscaras representa el extremo de precisión del control compositivo en la generación de IA, donde la precisión a nivel de píxel importa más que la velocidad de configuración. La inversión en creación de máscaras (5-20 minutos por composición) se recupera en control quirúrgico sobre exactamente qué aparece dónde.

La ventaja crítica sobre los enfoques basados en cuadrícula es la flexibilidad de forma. Cuando tu composición no encaja en cuadrículas rectangulares (y la mayoría de las composiciones interesantes no lo hacen), los enfoques basados en máscaras proporcionan el único camino a resultados limpios. El beneficio agregado de compatibilidad con Flux hace que este enfoque sea a prueba de futuro a medida que surjan nuevos modelos que pueden no soportar extensiones tradicionales de prompts regionales.

Para trabajo de producción que requiere composiciones consistentes y complejas (catálogos de productos, contenido centrado en personajes, ilustraciones de estilo mixto, visualizaciones arquitectónicas con colocación precisa de elementos), el prompting regional basado en máscaras pasa de "técnica avanzada" a "capacidad esencial." Los flujos de trabajo se vuelven rutinarios después de 3-5 proyectos a medida que la creación de máscaras y configuración de flujos de trabajo se vuelven segunda naturaleza.

Comienza con composiciones simples de dos regiones (primer plano/fondo, divisiones de personajes izquierda/derecha) para internalizar cómo las máscaras afectan la aplicación del prompt. Progresa a composiciones de 3-4 regiones a medida que crece la comodidad. Reserva las composiciones de 5+ regiones para cuando sea absolutamente necesario, ya que la complejidad aumenta exponencialmente más allá de 4-5 regiones.

Las técnicas en esta guía cubren todo desde la creación básica de máscaras hasta la composición avanzada de múltiples regiones e implementaciones específicas para Flux. Ya sea que crees máscaras en software externo y las importes o uses los nodos de generación de máscaras de ComfyUI, el principio central permanece igual: las máscaras definen dónde se aplican los prompts con precisión a nivel de píxel.

Ya sea que construyas flujos de trabajo basados en máscaras localmente o uses Apatero.com (que proporciona pintura integrada de máscaras y prompting regional en una sola interfaz sin software externo), dominar el prompting regional basado en máscaras eleva tu control compositivo de "aproximado" a "exacto." Esa precisión es cada vez más esencial a medida que las aplicaciones de generación de IA pasan de la exploración creativa a la producción comercial donde la composición debe coincidir con las especificaciones exactamente.

¿Listo para Crear Tu Influencer IA?

Únete a 115 estudiantes dominando ComfyUI y marketing de influencers IA en nuestro curso completo de 51 lecciones.

El precio promocional termina en:
--
Días
:
--
Horas
:
--
Minutos
:
--
Segundos
Reclama Tu Lugar - $199
Ahorra $200 - El Precio Aumenta a $399 Para Siempre