/ ComfyUI / Prompting Regional Baseado em Máscaras no ComfyUI: Guia Completo de Controle de Precisão 2025
ComfyUI 31 min de leitura

Prompting Regional Baseado em Máscaras no ComfyUI: Guia Completo de Controle de Precisão 2025

Domine o prompting regional baseado em máscaras no ComfyUI para controle pixel-perfeito de múltiplas regiões. Fluxos de trabalho completos, técnicas de criação de máscaras, compatibilidade com Flux e composição avançada.

Prompting Regional Baseado em Máscaras no ComfyUI: Guia Completo de Controle de Precisão 2025 - Complete ComfyUI guide and tutorial

Eu mudei do Regional Prompter baseado em grid para prompting regional baseado em máscaras depois de esbarrar nas limitações dele em um projeto de cliente que exigia cinco regiões com formas irregulares. Abordagens baseadas em grid te forçam a fazer divisões retangulares, mas técnicas baseadas em máscaras permitem que você defina qualquer forma de região com precisão em nível de pixel. Melhor ainda, abordagens baseadas em máscaras funcionam com Flux e outros modelos que não suportam extensões tradicionais do Regional Prompter.

Neste guia, você terá fluxos de trabalho completos de prompting regional baseado em máscaras para ComfyUI, incluindo técnicas de criação e preparação de máscaras, composição de múltiplas máscaras para cenas complexas, implementações específicas para Flux, geração automatizada de máscaras com Segment Anything, e fluxos de trabalho de produção para projetos que exigem precisão cirúrgica no controle regional.

Por Que Prompting Regional Baseado em Máscaras Supera Abordagens de Grid

O Regional Prompter baseado em grid (coberto no meu guia de Regional Prompter) divide imagens em regiões retangulares. Isso funciona muito bem para composições simples, mas falha quando seus elementos composicionais não se alinham com grids retangulares.

O prompting regional baseado em máscaras usa máscaras em tons de cinza ou binárias para definir regiões de qualquer forma. Áreas pretas (0) recebem um prompt, áreas brancas (255) recebem outro prompt, e áreas cinzas mesclam entre os prompts proporcionalmente. Isso fornece controle em nível de pixel sobre a aplicação do prompt.

Comparação entre Regional Prompting Baseado em Grid vs Máscaras

  • Flexibilidade de forma: Grid permite apenas regiões retangulares, enquanto Máscaras suportam qualquer forma
  • Precisão: Grid fornece controle em nível de região, Máscaras entregam precisão em nível de pixel
  • Complexidade de configuração: Grid é simples de configurar, Máscaras varia de moderado a complexo
  • Compatibilidade de modelo: Grid funciona apenas com SD1.5 e SDXL, Máscaras funciona com todos os modelos incluindo Flux
  • Overhead de processamento: Grid adiciona 15-20% de overhead, Máscaras adiciona 10-15% de overhead

Cenários críticos onde abordagens baseadas em máscaras são essenciais:

Sujeitos não retangulares: Personagem com cabelo fluindo ou silhueta complexa. Regiões baseadas em grid criam limites retangulares que cortam o personagem de forma não natural. Regiões baseadas em máscaras seguem o contorno real do personagem.

Posicionamento preciso de objetos: Fotografia de produto com múltiplos produtos em posições e ângulos específicos. Máscaras permitem definir limites exatos do produto independentemente da forma ou orientação.

Uso do modelo Flux: Flux não suporta a extensão tradicional Regional Prompter. Técnicas baseadas em máscaras são a única maneira de fazer prompting regional com Flux.

Composições orgânicas: Paisagens com linhas de horizonte irregulares, arquitetura com formas complexas, qualquer composição onde grids retangulares não se alinham com limites de conteúdo.

Composição em múltiplas camadas: Cenas complexas exigindo 5+ regiões com prioridades sobrepostas. Abordagens baseadas em máscaras lidam com isso de forma mais elegante do que tentar forçar em divisões de grid.

Eu testei isso com uma composição complexa de personagem: pessoa com capa fluindo em pé na frente de um fundo arquitetônico. A abordagem baseada em grid produziu limites retangulares da capa que pareciam artificiais. A abordagem baseada em máscaras com máscara de capa pintada à mão produziu fluxo natural da capa que se integrou perfeitamente com o personagem e o fundo.

O trade-off é o tempo de configuração. O prompting regional baseado em grid leva 30 segundos para configurar (apenas especifique dimensões do grid e prompts). Abordagens baseadas em máscaras exigem 5-15 minutos para criar máscaras de qualidade, mas esse investimento compensa em precisão composicional.

Entendendo o Condicionamento Baseado em Máscaras no ComfyUI

Antes de mergulhar nos fluxos de trabalho, entender como o ComfyUI processa máscaras para condicionamento é essencial.

Valores de Máscara e Mesclagem de Prompt:

Máscaras são imagens em tons de cinza onde valores de pixel (0-255 ou normalizados 0.0-1.0) determinam a influência do prompt:

  • Valor 0 (preto): 0% de influência do prompt (usa totalmente o prompt alternativo ou condicionamento base)
  • Valor 128 (cinza 50%): 50% de mesclagem de prompt (mistura igualmente prompts primário e alternativo)
  • Valor 255 (branco): 100% de influência do prompt (usa totalmente o prompt primário)

Essa mesclagem gradual permite criar transições suaves entre regiões em vez de bordas duras. Uma máscara com bordas difusas (preto → gradiente cinza → branco) produz transições de prompt suaves sem costuras visíveis.

Aplicação de Condicionamento:

O sistema de condicionamento do ComfyUI aplica máscaras a prompts usando estes nós:

ConditioningSetMask: Aplica uma máscara ao condicionamento existente

  • conditioning: O condicionamento do prompt para mascarar
  • mask: A máscara definindo onde este condicionamento se aplica
  • strength: Multiplicador de força geral (0.0-2.0, padrão 1.0)
  • set_cond_area: Se deve restringir a geração apenas à área mascarada

ConditioningCombine: Mescla múltiplos condicionamentos mascarados

  • conditioning_1: Primeiro condicionamento mascarado
  • conditioning_2: Segundo condicionamento mascarado
  • method: Como combinar (add, average ou multiply)

O padrão do fluxo de trabalho é:

Passo 1: Criar condicionamento do prompt (CLIP Text Encode)

Passo 2: Aplicar máscara ao condicionamento (ConditioningSetMask)

Passo 3: Repetir para cada par região/prompt

Passo 4: Combinar todos os condicionamentos mascarados (ConditioningCombine)

Passo 5: Usar condicionamento combinado no KSampler

Considerações sobre Resolução da Máscara:

Máscaras devem corresponder à sua resolução de geração para resultados ideais:

Resolução de Geração Resolução da Máscara Observações
512x512 512x512 Correspondência perfeita
1024x1024 1024x1024 Correspondência perfeita
1024x1024 512x512 Funciona mas menos preciso
512x512 1024x1024 Desnecessário, será reduzido

Máscaras em resolução menor que a geração funcionam mas reduzem a precisão. Máscaras em resolução maior que a geração não fornecem benefício e desperdiçam tempo de processamento.

Mascaramento no Espaço Latente:

O ComfyUI processa a geração no espaço latente (8x reduzido do espaço de pixel). Uma imagem 512x512 é 64x64 no espaço latente. Máscaras são automaticamente reduzidas para corresponder à resolução latente durante a geração.

Isso significa que detalhes finos em máscaras (características de 1-2 pixels) podem não ser preservados precisamente após a redução latente. Projete máscaras com características de pelo menos 8-16 pixels de largura para preservação confiável através do processamento latente.

Aviso sobre Efeitos de Redução de Máscara: Máscaras intrincadas com linhas finas ou pequenos detalhes podem perder precisão durante a redução latente. Teste suas máscaras na resolução alvo para verificar se os detalhes sobrevivem ao processo de geração. Simplifique as máscaras se os detalhes desaparecerem.

Difusão de Máscara para Transições Suaves:

Máscaras de borda dura (preto puro a branco puro, sem transição cinza) criam costuras visíveis onde as regiões se encontram. Máscaras difusas com gradientes cinzas de 10-30 pixels nas bordas mesclam as regiões suavemente.

Em software de edição de imagem:

Passo 1: Crie primeiro a máscara de borda dura (apenas preto e branco)

Passo 2: Aplique Desfoque Gaussiano com raio de 10-30 pixels nas bordas

Passo 3: Resultado: Zonas de transição suaves entre regiões

Ou use o nó Mask Blur do ComfyUI para difundir máscaras proceduralmente:

  • mask: Máscara de entrada
  • blur_radius: Largura da difusão em pixels (10-30 típico)

Fluxo de Trabalho Básico de Prompting Regional Baseado em Máscaras

O fluxo de trabalho fundamental baseado em máscaras usa máscaras separadas para cada região, aplicando diferentes prompts via condicionamento mascarado. Aqui está a configuração completa para uma composição de duas regiões.

Nós necessários:

  1. Load Checkpoint - Seu modelo base
  2. Load Image - Carregar imagem(ns) de máscara
  3. CLIP Text Encode - Prompts para cada região
  4. ConditioningSetMask - Aplicar máscaras ao condicionamento
  5. ConditioningCombine - Mesclar condicionamentos mascarados
  6. KSampler - Geração
  7. VAE Decode e Save Image - Saída

Estrutura do fluxo de trabalho para duas regiões (divisão esquerda/direita):

Passo 1: Carregue seu modelo checkpoint, que fornece o modelo base, codificador CLIP e decodificador VAE

Passo 2: Carregue duas imagens de máscara: left_mask.png para a região esquerda e right_mask.png para a região direita

Passo 3: Para a região esquerda: Codifique seu prompt da região esquerda usando CLIP Text Encode

Passo 4: Aplique a máscara esquerda ao condicionamento da região esquerda usando ConditioningSetMask

Passo 5: Para a região direita: Codifique seu prompt da região direita usando CLIP Text Encode

Passo 6: Aplique a máscara direita ao condicionamento da região direita usando ConditioningSetMask

Passo 7: Combine ambos os condicionamentos mascarados usando ConditioningCombine

Passo 8: Passe o condicionamento combinado para o KSampler para geração

Passo 9: Decodifique a saída latente com VAE Decode

Passo 10: Salve a imagem final

Criando as máscaras:

Para uma composição simples esquerda/direita em 1024x1024:

Máscara esquerda (left_mask.png):

  • Metade esquerda: Branco (255)
  • Metade direita: Preto (0)
  • Transição central: gradiente cinza de 20 pixels para mesclagem suave

Máscara direita (right_mask.png):

  • Metade esquerda: Preto (0)
  • Metade direita: Branco (255)
  • Transição central: gradiente cinza de 20 pixels

Crie estas em qualquer software de edição de imagem (Photoshop, GIMP, Krita, Procreate). Salve como PNG ou JPG. As máscaras devem ser em tons de cinza puro (sem cor).

Configurando nós ConditioningSetMask:

Para região esquerda:

  • conditioning: Conectar do CLIP Text Encode (prompt esquerdo)
  • mask: Conectar do Load Image (left_mask.png)
  • strength: 1.0 (força total do prompt)
  • set_cond_area: "default" (aplica à área de geração completa)

Para região direita:

  • conditioning: Conectar do CLIP Text Encode (prompt direito)
  • mask: Conectar do Load Image (right_mask.png)
  • strength: 1.0
  • set_cond_area: "default"

Combinando condicionamentos:

ConditioningCombine:

  • conditioning_1: masked_left_conditioning
  • conditioning_2: masked_right_conditioning
  • method: "concat" ou "add" (ambos funcionam, "concat" é padrão)

Exemplo de prompts para composição de personagem esquerda/direita:

Prompt esquerdo: "Mulher profissional com cabelo castanho em vestido vermelho de negócios, expressão confiante, pose em pé, iluminação natural"

Prompt direito: "Homem profissional com cabelo escuro curto em terno azul de negócios, expressão neutra, pose em pé, iluminação natural"

Prompt negativo (aplica globalmente, não mascarado): "desfocado, distorcido, baixa qualidade, anatomia ruim, deformado"

Gere e examine os resultados. O lado esquerdo deve mostrar mulher em vestido vermelho, o lado direito deve mostrar homem em terno azul, com transição suave no centro onde as máscaras se difundem juntas.

Resolvendo problemas do fluxo de trabalho básico:

Se as regiões não mostrarem o conteúdo esperado:

  1. Verifique se as máscaras estão corretas (máscara esquerda branca à esquerda, máscara direita branca à direita)
  2. Confira conexões de máscara aos nós ConditioningSetMask corretos
  3. Aumente os passos do KSampler para 25-30 para definição regional mais clara
  4. Verifique se ConditioningCombine está configurado para "concat" ou "add"

Se você vir costuras visíveis:

  1. Aumente a difusão da máscara (desfoque as máscaras mais)
  2. Garanta que as zonas de difusão da máscara se sobreponham no meio
  3. Verifique se as máscaras somam aproximadamente 1.0 nas áreas de sobreposição

Para prompting regional rápido baseado em máscaras sem criar máscaras manualmente, Apatero.com fornece ferramentas integradas de pintura de máscara onde você pode desenhar regiões diretamente na interface e atribuir prompts, eliminando requisitos de software de edição de imagem externo.

Técnicas e Ferramentas de Criação de Máscaras

Máscaras de qualidade são a base do prompting regional baseado em máscaras bem-sucedido. Aqui estão abordagens sistemáticas de criação de máscaras do simples ao complexo.

Técnica 1: Máscaras Geométricas Simples (5 minutos)

Para regiões geométricas básicas (esquerda/direita, superior/inferior, quadrantes), crie máscaras rapidamente em qualquer editor de imagem.

Ferramentas: GIMP, Photoshop, Krita, Procreate, até Paint.NET

Processo:

Passo 1: Crie nova imagem na resolução alvo (1024x1024)

Passo 2: Preencha com cor base (geralmente preto para regiões de fundo)

Passo 3: Use ferramentas de seleção para selecionar região (seleção retangular, seleção de elipse, etc.)

Passo 4: Preencha seleção com branco (255) para região de prompt primário

Passo 5: Aplique Desfoque Gaussiano (raio 15-25) para suavizar bordas

Passo 6: Salve como PNG

Tempo: 3-5 minutos por máscara

Melhor para: Composições simples com divisões de região geométricas

Técnica 2: Máscaras Pintadas à Mão (10-20 minutos)

Para formas orgânicas (personagens, elementos fluindo, limites irregulares), pinte máscaras à mão com precisão.

Ferramentas: Photoshop, Krita, Procreate (com caneta), GIMP

Processo:

Passo 1: Carregue imagem de referência ou esboço da composição

Passo 2: Crie nova camada para máscara

Passo 3: Use ferramenta de pincel (pincel de borda dura para pintura inicial)

Passo 4: Pinte branco (255) onde o prompt deve aplicar

Passo 5: Deixe preto (0) onde o prompt NÃO deve aplicar

Passo 6: Use pincel suave ou filtro de desfoque nas bordas para difusão

Passo 7: Refine com ferramenta de borracha para ajustar limites

Passo 8: Salve camada de máscara como PNG em tons de cinza

Tempo: 10-20 minutos por máscara complexa

Melhor para: Contornos de personagens, formas orgânicas, elementos composicionais irregulares

Para detalhes do fluxo de trabalho de pintura de máscaras, veja meu guia de Mask Editor do ComfyUI que cobre técnicas que se aplicam diretamente à criação de máscaras de prompting regional.

Técnica 3: Máscaras Baseadas em Seleção (15-30 minutos)

Para definir precisamente regiões complexas baseadas em conteúdo de imagem existente, use ferramentas de seleção e depois converta para máscaras.

Ferramentas: Photoshop (melhor), GIMP (bom), Krita

Processo:

Passo 1: Carregue imagem de referência ou esboço de composição

Passo 2: Use varinha mágica, laço ou ferramenta de caneta para selecionar região desejada

Fluxos de Trabalho ComfyUI Gratuitos

Encontre fluxos de trabalho ComfyUI gratuitos e de código aberto para as técnicas deste artigo. Open source é poderoso.

100% Grátis Licença MIT Pronto para Produção Dar Estrela e Testar

Passo 3: Refine bordas de seleção (Select > Modify > Feather no Photoshop)

Passo 4: Crie nova camada e preencha seleção com branco

Passo 5: Desselecione e verifique qualidade da máscara

Passo 6: Aplique desfoque adicional se necessário para transições mais suaves

Passo 7: Salve como PNG em tons de cinza

Tempo: 15-30 minutos dependendo da complexidade da seleção

Melhor para: Definir regiões baseadas em conteúdo de imagem existente, fotografia de produto, recortes de personagens

Técnica 4: Geração de Máscaras Assistida por IA (2-5 minutos)

Use ferramentas de segmentação de IA para gerar automaticamente máscaras a partir de imagens de referência.

Ferramentas: Segment Anything Model (SAM), Clipdrop, Photoshop Generative Fill

Processo com SAM no ComfyUI:

Passo 1: Instale nós personalizados SAM (ComfyUI-Segment-Anything)

Passo 2: Carregue imagem de referência

Passo 3: Use nós SAM para detectar e segmentar sujeitos

Passo 4: Converta segmentos para máscaras

Passo 5: Refine máscaras se necessário com retoques manuais

Passo 6: Use máscaras para prompting regional

Tempo: 2-5 minutos incluindo refinamento manual mínimo

Melhor para: Geração rápida de máscaras, sujeitos complexos onde mascaramento manual é proibitivo em tempo

Técnica 5: Geração Procedural de Máscaras no ComfyUI

Gere máscaras programaticamente dentro do ComfyUI usando nós de geração de máscaras.

Nós disponíveis:

  • Mask from Color Range: Cria máscara a partir de faixa de cor na imagem
  • Depth to Mask: Converte mapas de profundidade para máscaras (útil para divisão de região baseada em profundidade)
  • Solid Color Mask: Cria máscaras de cor sólida simples
  • Gradient Mask: Cria máscaras de gradiente para transições suaves

Exemplo de fluxo de trabalho para máscara baseada em profundidade:

Passo 1: Carregue sua imagem de referência no ComfyUI

Passo 2: Processe a imagem através de um nó Depth Estimator (MiDaS ou Zoe)

Passo 3: Aplique Threshold Depth para separar primeiro plano do fundo baseado em valores de profundidade

Passo 4: Use Mask Blur para difundir as bordas da máscara baseada em profundidade

Passo 5: Conecte a máscara resultante como a máscara de região para seu prompt de primeiro plano

Isso cria automaticamente uma máscara de primeiro plano/fundo baseada em profundidade sem pintura manual. Para mais sobre geração de mapas de profundidade e controle de composição baseado em profundidade, veja nosso guia de Depth ControlNet.

Tempo: 3-5 minutos para configurar, depois automático para imagens subsequentes

Melhor para: Processamento em lote, geração consistente de máscaras em múltiplas imagens, composições baseadas em profundidade

Lista de Verificação de Qualidade de Máscara:

Antes de usar máscaras para prompting regional, verifique:

Passo 1: Resolução correta: Corresponde à resolução de geração ou é 2x (reduzirá de forma limpa)

Passo 2: Tons de cinza puros: Sem canais de cor, apenas valores de luminância

Passo 3: Gradientes suaves: Sem transições bruscas a menos que bordas duras intencionais sejam desejadas

Passo 4: Cobertura apropriada: Máscaras cobrem regiões pretendidas completamente, sem lacunas ou ilhas

Passo 5: Difusão apropriada: Zonas de difusão de 15-30 pixels para mesclagem suave

Passo 6: Regiões distintas: Máscaras sobrepostas balanceadas (soma para ~1.0 em áreas de sobreposição)

Máscaras de qualidade ruim (bordas duras, lacunas, resolução errada, dados de cor) produzem artefatos, costuras visíveis ou regiões que não respondem aos prompts corretamente.

Composição Avançada de Máscaras Multi-Região

Fluxos de trabalho simples de duas regiões são diretos, mas composições complexas com 4-8 regiões exigem gerenciamento sistemático de máscaras e combinação condicional.

Arquitetura de Fluxo de Trabalho para 4+ Regiões:

Para composições com múltiplas regiões, o padrão de fluxo de trabalho escala sistematicamente:

Passos de Processamento por Região:

Passo 1: Carregue seu modelo checkpoint para obter o modelo base e codificador CLIP

Passo 2: Para cada região que você quer controlar:

Quer pular a complexidade? Apatero oferece resultados profissionais de IA instantaneamente sem configuração técnica.

Sem configuração Mesma qualidade Comece em 30 segundos Experimentar Apatero Grátis
Cartão de crédito não necessário
  • Carregue a imagem de máscara da região (region_1_mask.png, region_2_mask.png, etc.)
  • Codifique o texto do prompt da região usando CLIP Text Encode
  • Aplique a máscara ao condicionamento usando ConditioningSetMask

Passo 3: Isso cria condicionamento mascarado separado para cada região

Combinando Todas as Regiões:

Passo 1: Combine os primeiros dois condicionamentos mascarados usando ConditioningCombine

Passo 2: Pegue o resultado e combine com o terceiro condicionamento mascarado

Passo 3: Continue encadeando nós ConditioningCombine para cada região adicional

Passo 4: A saída combinada final contém todo o condicionamento regional mesclado junto

Passo 5: Passe este condicionamento combinado para o KSampler para geração

ConditioningCombine aceita apenas duas entradas, então para N regiões, você precisa de N-1 nós de combinação encadeados juntos.

Hierarquia e Prioridade de Máscaras:

Quando máscaras se sobrepõem, a prioridade determina qual prompt domina. Implemente prioridade através de valores de máscara:

Região de alta prioridade (sujeito): Valores de máscara 255 (branco puro), força total do prompt Região de prioridade média (elementos de suporte): Valores de máscara 180-200 (cinza claro), força do prompt 0.7-0.8 Região de baixa prioridade (fundo): Valores de máscara 120-150 (cinza médio), força do prompt 0.5-0.6

Em áreas de sobreposição, regiões de prioridade mais alta com valores de máscara mais altos dominam.

Exemplo: Cena de Grupo de Quatro Personagens

Composição: Quatro pessoas em arranjo 2×2 com fundo compartilhado. Para fluxos de trabalho precisos de consistência facial de personagens, veja nosso guia profissional de face swap que complementa o prompting regional baseado em máscaras.

Máscaras necessárias:

  1. character_1_mask.png: Contorno do personagem superior esquerdo (personagem branco, preto em outros lugares)
  2. character_2_mask.png: Contorno do personagem superior direito (personagem branco, preto em outros lugares)
  3. character_3_mask.png: Contorno do personagem inferior esquerdo (personagem branco, preto em outros lugares)
  4. character_4_mask.png: Contorno do personagem inferior direito (personagem branco, preto em outros lugares)
  5. background_mask.png: Imagem completa com áreas de personagens pretas (inverso das máscaras de personagens combinadas)

Prompts:

  • Personagem 1: "Mulher com cabelo loiro em vestido vermelho, sorrindo, retrato profissional"
  • Personagem 2: "Homem com cabelo escuro em terno azul, expressão neutra, retrato profissional"
  • Personagem 3: "Mulher jovem com cabelo cacheado em blusa verde, expressão amigável, retrato casual"
  • Personagem 4: "Homem mais velho com cabelo grisalho em jaqueta marrom, expressão séria, retrato distinto"
  • Fundo: "Interior de escritório moderno, iluminação suave, ambiente profissional, fundo desfocado"

Fluxo de trabalho:

Passo 1: Aplique máscara+prompt de fundo com força 0.7 (prioridade menor)

Passo 2: Aplique cada máscara+prompt de personagem com força 1.0 (prioridade maior)

Passo 3: Combine todos os cinco condicionamentos mascarados

Passo 4: Gere

Personagens aparecem com aparências distintas, e o fundo preenche áreas não cobertas por personagens, com mesclagem suave nas bordas.

Gerenciamento de Sobreposição de Máscaras: Quando máscaras se sobrepõem, o modelo mescla prompts proporcionalmente. Se character_1_mask e character_2_mask se sobrepõem nas bordas (ambos têm valor 200 na área de sobreposição), essa área recebe mesclagem 50/50 de ambos os prompts de personagem. Use difusão cuidadosamente para controlar zonas de mesclagem.

Estratégia de Máscaras em Camadas para Profundidade:

Para composições com camadas de profundidade distintas (primeiro plano/plano médio/fundo), crie máscaras em camadas com opacidade decrescente:

Camada Valor da Máscara Força do Prompt Propósito
Primeiro plano (mais próximo) 255 (branco) 1.2 Máximo detalhe e aderência ao prompt
Plano médio 200 (cinza claro) 1.0 Nível de detalhe padrão
Fundo (mais distante) 140 (cinza médio) 0.7 Atmosférico, menos detalhe

Esse prompting baseado em profundidade cria naturalmente percepção de profundidade onde o primeiro plano é nítido e detalhado enquanto o fundo é mais suave.

Técnicas de Mesclagem Perfeita:

Para resultados profissionais sem costuras visíveis entre regiões:

Zonas de difusão de sobreposição: Garanta que todas as máscaras tenham zonas de difusão de 25-40 pixels onde se encontram Soma de máscaras balanceadas: Em áreas de sobreposição, valores de máscaras devem somar aproximadamente 255 (se mask_A = 180 e mask_B = 75 na sobreposição, soma = 255) Prompting consistente: Use descritores similares de iluminação/estilo em todos os prompts regionais para que as regiões correspondam estilisticamente Condicionamento base global: Adicione condicionamento global fraco (força 0.3) com descrição geral da cena como fundação

Combinação Procedural de Máscaras:

Para trabalho multi-região sistemático, crie máscaras proceduralmente para garantir cobertura apropriada:

Passo 1: Comece com uma tela preta na sua resolução alvo (1024x1024)

Passo 2: Defina seu layout de região com coordenadas e identificadores

Passo 3: Para cada região no seu layout:

  • Crie uma região branca nas coordenadas especificadas
  • Aplique difusão de 30 pixels para suavizar as bordas
  • Salve a máscara com um nome de arquivo descritivo

Passo 4: Isso garante que todas as máscaras se encaixem perfeitamente juntas com difusão apropriada

Passo 5: Nenhuma lacuna ou sobreposições excessivas ocorrem entre regiões

Isso garante que as máscaras se encaixem perfeitamente com difusão apropriada, eliminando lacunas ou sobreposições excessivas.

Prompting Regional Baseado em Máscaras para Modelos Flux

Modelos Flux não suportam extensões tradicionais do Regional Prompter, tornando abordagens baseadas em máscaras a única maneira de alcançar controle de prompt regional com Flux.

Implementação Específica para Flux:

Flux usa uma arquitetura de condicionamento diferente do Stable Diffusion, exigindo fluxos de trabalho adaptados.

Estrutura de fluxo de trabalho para Flux com máscaras regionais:

Passo 1: Carregue seu modelo checkpoint Flux

Passo 2: Carregue o codificador de texto duplo CLIP do Flux

Passo 3: Carregue suas máscaras de região (máscara region_1 e máscara region_2)

Passo 4: Para a primeira região:

Junte-se a outros 115 membros do curso

Crie Seu Primeiro Influenciador IA Ultra-Realista em 51 Lições

Crie influenciadores IA ultra-realistas com detalhes de pele realistas, selfies profissionais e cenas complexas. Receba dois cursos completos em um pacote. ComfyUI Foundation para dominar a tecnologia e Fanvue Creator Academy para aprender a se promover como criador de IA.

Preço promocional termina em:
--
Dias
:
--
Horas
:
--
Minutos
:
--
Segundos
51 Lições • 2 Cursos Completos
Pagamento Único
Atualizações Vitalícias
Economize $200 - Preço Aumenta Para $399 Permanentemente
Desconto antecipado para nossos primeiros alunos. Estamos constantemente adicionando mais valor, mas você garante $199 para sempre.
Para iniciantes
Pronto para produção
Sempre atualizado
  • Codifique seu primeiro prompt de região usando Flux Text Encode com o codificador CLIP
  • Aplique a primeira máscara a este condicionamento usando ConditioningSetMask

Passo 5: Para a segunda região:

  • Codifique seu segundo prompt de região usando Flux Text Encode com o codificador CLIP
  • Aplique a segunda máscara a este condicionamento usando ConditioningSetMask

Passo 6: Combine ambos os condicionamentos mascarados usando ConditioningCombine

Passo 7: Passe o condicionamento combinado para Flux Sampler para geração

Passo 8: Decodifique a saída latente com VAE Decode

Passo 9: Salve a imagem final

Codificação de Texto CLIP do Flux:

Flux usa codificadores de texto duplos (CLIP-L e T5). Para prompting regional:

  • clip_l_prompt: Codificação CLIP primária (use prompt principal)
  • t5_prompt: Codificação T5 (pode ser igual a clip_l ou ligeira variação)

Para trabalho regional, mantenha ambos os prompts clip_l e t5 idênticos dentro de cada região para consistência.

Considerações de Máscaras Específicas para Flux:

Força da máscara: Flux responde mais fortemente às máscaras do que modelos SD. Use valores de máscara 180-200 (não 255 completo) para regiões primárias para evitar sobre-restrição.

Largura de difusão: Flux se beneficia de zonas de difusão mais largas (40-60 pixels) comparado a SD (20-30 pixels) para mesclagem perfeita.

Escala CFG: Flux tipicamente usa CFG mais baixo (3-5). Com mascaramento regional, aumente levemente para 5-7 para definição regional mais clara.

Passos: Flux precisa de menos passos (15-25). Mascaramento regional não requer aumentos de passo como SD (SD se beneficia de 30-35 passos com máscaras regionais).

Exemplo de Fluxo de Trabalho Regional Flux:

Objetivo: Gerar paisagem com sujeito de primeiro plano detalhado e fundo em estilo pintado usando Flux.

Máscaras:

  • foreground_mask.png: Contorno do sujeito no centro (sujeito branco, preto em outros lugares, difusão de 50 pixels)
  • background_mask.png: Imagem inteira menos sujeito (inverso da máscara de primeiro plano)

Prompts:

  • Primeiro plano (Flux Text Encode): "Retrato profissional de mulher em vestido vermelho, fotorrealista, características faciais detalhadas, foco nítido, alta qualidade"
  • Fundo (Flux Text Encode): "Fundo pintado em aquarela abstrata, estilo artístico, cores suaves, atmosfera sonhadora"
  • Negativo: "desfocado, distorcido, baixa qualidade"

Configurações do Flux Sampler:

  • steps: 20
  • cfg: 6.5
  • sampler: euler (Flux funciona bem com euler)
  • scheduler: simple

Gere e examine. O primeiro plano deve ser fotorrealista enquanto o fundo é pictórico, criando contraste de estilo intencional.

Limitações do Prompting Regional Flux: A arquitetura do Flux torna o prompting regional menos preciso do que modelos SD. Espere 10-15% mais sangramento de região com Flux. Compense com máscaras mais fortes (valores mais altos), difusões mais largas e prompts mais distintos entre regiões.

Comparação entre Prompting Regional Flux vs SD:

Aspecto Stable Diffusion Flux
Precisão regional 9.1/10 7.8/10
Difusão de máscara necessária 20-30px 40-60px
Complexidade de configuração Moderada Moderada
Requisitos CFG 7-9 5-7
Passos necessários 25-35 15-25
Qualidade geral Excelente Muito Boa

Para trabalho de produção Flux exigindo controle regional máximo, recomendo usar Apatero.com que tem prompting regional otimizado para Flux com parâmetros pré-ajustados para melhor isolamento de região do que fluxos de trabalho padrão.

Melhores Práticas de Prompting Regional Flux:

Passo 1: Aumente o contraste da máscara: Use valores 0 e 220-240 (não 255) para melhor controle

Passo 2: Simplifique a contagem de regiões: Limite a 3-4 regiões no máximo com Flux (5+ se torna imprevisível)

Passo 3: Prompts distintos: Torne prompts regionais muito diferentes (fotorrealista vs pintado, não mudanças sutis de estilo)

Passo 4: CFG mais alto: Use CFG 6-7 em vez do típico 3-5 do Flux

Passo 5: Teste máscaras: Gere imagens de teste com apenas visualização de máscara antes de adicionar prompts

Para controle aprimorado do Flux através de treinamento personalizado, explore nossa coleção Ultra Real Flux LoRAs que pode ser combinada com prompting regional baseado em máscaras para máxima precisão.

Fluxos de Trabalho de Produção e Automação

O prompting regional baseado em máscaras se torna prático para produção quando você sistematiza a criação de máscaras e execução de fluxo de trabalho.

Sistema de Template de Fluxo de Trabalho:

Crie templates reutilizáveis para composições comuns:

Template 1: Dois Personagens Lado a Lado

  • Máscaras: left_character.png, right_character.png, shared_background.png
  • Prompts: Descrição do Personagem A, Descrição do Personagem B, Descrição do Ambiente
  • Parâmetros: 1024x1024, 30 passos, CFG 8, difusão 30px

Template 2: Hero Shot com Fundo

  • Máscaras: hero_subject.png, background.png
  • Prompts: Descrição detalhada do sujeito, Ambiente de fundo
  • Parâmetros: 1024x1536 retrato, 35 passos, CFG 7.5, difusão 40px

Template 3: Catálogo de Produtos (4 produtos)

  • Máscaras: product_1.png até product_4.png, background.png
  • Prompts: Descrições individuais de produtos, Fundo branco/cinza
  • Parâmetros: 2048x2048, 40 passos, CFG 9, difusão 25px

Salve estes como arquivos JSON de fluxo de trabalho do ComfyUI. Para novos projetos, carregue template e apenas atualize prompts + máscaras, mantendo todas as conexões de nós e parâmetros.

Script de Geração de Máscaras em Lote:

Para projetos que exigem múltiplas máscaras similares (catálogos de produtos, fichas de personagens), crie script de geração de máscaras usando Python:

Passo 1: Defina sua resolução de máscara (tipicamente 1024x1024) e quantidade de difusão (30 pixels)

Passo 2: Especifique posições para cada quadrante: superior esquerdo em (0,0), superior direito em (512,0), inferior esquerdo em (0,512), inferior direito em (512,512)

Passo 3: Para cada posição de quadrante:

  • Crie uma nova imagem em tons de cinza preenchida com preto
  • Preencha a área de quadrante especificada com pixels brancos
  • Aplique desfoque Gaussiano com o raio de difusão para suavizar bordas
  • Salve a máscara com um nome descritivo como "top_left_mask.png"

Passo 4: Execute este script uma vez para gerar todas as máscaras de quadrante

Passo 5: Reutilize estas máscaras para qualquer projeto exigindo layouts de grid 2x2

Execute uma vez para gerar todas as máscaras para layouts de grid 2×2, depois reutilize para todos os projetos que precisam de composições de quadrante.

Execução Automatizada de Fluxo de Trabalho:

Para produção de alto volume, automatize com API do ComfyUI usando esta abordagem:

Passo 1: Crie um arquivo JSON de template de fluxo de trabalho com valores placeholder para prompts e caminhos de máscaras

Passo 2: Carregue este template no seu script de automação

Passo 3: Para cada geração:

  • Atualize o texto do prompt no JSON do fluxo de trabalho para cada região
  • Atualize os caminhos de arquivo de máscara para apontar para suas máscaras específicas
  • Submeta o fluxo de trabalho modificado para a API do ComfyUI em localhost:8188/prompt

Passo 4: Faça loop através de variações para gerar múltiplas imagens com a mesma estrutura regional

Passo 5: Por exemplo, gere 10 variações de personagem usando máscaras idênticas mas descrições de personagem diferentes

Passo 6: Cada geração mantém controle regional consistente enquanto varia apenas os prompts especificados

Isso gera 10 variações de personagem com controle regional baseado em máscaras idêntico mas prompts variados.

Lista de Verificação de Garantia de Qualidade:

Antes de entregar trabalho regional baseado em máscaras:

Passo 1: Sem costuras visíveis: Verifique todos os limites de região para artefatos ou bordas duras

Passo 2: Precisão do prompt: Cada região mostra conteúdo correspondente ao seu prompt específico

Passo 3: Sem sangramento de região: Personagem A não tem atributos do Personagem B

Passo 4: Iluminação consistente: Direção/qualidade da iluminação corresponde entre regiões (a menos que intencionalmente variada)

Passo 5: Cobertura de máscara completa: Sem lacunas ou ilhas onde prompts não se aplicam

Passo 6: Resolução apropriada: Saída atende especificações do cliente (impressão vs web)

Fluxo de Trabalho de Revisão:

Quando clientes solicitam mudanças em regiões específicas:

Passo 1: Identifique qual região precisa de mudanças (rosto do personagem, fundo, etc.)

Passo 2: Modifique apenas o prompt daquela região

Passo 3: Mantenha todos os outros prompts e máscaras idênticos

Passo 4: Regenere com a mesma seed (se resultados determinísticos forem necessários)

Passo 5: Apenas a região modificada muda, o resto permanece consistente

Esta capacidade de revisão cirúrgica é o recurso matador do prompting regional baseado em máscaras para trabalho com clientes.

Resolvendo Problemas de Prompting Regional Baseado em Máscaras

Fluxos de trabalho baseados em máscaras falham em padrões específicos e reconhecíveis. Conhecer problemas e soluções previne tempo desperdiçado.

Problema: Costuras visíveis ou bordas duras entre regiões

Costuras aparecem como linhas claras onde uma região encontra outra.

Causas e correções:

Passo 1: Difusão insuficiente: Aumente o desfoque da máscara para 30-50 pixels

Passo 2: Máscaras não se sobrepõem: Garanta que zonas de difusão se sobreponham em 10-20 pixels

Passo 3: Prompts conflitantes nos limites: Adicione descritores compartilhados de estilo/iluminação a ambos os prompts regionais

Passo 4: Incompatibilidade de resolução: Verifique se máscaras correspondem à resolução de geração

Passo 5: CFG muito alto: Reduza CFG de 9-10 para 7-8 para limites mais suaves

Problema: Regiões ignoram prompts ou trocam conteúdo

Uma região mostra conteúdo do prompt de outra região.

Correções:

Passo 1: Verifique conexões de máscaras: Garanta que mask_1 conecta a conditioning_1, não trocados

Passo 2: Confira polaridade da máscara: Branco deve ser onde o prompt se aplica, não invertido

Passo 3: Aumente distinção do prompt: Torne prompts mais diferentes uns dos outros

Passo 4: Fortaleça condicionamento: Aumente força do ConditioningSetMask para 1.2-1.5

Passo 5: Simplifique composição: Reduza número de regiões se 5+ regiões produzindo confusão

Problema: Uma região domina imagem inteira

Conteúdo de uma região aparece em todos os lugares, sobrepujando outras regiões.

Correções:

  1. Reduza valores de máscara da região dominante: Mude 255 para 180-200
  2. Aumente valores de máscara de outras regiões: Aumente regiões mais fracas para 220-240
  3. Confira soma de máscaras: Em áreas de sobreposição, garanta que o total não exceda 255 significativamente
  4. Rebalanceie forças de prompt: Reduza força do ConditioningSetMask para região dominante para 0.7-0.8
  5. Simplifique prompt dominante: Remova palavras-chave fortes sangrando para outras regiões

Problema: Máscaras não carregam ou mostram erros

ComfyUI falha em carregar máscaras ou lança erros durante processamento de máscaras.

Correções:

  1. Verifique formato da máscara: Deve ser PNG ou JPG, alguns nós exigem formatos específicos
  2. Confira se máscara é tons de cinza: Sem dados de cor RGB, apenas canal de luminância
  3. Verifique caminho do arquivo: Garanta que caminho do arquivo de máscara está correto e acessível
  4. Confira resolução da máscara: Máscaras extremamente grandes (4K+) podem causar problemas, redimensione para corresponder à resolução de geração
  5. Recarregue fluxo de trabalho: Às vezes o estado do nó fica corrompido, recarregue arquivo de fluxo de trabalho

Problema: Imagem inteira desfocada ou baixa qualidade

Qualidade de saída degrada ao usar prompting regional baseado em máscaras.

Causas:

  1. Muitas regiões: 6+ regiões podem reduzir qualidade, simplifique para 4-5 no máximo
  2. Máscaras sobre-difusas: Desfoque excessivo (80+ pixels) reduz nitidez geral
  3. Máscaras de baixa resolução: Máscaras a 50% da resolução de geração perdem precisão
  4. Prompts regionais conflitantes: Estilos contraditórios forçam modelo a comprometer, reduzindo qualidade
  5. Passos muito poucos: Aumente de 20 para 30-35 para fluxos de trabalho mascarados

Problema: Fundo sangra para primeiro plano ou vice-versa

Elementos de fundo aparecem em regiões de primeiro plano ou sujeito de primeiro plano se estende para o fundo.

Correções:

  1. Fortaleça máscara de primeiro plano: Aumente valores de máscara de primeiro plano para 240-255
  2. Enfraqueça força da máscara de fundo: Reduza força do ConditioningSetMask para fundo para 0.6-0.7
  3. Aumente largura de difusão: Paradoxalmente, difusões mais largas às vezes reduzem sangramento criando transições mais suaves
  4. Use mascaramento de prioridade: Aplique condicionamento de primeiro plano depois do fundo na cadeia ConditioningCombine
  5. Simplifique prompts: Remova palavras-chave ambíguas que poderiam aplicar a múltiplas regiões

Problema: Prompting regional específico para Flux produz resultados ruins

Fluxo de trabalho funciona com SD mas falha com Flux.

Correções específicas para Flux:

  1. Reduza contraste da máscara: Use 0 e 220 em vez de 0 e 255
  2. Aumente difusão: Dobre largura de difusão (30px → 60px)
  3. CFG mais baixo: Flux com máscaras funciona melhor em CFG 5-7, não mais alto
  4. Menos regiões: Limite a 3 regiões no máximo com Flux
  5. Prompts mais simples: Prompting regional Flux tem dificuldade com prompts complexos, simplifique descrições

Considerações Finais

O prompting regional baseado em máscaras representa o extremo de precisão do controle composicional na geração de IA, onde a precisão em nível de pixel importa mais do que a velocidade de configuração. O investimento na criação de máscaras (5-20 minutos por composição) compensa em controle cirúrgico sobre exatamente o que aparece onde.

A vantagem crítica sobre abordagens baseadas em grid é a flexibilidade de forma. Quando sua composição não se encaixa em grids retangulares (e a maioria das composições interessantes não se encaixa), abordagens baseadas em máscaras fornecem o único caminho para resultados limpos. O benefício adicional da compatibilidade com Flux torna esta abordagem à prova de futuro à medida que novos modelos surgem que podem não suportar extensões tradicionais de prompt regional.

Para trabalho de produção exigindo composições consistentes e complexas (catálogos de produtos, conteúdo focado em personagens, ilustrações de estilo misto, visualizações arquitetônicas com posicionamento preciso de elementos), o prompting regional baseado em máscaras passa de "técnica avançada" para "capacidade essencial". Os fluxos de trabalho se tornam rotina após 3-5 projetos à medida que a criação de máscaras e configuração de fluxo de trabalho se tornam segunda natureza.

Comece com composições simples de duas regiões (primeiro plano/fundo, divisões de personagem esquerda/direita) para internalizar como máscaras afetam a aplicação de prompt. Progride para composições de 3-4 regiões à medida que o conforto aumenta. Reserve composições de 5+ regiões para quando absolutamente necessário, pois a complexidade aumenta exponencialmente além de 4-5 regiões.

As técnicas neste guia cobrem tudo desde criação básica de máscaras até composição avançada multi-região e implementações específicas para Flux. Seja você criando máscaras em software externo e importando-as ou usando nós de geração de máscaras do ComfyUI, o princípio central permanece o mesmo - máscaras definem onde prompts se aplicam com precisão em nível de pixel.

Seja você construindo fluxos de trabalho baseados em máscaras localmente ou usando Apatero.com (que fornece pintura de máscaras integrada e prompting regional em uma interface única sem software externo), dominar o prompting regional baseado em máscaras eleva seu controle composicional de "aproximado" para "exato". Essa precisão é cada vez mais essencial à medida que aplicações de geração de IA passam de exploração criativa para produção comercial onde a composição deve corresponder às especificações exatamente.

Pronto para Criar Seu Influenciador IA?

Junte-se a 115 alunos dominando ComfyUI e marketing de influenciadores IA em nosso curso completo de 51 lições.

Preço promocional termina em:
--
Dias
:
--
Horas
:
--
Minutos
:
--
Segundos
Garanta Sua Vaga - $199
Economize $200 - Preço Aumenta Para $399 Permanentemente