Prompting Regional Baseado em Máscaras no ComfyUI: Guia Completo de Controle de Precisão 2025
Domine o prompting regional baseado em máscaras no ComfyUI para controle pixel-perfeito de múltiplas regiões. Fluxos de trabalho completos, técnicas de criação de máscaras, compatibilidade com Flux e composição avançada.
Eu mudei do Regional Prompter baseado em grid para prompting regional baseado em máscaras depois de esbarrar nas limitações dele em um projeto de cliente que exigia cinco regiões com formas irregulares. Abordagens baseadas em grid te forçam a fazer divisões retangulares, mas técnicas baseadas em máscaras permitem que você defina qualquer forma de região com precisão em nível de pixel. Melhor ainda, abordagens baseadas em máscaras funcionam com Flux e outros modelos que não suportam extensões tradicionais do Regional Prompter.
Neste guia, você terá fluxos de trabalho completos de prompting regional baseado em máscaras para ComfyUI, incluindo técnicas de criação e preparação de máscaras, composição de múltiplas máscaras para cenas complexas, implementações específicas para Flux, geração automatizada de máscaras com Segment Anything, e fluxos de trabalho de produção para projetos que exigem precisão cirúrgica no controle regional.
Por Que Prompting Regional Baseado em Máscaras Supera Abordagens de Grid
O Regional Prompter baseado em grid (coberto no meu guia de Regional Prompter) divide imagens em regiões retangulares. Isso funciona muito bem para composições simples, mas falha quando seus elementos composicionais não se alinham com grids retangulares.
O prompting regional baseado em máscaras usa máscaras em tons de cinza ou binárias para definir regiões de qualquer forma. Áreas pretas (0) recebem um prompt, áreas brancas (255) recebem outro prompt, e áreas cinzas mesclam entre os prompts proporcionalmente. Isso fornece controle em nível de pixel sobre a aplicação do prompt.
Comparação entre Regional Prompting Baseado em Grid vs Máscaras
- Flexibilidade de forma: Grid permite apenas regiões retangulares, enquanto Máscaras suportam qualquer forma
- Precisão: Grid fornece controle em nível de região, Máscaras entregam precisão em nível de pixel
- Complexidade de configuração: Grid é simples de configurar, Máscaras varia de moderado a complexo
- Compatibilidade de modelo: Grid funciona apenas com SD1.5 e SDXL, Máscaras funciona com todos os modelos incluindo Flux
- Overhead de processamento: Grid adiciona 15-20% de overhead, Máscaras adiciona 10-15% de overhead
Cenários críticos onde abordagens baseadas em máscaras são essenciais:
Sujeitos não retangulares: Personagem com cabelo fluindo ou silhueta complexa. Regiões baseadas em grid criam limites retangulares que cortam o personagem de forma não natural. Regiões baseadas em máscaras seguem o contorno real do personagem.
Posicionamento preciso de objetos: Fotografia de produto com múltiplos produtos em posições e ângulos específicos. Máscaras permitem definir limites exatos do produto independentemente da forma ou orientação.
Uso do modelo Flux: Flux não suporta a extensão tradicional Regional Prompter. Técnicas baseadas em máscaras são a única maneira de fazer prompting regional com Flux.
Composições orgânicas: Paisagens com linhas de horizonte irregulares, arquitetura com formas complexas, qualquer composição onde grids retangulares não se alinham com limites de conteúdo.
Composição em múltiplas camadas: Cenas complexas exigindo 5+ regiões com prioridades sobrepostas. Abordagens baseadas em máscaras lidam com isso de forma mais elegante do que tentar forçar em divisões de grid.
Eu testei isso com uma composição complexa de personagem: pessoa com capa fluindo em pé na frente de um fundo arquitetônico. A abordagem baseada em grid produziu limites retangulares da capa que pareciam artificiais. A abordagem baseada em máscaras com máscara de capa pintada à mão produziu fluxo natural da capa que se integrou perfeitamente com o personagem e o fundo.
O trade-off é o tempo de configuração. O prompting regional baseado em grid leva 30 segundos para configurar (apenas especifique dimensões do grid e prompts). Abordagens baseadas em máscaras exigem 5-15 minutos para criar máscaras de qualidade, mas esse investimento compensa em precisão composicional.
Entendendo o Condicionamento Baseado em Máscaras no ComfyUI
Antes de mergulhar nos fluxos de trabalho, entender como o ComfyUI processa máscaras para condicionamento é essencial.
Valores de Máscara e Mesclagem de Prompt:
Máscaras são imagens em tons de cinza onde valores de pixel (0-255 ou normalizados 0.0-1.0) determinam a influência do prompt:
- Valor 0 (preto): 0% de influência do prompt (usa totalmente o prompt alternativo ou condicionamento base)
- Valor 128 (cinza 50%): 50% de mesclagem de prompt (mistura igualmente prompts primário e alternativo)
- Valor 255 (branco): 100% de influência do prompt (usa totalmente o prompt primário)
Essa mesclagem gradual permite criar transições suaves entre regiões em vez de bordas duras. Uma máscara com bordas difusas (preto → gradiente cinza → branco) produz transições de prompt suaves sem costuras visíveis.
Aplicação de Condicionamento:
O sistema de condicionamento do ComfyUI aplica máscaras a prompts usando estes nós:
ConditioningSetMask: Aplica uma máscara ao condicionamento existente
- conditioning: O condicionamento do prompt para mascarar
- mask: A máscara definindo onde este condicionamento se aplica
- strength: Multiplicador de força geral (0.0-2.0, padrão 1.0)
- set_cond_area: Se deve restringir a geração apenas à área mascarada
ConditioningCombine: Mescla múltiplos condicionamentos mascarados
- conditioning_1: Primeiro condicionamento mascarado
- conditioning_2: Segundo condicionamento mascarado
- method: Como combinar (add, average ou multiply)
O padrão do fluxo de trabalho é:
Passo 1: Criar condicionamento do prompt (CLIP Text Encode)
Passo 2: Aplicar máscara ao condicionamento (ConditioningSetMask)
Passo 3: Repetir para cada par região/prompt
Passo 4: Combinar todos os condicionamentos mascarados (ConditioningCombine)
Passo 5: Usar condicionamento combinado no KSampler
Considerações sobre Resolução da Máscara:
Máscaras devem corresponder à sua resolução de geração para resultados ideais:
| Resolução de Geração | Resolução da Máscara | Observações |
|---|---|---|
| 512x512 | 512x512 | Correspondência perfeita |
| 1024x1024 | 1024x1024 | Correspondência perfeita |
| 1024x1024 | 512x512 | Funciona mas menos preciso |
| 512x512 | 1024x1024 | Desnecessário, será reduzido |
Máscaras em resolução menor que a geração funcionam mas reduzem a precisão. Máscaras em resolução maior que a geração não fornecem benefício e desperdiçam tempo de processamento.
Mascaramento no Espaço Latente:
O ComfyUI processa a geração no espaço latente (8x reduzido do espaço de pixel). Uma imagem 512x512 é 64x64 no espaço latente. Máscaras são automaticamente reduzidas para corresponder à resolução latente durante a geração.
Isso significa que detalhes finos em máscaras (características de 1-2 pixels) podem não ser preservados precisamente após a redução latente. Projete máscaras com características de pelo menos 8-16 pixels de largura para preservação confiável através do processamento latente.
Aviso sobre Efeitos de Redução de Máscara: Máscaras intrincadas com linhas finas ou pequenos detalhes podem perder precisão durante a redução latente. Teste suas máscaras na resolução alvo para verificar se os detalhes sobrevivem ao processo de geração. Simplifique as máscaras se os detalhes desaparecerem.
Difusão de Máscara para Transições Suaves:
Máscaras de borda dura (preto puro a branco puro, sem transição cinza) criam costuras visíveis onde as regiões se encontram. Máscaras difusas com gradientes cinzas de 10-30 pixels nas bordas mesclam as regiões suavemente.
Em software de edição de imagem:
Passo 1: Crie primeiro a máscara de borda dura (apenas preto e branco)
Passo 2: Aplique Desfoque Gaussiano com raio de 10-30 pixels nas bordas
Passo 3: Resultado: Zonas de transição suaves entre regiões
Ou use o nó Mask Blur do ComfyUI para difundir máscaras proceduralmente:
- mask: Máscara de entrada
- blur_radius: Largura da difusão em pixels (10-30 típico)
Fluxo de Trabalho Básico de Prompting Regional Baseado em Máscaras
O fluxo de trabalho fundamental baseado em máscaras usa máscaras separadas para cada região, aplicando diferentes prompts via condicionamento mascarado. Aqui está a configuração completa para uma composição de duas regiões.
Nós necessários:
- Load Checkpoint - Seu modelo base
- Load Image - Carregar imagem(ns) de máscara
- CLIP Text Encode - Prompts para cada região
- ConditioningSetMask - Aplicar máscaras ao condicionamento
- ConditioningCombine - Mesclar condicionamentos mascarados
- KSampler - Geração
- VAE Decode e Save Image - Saída
Estrutura do fluxo de trabalho para duas regiões (divisão esquerda/direita):
Passo 1: Carregue seu modelo checkpoint, que fornece o modelo base, codificador CLIP e decodificador VAE
Passo 2: Carregue duas imagens de máscara: left_mask.png para a região esquerda e right_mask.png para a região direita
Passo 3: Para a região esquerda: Codifique seu prompt da região esquerda usando CLIP Text Encode
Passo 4: Aplique a máscara esquerda ao condicionamento da região esquerda usando ConditioningSetMask
Passo 5: Para a região direita: Codifique seu prompt da região direita usando CLIP Text Encode
Passo 6: Aplique a máscara direita ao condicionamento da região direita usando ConditioningSetMask
Passo 7: Combine ambos os condicionamentos mascarados usando ConditioningCombine
Passo 8: Passe o condicionamento combinado para o KSampler para geração
Passo 9: Decodifique a saída latente com VAE Decode
Passo 10: Salve a imagem final
Criando as máscaras:
Para uma composição simples esquerda/direita em 1024x1024:
Máscara esquerda (left_mask.png):
- Metade esquerda: Branco (255)
- Metade direita: Preto (0)
- Transição central: gradiente cinza de 20 pixels para mesclagem suave
Máscara direita (right_mask.png):
- Metade esquerda: Preto (0)
- Metade direita: Branco (255)
- Transição central: gradiente cinza de 20 pixels
Crie estas em qualquer software de edição de imagem (Photoshop, GIMP, Krita, Procreate). Salve como PNG ou JPG. As máscaras devem ser em tons de cinza puro (sem cor).
Configurando nós ConditioningSetMask:
Para região esquerda:
- conditioning: Conectar do CLIP Text Encode (prompt esquerdo)
- mask: Conectar do Load Image (left_mask.png)
- strength: 1.0 (força total do prompt)
- set_cond_area: "default" (aplica à área de geração completa)
Para região direita:
- conditioning: Conectar do CLIP Text Encode (prompt direito)
- mask: Conectar do Load Image (right_mask.png)
- strength: 1.0
- set_cond_area: "default"
Combinando condicionamentos:
Nó ConditioningCombine:
- conditioning_1: masked_left_conditioning
- conditioning_2: masked_right_conditioning
- method: "concat" ou "add" (ambos funcionam, "concat" é padrão)
Exemplo de prompts para composição de personagem esquerda/direita:
Prompt esquerdo: "Mulher profissional com cabelo castanho em vestido vermelho de negócios, expressão confiante, pose em pé, iluminação natural"
Prompt direito: "Homem profissional com cabelo escuro curto em terno azul de negócios, expressão neutra, pose em pé, iluminação natural"
Prompt negativo (aplica globalmente, não mascarado): "desfocado, distorcido, baixa qualidade, anatomia ruim, deformado"
Gere e examine os resultados. O lado esquerdo deve mostrar mulher em vestido vermelho, o lado direito deve mostrar homem em terno azul, com transição suave no centro onde as máscaras se difundem juntas.
Resolvendo problemas do fluxo de trabalho básico:
Se as regiões não mostrarem o conteúdo esperado:
- Verifique se as máscaras estão corretas (máscara esquerda branca à esquerda, máscara direita branca à direita)
- Confira conexões de máscara aos nós ConditioningSetMask corretos
- Aumente os passos do KSampler para 25-30 para definição regional mais clara
- Verifique se ConditioningCombine está configurado para "concat" ou "add"
Se você vir costuras visíveis:
- Aumente a difusão da máscara (desfoque as máscaras mais)
- Garanta que as zonas de difusão da máscara se sobreponham no meio
- Verifique se as máscaras somam aproximadamente 1.0 nas áreas de sobreposição
Para prompting regional rápido baseado em máscaras sem criar máscaras manualmente, Apatero.com fornece ferramentas integradas de pintura de máscara onde você pode desenhar regiões diretamente na interface e atribuir prompts, eliminando requisitos de software de edição de imagem externo.
Técnicas e Ferramentas de Criação de Máscaras
Máscaras de qualidade são a base do prompting regional baseado em máscaras bem-sucedido. Aqui estão abordagens sistemáticas de criação de máscaras do simples ao complexo.
Técnica 1: Máscaras Geométricas Simples (5 minutos)
Para regiões geométricas básicas (esquerda/direita, superior/inferior, quadrantes), crie máscaras rapidamente em qualquer editor de imagem.
Ferramentas: GIMP, Photoshop, Krita, Procreate, até Paint.NET
Processo:
Passo 1: Crie nova imagem na resolução alvo (1024x1024)
Passo 2: Preencha com cor base (geralmente preto para regiões de fundo)
Passo 3: Use ferramentas de seleção para selecionar região (seleção retangular, seleção de elipse, etc.)
Passo 4: Preencha seleção com branco (255) para região de prompt primário
Passo 5: Aplique Desfoque Gaussiano (raio 15-25) para suavizar bordas
Passo 6: Salve como PNG
Tempo: 3-5 minutos por máscara
Melhor para: Composições simples com divisões de região geométricas
Técnica 2: Máscaras Pintadas à Mão (10-20 minutos)
Para formas orgânicas (personagens, elementos fluindo, limites irregulares), pinte máscaras à mão com precisão.
Ferramentas: Photoshop, Krita, Procreate (com caneta), GIMP
Processo:
Passo 1: Carregue imagem de referência ou esboço da composição
Passo 2: Crie nova camada para máscara
Passo 3: Use ferramenta de pincel (pincel de borda dura para pintura inicial)
Passo 4: Pinte branco (255) onde o prompt deve aplicar
Passo 5: Deixe preto (0) onde o prompt NÃO deve aplicar
Passo 6: Use pincel suave ou filtro de desfoque nas bordas para difusão
Passo 7: Refine com ferramenta de borracha para ajustar limites
Passo 8: Salve camada de máscara como PNG em tons de cinza
Tempo: 10-20 minutos por máscara complexa
Melhor para: Contornos de personagens, formas orgânicas, elementos composicionais irregulares
Para detalhes do fluxo de trabalho de pintura de máscaras, veja meu guia de Mask Editor do ComfyUI que cobre técnicas que se aplicam diretamente à criação de máscaras de prompting regional.
Técnica 3: Máscaras Baseadas em Seleção (15-30 minutos)
Para definir precisamente regiões complexas baseadas em conteúdo de imagem existente, use ferramentas de seleção e depois converta para máscaras.
Ferramentas: Photoshop (melhor), GIMP (bom), Krita
Processo:
Passo 1: Carregue imagem de referência ou esboço de composição
Passo 2: Use varinha mágica, laço ou ferramenta de caneta para selecionar região desejada
Fluxos de Trabalho ComfyUI Gratuitos
Encontre fluxos de trabalho ComfyUI gratuitos e de código aberto para as técnicas deste artigo. Open source é poderoso.
Passo 3: Refine bordas de seleção (Select > Modify > Feather no Photoshop)
Passo 4: Crie nova camada e preencha seleção com branco
Passo 5: Desselecione e verifique qualidade da máscara
Passo 6: Aplique desfoque adicional se necessário para transições mais suaves
Passo 7: Salve como PNG em tons de cinza
Tempo: 15-30 minutos dependendo da complexidade da seleção
Melhor para: Definir regiões baseadas em conteúdo de imagem existente, fotografia de produto, recortes de personagens
Técnica 4: Geração de Máscaras Assistida por IA (2-5 minutos)
Use ferramentas de segmentação de IA para gerar automaticamente máscaras a partir de imagens de referência.
Ferramentas: Segment Anything Model (SAM), Clipdrop, Photoshop Generative Fill
Processo com SAM no ComfyUI:
Passo 1: Instale nós personalizados SAM (ComfyUI-Segment-Anything)
Passo 2: Carregue imagem de referência
Passo 3: Use nós SAM para detectar e segmentar sujeitos
Passo 4: Converta segmentos para máscaras
Passo 5: Refine máscaras se necessário com retoques manuais
Passo 6: Use máscaras para prompting regional
Tempo: 2-5 minutos incluindo refinamento manual mínimo
Melhor para: Geração rápida de máscaras, sujeitos complexos onde mascaramento manual é proibitivo em tempo
Técnica 5: Geração Procedural de Máscaras no ComfyUI
Gere máscaras programaticamente dentro do ComfyUI usando nós de geração de máscaras.
Nós disponíveis:
- Mask from Color Range: Cria máscara a partir de faixa de cor na imagem
- Depth to Mask: Converte mapas de profundidade para máscaras (útil para divisão de região baseada em profundidade)
- Solid Color Mask: Cria máscaras de cor sólida simples
- Gradient Mask: Cria máscaras de gradiente para transições suaves
Exemplo de fluxo de trabalho para máscara baseada em profundidade:
Passo 1: Carregue sua imagem de referência no ComfyUI
Passo 2: Processe a imagem através de um nó Depth Estimator (MiDaS ou Zoe)
Passo 3: Aplique Threshold Depth para separar primeiro plano do fundo baseado em valores de profundidade
Passo 4: Use Mask Blur para difundir as bordas da máscara baseada em profundidade
Passo 5: Conecte a máscara resultante como a máscara de região para seu prompt de primeiro plano
Isso cria automaticamente uma máscara de primeiro plano/fundo baseada em profundidade sem pintura manual. Para mais sobre geração de mapas de profundidade e controle de composição baseado em profundidade, veja nosso guia de Depth ControlNet.
Tempo: 3-5 minutos para configurar, depois automático para imagens subsequentes
Melhor para: Processamento em lote, geração consistente de máscaras em múltiplas imagens, composições baseadas em profundidade
Lista de Verificação de Qualidade de Máscara:
Antes de usar máscaras para prompting regional, verifique:
Passo 1: Resolução correta: Corresponde à resolução de geração ou é 2x (reduzirá de forma limpa)
Passo 2: Tons de cinza puros: Sem canais de cor, apenas valores de luminância
Passo 3: Gradientes suaves: Sem transições bruscas a menos que bordas duras intencionais sejam desejadas
Passo 4: Cobertura apropriada: Máscaras cobrem regiões pretendidas completamente, sem lacunas ou ilhas
Passo 5: Difusão apropriada: Zonas de difusão de 15-30 pixels para mesclagem suave
Passo 6: Regiões distintas: Máscaras sobrepostas balanceadas (soma para ~1.0 em áreas de sobreposição)
Máscaras de qualidade ruim (bordas duras, lacunas, resolução errada, dados de cor) produzem artefatos, costuras visíveis ou regiões que não respondem aos prompts corretamente.
Composição Avançada de Máscaras Multi-Região
Fluxos de trabalho simples de duas regiões são diretos, mas composições complexas com 4-8 regiões exigem gerenciamento sistemático de máscaras e combinação condicional.
Arquitetura de Fluxo de Trabalho para 4+ Regiões:
Para composições com múltiplas regiões, o padrão de fluxo de trabalho escala sistematicamente:
Passos de Processamento por Região:
Passo 1: Carregue seu modelo checkpoint para obter o modelo base e codificador CLIP
Passo 2: Para cada região que você quer controlar:
Quer pular a complexidade? Apatero oferece resultados profissionais de IA instantaneamente sem configuração técnica.
- Carregue a imagem de máscara da região (region_1_mask.png, region_2_mask.png, etc.)
- Codifique o texto do prompt da região usando CLIP Text Encode
- Aplique a máscara ao condicionamento usando ConditioningSetMask
Passo 3: Isso cria condicionamento mascarado separado para cada região
Combinando Todas as Regiões:
Passo 1: Combine os primeiros dois condicionamentos mascarados usando ConditioningCombine
Passo 2: Pegue o resultado e combine com o terceiro condicionamento mascarado
Passo 3: Continue encadeando nós ConditioningCombine para cada região adicional
Passo 4: A saída combinada final contém todo o condicionamento regional mesclado junto
Passo 5: Passe este condicionamento combinado para o KSampler para geração
ConditioningCombine aceita apenas duas entradas, então para N regiões, você precisa de N-1 nós de combinação encadeados juntos.
Hierarquia e Prioridade de Máscaras:
Quando máscaras se sobrepõem, a prioridade determina qual prompt domina. Implemente prioridade através de valores de máscara:
Região de alta prioridade (sujeito): Valores de máscara 255 (branco puro), força total do prompt Região de prioridade média (elementos de suporte): Valores de máscara 180-200 (cinza claro), força do prompt 0.7-0.8 Região de baixa prioridade (fundo): Valores de máscara 120-150 (cinza médio), força do prompt 0.5-0.6
Em áreas de sobreposição, regiões de prioridade mais alta com valores de máscara mais altos dominam.
Exemplo: Cena de Grupo de Quatro Personagens
Composição: Quatro pessoas em arranjo 2×2 com fundo compartilhado. Para fluxos de trabalho precisos de consistência facial de personagens, veja nosso guia profissional de face swap que complementa o prompting regional baseado em máscaras.
Máscaras necessárias:
- character_1_mask.png: Contorno do personagem superior esquerdo (personagem branco, preto em outros lugares)
- character_2_mask.png: Contorno do personagem superior direito (personagem branco, preto em outros lugares)
- character_3_mask.png: Contorno do personagem inferior esquerdo (personagem branco, preto em outros lugares)
- character_4_mask.png: Contorno do personagem inferior direito (personagem branco, preto em outros lugares)
- background_mask.png: Imagem completa com áreas de personagens pretas (inverso das máscaras de personagens combinadas)
Prompts:
- Personagem 1: "Mulher com cabelo loiro em vestido vermelho, sorrindo, retrato profissional"
- Personagem 2: "Homem com cabelo escuro em terno azul, expressão neutra, retrato profissional"
- Personagem 3: "Mulher jovem com cabelo cacheado em blusa verde, expressão amigável, retrato casual"
- Personagem 4: "Homem mais velho com cabelo grisalho em jaqueta marrom, expressão séria, retrato distinto"
- Fundo: "Interior de escritório moderno, iluminação suave, ambiente profissional, fundo desfocado"
Fluxo de trabalho:
Passo 1: Aplique máscara+prompt de fundo com força 0.7 (prioridade menor)
Passo 2: Aplique cada máscara+prompt de personagem com força 1.0 (prioridade maior)
Passo 3: Combine todos os cinco condicionamentos mascarados
Passo 4: Gere
Personagens aparecem com aparências distintas, e o fundo preenche áreas não cobertas por personagens, com mesclagem suave nas bordas.
Gerenciamento de Sobreposição de Máscaras: Quando máscaras se sobrepõem, o modelo mescla prompts proporcionalmente. Se character_1_mask e character_2_mask se sobrepõem nas bordas (ambos têm valor 200 na área de sobreposição), essa área recebe mesclagem 50/50 de ambos os prompts de personagem. Use difusão cuidadosamente para controlar zonas de mesclagem.
Estratégia de Máscaras em Camadas para Profundidade:
Para composições com camadas de profundidade distintas (primeiro plano/plano médio/fundo), crie máscaras em camadas com opacidade decrescente:
| Camada | Valor da Máscara | Força do Prompt | Propósito |
|---|---|---|---|
| Primeiro plano (mais próximo) | 255 (branco) | 1.2 | Máximo detalhe e aderência ao prompt |
| Plano médio | 200 (cinza claro) | 1.0 | Nível de detalhe padrão |
| Fundo (mais distante) | 140 (cinza médio) | 0.7 | Atmosférico, menos detalhe |
Esse prompting baseado em profundidade cria naturalmente percepção de profundidade onde o primeiro plano é nítido e detalhado enquanto o fundo é mais suave.
Técnicas de Mesclagem Perfeita:
Para resultados profissionais sem costuras visíveis entre regiões:
Zonas de difusão de sobreposição: Garanta que todas as máscaras tenham zonas de difusão de 25-40 pixels onde se encontram Soma de máscaras balanceadas: Em áreas de sobreposição, valores de máscaras devem somar aproximadamente 255 (se mask_A = 180 e mask_B = 75 na sobreposição, soma = 255) Prompting consistente: Use descritores similares de iluminação/estilo em todos os prompts regionais para que as regiões correspondam estilisticamente Condicionamento base global: Adicione condicionamento global fraco (força 0.3) com descrição geral da cena como fundação
Combinação Procedural de Máscaras:
Para trabalho multi-região sistemático, crie máscaras proceduralmente para garantir cobertura apropriada:
Passo 1: Comece com uma tela preta na sua resolução alvo (1024x1024)
Passo 2: Defina seu layout de região com coordenadas e identificadores
Passo 3: Para cada região no seu layout:
- Crie uma região branca nas coordenadas especificadas
- Aplique difusão de 30 pixels para suavizar as bordas
- Salve a máscara com um nome de arquivo descritivo
Passo 4: Isso garante que todas as máscaras se encaixem perfeitamente juntas com difusão apropriada
Passo 5: Nenhuma lacuna ou sobreposições excessivas ocorrem entre regiões
Isso garante que as máscaras se encaixem perfeitamente com difusão apropriada, eliminando lacunas ou sobreposições excessivas.
Prompting Regional Baseado em Máscaras para Modelos Flux
Modelos Flux não suportam extensões tradicionais do Regional Prompter, tornando abordagens baseadas em máscaras a única maneira de alcançar controle de prompt regional com Flux.
Implementação Específica para Flux:
Flux usa uma arquitetura de condicionamento diferente do Stable Diffusion, exigindo fluxos de trabalho adaptados.
Estrutura de fluxo de trabalho para Flux com máscaras regionais:
Passo 1: Carregue seu modelo checkpoint Flux
Passo 2: Carregue o codificador de texto duplo CLIP do Flux
Passo 3: Carregue suas máscaras de região (máscara region_1 e máscara region_2)
Passo 4: Para a primeira região:
Junte-se a outros 115 membros do curso
Crie Seu Primeiro Influenciador IA Ultra-Realista em 51 Lições
Crie influenciadores IA ultra-realistas com detalhes de pele realistas, selfies profissionais e cenas complexas. Receba dois cursos completos em um pacote. ComfyUI Foundation para dominar a tecnologia e Fanvue Creator Academy para aprender a se promover como criador de IA.
- Codifique seu primeiro prompt de região usando Flux Text Encode com o codificador CLIP
- Aplique a primeira máscara a este condicionamento usando ConditioningSetMask
Passo 5: Para a segunda região:
- Codifique seu segundo prompt de região usando Flux Text Encode com o codificador CLIP
- Aplique a segunda máscara a este condicionamento usando ConditioningSetMask
Passo 6: Combine ambos os condicionamentos mascarados usando ConditioningCombine
Passo 7: Passe o condicionamento combinado para Flux Sampler para geração
Passo 8: Decodifique a saída latente com VAE Decode
Passo 9: Salve a imagem final
Codificação de Texto CLIP do Flux:
Flux usa codificadores de texto duplos (CLIP-L e T5). Para prompting regional:
- clip_l_prompt: Codificação CLIP primária (use prompt principal)
- t5_prompt: Codificação T5 (pode ser igual a clip_l ou ligeira variação)
Para trabalho regional, mantenha ambos os prompts clip_l e t5 idênticos dentro de cada região para consistência.
Considerações de Máscaras Específicas para Flux:
Força da máscara: Flux responde mais fortemente às máscaras do que modelos SD. Use valores de máscara 180-200 (não 255 completo) para regiões primárias para evitar sobre-restrição.
Largura de difusão: Flux se beneficia de zonas de difusão mais largas (40-60 pixels) comparado a SD (20-30 pixels) para mesclagem perfeita.
Escala CFG: Flux tipicamente usa CFG mais baixo (3-5). Com mascaramento regional, aumente levemente para 5-7 para definição regional mais clara.
Passos: Flux precisa de menos passos (15-25). Mascaramento regional não requer aumentos de passo como SD (SD se beneficia de 30-35 passos com máscaras regionais).
Exemplo de Fluxo de Trabalho Regional Flux:
Objetivo: Gerar paisagem com sujeito de primeiro plano detalhado e fundo em estilo pintado usando Flux.
Máscaras:
- foreground_mask.png: Contorno do sujeito no centro (sujeito branco, preto em outros lugares, difusão de 50 pixels)
- background_mask.png: Imagem inteira menos sujeito (inverso da máscara de primeiro plano)
Prompts:
- Primeiro plano (Flux Text Encode): "Retrato profissional de mulher em vestido vermelho, fotorrealista, características faciais detalhadas, foco nítido, alta qualidade"
- Fundo (Flux Text Encode): "Fundo pintado em aquarela abstrata, estilo artístico, cores suaves, atmosfera sonhadora"
- Negativo: "desfocado, distorcido, baixa qualidade"
Configurações do Flux Sampler:
- steps: 20
- cfg: 6.5
- sampler: euler (Flux funciona bem com euler)
- scheduler: simple
Gere e examine. O primeiro plano deve ser fotorrealista enquanto o fundo é pictórico, criando contraste de estilo intencional.
Limitações do Prompting Regional Flux: A arquitetura do Flux torna o prompting regional menos preciso do que modelos SD. Espere 10-15% mais sangramento de região com Flux. Compense com máscaras mais fortes (valores mais altos), difusões mais largas e prompts mais distintos entre regiões.
Comparação entre Prompting Regional Flux vs SD:
| Aspecto | Stable Diffusion | Flux |
|---|---|---|
| Precisão regional | 9.1/10 | 7.8/10 |
| Difusão de máscara necessária | 20-30px | 40-60px |
| Complexidade de configuração | Moderada | Moderada |
| Requisitos CFG | 7-9 | 5-7 |
| Passos necessários | 25-35 | 15-25 |
| Qualidade geral | Excelente | Muito Boa |
Para trabalho de produção Flux exigindo controle regional máximo, recomendo usar Apatero.com que tem prompting regional otimizado para Flux com parâmetros pré-ajustados para melhor isolamento de região do que fluxos de trabalho padrão.
Melhores Práticas de Prompting Regional Flux:
Passo 1: Aumente o contraste da máscara: Use valores 0 e 220-240 (não 255) para melhor controle
Passo 2: Simplifique a contagem de regiões: Limite a 3-4 regiões no máximo com Flux (5+ se torna imprevisível)
Passo 3: Prompts distintos: Torne prompts regionais muito diferentes (fotorrealista vs pintado, não mudanças sutis de estilo)
Passo 4: CFG mais alto: Use CFG 6-7 em vez do típico 3-5 do Flux
Passo 5: Teste máscaras: Gere imagens de teste com apenas visualização de máscara antes de adicionar prompts
Para controle aprimorado do Flux através de treinamento personalizado, explore nossa coleção Ultra Real Flux LoRAs que pode ser combinada com prompting regional baseado em máscaras para máxima precisão.
Fluxos de Trabalho de Produção e Automação
O prompting regional baseado em máscaras se torna prático para produção quando você sistematiza a criação de máscaras e execução de fluxo de trabalho.
Sistema de Template de Fluxo de Trabalho:
Crie templates reutilizáveis para composições comuns:
Template 1: Dois Personagens Lado a Lado
- Máscaras: left_character.png, right_character.png, shared_background.png
- Prompts: Descrição do Personagem A, Descrição do Personagem B, Descrição do Ambiente
- Parâmetros: 1024x1024, 30 passos, CFG 8, difusão 30px
Template 2: Hero Shot com Fundo
- Máscaras: hero_subject.png, background.png
- Prompts: Descrição detalhada do sujeito, Ambiente de fundo
- Parâmetros: 1024x1536 retrato, 35 passos, CFG 7.5, difusão 40px
Template 3: Catálogo de Produtos (4 produtos)
- Máscaras: product_1.png até product_4.png, background.png
- Prompts: Descrições individuais de produtos, Fundo branco/cinza
- Parâmetros: 2048x2048, 40 passos, CFG 9, difusão 25px
Salve estes como arquivos JSON de fluxo de trabalho do ComfyUI. Para novos projetos, carregue template e apenas atualize prompts + máscaras, mantendo todas as conexões de nós e parâmetros.
Script de Geração de Máscaras em Lote:
Para projetos que exigem múltiplas máscaras similares (catálogos de produtos, fichas de personagens), crie script de geração de máscaras usando Python:
Passo 1: Defina sua resolução de máscara (tipicamente 1024x1024) e quantidade de difusão (30 pixels)
Passo 2: Especifique posições para cada quadrante: superior esquerdo em (0,0), superior direito em (512,0), inferior esquerdo em (0,512), inferior direito em (512,512)
Passo 3: Para cada posição de quadrante:
- Crie uma nova imagem em tons de cinza preenchida com preto
- Preencha a área de quadrante especificada com pixels brancos
- Aplique desfoque Gaussiano com o raio de difusão para suavizar bordas
- Salve a máscara com um nome descritivo como "top_left_mask.png"
Passo 4: Execute este script uma vez para gerar todas as máscaras de quadrante
Passo 5: Reutilize estas máscaras para qualquer projeto exigindo layouts de grid 2x2
Execute uma vez para gerar todas as máscaras para layouts de grid 2×2, depois reutilize para todos os projetos que precisam de composições de quadrante.
Execução Automatizada de Fluxo de Trabalho:
Para produção de alto volume, automatize com API do ComfyUI usando esta abordagem:
Passo 1: Crie um arquivo JSON de template de fluxo de trabalho com valores placeholder para prompts e caminhos de máscaras
Passo 2: Carregue este template no seu script de automação
Passo 3: Para cada geração:
- Atualize o texto do prompt no JSON do fluxo de trabalho para cada região
- Atualize os caminhos de arquivo de máscara para apontar para suas máscaras específicas
- Submeta o fluxo de trabalho modificado para a API do ComfyUI em localhost:8188/prompt
Passo 4: Faça loop através de variações para gerar múltiplas imagens com a mesma estrutura regional
Passo 5: Por exemplo, gere 10 variações de personagem usando máscaras idênticas mas descrições de personagem diferentes
Passo 6: Cada geração mantém controle regional consistente enquanto varia apenas os prompts especificados
Isso gera 10 variações de personagem com controle regional baseado em máscaras idêntico mas prompts variados.
Lista de Verificação de Garantia de Qualidade:
Antes de entregar trabalho regional baseado em máscaras:
Passo 1: Sem costuras visíveis: Verifique todos os limites de região para artefatos ou bordas duras
Passo 2: Precisão do prompt: Cada região mostra conteúdo correspondente ao seu prompt específico
Passo 3: Sem sangramento de região: Personagem A não tem atributos do Personagem B
Passo 4: Iluminação consistente: Direção/qualidade da iluminação corresponde entre regiões (a menos que intencionalmente variada)
Passo 5: Cobertura de máscara completa: Sem lacunas ou ilhas onde prompts não se aplicam
Passo 6: Resolução apropriada: Saída atende especificações do cliente (impressão vs web)
Fluxo de Trabalho de Revisão:
Quando clientes solicitam mudanças em regiões específicas:
Passo 1: Identifique qual região precisa de mudanças (rosto do personagem, fundo, etc.)
Passo 2: Modifique apenas o prompt daquela região
Passo 3: Mantenha todos os outros prompts e máscaras idênticos
Passo 4: Regenere com a mesma seed (se resultados determinísticos forem necessários)
Passo 5: Apenas a região modificada muda, o resto permanece consistente
Esta capacidade de revisão cirúrgica é o recurso matador do prompting regional baseado em máscaras para trabalho com clientes.
Resolvendo Problemas de Prompting Regional Baseado em Máscaras
Fluxos de trabalho baseados em máscaras falham em padrões específicos e reconhecíveis. Conhecer problemas e soluções previne tempo desperdiçado.
Problema: Costuras visíveis ou bordas duras entre regiões
Costuras aparecem como linhas claras onde uma região encontra outra.
Causas e correções:
Passo 1: Difusão insuficiente: Aumente o desfoque da máscara para 30-50 pixels
Passo 2: Máscaras não se sobrepõem: Garanta que zonas de difusão se sobreponham em 10-20 pixels
Passo 3: Prompts conflitantes nos limites: Adicione descritores compartilhados de estilo/iluminação a ambos os prompts regionais
Passo 4: Incompatibilidade de resolução: Verifique se máscaras correspondem à resolução de geração
Passo 5: CFG muito alto: Reduza CFG de 9-10 para 7-8 para limites mais suaves
Problema: Regiões ignoram prompts ou trocam conteúdo
Uma região mostra conteúdo do prompt de outra região.
Correções:
Passo 1: Verifique conexões de máscaras: Garanta que mask_1 conecta a conditioning_1, não trocados
Passo 2: Confira polaridade da máscara: Branco deve ser onde o prompt se aplica, não invertido
Passo 3: Aumente distinção do prompt: Torne prompts mais diferentes uns dos outros
Passo 4: Fortaleça condicionamento: Aumente força do ConditioningSetMask para 1.2-1.5
Passo 5: Simplifique composição: Reduza número de regiões se 5+ regiões produzindo confusão
Problema: Uma região domina imagem inteira
Conteúdo de uma região aparece em todos os lugares, sobrepujando outras regiões.
Correções:
- Reduza valores de máscara da região dominante: Mude 255 para 180-200
- Aumente valores de máscara de outras regiões: Aumente regiões mais fracas para 220-240
- Confira soma de máscaras: Em áreas de sobreposição, garanta que o total não exceda 255 significativamente
- Rebalanceie forças de prompt: Reduza força do ConditioningSetMask para região dominante para 0.7-0.8
- Simplifique prompt dominante: Remova palavras-chave fortes sangrando para outras regiões
Problema: Máscaras não carregam ou mostram erros
ComfyUI falha em carregar máscaras ou lança erros durante processamento de máscaras.
Correções:
- Verifique formato da máscara: Deve ser PNG ou JPG, alguns nós exigem formatos específicos
- Confira se máscara é tons de cinza: Sem dados de cor RGB, apenas canal de luminância
- Verifique caminho do arquivo: Garanta que caminho do arquivo de máscara está correto e acessível
- Confira resolução da máscara: Máscaras extremamente grandes (4K+) podem causar problemas, redimensione para corresponder à resolução de geração
- Recarregue fluxo de trabalho: Às vezes o estado do nó fica corrompido, recarregue arquivo de fluxo de trabalho
Problema: Imagem inteira desfocada ou baixa qualidade
Qualidade de saída degrada ao usar prompting regional baseado em máscaras.
Causas:
- Muitas regiões: 6+ regiões podem reduzir qualidade, simplifique para 4-5 no máximo
- Máscaras sobre-difusas: Desfoque excessivo (80+ pixels) reduz nitidez geral
- Máscaras de baixa resolução: Máscaras a 50% da resolução de geração perdem precisão
- Prompts regionais conflitantes: Estilos contraditórios forçam modelo a comprometer, reduzindo qualidade
- Passos muito poucos: Aumente de 20 para 30-35 para fluxos de trabalho mascarados
Problema: Fundo sangra para primeiro plano ou vice-versa
Elementos de fundo aparecem em regiões de primeiro plano ou sujeito de primeiro plano se estende para o fundo.
Correções:
- Fortaleça máscara de primeiro plano: Aumente valores de máscara de primeiro plano para 240-255
- Enfraqueça força da máscara de fundo: Reduza força do ConditioningSetMask para fundo para 0.6-0.7
- Aumente largura de difusão: Paradoxalmente, difusões mais largas às vezes reduzem sangramento criando transições mais suaves
- Use mascaramento de prioridade: Aplique condicionamento de primeiro plano depois do fundo na cadeia ConditioningCombine
- Simplifique prompts: Remova palavras-chave ambíguas que poderiam aplicar a múltiplas regiões
Problema: Prompting regional específico para Flux produz resultados ruins
Fluxo de trabalho funciona com SD mas falha com Flux.
Correções específicas para Flux:
- Reduza contraste da máscara: Use 0 e 220 em vez de 0 e 255
- Aumente difusão: Dobre largura de difusão (30px → 60px)
- CFG mais baixo: Flux com máscaras funciona melhor em CFG 5-7, não mais alto
- Menos regiões: Limite a 3 regiões no máximo com Flux
- Prompts mais simples: Prompting regional Flux tem dificuldade com prompts complexos, simplifique descrições
Considerações Finais
O prompting regional baseado em máscaras representa o extremo de precisão do controle composicional na geração de IA, onde a precisão em nível de pixel importa mais do que a velocidade de configuração. O investimento na criação de máscaras (5-20 minutos por composição) compensa em controle cirúrgico sobre exatamente o que aparece onde.
A vantagem crítica sobre abordagens baseadas em grid é a flexibilidade de forma. Quando sua composição não se encaixa em grids retangulares (e a maioria das composições interessantes não se encaixa), abordagens baseadas em máscaras fornecem o único caminho para resultados limpos. O benefício adicional da compatibilidade com Flux torna esta abordagem à prova de futuro à medida que novos modelos surgem que podem não suportar extensões tradicionais de prompt regional.
Para trabalho de produção exigindo composições consistentes e complexas (catálogos de produtos, conteúdo focado em personagens, ilustrações de estilo misto, visualizações arquitetônicas com posicionamento preciso de elementos), o prompting regional baseado em máscaras passa de "técnica avançada" para "capacidade essencial". Os fluxos de trabalho se tornam rotina após 3-5 projetos à medida que a criação de máscaras e configuração de fluxo de trabalho se tornam segunda natureza.
Comece com composições simples de duas regiões (primeiro plano/fundo, divisões de personagem esquerda/direita) para internalizar como máscaras afetam a aplicação de prompt. Progride para composições de 3-4 regiões à medida que o conforto aumenta. Reserve composições de 5+ regiões para quando absolutamente necessário, pois a complexidade aumenta exponencialmente além de 4-5 regiões.
As técnicas neste guia cobrem tudo desde criação básica de máscaras até composição avançada multi-região e implementações específicas para Flux. Seja você criando máscaras em software externo e importando-as ou usando nós de geração de máscaras do ComfyUI, o princípio central permanece o mesmo - máscaras definem onde prompts se aplicam com precisão em nível de pixel.
Seja você construindo fluxos de trabalho baseados em máscaras localmente ou usando Apatero.com (que fornece pintura de máscaras integrada e prompting regional em uma interface única sem software externo), dominar o prompting regional baseado em máscaras eleva seu controle composicional de "aproximado" para "exato". Essa precisão é cada vez mais essencial à medida que aplicações de geração de IA passam de exploração criativa para produção comercial onde a composição deve corresponder às especificações exatamente.
Pronto para Criar Seu Influenciador IA?
Junte-se a 115 alunos dominando ComfyUI e marketing de influenciadores IA em nosso curso completo de 51 lições.
Artigos Relacionados
25 Dicas e Truques do ComfyUI Que Usuários Pro Não Querem Que Você Saiba em 2025
Descubra 25 dicas avançadas do ComfyUI, técnicas de otimização de workflow e truques de nível profissional que usuários experts utilizam. Guia completo de ajuste de CFG, processamento em lote e melhorias de qualidade.
Rotação 360 de Anime com Anisora v3.2: Guia Completo de Rotação de Personagens no ComfyUI 2025
Domine a rotação 360 graus de personagens de anime com Anisora v3.2 no ComfyUI. Aprenda fluxos de trabalho de órbita de câmera, consistência multi-view e técnicas profissionais de animação de turnaround.
Combo AnimateDiff + IPAdapter no ComfyUI: Guia Completo de Animação com Estilo Consistente 2025
Domine a combinação AnimateDiff + IPAdapter no ComfyUI para animações de personagens com estilo consistente. Fluxos de trabalho completos, técnicas de transferência de estilo, controle de movimento e dicas de produção.