/ ייצור תמונות בינה מלאכותית / כיצד לשים 2 דמויות עקביות באותה דור תמונה
ייצור תמונות בינה מלאכותית 23 דקות קריאה

כיצד לשים 2 דמויות עקביות באותה דור תמונה

שלוט בעקביות דמויות מרובות בדור תמונות בינה מלאכותית עם טכניקות של LoRA stacking, regional prompting ו-IP-Adapter לתוצאות מקצועיות.

כיצד לשים 2 דמויות עקביות באותה דור תמונה - Complete ייצור תמונות בינה מלאכותית guide and tutorial

ביליתם שעות בהשלמת עיצוב דמות ב-Stable Diffusion. הפנים נראים מושלמים, התלבושת מתאימה לחזון שלכם, והסגנון הוא בדיוק מה שאתם צריכים. ואז אתם מנסים להוסיף דמות שנייה כדי ליצור סצנת אינטראקציה, והכל קורס. הדמות המקורית משתנה למישהו לגמרי שונה, תכונות הפנים משתלבות זו בזו, ובסופו של דבר אתם מקבלים שתי זרים לא עקביים במקום הגיבורים הזוויים בזהירות.

תשובה מהירה: ייצור 2 דמויות עקביות באותה תמונה דורש שילוב של מספר טכניקות כולל LoRAs ספציפיות לדמויות, regional prompting כדי להפריד בין אזורי דמויות, IP-Adapter לעקביות פנים, ותכנון קומפוזיציה זהיר. הגישה האמינה ביותר מערימה LoRAs בודדות לדמויות במשקלים נמוכים יותר תוך שימוש בכלים של regional prompting כדי לשלוט במקום שכל דמות מופיעה בתמונה.

נקודות מפתח
  • עקביות דמויות מרובות דורשת טכניקות מיוחדות מעבר ל-prompting רגיל
  • LoRA stacking במשקלים מופחתים מונע זיווג של תכונות דמויות
  • Regional prompting מחלקת את קנווס התמונה לשליטה עצמאית בדמויות
  • שיטות IP-Adapter multi-face שומרות על עקביות פנים על פני דמויות
  • תכנון קומפוזיציה והצבת דמויות משפרות משמעותית את שיעורי ההצלחה

מדוע עקביות דמויות מרובות כל כך קשה?

הקושי הבסיסי נובע מאופן עיבוד המידע על ידי דגמי diffusion. כאשר אתם מאמנים דגם או LoRA בדמות יחידה, הוא לומד דפוסים, תכונות פנים, פרטי ביגוד ואלמנטים של סגנון כחבילה קשורה. הצגת דמות שנייה יוצרת אותות מתחרים המבלבלים את תהליך הדור.

דגמי דור תמונות פועלים דרך מנגנוני תשומת לב המערבבים תכונות על פני הרכב שלם. ללא גבולות מפורשים, הדגם מתייחס לכל אלמנטים כחלק מסצנה מאוחדת. זה אומר שתכונות ייחודיות מדמות אחת דולפות לתוך שטח הדמות השנייה. אתם עשויים לראות את צבע העיניים של דמות A מופיע בדמות B, או תסרוקות המתערבבות בין הנושאים.

הבעיה מתגברת עם LoRAs של דמויות ספציפיות. כל LoRA משנה את ההתנהגות של הדגם הבסיסי לטובת תכונות מסוימות. כאשר אתם מערימים שתי LoRAs של דמויות, הן מתחרות בהשפעה על אותם נתיבים נוירליים. הדגם בעצם מנסה ליצור היברידי המספק את שתי ה-LoRAs בו-זמנית, וכתוצאה מכך אף אחת מהדמויות לא מופיעה כראוי.

לפני שתתחילו ודאו שיש לכם LoRAs בודדות של דמויות מאומנות כראוי לפני ניסיון של סצנות דמויות מרובות. LoRAs במקור גרוע יחמירו בלבד בעיות עקביות כאשר משלבים אותם.

קוהרנציה מרחבית מוסיפה שכבה נוספת של מורכבות. הדגם חייב להבין שקיימים שני ישויות נפרדות באזורים שונים של התמונה תוך שמירה על עקביות סדר גודל, פרספקטיבה והארה בין שתיהן. זה דורש שליטה מתוחכמת בקומפוזיציה שלא ניתן לספק רק דרך prompting רגיל.

כיצד אתם מערימים LoRAs של דמויות בהצלחה?

LoRA stacking יוצר את הבסיס של ייצור דמויות מרובות, אך הטכניקה דורשת דיוק כדי להימנע מדלף דמויות. התחילו בהפחתת משקל כל LoRA של דמויות לכ-0.4 עד 0.6 במקום ההיקף הטיפוסי של 0.8 עד 1.0 המשמש לייצור דמויות יחידות. השפעה מופחתת זו מונעת כל LoRA מלשלוט על הרכב כולו.

טענו את LoRA הדמות הראשונה והקצו אותו לאזורי prompting ספציפיים. אם אתם משתמשים ב-ComfyUI, הצומת ConditioningSetArea מאפשר לכם להגדיר אזורים מלבניים שבהם conditioning מסוים חל. עבור הדמות הראשונה שלכם, ייתכן שתציינו את 40 אחוז השמאלי של רוחב התמונה. ה-LoRA של הדמות השנייה מקבל הקצאה לאזור שונה, אולי 40 אחוז הימני.

הסדר שבו אתם טוענים LoRAs חשוב מאוד. הציבו את הדמות שאמורה להופיע בולטת ביותר או הקרובה למצלמה תחילה בערימת LoRA שלכם. ה-LoRA של דמות זו מקבל עדיפות עיבוד, ויוצרת בסיס שLoRAs עוקבות משנות במקום להחליף. אם אתם צריכים דמות A לשלוט בסצנה בעוד דמות B ממלאת תפקיד תומך, טענו את ה-LoRA של דמות A תחילה במשקל קצת יותר גבוה.

שימו לב לתקן prompting כאשר אתם מערימים LoRAs. כל דמות צריכה טקסט תיאורי עצמאי המחזק את התכונות הייחודיות שלה. במקום prompt אחד המתאר את שתי הדמויות ביחד, השתמשו בconditioning נפרד לכל אזור. עבור דמות A, כתבו תיאור מלא כולל יציאה, ביטוי פנים, ביגוד ותיאור הקשר סביבתי. עשו את אותו הדבר עבור דמות B בתחומם המיועד.

איזון משקלות דורש ניסוי בהתאם ל-LoRAs הספציפיים שלכם. יש LoRAs של דמויות מסוימות אימון עם השפעה חזקה יותר מאחרות בשל גודל מערך הנתונים או משך ההדרכה. אם דמות אחת כל הזמן מעוצמת אחרת, הפחיתו את משקל ה-LoRA הדומיננטי ב-0.1 תוך הגדלת הדמות החלשה. המטרה היא השפעה מאוזנת שבה שתי הדמויות שומרות על התכונות הייחודיות שלהן ללא זיווג.

טכניקה מקצועית יצרו אזור חפיפה ניטרלי בין אזורי דמויות שבו כל LoRA לא חל במלוא כוחו. אזור מאגר של 10-20 אחוז עוזר למנוע מעברים קשים וכשל מאפשר נקודות אינטראקציה טבעיות בין דמויות.

לשליטה מתקדמת, שקול שימוש בעברות מרובות עם שילובי LoRA שונים. צור קומפוזיציה ראשונית עם שתי LoRAs במשקלים נמוכים כדי לשכן מיקום בסיסי. אז הפעל עברה שנייה תוך שימוש ב-ControlNet או img2img עם מסכות אזוריות, והחל כל LoRA של דמויות בנפרד לאזורים הספציפיים שלهם במשקלים גבוהים יותר. גישה דו-שלבית זו מונעת זיהום חוצה-עדין תוך שמירה על שלמות הקומפוזיציה.

אילו שיטות Regional Prompting עובדות הכי טוב?

Regional prompting מחלקת את קנווס שלך לאזורים מבוקרים שבהם הוראות דור שונות חלות. הפרדה מרחבית זו מונעת את זיווג תכונות הדמויות המטריד ניסיונות רגילים של דמויות מרובות. מספר כלים וזרימות עבודה מספקות יכולות regional prompting עם רמות בקרה משתנות.

ComfyUI מציע את regional prompting הגמיש ביותר דרך מערכת זרימת עבודה מבוססת צמתים. הצומת ConditioningSetArea מגדיר אזורים מלבניים עם מימדים מבוססים על פיקסל או אחוז דיוק. חברו conditioning של prompt נפרד לכל אזור, המאפשר תיאורי דמויות עצמאיים לחלוטין. אתה יכול ליצור אזורים חופפים עם כוחות חיבור שונים כדי להתמודד עם אזורים שבהם דמויות מתקיימות או תופסות מרחב משותף.

ההרחבה Regional Prompter עבור AUTOMATIC1111 מספקת פונקציונליות דומה דרך ממשק יותר פשוט. חלקו את התמונה שלכם באמצעות יחסים פשוטים כמו 1:1 לעיצורים מפוצלים או 2:1 לסדרי עדיפויות רקע ממנה. כל אזור מקבל טקסט prompt משלו, ואתה יכול לציין אם אזורים צריכים לתערבב בגבולות או לשמור על הפרדות קשות.

טכניקות Latent couple לוקחות שליטה אזורית רחוק יותר על ידי פיצול בפועל של מרחב ההמתנה במהלך דור. במקום להחיל רק prompts שונים לאזורים, שיטה זו מעבדת כל אזור דרך דרכי denoising נפרדות שמתמזגות רק בשלבים מסוימים. גישה זו מפחיתה משמעותית את זיהום צולב בין דמויות אך דורשת יותר משאבי מחשוב וזמני דור ארוכים יותר.

לגבולות דמויות דיוקים, masking-based regional prompting מציע שליטה pixel-perfect. יצרו מסכות בינאריות בעורך תמונות שבו אזורים לבנים מייצגים את אזור דמות A ואזורים שחורים מייצגים את אזור דמות B. ייבאו מסכות אלו לזרימת העבודה שלכם והשתמשו בהם כדי לשלוט במקום שconditioning של כל דמות חל. שיטה זו פועלת יוצאת דופן במיוחד ליצורי קומפוזיציה מורכבים שבהם דמויות חופפות או תופסות מרחבים לא סדירים.

בעוד שפלטפורמות כמו Apatero.com מטפלות בregional prompting באופן אוטומטי מאחורי הקלעים, הבנת טכניקות אלו עוזרת לכם לפתור בעיות עקביות ולהשיג מטרות קומפוזיציוניות ספציפיות בעבודה עם התקנות מקומיות.

ControlNet integration משפר את regional prompting בהוספת pose, depth, או הנחיית קומפוזיציה. צרו תמונת ייחוס או סקיצה המציגה את עמדות הדמויות הרצויות. השתמשו בזה כקלט ControlNet בעוד יישום prompting אזורי שונה לכל אזור דמויות. ה-ControlNet מבטיח שדמויות שומרות על עמדות ראויות בזוהי regional prompts שומרות על עקביות ביצוע בודדת.

Attention masking מספק גישה אזורית נוספת על ידי שינוי משקלי תשומת לב במהלך דור. כלים כמו הרחבת Attention Couple מכפילים ניקוד תשומת לב בעל מסכות ספציפיות אזוריות, למעשה אומרים לדגם להתמקד בתכונות מסוימות באזורים מיועדים. טכניקה זו עובדת במיוחד טוב כאשר משולבת עם LoRA stacking, כיוון שהיא מחזקת את הפרדה המרחבית בין LoRAs של דמויות.

כיצד IP-Adapter מטפל בפנים מרובות?

IP-Adapter שינה את הגיאומטריה של עקביות דמויות על ידי שימוש בהטבעות תמונה במקום תיאורים טקסטואליים כדי להגדיר הופעה. היכולות multi-face של IP-Adapter מאפשרות לכם לספק תמונות ייחוס לכל דמות, מה שמבטיח שתכונות פנים נשארות עקביות אפילו בסצנות דמויות מרובות מורכבות.

זרימת העבודה של IP-Adapter הסטנדרטית משתמשת בתמונת ייחוס יחידה ומחילה את תכונות הפנים הללו על פני הדור כולו. עבור עבודת דמויות מרובות, אתה זקוק לדגמי IP-Adapter FaceID או IP-Adapter Plus התומכים בכניסות פנים מרובות. טען תמונות ייחוס נפרדות לכל דמות, והמערכת יוצרת הטבעות לכל פנים בעצמאות.

InstantID מייצג את ההתפתחות האחרונה בדור עקביות פנים. טכנולוגיה זו משלבת הטבעות פנים עם בקרת pose והנחיית סגנון במערכת מאוחדת יחידה. עבור סצנות דו דמות, ספקו פנים ייחוס לשתי הדמויות יחד עם מדריך קומפוזיציה המציג את העמדות שלהן. InstantID שומר על עקביות פנים תוך מאפשר וריאציה pose טבעית ואינטראקציה בין דמויות.

המפתח להצלחה בעבודת IP-Adapter multi-face נעוצה בכוח הטבעה ותיעוד שכבה. בשונה מLoRAs שמשפיעים על תהליך הדור כולו, IP-Adapter יכול לכוונן שכבות דגם ספציפיות שבהן תכונות פנים מטופלות. הגדרו את הטבעות הפנים שלכם בהשפעה בעיקר על שכבות אמצע ומאוחרות שבהן פרטים מעודנים מתגלים, תוך הוצאת שכבות מוקדמות חופשיות כדי לשכן קומפוזיציה כללית וסגנון.

איכות תמונת ייחוס משפיע דרמטית על התוצאות של IP-Adapter. השתמשו בתצלומים ברורים ומואירים היטב המציגים צפיות פנים חזיתיות או שלוש רבע ללא עיכובים. תמונות ייחוס מרובות לכל דמות משפרות עקביות, כאשר המערכת יכולה להשוות תכונות על פני מספר דוגמאות במקום להסתמך על שיחת פוטנציאל לא מייצגת.

איזון משקלות חל ל-IP-Adapter בדיוק כפי שהוא עושה עבור LoRA stacking. הטבעת הפנים של כל דמות צריכה לפעול בעוצמה של 0.5 עד 0.7 כדי למנוע שליטה מוחלטת של התמונה. משקלות גבוהים יותר הופכים פנים לעקביות יותר אך מפחיתים גמישות לביטוי וריאציית זווית. משקלות נמוכים יותר מאפשרים וריאציה טבעית יותר אך מסתכנים בהפסד עקביות.

עבור זרימות עבודה מתקדמות, שלבו IP-Adapter עם regional prompting כדי להקצות הטבעות פנים ספציפיות לאזורים מיועדים. החלו הטבעת פנים של דמות A רק לאזור השמאל בעוד הטבעת דמות B משפיעה על אזור ימין. שילוב זה מספק את בקרת העקביות החזקה ביותר האפשרית, כיוון ששניהם עמדה מרחבית ותכונות פנים מקבלות הנחיה עצמאית.

Apatero.com משלבת את טכניקות IP-Adapter מתקדמות אלו לתוך צינור הדור שלה, איזון אוטומטי של עקביות פנים עם וריאציה טבעית כך שתוכלו להתמקד בכיוון יצירתי במקום התצורה הטכנית.

אילו אסטרטגיות פריסה וקומפוזיציה מונעות זיווג דמויות?

תכנון קומפוזיציה קובע הצלחה או כשלון בייצור דמויות מרובות לפני שאתם אפילו מתחילים את ההגדרה הטכנית. עמדה אסטרטגית של דמויות יוצרת הפרדה טבעית המחזקת את אמצעי הרמתכנות העקביות שלכם.

כלל שליש מספק מסגרת התחלה מעולה לקומפוזיציות דו דמות. הציבו דמות A בקו השלישי שמאל ודמות B בקו השלישי ימין. רווח זה יוצר הפרדה מספקת כדי למזער זיווג תכונות תוך שמירה על איזון חזותי. הימנעו מהצבת דמויות קרוב מדי זו לזו, במיוחד אם הפנים שלהן יהיו בגדלים דומים בתמונה.

זרימות עבודה ComfyUI בחינם

מצא זרימות עבודה ComfyUI חינמיות וקוד פתוח לטכניקות במאמר זה. קוד פתוח הוא חזק.

100% בחינם רישיון MIT מוכן לייצור תן כוכב ונסה

שכבות עומק מציעות טכניקת קומפוזיציה חזקה נוספת. הציבו דמות אחת בבירור בחזית ואת השנייה בחציון או בחלק האחורי. הוודל בגודל וריאציית הפוקוס עוזרים לדגם להבין שאלו ישויות נפרדות. דמות בגובה 70 אחוז של קרא כנפרדת מזו ב -40 אחוז גובה, שפחתת הסבירות לערבוב תכונות.

אם כיוון פנים שולט בזרימת חזות ובעצמאות דמויות. הציבו דמויות פנים לעבר זו לזו לסצנות אינטראקציה, אך ודאו שהם תופסים אזורים מוגדרים בבירור. לחלופין, השתמשו בזוויות משלימות שבהן דמות אחת פונה שלוש רבע שמאל בעוד האחרת פונה שלוש רבע ימין. וריאציה זוויתית זו עוזרת לדגם להבחין בין נושאים.

הטבעה סביבתית קושרת כל דמות לאלמנטים ייחודיים בסצנה. הציבו דמות A ליד חלון עם הארה מסוימת בעוד דמות B עומדת ליד דלת עם הארה שונה. קוויים סביבתיים אלו מספקים הקשר נוסף המסייע בהפרדת דמויות קונספטואליות במהלך דור.

רשימת בדיקת קומפוזיציה
  • הפרדה אופקית מינימלית של 30 אחוז בין מרכזי דמויות
  • עמדות או סדרי גודל שונים אם אפשר
  • הארה ייחודית או הקשר סביבתי לכל דמות
  • היררכיה חזותית ברורה המבססת איזו דמות שולטת בסצנה
  • מרחב שלילי בין דמויות כדי למנוע חפיפה תכונות

הרזולוציה וצורת הקנווס משפיעים על עקביות דמויות משמעותית. יחסי גובה-רוחב רחבים יותר כמו 16:9 מספקים מטבעם יותר מרחק הפרדה אופקי. רזולוציות גבוהות יותר מאפשרות עריכה מעודנת יותר של תכונות בודדות, מה שהופך את הדגם להשומר דמויות ייחודיות. זמנו לפחות 1024 פיקסלים בממד הקטן שלכם בעת ייצור סצנות דמויות מרובות.

הקביעה של זריקה קובעת כמה פרטים מפורשים הדגם חייב לשמור לכל דמות. צילומים גוף מלא מפיצים תכונות על פני אזורים גדולים יותר, שפחתת הדיוק הנדרש לעקביות פנים אך הוספת מורכבות בpose וביגוד. קרובות או זריקות חזה מרכזות פרטים באזורים קטנים יותר, מה שהופך עקביות פנים ליותר קלה אך דורשת שליטה אזורית הדוקה יותר.

מורכבות רקע צריכה להיות פחות כאשר מורכבות דמויות גדלה. רקעים פשוטים, צבעי מעברים או אלמנטים סביבתיים רכים מונעים את הדגם מהקצאת תשומת לב לפרטי סצנה כשהוא צריך להתמקד בעקביות דמויות. שמור סביבות מורכבות לעבודה דמות יחידה או סצנות שבהן עקביות דמויות משנה פחות מהקומפוזיציה הכוללת.

אילו שלבי פתרון בעיות מתקנים בעיות דמויות מרובות נפוצות?

כאשר דמויות מתעערבות למרות ההגדרה הנכונה, פתרון בעיות שיטתי מזהה ופתר את הסיבה הגוררת. התחילו בבידוד משתנים כדי לקבוע איזה רכיב נכשל.

צרו כל דמות בנפרד תוך שימוש בLoRAs או IP-Adapter embeddings שלהם בהתאמה ללא ההגדרה של דמויות מרובות. אם דמויות בודדות נראות לא עקביות, חומרי המקור שלכם צריכים רפייה לפני ניסיון של דור משולב. הדרכו מחדש LoRAs עם מערכי נתונים עקביים יותר או בחרו תמונות ייחוס טובות יותר ל-IP-Adapter.

אם דמויות בודדות עובדות אך שילוב נכשל, הבעיה טמונה בטכניקת האינטגרציה שלכם. הוסיפו בהדרגה מורכבות החל ביומן שתי LoRAs במשקלים נמוכים וללא regional prompting. אם זה מייצר זיווג, הפחיתו משקלות עוד יותר או הגדילו הפרדה בקומפוזיציה שלכם. אם שילוב בסיסי עובד, הוסיפו regional prompting וחנו שוב.

דלף תכונות דמויות לעתים קרובות מצביע על הפרדה אזורית לא מספקת או אזורי conditioning חופפים. הגדילו את אזור המאגר בין prompting אזוריים והבטיחו שמסכות או הגדרות אזוריות לא חופפות. לחלופין, הגדילו את הקונטרסט בתיאורי ה-prompt שלכם כך שהדגם יקבל אותות הבדלה חזקים יותר.

בולטות דמויות לא מאוזנת מצביעה על צורך בהתאמת משקלות. אם דמות אחת כל הזמן מופיעה מעודנת או מיוצגת בדיוק יותר, הפחיתו את משקל ה-LoRA שלהם ב-0.1 והגדילו משקל הדמות האחרת ב-0.1. עשו התאמות קטנות וחנו ברחבות במקום לבצע שינויי משקלות דרמטיים.

בחירת דגם משפיעה על יכולת דמויות מרובות משמעותית. יש דגמים בסיסיים מסוימים המטפלים בנושאים מרובים טוב יותר מאחרים בשל הרכב נתוני הדרכה. Realistic Vision, Deliberate, ודגמי DreamShaper בדרך כלל מבצעים טוב עם דמויות מרובות. אם אתה חווה בעיות קבועות, בדוק דגמי בסיס שונים לפני סיום שהטכניקה שלך היא במקום האשמה.

שלבי דגימה ו-CFG scale דורשים התאמה לעבודת דמויות מרובות. הגדילו צעדי דגימה ל-35-50 כדי לתת לדגם יותר זמן איטרציה כדי לפתור אותות מתחרים מLoRAs או הטבעות מרובות. הנמיכו את CFG scale ל-6-8 כדי להפחית דיוק ל-prompt שעלול לגרום לייצוג דמויות קשה שמתערבב בצורה גרועה.

לבעיות מתקיימות עם שילובי דמויות ספציפיים, שקול ייצור סצנה בשלבים. צרו דמות A לבד בסצנה תחילה, ואז השתמשו בצביעה כדי להוסיף דמות B בעברה נפרדת. גישה מסודרת זו מאפשרת תשומת לב מודל מלאה לכל דמות בעצמאות, אם כי היא דורשת עבודה ידנית רבה יותר.

רוצה לדלג על המורכבות? Apatero מספק לך תוצאות AI מקצועיות מיד ללא הגדרות טכניות.

ללא הגדרה אותה איכות התחל ב-30 שניות נסה Apatero בחינם
לא נדרש כרטיס אשראי
טעות נפוצה אל תמשיכו בהגדלת משקלות LoRA או הטבעה כדי להכריח עקביות. משקלות גבוהים יותר מגדילים דיוק דמויות רק עד לנקודה, ולאחר מכן הם גורמים לאי-יציבות וזיהום צולב. אם משקל 0.7 לא עובד, הפתרון טמון בהפרדה אזורית טובה יותר או תכנון קומפוזיציה ולא דחיפה ל-0.9 או גבוה יותר.

מגבלות חומרה יכולות להתבטא כבעיות עקביות. ייצור דמויות מרובות עם regional prompting וLoRAs מוערמות דורש יותר VRAM מעבודה סטנדרטית דמות יחידה. אם אתה חווה קריסות או תוצאות שפופלות בחומרה נמוכה יותר, שקול שימוש ב-Apatero.com המטפל במורכבות חישובית תשתית מקצועית.

כיצד זרימות עבודה ComfyUI הופכות את דור דמויות מרובות לפשוט יותר?

זרימות עבודה ComfyUI מספקות הגישה החזקה והגמישה ביותר לעקביות דמויות מרובות דרך תכנות חזותי מבוסס צמתים. הבנת הצמתים והדפוסים ההסתברותיים העיקריים מאפשרים לכם לבנות זרימות עבודה שניתן לעיד שמטפלות בתרחישים בעקביות.

זרימת העבודה הבסיסית מתחילה עם צומות Load LoRA נפרדות לכל דמות. חברו כל אחת לצומת CLIP Text Encode שלה המכיל תיאור ספציפי של דמות זו. פלטוי conditioning אלה זנים לתוך צומות ConditioningSetArea שבהם אתם מגדירים אזורים מרחביים. התוצאות משתי צומות ConditioningSetArea אז משלבות דרך צומת ConditioningCombine לפני התחברות ל-sampler שלכם.

עבור זרימות עבודה IP-Adapter, החליפו או השלימו את צומות LoRA עם צומות IPAdapter. טענו את תמונות הייחוס שלכם דרך צומות LoadImage, ואז חברו אותם לצומות IPAdapter Apply. השתמשו בקלט המסכה בצומות IPAdapter כדי להגביל השפעת הטבעות פנים לאזורים ספציפיים, להשגת שליטה אזורית זהה לconditioning מבוסס טקסט.

IntegrationControlNet מוסיפה שכבה נוספת של שליטה. יצרו סקיצה קומפוזיציה או השתמשו ב-OpenPose כדי ליצור הפניות pose המציגות שתי דמויות. הזנו זה דרך צומת ControlNet Apply המשפיע על הדור כולו בעוד conditioning דמויות אזוריות שלכם שומרות על עקביות התבנית הבודדת. ה-ControlNet מטפל בעמדה בזוהי regional prompts מטפלות בתכונות.

זרימות עבודה Latent couple דורשות סידורי צמתים מורכבים יותר אך מספקות הפרדה עליונה. השתמשו בצומת LatentComposite כדי לחלק את מרחב ההמתנה שלכם לאזורים. עיבדו כל אזור דרך צומות sampler נפרדות עם conditioning שונה לפני מיזוג אחורה ביחד. גישה זו מונעת כל אינטראקציה בין דרכי ייצור דמויות עד שלב הקומפוזיציה הסופי.

הרחבת Attention Couple מוסיפה צמתים המשנים משקלי תשומת לב במהלך דור. יצרו מסכות תשומת לב המציגות היכן כל דמות מופיעה, ואז השתמשו במסכות אלו כדי להגביר או להדכיא תשומת לב באזורים מיועדים. זה מחזק את regional prompting שלכם על ידי כך שעליו משנה בפועל כיצד הדגם מקצה כוח עיבוד על פני הקנווס.

יעילות זרימת עבודה משתפרת דרך קבוצות צמתים ורכיבים שניתן לעיד. בנו מודול דמות המכיל צומות LoadLoRA, CLIPTextEncode, וConditioningSetArea המוגדרות לדמות אחת. שמרו זאת כקבוצה, ואז הצמיד שתי עותקים לשתי הדמויות שלכם. התאימו את הגדרות האזור וטקסט ה-prompt תוך שמירה על קביעות המבנה הכוללת.

זרימות עבודה מתקדמות מיישמות שיפור איטרטיבי שבו דור ראשוני מבססת קומפוזיציה, ואז עברות עוקבות משפרות כל דמות בנפרד תוך שימוש בטכניקות img2img. העברה הראשונה משתמשת ב-LoRAs משקל נמוך כדי ליצור קומפוזיציה גסה. העברה השנייה מסכה את אזור דמות A ומעבדת אותו עם LoRA של דמות A במשקל גבוה יותר. העברה השלישית עושה את אותו הדבר עבור דמות B.

עבור אנשים מקצוע המנהלים פרויקטים מרובים עם זוגות דמויות חוזרים, זרימות עבודה פרמטריות חוסכות זמן ענק. יצרו תבניות זרימת עבודה שבהן LoRAs דמויות, הטבעות, גבולות אזוריים, ואלמנטים של prompt טענו מקובצים חיצוניים או צומות תצורה. זה מאפשר לכם להחליף הגדרות דמויות ללא סיכום שוב של מבנה זרימת העבודה כולו.

בזוהי ComfyUI מספקת שליטה והגמישות ללא השוואה, עקומת הלמידה יכולה להיות תלולה ליוצרים הרוצים תוצאות יותר מהשגת טכנית. פלטפורמות כמו Apatero.com מספקות עקביות וחיוני שווה ערך דרך זרימות עבודה משופרות בזהירות ללא דורוש ממשתמשים להבין תכנות מבוסס צמתים או פרטי תצורה טכניים.

אילו שיטות חלופיות קיימות מעבר LoRA ו-IP-Adapter?

מספר טכניקות חדשות וגישות חלופיות מציעות פשרות שונות לדור דמויות מרובות. הבנת אפשרויות אלו עוזרת לכם לבחור את הכלי הנכון לתרחישים ספציפיים.

הדרכת DreamBooth במערכי נתונים של דמויות מרובות מספקת עקביות על ידי הוראת הדגם שדמויות אלו קיימות בטבעיות. במקום הדרכה LoRAs נפרדות לכל דמות, אתה מאמן נקודת ביקורת דגם יחידה בתמונות המציגות שתי דמויות ביחד. גישה זו עובדת הכי טוב כאשר יש לכם נתונים אימון נרחבים המציגים את זוג הדמויות במצבים שונים.

הצטרף ל-115 חברי קורס אחרים

צור את המשפיען הראשון שלך עם AI בריאליזם מלא ב-51 שיעורים

צור משפיענים AI ריאליסטיים במיוחד עם פרטי עור אמיתיים, סלפי מקצועיים וסצנות מורכבות. קבל שני קורסים מלאים בחבילה אחת. ComfyUI Foundation לשליטה בטכנולוגיה, ו-Fanvue Creator Academy ללמוד כיצד לשווק את עצמך כיוצר AI.

התמחור המוקדם מסתיים בעוד:
--
ימים
:
--
שעות
:
--
דקות
:
--
שניות
51 שיעורים • 2 קורסים מלאים
תשלום חד-פעמי
עדכונים לכל החיים
חסוך $200 - המחיר עולה ל-$399 לתמיד
הנחת רוכש מוקדם לסטודנטים הראשונים שלנו. אנחנו כל הזמן מוסיפים יותר ערך, אבל אתה נועל $199 לתמיד.
מתאים למתחילים
מוכן לייצור
תמיד מעודכן

הטבעה טקסטואלית יוצרת אסימוני הטבעה המייצגים כל דמות ללא הדרכה דגם מלאה. הטבעות אלו בדרך כלל בעלות השפעה פחות מLoRAs, מה שהופכים אותם בטבעיות יותר תואמות כאשר משלבים. אתה יכול ערום הטבעות הטבעה טקסטואליות מרובות עם סיכון נמוך יותר של זיווג תכונות, אם כי אתה מקריב עקביות כלשהו בהשוואה ל-LoRAs.

מצב ייחוס דמות ControlNet מציע עקביות דרך הנחיית pose והופעה גסה ללא הדורוש להדרכה LoRA. ספקו תמונת ייחוס המציגה דמות A, וControlNet יינסה להתאים את הופעת הדמות הזו בדור. השתמשו בעברות ControlNet נפרדות או דגמים לשתי דמויות, כל אחת עם תמונת ייחוס משלה.

זרימות עבודה של סקיצה וצביעה מניבות שליטה ידנית על גבולות דמויות. צרו קומפוזיציה גסה המציגה היכן דמויות צריכות להופיע, ואז השתמשו בצביעה כדי לעדן כל דמות בנפרד עם LoRAs או הטבעות ספציפיות שלהן. גישה ידנית זו מבטיחה הפרדה מוחלטת אך דורשת זמן וכישור אמנותי רביו.

החלפת פנים בעיבוד לאחר דור מספקת fallback כאשר טכניקות דור אינן שומרות על עקביות. צרו סצנת דמויות מרובות שלכם בטכניקות הזמינות הטובות ביותר, ואז השתמשו בכלים להחלפת פנים כדי להחליף פנים בגרסאות ייחוס עקביות. בזוהי גישה עובדת, היא מרגישה כמו הודה בהפסד בחזית דור ועלולה להייצר חפצים גלויים אם לא בוצע בקרינות.

שיטות העברת סגנון יכולות לאחד דמויות מדורים נפרדים. צרו כל דמות בדור בודד שבו עקביות קלה להשגה. השתמשו בכלים לעריכת תמונות כדי להרכיב אותם לקנווס יחיד, ואז הפעל העברת סגנון או img2img בעוצמה נמוכה כדי לתערבב אותם לסצנה מושלמת. זה עובד במיוחד טוב עבור תוכן בעיבוד או סגנון.

כלים לעריכה בסיוע בינה מלאכותית מתעוררים המבינים זהות דמויות על פני תמונות. בזוהי פותחו בעיקר לעקביות וידאו, כמה מכלים אלו עובדים עם תמונות עדיין המכילות דמויות מרובות. הם מנתחים כל דמות בנפרד ומחילים התאמות עקביות כדי לשמור על זהויות בודדות תוך שמירה על קוהרנציה סצנה.

המציאות המעשית היא שעקביות דמויות מרובות נשארת קשה אפילו עם טכניקות מתקדמות. ליוצרים המעדיפים תוצאות על עקומת למידה, שירותים כמו Apatero.com מספקים גישה לזרימות עבודה מתוחכמות אלו עם ממשקים פשוטים, המאפשרים לכם ליצור סצנות דמויות עקביות דרך prompting פשוט במקום תצורה טכנית.

כיצד אתה שומר על עקביות סגנון על פני שתי הדמויות?

עקביות סגנון מציגה אתגר נפרד מעקביות דמויות. אפילו כאשר תכונות פנים וריצה נשארות יציבות, סגנונות אומנות לא תואמים בין דמויות יוצרים קומפוזיציות בעלות לא תיאם שנראות כמו עבודות פוטושוף גרועות במקום סצנות קוהרנטיות.

LoRAs של סגנון צריכים להחיל גלובלי במקום באופן אזורי. בשונה מLoRAs דמויות הדורשות הפרדה מרחבית, סגנון האומנות שלכם צריך להשפיע על הקנווס כולו שווה. הציבו סגנונות LoRAs אחרונים בסדר הטעינה שלכם כך שהם משנים עיבוד שתי הדמויות לאחר שתכונות דמויות בודדות מבוססות.

בחירת הדגם הבסיסי קובעת את יסוד סגנון הבסיס שלכם. בחרו דגמים המצטיינים בסגנון האומנות שאתם מכוונים. עבודה של צילום אמנות אמיתית צריכה להשתמש בדגמים כמו Realistic Vision או CyberRealistic. סגנונות אנימה או מוצגים עובדים טוב יותר עם דגמים כמו Anything V5 או CounterfeitV3. התחלה עם דגם הבסיס הנכון מפחיתה את עבודת הסגנון ש-LoRAs שלכם חייבים להשיג.

עקביות הארה מאחדת דמויות על פני גבולות סגנון. ודאו ששתי ה-regional prompts כוללות תיאורי הארה דומים. אם דמות A יש "אור חלון רך משמאל," דמות B צריכה להתייחס להארה תואמת כמו "הארה אזוריית עדינה" במקום תנאים סותריים כמו "זרקור קשה." הארה עקבית אומרת לדגם לעיבוד שתי הדמויות כחלק מאותה סביבה פיזית.

דירוג צבע דרך prompts עוזר לשמור על הרמוניה חזותית. כללו תיאורי טון צבע כוללים החלים על הסצנה כולה במקום תכונות ספציפיות לדמויות. תנאים כמו "צבע חם," "טונים בחצוצים," או "צבעים תוססים" בטבעות base prompt משפיעים על שתי הדמויות בו זמנית.

התאמות לאחר דור יכולות להצליל אי-עקביות סגנון שחלנו במהלך דור. השתמשו בכלים לעריכת תמונות כדי להחיל תיקון צבע אחיד, הבהירות, או השפעות פילטר על פני התמונה כולה. שלב עיבוד אחיד לעתים קרובות מערבב דמויות יותר בעיל מאשר ניסיון להשלים התאמה סגנון במהלך דור.

preprocessors של ControlNet כמו צבע ועומק יכול לחלץ וליישום מחדש מידע סגנון על פני דמויות. צרו את תמונת דמויות מרובות ראשונית שלכם, ואז הפעל אותה דרך preprocessor צבע ControlNet כדי לחלץ התפלגות הצבע. השתמשו בזה כהנחיה לעברה דור עוקבת המאחדת סגנון תוך שמירה על זהויות דמויות.

עדיפות מבנה Prompt חשובה לשמורה סגנון. הציבו תיאורי סגנון רחבי סצנה בתחילת ה-prompt שלכם שבו הם מקבלים משקל מקסימלי. עקבו עם פרטי הופעה ספציפיים לדמויות. סדר זה אומר לדגם שעקביות סגנון מחוברת שינוי דמויות בהיררכיית חשיבות.

שאלות שנשאלות בתדירות

האם אתה יכול להשתמש ביותר משתי LoRAs דמות בו זמנית?

אתה יכול מבחינה טכנית ערום שלוש או יותר LoRAs דמות, אך שיעורי הצלחה ירדו בחדות עם כל דמות נוספת. האותות המתחרים הופכים לקשים יותר להיות מאוזנים, ו-regional prompting הופך למורכב יותר. רוב זרימות העבודה מגיעות לשיא בשתי דמויות עם עקביות אמינה. עבור סצנות הדורשות שלוש דמויות או יותר, שקול ייצור בעברות נפרדות וקומפוזיציה, או שימוש ב-Apatero.com המטפל בתרחישים דמויות מרובות מורכבים דרך צינורות עיבוד משופרים.

איזה משקל LoRA עובד הכי טוב לסצנות דו דמות?

התחילו במשקל 0.5 לכל LoRA דמות והתאימו על בסיס תוצאות. אם דמות אחת שולטת, הפחיתו את משקלם ל-0.4 והגדילו את האחרת ל-0.6. המשקל המשולב הכולל של כל LoRAs דמויות צריך בדרך כלל להיות מתחת ל-1.2 כדי להימנע מלהעמיס את הדגם הבסיסי. משקלות נמוכים יותר סביב 0.3 עד 0.4 עובדים טוב יותר בשילוב שלוש או יותר LoRAs, אם כי עקביות סובלת עם כל דמות נוספת.

האם אתה צריך prompts נפרדים לכל אזור דמויות?

Prompts אזוריים נפרדים משפרים משמעותית עקביות ויש להתחשבו כעיקרי לדור דמויות מרובות אמין. לכל דמות צריך טקסט תיאורי משלה המציין הופעה, pose, ביטוי, וביגוד ללא הפרעה מתיאור הדמות האחרת. Prompts גלובליים המתאר שתי דמויות ביחד מייצרים תוצאות נחות עם זיווג תכונות תדיר.

כיצד אתה מונע דמויות בעל אותו פנים?

השתמשו ב-LoRAs דמויות מובחנת מספיקה המאומנות על נושאים בבירור שונים, מיישם boundaries strict regional prompting, ושקול הוספת הטבעות פנים IP-Adapter עם פנים ייחוס שונות. הבעיה לעתים קרובות נובעת מLoRAs שלא הודרכו בצורה מובחנת מספיקה. אם מניעה נכשל, החלפת פנים בעיבוד לאחר דור יכול לשנות דמויות.

מה ההימדה המינימלית לסצנות דמויות עקביות שתיים?

צרו לפחות 1024 פיקסלים בממד הקטן ביותר להפרדה דמויות אמינה ופרט. תמונות רחבות יותר כמו 1024x768 או 1280x768 עובדים טוב יותר מעיצורים רבועים לשתי דמויות כיוון שהם מספקים יותר מרחב הפרדה אופקי. רזולוציות גבוהות יותר כמו 1280x896 או 1536x864 משפרות עקביות עוד יותר אך דורשות יותר VRAM וזמן דור.

האם אתה יכול להשתמש בLoRAs דמות ממקורות הדרכה שונים ביחד?

כן, LoRAs מאימוני או שיטות הדרכה שונים יכולים להשלב בהצלחה כל עוד הם תואמים לדגם הבסיסי שלך. הגורמים העיקריים הם חוזק LoRA יחסי והפרדה אזורית מספקת. ייתכן שתצטרך התאמת משקלות רבות יותר כדי להיות מאוזנים LoRAs המודרכים בטכניקות שונות, כיוון שיש גישות הדרכה מסוימות המייצרות אפקטים חזקים או חלשים יותר מאחרות.

האם דגם הבסיס חשוב לעקביות דמויות מרובות?

בחירת דגם בסיסי משפיעה משמעותית על שיעורי הצלחה דמויות מרובות. דגמים מודרכים ב-datasets מגוונים עם תמונות רבות ב-multi-person טיפלו בהפרדה דמויות טוב יותר מדגמים המודרכים בעיקר בדיוקי נושא יחיד. Realistic Vision, Deliberate, ו-DreamShaper בדרך כלל בצעו טוב עם דמויות מרובות, בזוהי חלק מדגמים מיוחדים נוגדים.

כמה צעדי דגימה דורים דמויות דו צריכים?

השתמשו 35 עד 50 צעדי דגימה לעבודת דמויות מרובות בהשוואה ל-20 עד 30 טיפוסי לדמויות יחידות. המורכבות הנוספת דורשת יותר איטרציות לדגם כדי לפתור אותות מתחרים ולייצר תוצאות ניקיות. ספירות שלב קיצוניות גבוהות מעל 60 לעתים קרובות שיפור איכות מספיקות כדי להצדיק את השקעת הזמן.

האם אתה יכול לערבב סגנונות דמויות מציאותיים ואנימה באותה תמונה?

ערבוב סגנונות בעיקרון שונים בתמונה יחידה הוא שימושי מבחינה טכנית אך לעתים קרובות מייצר תוצאות לא יפות מבחינה אסתטית. דגם הבסיס ינסה להשמר בין סגנונות, לעתים קרובות יוצר קרקום בינוני שנראה לא נכון. עבור פרויקטים הדורשים סגנונות מעורבים, צרו דמויות בנפרד וקומפוזיציה, או עבוד עם שירותים כמו Apatero.com שיכול לעזור למערבב אלמנטים דספרטיים בצורה טבעית יותר.

מה אתה צריך לעשות כאשר דמויות מתעערבות ללא קשר למה שתנסו?

אם כל פתרונות טכניים נכשלים, צרו כל דמות בנפרד בתמונות נפרדות עם קומפוזיציה זהה, הארה, והנחיית pose. ואז השתמשו בתוכנת עריכת תמונות כדי להרכיב אותם לסצנה יחידה ידנית. גישה מובטחת הצלחה זו מסחרת נוחות דור לעבודה ידנית אך מייצרת תוצאות אמינות כאשר טכניקות אוטומטיות נכשלות. לחלופין, פלטפורמות כמו Apatero.com מטפלות בתרחישים מאתגרים אלו דרך זרימות עבודה מתמחות שממוצעי משתמשים לא צריכים להגדיר בעצמם.

סיכום

ייצור שתי דמויות עקביות באותה תמונה דוחף ייצור תמונות בינה מלאכותית לגבולות שלה, דורש שילוב של טכניקות טכניות ואסטרטגיה קומפוזיציונית. הצלחה באה מהבנה שדמויות מרובות יוצרות אותות מתחרים תוך תהליך דור, והעבודה שלכם היא למזער קונפליקט דרך התקנה זהירה.

הגישה האמינה ביותר משלבת LoRAs דמויות ספציפיות במשקלים מופחתים עם strict regional prompting כדי להפריד אזורים דמויות מרחביים. הוספת הטבעות פנים IP-Adapter מספקת שכבת עקביות נוספת המחזקת זהות דמויות ללא הפרעה לקומפוזיציה כוללת. תכנון פריסה אסטרטגי המעמיד דמויות עם הפרדה ברורה מונע זיווג תכונות המטריד ניסיונות קומפוזיציה מתוכננים בצורה גרועה.

בזוהי טכניקות אלו עובדות בעיל יישום נכון, הן דורשות הרבה ידע טכני וניסוי סבלני כדי לשלוט. זרימות עבודה ComfyUI מספקות בקרה גדולה ביותר אך באות עם עקומת למידה תלולה. ליוצרים הרוצים תוצאות דמויות מרובות מקצועיות ללא הפיכה למהנדסי דור, Apatero.com מספק טכניקות עקביות מתוחכמות שוות דרך ממשקי prompting פשוטים.

תובנה מפתח היא שעקביות דמויות מרובות ניתנת לפתרון אך לא אוטומטית. כל דמות נוספת מכפילה מורכבות באופן אקספוננציאלי. מקדו את עבודת הדמויות המרובות בסצנות חיוניות למעשה שבהן האינטראקציה מצדיקה את המאמץ, והשתמשו בדור דמות יחידה לכל שאר.

כאשר אתה מפתח זרימות עבודה דמויות מרובות, זכור כי תוצאות לא מושלמות יכולות להיות מושלמות עם התאמות עיבוד קטנות. דור שמקבל 90 אחוז מהדרך יכול להיות מלוטש לשלמות עם התאמות ידניות קטנות, מה שהופך זה מיותר לרדיפה של 10 אחוז האחרונים דרך מאות דורים. סיעור טכנית מושלמת עם יעילות מעשית, וסצנות דמויות מרובות שלכם יספרו את הסיפורים שעבודת דמות יחידה אפילו לא יכלה.

מוכן ליצור את המשפיען AI שלך?

הצטרף ל-115 סטודנטים שמשתלטים על ComfyUI ושיווק משפיענים AI בקורס המלא שלנו בן 51 שיעורים.

התמחור המוקדם מסתיים בעוד:
--
ימים
:
--
שעות
:
--
דקות
:
--
שניות
תפוס את מקומך - $199
חסוך $200 - המחיר עולה ל-$399 לתמיד