What will I learn from this ai image generation tutorial?

2025年決定版のLoRA trainingガイド。ヘッドショットとボディショットの最適なdataset配分、実証済みのtraining戦略、100枚以上のimageを使った実際の結果を学べます。 This comprehensive guide covers all the essential concepts and practical steps you need to master ai image generation.

Is this ai image generation tutorial suitable for beginners?

This tutorial is designed to be accessible for learners at various skill levels. We provide clear explanations and step-by-step instructions to help you understand ai image generation concepts effectively.

How long does it take to complete this ai image generation tutorial?

This tutorial has an estimated reading time of 7 minutes. However, we recommend taking additional time to practice the concepts and techniques covered to fully master the material.

Where can I find more ai image generation tutorials and resources?

You can find more ai image generation tutorials in our AI Image Generation category section. We also recommend exploring our related articles and following our blog for the latest updates on ai image generation techniques and best practices.

/ AI Image Generation / LoRA Training完全ガイド 2025 - ヘッドショットとボディショットは実際に何枚必要?

AI Image Generation • October 16, 2025 • 7 分で読めます

LoRA Training完全ガイド 2025 - ヘッドショットとボディショットは実際に何枚必要?

2025年決定版のLoRA trainingガイド。ヘッドショットとボディショットの最適なdataset配分、実証済みのtraining戦略、100枚以上のimageを使った実際の結果を学べます。

初めてのキャラクターLoRAをtrainingしようとしているけど、ネット上の情報がバラバラで困っていませんか?あるチュートリアルでは5〜10枚の画像で十分と言い、別のものでは200枚以上必要だと主張しています。ヘッドショットとフルボディショットの割合についても、誰も意見が一致しません。さらに、SFWとNSFWの両方に対応したLoRAをtrainingしたい場合はどうすればいいのでしょうか?

20枚から200枚以上まで、さまざまなサイズのdatasetで数十回のtrainingを実施した結果、実際に機能するものについて明確なパターンが見えてきました。真実は?datasetのサイズと構成は非常に重要ですが、最適な設定はLoRAに何をさせたいかによって完全に異なります。

このガイドでは、一貫した高品質な結果を生み出すLoRA training datasetの構築について、実証済みの実践的な戦略を紹介します。trainingしたLoRAをComfyUIのworkflowで使用する方法については、ComfyUI基礎ガイドと必須custom nodesをご覧ください。

ComfyUIを学習中？他の115人の受講生に参加

ComfyUI + AIインフルエンサーマーケティングをカバーする51レッスン。早期割引終了間近。

この記事で学べること: さまざまなLoRAタイプと用途に応じた最適なdatasetサイズ、目標に基づいた完璧なヘッドショット対ボディショットの比率、顔のみ、全身、多目的LoRAの実証済みtraining戦略、SFW/NSFWキャラクター一貫性のための100枚以上のimage datasetの構造化方法、overfittingを防ぎ品質を向上させるdataset準備テクニック、具体的な画像枚数と構成を使った実際のtraining結果。

LoRA Trainingの基礎を理解する - 本当に重要なこと

datasetの詳細に入る前に、LoRAが何を学習しているのかを理解することで、training dataの構成について適切な判断ができるようになります。

LoRAが実際に学習すること: LoRA(Low-Rank Adaptations)は、training dataに特有のパターンを捉えることで、base modelの出力を修正することを学習します。顔の特徴、体のプロポーション、服のスタイル、照明の好み、そしてdatasetに存在する芸術的な特性を学習しているのです。

これらのパターンがより一貫して現れるほど、LoRAはそれをより良く捉えて再現します。

Dataset構成が重要な理由:

Dataset特性	LoRAへの影響	Trainingの考慮事項
Image枚数	一貫性の強度	より多くのimage = より良い一貫性(ある程度まで)
アングルの多様性	ポーズの柔軟性	より多くのアングル = より汎用的な出力
一貫した被写体	アイデンティティの保持	同じ被写体 = より良いキャラクター保持
多様な背景	シーンの柔軟性	さまざまな背景 = より良い適応性
服装のバリエーション	スタイル範囲	より多くの多様性 = 服装overfittingの減少

Overfitting問題: 似たようなimageが多すぎるとoverfittingが発生します。これは、LoRAが一般的なキャラクター特徴を学習するのではなく、特定の写真を記憶してしまうことです。これにより、training dataとは異なるシーンを生成しようとすると問題が発生します。

アングル、照明、コンテキストの多様性は、キャラクターの一貫性を維持しながらoverfittingを防ぎます。

品質 vs 数量: 高品質で、よく構成され、バリエーションのある10枚のimageは、ほぼ同一の自撮り写真50枚よりも優れたパフォーマンスを発揮します。品質、多様性、一貫性は、単純なimage枚数よりも重要です。

これは、より多くのimageが役に立たないという意味ではありません。ランダムなimageをtrainingに投入しても、より良い結果は得られないという意味です。

Training時間とリソース:

Datasetサイズ	Training時間(RTX 3090)	必要VRAM	ストレージ	コスト(クラウド)
20 images	30-60分	10-12GB	100-200MB	$2-5
50 images	1-2時間	12-16GB	250-500MB	$5-10
100 images	2-4時間	16-20GB	500MB-1GB	$10-20
200+ images	4-8時間	20-24GB	1-2GB	$20-40

これらのリソース要件を理解することで、training runを効果的に計画できます。VRAMが限られている場合は、最適化戦略について完全なlow-VRAM survival guideをご覧ください。

trainingインフラを管理せずに優れたLoRAを作成したいユーザーには、Apatero.comのようなプラットフォームが、自動最適化機能を備えた合理化されたtrainingインターフェースを提供しています。

実証済みの公式 - 実際に機能するDatasetサイズ

数十回のtraining runにわたる広範なテストに基づいて、さまざまなLoRAタイプで一貫して高品質な結果を生み出すdataset構成を紹介します。

顔のみのLoRA(ヘッドショット/ポートレートのみ): 目標がヘッドショットとハーフレングスポートレートの生成であれば、全身画像は必要ありません。完全に顔の一貫性に焦点を当てましょう。

最適な設定: 100枚以上の顔に焦点を当てたimage

70-80枚のクローズアップヘッドショット(肩から上)
20-30枚のハーフレングスポートレート(腰から上)
表情、アングル、照明のバリエーション
すべてのimageで一貫した被写体

実際の結果: テストでは、100枚以上の顔画像が、さまざまなprompt、スタイル、コンテキストで優れた顔の一貫性を生み出しました。LoRAは、さまざまなシーンで認識可能なキャラクターの顔を確実に生成します。極度の一貫性が必要なビジュアルノベルのキャラクター作成については、VNCCSガイドもご覧ください。

小さなdataset(20-30枚の顔画像)でも機能しましたが、一貫性が弱く、顔の特徴がずれることがありました。

全身LoRA(完全なキャラクター): 頭からつま先まで一貫したキャラクター外見で全身画像を生成するには、体のプロポーションのtraining dataが必要です。

最適な設定: 100枚以上の合計imageを50/50で分割

50枚以上のヘッドショットとクローズアップポートレート
50枚以上の全身ショット(頭からつま先まで見える)
ポーズ、服装、コンテキストのミックス
すべてのimageで一貫したキャラクター

50/50分割が機能する理由: このバランスの取れたアプローチにより、LoRAはクローズアップから顔の詳細を学習し、全身ショットから体のプロポーションを理解します。どちらかのタイプに偏りすぎると、弱点が生まれます。

ヘッドショットが多すぎると、LoRAは体の生成に苦労します。全身ショットが多すぎると、顔の一貫性が損なわれます。

多目的LoRA(SFW + NSFW): SFWとアダルトコンテンツの両方を扱い、一貫したキャラクター表現を実現するLoRAの場合、datasetの分離とボリュームが非常に重要です。

最適な設定: 200枚以上の合計imageをコンテンツタイプ別に分割

100枚以上のSFW images(50枚以上のヘッドショット、50枚以上のボディショット)
100枚以上のNSFW images(50枚以上のヘッドショット、50枚以上のボディショット)
各カテゴリー内でアングルと多様性のバランスを維持
すべてのimageで同じキャラクター

NSFW Trainingにより多くのImageが必要な理由: modelはNSFWの構成についての既存知識が少ないため、キャラクターの一貫性を維持しながらこれらのパターンを学習するには、より多くのtraining dataが必要です。

100/100の分割により、どちらかのカテゴリーにoverfittingすることなく、両方のコンテンツタイプの適切な表現が保証されます。

テスト結果:

Datasetタイプ	Image枚数	顔の一貫性	体の一貫性	汎用性	全体的な品質
顔のみ	100枚以上の顔	優秀	N/A	中程度	ヘッドショットに優秀
全身	50/50分割(合計100枚)	優秀	優秀	高い	全体的に優秀
SFW+NSFW	100/100分割(合計200枚)	優秀	優秀	非常に高い	両カテゴリーで優秀
小規模dataset	20-30 images	良好	弱い	低い	使用可能だが限定的

最小限の実行可能Dataset: 100枚以上のimageが最適ですが、20-30枚の高品質で多様なimageで使用可能なLoRAをtrainingできます。一貫性が弱く、汎用性も低くなることを期待してください。ただし、LoRAは基本的なキャラクター特徴を捉えます。

この最小限のアプローチは、個人プロジェクトや実験には有効ですが、プロフェッショナルや商業的な作業には推奨されません。

Dataset準備 - Training Setの構築

品質の高いdataset準備は、数量と同じくらい重要です。優れたLoRAを生み出すtraining setの構築方法を紹介します。

Image選択基準:

基準	重要な理由	実装方法
一貫した被写体	アイデンティティの保持	すべてのimageで同じ人物/キャラクター
さまざまなアングル	ポーズの柔軟性	正面、3/4、横、後ろのビュー
異なる表情	感情の範囲	幸せ、ニュートラル、真剣など
多様な照明	照明への適応	自然光、スタジオ、ドラマチック、ソフト
複数の衣装	服装overfittingの回避	少なくとも5-10種類の異なる衣装
クリーンな背景	被写体への焦点	背景の複雑さを最小限に

Aspect Ratio分布: 最新のLoRA trainingは複数のaspect ratioを扱います。LoRAの使用方法に合わせてtraining dataを変化させましょう。

推奨分布:

40% 正方形(1:1) - ヘッドショット、クローズアップ
30% ポートレート(3:4または2:3) - 全身立ち姿
20% ランドスケープ(4:3または3:2) - 全身アクション
10% 超ワイドまたは超縦長 - クリエイティブな構図

Image品質要件:

無料のComfyUIワークフロー

この記事のテクニックに関する無料のオープンソースComfyUIワークフローを見つけてください。オープンソースは強力です。

100%無料 MITライセンス本番環境対応スターを付けて試す

品質要素	最小	推奨	注記
解像度	512x512	1024x1024以上	高いほど良い
フォーカス	シャープな被写体	完璧にシャープな被写体	ぼやけはtrainingを劣化させる
照明	特徴が見える	よく照らされ、明確なディテール	濃い影を避ける
圧縮	軽いJPEG	PNGまたは高品質JPEG	圧縮アーティファクトを避ける

Training Dataで避けるべきこと: 重度にフィルターをかけたり編集したりしたimageは含めないでください。Instagramのフィルターはtrainingを混乱させます。単一の被写体にトリミングできない限り、複数の人が写っているimageは避けましょう。被写体が部分的に隠れているか、切り取られているimageはスキップしてください。低解像度または重度に圧縮されたimageは除外してください。

Datasetのキャプショニング:

キャプショニングアプローチ	利点	欠点	最適な用途
自動キャプショニング(BLIP)	高速、一貫性	一般的な説明	大規模dataset
手動キャプショニング	正確、詳細	時間がかかる	品質重視
ハイブリッドアプローチ	バランスが取れている	中程度の労力	ほとんどのプロジェクト

ディレクトリ構造: training toolsのためにdatasetを論理的に整理しましょう。training_datasetフォルダを作成し、headshots、body_shots、sfw、nsfwカテゴリーのサブフォルダを作成します。各imageファイルには、同じ名前の.txtキャプションファイルが対応している必要があります。

ほとんどのtraining toolsは、同じディレクトリ内のimageと対応する.txtキャプションファイルを期待しています。

実際に重要なTraining Parameters

dataset構成を超えて、training parametersはLoRAの品質に大きく影響します。一貫して良い結果を生み出す実証済みの設定を紹介します。

コアTraining Parameters:

Parameter	小規模Dataset(20-30)	中規模Dataset(50-100)	大規模Dataset(100以上)
Training steps	1000-1500	2000-3000	3000-5000
Learning rate	1e-4から5e-4	5e-5から1e-4	1e-5から5e-5
Batch size	1-2	2-4	4-8
Network rank	8-16	16-32	32-64
Network alpha	8	16	32

Learning Rateの影響: Learning rateは、LoRAがtraining dataから学習する積極性を制御します。高すぎるとoverfittingと不安定性を引き起こします。低すぎると、多くのstepsでも学習が不十分になります。

控えめなlearning rate(1e-4)から始めて、overfittingを防ぐために大規模datasetでは減少させます。

Step数の決定: 合計stepsの計算式: (image枚数 × epochs) / batch_size

100枚のimageで30 epochs、batch size 2の場合: (100 × 30) / 2 = 1500 steps

ほとんどのtraining toolsは、epoch設定に基づいてこれを自動的に計算します。

Network Rankの説明:

Rank	Trainingされるparameters	Training時間	品質	ファイルサイズ
8	最小限	高速	良好	小(約10MB)
16	低い	中程度	より良い	中(約20MB)
32	中程度	遅い	優秀	標準(約40MB)
64	高い	非常に遅い	収穫逓減	大(約80MB)

高いrankはLoRAがより複雑な特徴を学習できますが、overfittingを避けるためにより多くのtraining dataが必要です。

Training Platform比較:

Platform	使いやすさ	コントロール	コスト	最適な用途
Kohya GUI(ローカル)	中程度	完全	無料(GPU コスト)	技術的なユーザー
CivitAI training	簡単	限定的	クレジットベース	初心者
Apatero.com	非常に簡単	最適化済み	サブスクリプション	プロフェッショナルな作業
Google Colab	中程度	高い	無料/有料	実験

Training進捗のモニタリング: overfittingの兆候に注意してください。training lossがゼロに近づく一方でvalidation lossが増加する場合は、overfittingを示しています。数百stepsごとにsample生成を行い、学習の進捗を視覚化します。

sampleの品質が横ばいになったらtrainingを停止してください。追加のstepsでは結果は改善されません。

複雑さをスキップしたいですか？ Apatero は、技術的なセットアップなしでプロフェッショナルなAI結果を即座に提供します。

セットアップ不要同じ品質 30秒で開始 Apateroを無料で試す

クレジットカード不要

よくあるTrainingミスとその回避方法

経験豊富なクリエイターでも、LoRAの品質を低下させるtrainingミスを犯すことがあります。最も一般的な問題とその解決策を紹介します。

ミス1 - Datasetの多様性不足:

問題	症状	解決策
すべて同じアングル	1つの視点からのみ機能	正面、3/4、横、後ろのアングルを含める
同じ衣装	LoRAが常にその衣装を生成	5-10種類以上の異なる衣装を使用
似た背景	特定のシーンにoverfit	背景を大幅に変える
同一の表情	限定的な感情範囲	さまざまな表情を含める

ミス2 - 似たようなImageが多すぎることによるOverfitting: 100枚のほぼ同一の自撮り写真でtrainingすると、その特定のポーズと照明でのみ機能するLoRAが生成されます。modelは、キャラクター特徴を学習するのではなく、写真を記憶します。

解決策: 一貫したキャラクター表現の中で最大の多様性を実現するようにdatasetをキュレーションします。

ミス3 - 一貫性のない被写体: 単一のdatasetで複数の異なる人物やキャラクターを使用すると、trainingが混乱します。LoRAはすべての被写体を同時に学習しようとし、一貫性のない結果を生み出します。

解決策: 1つのLoRA = 1つの被写体。異なるキャラクターには別々のLoRAをtrainingします。

ミス4 - 間違ったLearning Rate:

Learning Rate	結果	修正
高すぎる(1e-3以上)	不安定なtraining、overfitting	1e-4以下に減少
低すぎる(1e-6)	学習不十分	5e-5から1e-4に増加

ミス5 - Training Metricsの無視: loss曲線を監視せずにtrainingを盲目的に実行すると、最適でない結果につながります。Trainingは完了前にずっと早くoverfitする可能性があるか、当初計画されていたよりも多くのstepsが必要になる場合があります。

解決策: 200-500 stepsごとにsample outputsをチェックし、loss曲線を監視します。

ミス6 - 低品質のソースImage:

品質問題	影響	解決策
低解像度	ぼやけたLoRA出力	1024px以上のソースimageを使用
重い圧縮	生成時のアーティファクト	PNGまたは高品質JPEGを使用
悪い照明	一貫性のない特徴	よく照らされたソースimageのみ

ミス7 - 複雑さに対してDatasetが小さすぎる: 20枚のimageで、マルチスタイル、マルチ衣装、マルチコンテキストのLoRAをtrainingしようとしても、modelがすべてのバリエーションを学習するのに十分なdataは提供されません。

解決策: datasetサイズを複雑さの目標に合わせます。シンプルなキャラクターLoRA = 20-30 images。複雑で汎用的なLoRA = 100+ images。避けるべきより一般的な落とし穴については、10の一般的なComfyUI初心者のミスのガイドもご覧ください。

高度なTraining戦略と最適化

基本的なtrainingを超えて、高度なテクニックがLoRAの品質と汎用性を最適化します。

Multi-Concept Training: 複数の関連する概念(異なるスタイルの同じキャラクター)で単一のLoRAをtrainingするには、慎重なdataset分離と増加したimage枚数が必要です。

アプローチ: キャプチャしたい概念/スタイルごとに50枚以上のimage。各概念にLoRAが区別できるように、異なるcaptionキーワードを使用します。

他の115人の受講生に参加

51レッスンで超リアルなAIインフルエンサーを作成

AI Influencers created with ComfyUI - Ultra-realistic AI generated models for content creators

リアルな肌の質感、プロレベルのセルフィー、複雑なシーンを持つ超リアルなAIインフルエンサーを作成。1つのパッケージで2つの完全なコースを取得。技術をマスターするComfyUI Foundationと、AIクリエイターとして自分を売り込む方法を学ぶFanvue Creator Academy。

あなたの席を確保 - $199

早期割引終了まで：

日

時間

分

秒

完全なカリキュラム

買い切り

生涯アップデート

$200節約 - 価格は永久に$399に上昇

初期の学生向けの早期割引。私たちは常により多くの価値を追加していますが、あなたは$199を永久にロックします。

初心者歓迎

本番環境対応

常に最新

Progressive Training: 低いlearning rateと小さなnetwork rankでtrainingを開始し、徐々に両方を増やします。これにより、複雑な詳細を学習する前に安定した基盤が構築されます。

実装:

フェーズ1: Rank 8、LR 5e-5、500 steps
フェーズ2: Rank 16、LR 1e-4、1000 steps
フェーズ3: Rank 32、LR 5e-5、1500 steps

Dataset Augmentation:

テクニック	目的	実装
水平フリップ	Datasetサイズを倍増	Training toolsで自動有効化
明るさのバリエーション	照明の堅牢性	Training tool parameter
クロップのバリエーション	構図の柔軟性	Training中のランダムクロップ
カラージッター	色の堅牢性	高度なtraining tools

Regularization Images: overfittingを防ぎ、modelの機能を維持するために、類似した被写体の一般的なimage(特定のキャラクターではない)を含めます。

比率: training image 2-3枚につき1枚のregularization image。例: 100枚のキャラクターimage + 40枚のregularization images。

Tag Weighting: 重み付けされたcaption tagsを使用して、重要な特徴を強調します。

キャプションの例: (masterpiece:1.3), (character_name:1.5), blue eyes, blonde hair, red dress

重みは、タグ付けされた特徴をより強く強調するようにtrainingに指示します。

Checkpoint選択:

Base Model	最適な用途	Trainingの考慮事項
SD 1.5	汎用目的	成熟、広範なtrainingリソース
SDXL	高品質	より多くのVRAMが必要、trainingが長い
FLUX	最先端	最高品質、最高のリソース要件
Anime models	アニメ/マンガ	スタイル固有の最適化

Multi-Resolution Training: LoRAの柔軟性を向上させるために、さまざまな解像度でtrainingします。512x512、768x768、1024x1024、および非正方形比率のimageを含めます。

これにより、さまざまな生成解像度でうまく機能するLoRAが生成されます。

LoRAのテストと反復

Trainingはプロセスが完了したときに終わりません。体系的なテストにより、強み、弱み、反復の機会が明らかになります。

初期テストプロトコル:

テストタイプ	目的	Promptの例
アイデンティティテスト	キャラクター認識の確認	"photo of [character], neutral expression"
アングルテスト	マルチアングル機能のチェック	"3/4 view of [character]", "side profile"
スタイルテスト	スタイル全体の汎用性	"oil painting of [character]", "anime [character]"
コンテキストテスト	シーン適応	"[character] in forest", "[character] in city"
表情テスト	感情範囲	"smiling [character]", "angry [character]"

品質評価基準:

基準	悪い	許容可能	優秀
顔の一貫性	特徴が大きく異なる	一般的に認識可能	非常に一貫している
体のプロポーション	歪んでいるか不正確	ほぼ正確	正確で一貫している
服装の柔軟性	Training衣装に固執	ある程度の柔軟性	完全に適応可能
スタイル適応性	1つのスタイルでのみ機能	2-3スタイルで機能	多くのスタイルで機能

Overfittingの特定: training dataとは大きく異なるpromptでテストします。LoRAがtrainingコンテキスト外のものを生成するのに苦労している場合、overfittingが発生しました。

例: すべてのtraining imageが屋内シーンを示していて、LoRAが屋外シーンの生成に失敗する場合、modelは屋内コンテキストにoverfitしました。

反復戦略:

特定された問題	根本原因	次のTraining調整
弱い顔の一貫性	顔training dataの不足	20-30枚のヘッドショットを追加
悪い体のプロポーション	全身imageが少なすぎる	ボディショットのパーセンテージを増やす
服装overfitting	衣装の多様性が不十分	より多くの衣装のimageを追加
限定的なアングル	限定的なアングルからのtraining data	さまざまなアングルのimageを追加

Version管理: 異なるstep数でtrainingのcheckpointsを保存します。これにより、テストして選択できる複数のLoRA versionが提供されます。

多くのクリエイターは、最終checkpointではなく、trainingの70-80%の時点のLoRAが最良であることを発見します。

コミュニティフィードバック: LoRA trainingコミュニティでテスト生成を共有し、フィードバックを得ます。経験豊富なtrainerは、問題をすばやく特定し、改善を提案します。

実際のTraining例と結果

これらの原則を実践するために、正確な設定と結果を示す具体的なtraining runを紹介します。

例1 - ポートレートLoRA:

Dataset: 120枚の顔に焦点を当てたimage(90枚のヘッドショット、30枚のハーフレングス)
Parameters: Rank 32、LR 1e-4、3000 steps、SDXL base
結果: さまざまなpromptとスタイルで優れた顔の一貫性。LoRA weight 0.7-0.9が最良の結果を生み出しました。予想通り、全身生成には苦労しました。
最適な用途: ヘッドショット生成、アバター作成、ポートレートアート。face swappingのworkflowについては、ComfyUI face swapガイドをご覧ください

例2 - フルキャラクターLoRA:

Dataset: 100 images(50枚のヘッドショット、50枚の全身)
Parameters: Rank 32、LR 5e-5、2500 steps、SD 1.5 base
結果: 顔と体の一貫性の良いバランス。シーンとコンテキスト全体で汎用性。非常に高い解像度でわずかな顔のずれ。
最適な用途: 一般的なキャラクター生成、さまざまなシーン

例3 - 多目的LoRA(SFW/NSFW):

Dataset: 220 images(110 SFW 55/55分割、110 NSFW 55/55分割)
Parameters: Rank 64、LR 1e-5、5000 steps、SDXL base
結果: 両方のコンテンツタイプで優れた一貫性。すべてのコンテキストでキャラクターが認識可能。わずかに長いtraining時間は汎用性によって正当化されます。
最適な用途: 商業キャラクター作業、包括的なキャラクター表現

例4 - 最小Dataset:

Dataset: 25 images(15枚のヘッドショット、10枚のボディショット)
Parameters: Rank 16、LR 1e-4、1500 steps、SD 1.5 base
結果: 認識可能なキャラクターだが、詳細が一貫していない。特定のLoRA weights(0.8-0.9)でうまく機能したが、その範囲外では弱い。training衣装を生成する傾向。
最適な用途: 個人プロジェクト、クイックキャラクターコンセプト

Trainingコスト比較:

例	Training時間	クラウドコスト	品質評価	汎用性
ポートレート	3時間	$15	9/10	中程度
フルキャラクター	2.5時間	$12	8.5/10	高い
多目的	5時間	$25	9.5/10	非常に高い
最小	1.5時間	$8	6.5/10	低い

テストからの教訓: 25枚から100枚のimageへの飛躍は、一貫性と汎用性を劇的に改善します。100枚のimageを超えると、改善は変革的ではなく段階的になります。

全身LoRAの50/50分割は、他の比率を一貫して上回ります。SDXLでのtrainingは、SD 1.5と比較してより高品質を生み出しますが、より多くのVRAMと時間が必要です。

結論 - 機能するTraining Datasetsの構築

LoRA training datasetの構成は、平凡な結果と優れたキャラクター一貫性の違いを生み出します。このガイドの実証済みの公式は、特定のニーズの出発点を提供します。

重要なポイント: 顔のみのLoRAは、100枚以上の顔に焦点を当てたimageで優れた機能を発揮します。全身LoRAは、ヘッドショットとボディショット間で50/50に分割された100枚以上のimageが必要です。SFWとNSFWコンテンツを扱う多目的LoRAは、100/100に分割された200枚以上のimageから恩恵を受けます。品質と多様性は、生のimage枚数よりも重要です。

あなたのTraining戦略: 明確な目標から始めましょう。このLoRAは何を生成しますか?datasetのサイズと構成をそれらの目標に合わせます。数量よりも品質と多様性をキュレーションします。体系的にテストし、実際の結果に基づいて反復します。

Platform考慮事項: ローカルtrainingは完全なコントロールを提供しますが、技術的なセットアップとGPUリソースが必要です。Apatero.comのようなクラウドプラットフォームは、最適化されたtraining pipelinesでプロセスを合理化します。CivitAI trainingは、ガイド付きworkflowで初心者に優しいインターフェースを提供します。trainingしたLoRAを本番workflowにデプロイする方法については、workflowから本番APIへのガイドをご覧ください。

次は何ですか: これらのガイドラインに従って、最初のtraining datasetを構築しましょう。プロセスを学ぶために、控えめな50枚のimageのdatasetから始めて、結果に基づいてスケールアップします。LoRA trainingコミュニティに参加して、結果を共有し、経験豊富なtrainerから学びます。

結論: 優れたLoRAは、思慮深いdataset準備、適切なtraining parameters、体系的な反復から生まれます。これらの実証済みの戦略に従えば、どんなコンテキストでもキャラクターに命を吹き込む、一貫した汎用的なLoRAを作成できます。

あなたのtraining dataはLoRAの機能を定義します。dataset準備に時間を投資すれば、結果はその品質を反映します。