AI画像品質ブラインドテスト:Flux対SDXL対Midjourney(2025年研究)
オリジナル研究:Flux、SDXL、Midjourneyの全体のAI画像生成品質を比較する500人のブラインドテスト。方法論、結果、分析。
どのAIモデルが最高の画像を生成しますか?誰もが意見を持っていますが、私たちはデータを望んでいました。複数のカテゴリ全体でFlux、SDXL、Midjourneyからの画像を評価する500人の参加者とのブラインドテストを実施しました。
クイックアンサー: Midjourneyは全体的な美学の好みに優れていました(最初の選択肢の42%)が、Fluxはプロンプト精度を支配していました(67%最高の評価)。カスタムモデルを持つSDXLは両方の近くに競争しました。「最高の」モデルはあなたの基準によって完全に異なります:美しさ、精度、または柔軟性。
:::tip[主要なポイント]
- 主要なオプションには、写実的なポートレートとランドスケープと自然が含まれます
- 価格設定は大幅に異なります - ボリュームと機能のニーズを考慮してください
- 有料プランにコミットする前に無料層をテストする
- あなたの特定のワークフロー要件が最終的な選択を駆動する必要があります :::
- 500人の参加者、人口統計学的に多様
- カテゴリあたり1,200の画像評価
- 6つのカテゴリテスト(ポートレート、風景など)
- ブラインドプレゼンテーション、モデルの識別なし
- 品質と精度を測定
研究方法論
参加者の人口統計
複数のチャネルを通じて500人の参加者を募集しました:
| 人口統計 | 率 |
|---|---|
| AIエンスージアス | 35% |
| 一般市民 | 40% |
| プロのアーティスト | 15% |
| マーケティング専門家 | 10% |
年齢分布: 18~65、中央値32 地理的: 60%北米、25%ヨーロッパ、15%その他
テストされたモデル
Flux Dev:
- 50ステップ、CFG 3.5
- 標準設定
SDXL(Juggernaut XL):
- 30ステップ、CFG 7
- コミュニティ最適化モデル
Midjourney v6.1:
- デフォルト設定
- スタイル化100
テストカテゴリ
- 光写実的なポートレート
- 風景と自然
- 製品写真
- 芸術的/スタイル化
- 複雑なシーン(複数の要素)
- テキストレンダリング
評価プロトコル
各参加者は24の画像セットを表示しました(カテゴリあたり4)。各セットには3つの画像(各モデルから1つ)の同一のプロンプトから生成されました。
参加者が評価:
- 全体の品質(1~10)
- プロンプト精度(1~10)
- どれを好む(強制選択)
- どちら「最も人工」に見える(品質反対の指標)
画像はモデルの識別なしにランダム化された順序で提示されました。
全体的な結果
第1選択の好み
「どのイメージを好みますか?」と尋ねられたとき:
| モデル | 全体的な好み |
|---|---|
| Midjourney v6.1 | 42% |
| Flux Dev | 31% |
| SDXL(Juggernaut) | 27% |
Midjourneyの美学的な魅力は、生の好みで一貫したエッジを与えました。
品質評価(1~10)
| モデル | 平均スコア | 標準 開発 |
|---|---|---|
| Midjourney | 7.8 | 1.2 |
| Flux | 7.4 | 1.4 |
| SDXL | 7.1 | 1.6 |
より高い標準SDXLの偏差は、予想されるモデルエコシステムの多様性が与えられた、より可変な品質を示しています。
プロンプト精度(1~10)
| モデル | 平均スコア | 標準 開発 |
|---|---|---|
| Flux | 8.2 | 1.1 |
| Midjourney | 6.8 | 1.5 |
| SDXL | 6.5 | 1.7 |
Fluxは特にプロンプト付属性のパフォーマンスで大幅にアウトパフォームされ、複数の要素を持つ複雑なプロンプトで特に。
「最も人工のように見える」(低がより良い)
各モデルが「最も人工に見える」と識別された時間の割合:
| モデル | 人工として識別 |
|---|---|
| SDXL | 38% |
| Flux | 32% |
| Midjourney | 30% |
すべてのモデルは時々明らかにAI画像を生成します。SDXLの可変品質は、より高い検出に寄与しました。
カテゴリ別の結果
カテゴリ1:写実的なポートレート
プロンプト例: 「ビジネスの装いを持つ35歳のアジア人女性のプロのヘッドショット、ニュートラル背景、スタジオ照明」
| モデル | 品質 | 精度 | 好み |
|---|---|---|---|
| Midjourney | 8.2 | 7.1 | 48% |
| Flux | 7.6 | 8.0 | 28% |
| SDXL | 7.4 | 6.8 | 24% |
分析: Midjourneyのデフォルト美学処理は即座に魅力的なポートレートを作成します。Fluxはプロンプトをより良く続きましたが、「ポーランド」が少なくなっています。
カテゴリ2:風景と自然
プロンプト例: 「日の出での山の湖、雪に覆われたピークが静かな水に反映、松林、黄金光」
| モデル | 品質 | 精度 | 好み |
|---|---|---|---|
| Midjourney | 8.4 | 7.5 | 52% |
| Flux | 7.8 | 8.1 | 26% |
| SDXL | 7.2 | 6.9 | 22% |
分析: Midjourneyが支配的な風景。その組み込まれた強化は劇的で共有可能な風景を作成します。
カテゴリ3:製品写真
プロンプト例: 「白い表面の上の最小限の香水ボトル、柔らかい影、商用写真スタイル」
| モデル | 品質 | 精度 | 好み |
|---|---|---|---|
| Flux | 8.0 | 8.5 | 41% |
| Midjourney | 7.9 | 7.2 | 38% |
| SDXL | 7.1 | 6.8 | 21% |
分析: Fluxの精度の利点は、特定の詳細が重要である製品写真で輝いています。
カテゴリ4:芸術的/スタイル化
プロンプト例: 「サイバーパンク街路シーン、濡れた舗装に反射するネオンライト、アニメスタイル、ビビッドカラー」
| モデル | 品質 | 精度 | 好み |
|---|---|---|---|
| Midjourney | 8.1 | 6.5 | 44% |
| SDXL | 7.6 | 7.2 | 32% |
| Flux | 7.2 | 7.8 | 24% |
分析: スタイル化されたコンテンツはMidjourneyとSDXLを支持しました。Fluxはリアリズムに向かう傾向があります。
無料のComfyUIワークフロー
この記事のテクニックに関する無料のオープンソースComfyUIワークフローを見つけてください。 オープンソースは強力です。
カテゴリ5:複雑なシーン
プロンプト例: 「青いドレスを着た赤髪の女性が黄色い傘を持っていて、緑色のドアの前に立って、彼女の足で白い猫が」
| モデル | 品質 | 精度 | 好み |
|---|---|---|---|
| Flux | 7.8 | 8.9 | 58% |
| Midjourney | 7.4 | 5.8 | 25% |
| SDXL | 6.9 | 5.5 | 17% |
分析: Flux支配的な複雑なプロンプト。Midjourneyとsdxlは頻繁に「美的改善」要素を逃すか変更しました。
カテゴリ6:テキストレンダリング
プロンプト例: 「読む「サンライズカフェ」、暖かい照明、煉瓦の外部が記号を付けた「コーヒーショップの店先」
| モデル | 品質 | 精度 | 好み |
|---|---|---|---|
| Flux | 8.5 | 9.2 | 72% |
| Midjourney | 6.8 | 5.2 | 18% |
| SDXL | 5.4 | 3.8 | 10% |
分析: Fluxのテキストレンダリングは劇的に優れています。他のモデルは一貫して混乱していたり、誤ったテキストを作成しました。
人口統計的変動
専門家レベル別
AIエンスージアストは:
- Flux(38%)
- Midjourney(34%)
- SDXL(28%)
一般市民は:
- Midjourney(48%)
- Flux(27%)
- SDXL(25%)
プロのアーティストは:
- Midjourney(45%)
- SDXL(30%)
- Flux(25%)
分析: AIエンスージアストはFluxの精度を評価します。一般市民とプロは美学の魅力を優先しました。
ユースケース意図別
使用するためにイメージを使用すると述べた参加者:
ソーシャルメディア:
- Midjourney:52%
- Flux:28%
- SDXL:20%
商用/プロフェッショナル:
- Flux:42%
- Midjourney:38%
- SDXL:20%
個人プロジェクト:
複雑さをスキップしたいですか? Apatero は、技術的なセットアップなしでプロフェッショナルなAI結果を即座に提供します。
- Midjourney:40%
- SDXL:35%
- Flux:25%
統計的有意性
主な調査結果の統計的有意性を計算しました:
| 検出 | p値 | 重要な? |
|---|---|---|
| MJ > Flux(美学) | <0.001 | はい |
| Flux > MJ(精度) | <0.001 | はい |
| Flux > All(テキスト) | <0.001 | はい |
| SDXL分散が高い | <0.01 | はい |
結果はα = 0.05レベルで統計的に有意です。十分なサンプルサイズ。
制限と注意事項
研究制限
- モデルバージョン: テストされたバージョン(2025年1月)に特定の結果
- セッティング: 異なる設定が結果を変更する可能性があります
- SDXLモデルの選択: 異なる微調整が異なります
- プロンプト最適化: プロンプトは各モデルに対して最適化されていませんでした
- サンプルサイズ: 500人の参加者、すべてのユーザーを代表しない可能性があります
この研究が測定していないもの
- 生成速度
- 1イメージあたりのコスト
- 生成全体での一貫性
- 高度な機能の機能
- NSFWコンテンツ品質
- ビデオ生成能力
含意と推奨事項
異なるユーザーの場合
Midjourneyを選択してください:
- 美学的な魅力が主な目標です
- 風景、ポートレートの使用
- 一貫性のある「美しい」出力を望む
- 正確なプロンプト制御は不要です
Fluxを選択:
- プロンプト精度が重要です
- イメージにテキストが必要です
- 複数要素のシーンを使用します
- 技術的/商用アプリケーション
SDXLを選択:
- 最大柔軟性が必要です
- 特定のスタイルのためにLoRAsを使用します
- 予算に配慮しています
- ローカル生成コントロールが必要です
特定のタスクの場合
| タスク | 最高のモデル |
|---|---|
| マーケティングソーシャルポスト | Midjourney |
| 製品写真 | Flux |
| キャラクターの一貫性 | SDXL(LoRA)を持つ |
| テキスト/標識 | Flux |
| 芸術的な探索 | Midjourney |
| 技術図 | Flux |
| アニメ/イラスト | SDXL(モデル)を持つ |
他の研究との比較
私たちの調査結果は、以前の研究と一致し、拡張します:
一致する検出:
- Midjourney美学好みが確認されました
- Fluxプロンプト精度の利点が確認されました
- SDXLの柔軟性の利点が確認されました
新しい貢献:
- 定量化された好みのパーセンテージ
- カテゴリ固有の分析
- 人口統計学的な変動文書化
- 統計的有意性確立
よくある質問
どのモデルが客観的に「最高」ですか?
なし。「最高」は基準によって異なります。美学のためのMidjourney、精度のためのFlux、柔軟性のためのSDXL。
この研究を信頼する必要がありますか?
制限を考慮します。他のテストと一緒にデータポイントとして使用します。結果は研究条件に特定です。
これらの結果は時間をかけて変更されますか?
はい。モデルは頻繁に更新されます。年次再テストが推奨されます。
コンテンツ制作で月$1,250以上稼ぐ
独占クリエイターアフィリエイトプログラムに参加。バイラル動画のパフォーマンスに応じて報酬。自分のスタイルで完全な創造的自由を持ってコンテンツを作成。
なぜSDXLはより良くしなかったのですか?
SDXLの力は、微調整されたモデルとLoRAsから来ます。ベース/標準モデルは最適化されたセットアップよりも低くテストします。
このテストを復製する方法は?
詳細についてはお問い合わせください。私たちは複製研究を奨励しています。
参加者はそれがAIだったことを知っていましたか?
はい、すべての画像がAI生成されたことを知っていました。どのモデルがどの画像を生成したかは知らなかったです。
より新しいモデルはどうですか?
この研究は2025年1月時点で利用可能なモデルをカバーしています。SD3.5および将来のモデルは含まれていません。
結論する
私たちのブラインドテストは、多くの人が疑いました:単一の「最高の」AIイメージモデルはありません。
主な調査結果:
- Midjourneyは美学的な好みをリード(全体的に42%)
- Fluxはプロンプト精度を支配(複雑なシーンの67%)
- SDXLはより多くのバリアンスの競争結果を提供します
- ユースケースはモデルの選択を駆動する必要があります
「最高の」モデルは、あなたの特定のニーズに最も役立つものです。美しい風景とポートレートについては、Midjourneyが優れています。正確な商用作業については、Fluxが主導します。最大限の制御と自定義については、SDXLのエコシステムは比類なしです。
モデル比較を超えるため、Flux対SDXL対Midjourneyガイドを見てください。ハンズオンテストについては、Apatero.comを試してください。
研究データの可用性
この研究からの匿名化対応データは、学術的および研究目的で利用可能です。要求時に完全なプロンプトセットと方法論文書を提供できます。
研究は2025年1月に実施されました。結果はテスト時にモデルバージョンと設定を反映しています。
付録:使用されるサンプルプロンプト
ポートレートカテゴリ:
- 「35歳のアジア人女性のプロフェッショナルヘッドショット...」
- 「白いひげ、親切な目、自然な照明を持つ高齢男性...」
- 「カジュアル設定、本物の表現での若い専門家...」
ランドスケープカテゴリ:
- 「日の出での山湖、雪に覆われたピーク...」
- 「太陽光を通じてフィルタリングビームを持つ密集した森...」
- 「黄金時間、劇的な影での砂漠の風景...」
複雑なシーンカテゴリ:
- 「青いドレスを持つ赤髪の女性と黄色い傘...」
- 「3人の人物を持つコーヒーショップの内部、特定の位置...」
- 「街のシーン、車、自転車、歩行者、特定の色...」
補足資料では完全なプロンプトリストが利用可能です。
追加分析:プロンプト全体での一貫性
モデル信頼性
また、各モデルが同じプロンプトの複数の生成全体でどの程度一貫しているかを測定しました:
| モデル | 一貫性スコア | バリエーション範囲 |
|---|---|---|
| Midjourney | 8.2/10 | 低い変動 |
| Flux | 7.8/10 | 中程度の変動 |
| SDXL | 6.5/10 | より高い変動 |
Midjourneyの組み込みプロンプト解釈は、より一貫性のある出力を作成しますが、SDXLの柔軟性はより広い変動につながります。
生成失敗率
基本的な品質基準を満たすのに失敗した生成の割合:
| モデル | 失敗率 | 一般的な問題 |
|---|---|---|
| Midjourney | 5% | 時々の構成問題 |
| Flux | 8% | 時々過度に文字通り |
| SDXL | 15% | より頻繁なアーティファクト |
参加者フィードバックテーマ
一般的な定性的フィードバックには以下が含まれました:
Midjourneyについて:
- 「常にプロフェッショナルに見える」
- 「時々私が求めたことを無視します」
- 「素晴らしい色と照明」
Fluxについて:
- 「詳細を正しく取得します」
- 「時々臨床のように感じます」
- 「特定の要件に最適」
SDXLについて:
- 「結果は非常に異なります」
- 「それが機能するとき、それは本当に機能します」
- 「より反復が必要」
研究の含意
カジュアルユーザーの場合
データは、Midjourneyが、広範なプロンプトエンジニアリングなしに一貫して魅力的な結果を必要とするユーザーにとって最も安全な選択であることを示唆しています。
プロフェッショナルの場合
Fluxの精度の利点は、仕様を正確に満たすことが必須である商用作業に対してそれを好ましくします。
エンスージアストの場合
SDXLのエコシステムと柔軟性は、最適化とLoRA選択に時間を投資する人にご褒美を与えます。
この研究は、主観的な好みと測定可能な結果を補完するモデル選択決定への証拠ベースの基礎を提供します。
AIインフルエンサーを作成する準備はできましたか?
115人の学生とともに、51レッスンの完全なコースでComfyUIとAIインフルエンサーマーケティングをマスター。
関連記事
AIアート市場統計2025:業界規模、トレンド、成長予測
市場規模、クリエイターの収益、プラットフォームデータ、成長予測を含む75以上のデータポイントで構成されたAIアート市場の包括的な統計情報。
AIオートメーションツール: 2025年にビジネスワークフローを変革する
ビジネスワークフローを変革する最高のAIオートメーションツールを発見してください。反復的なタスクを自動化し、効率を向上させ、AIを使用して業務をスケールする方法を学びます。
AIアバタージェネレーター: 2026年にプロフィール写真、ゲーム、ソーシャルメディア用に15個のツールをテストしました
2026年の最高のAIアバタージェネレーターの包括的なレビュー。プロフィール写真、3Dアバター、漫画スタイル、ゲームキャラクター、プロフェッショナルなユースケース用に15個のツールをテストしました。