/ ComfyUI / WAN 2.2動画生成でスローモーションを回避する方法
ComfyUI 7 分で読めます

WAN 2.2動画生成でスローモーションを回避する方法

WAN 2.2動画生成におけるスローモーションアーティファクトを修正します。FPS設定、モーションブラー設定、プロンプト技術、サンプラー選択、自然な動きのためのトラブルシューティングの完全ガイドです。

WAN 2.2動画生成でスローモーションを回避する方法 - Complete ComfyUI guide and tutorial

私の最初のWAN 2.2動画は、誰かが手を振っている様子を作るはずでした。簡単ですよね?結果は、糖蜜で満たされたプールの中から手を振っているように見えました。素早く友好的な手振りであるべきものが、約5秒かかり、『マトリックス』の何かのように見えました。

とても混乱しました。動画品質は良く、人物も問題なかったのですが、動きが単純に...間違っていました。結局、デフォルトの6 FPS設定とモーションブラー0.8を使用していたことが判明しました。これらの設定が実際に何をするのか全く理解していなかったのです。

FPSを24に、モーションブラーを0.3に変更しました。全く同じプロンプト、同じシード、通常の人間の動き。スローモーション効果はWAN 2.2の制限でもなく、私のGPUが遅すぎたわけでもありません。文字通り、理解していなかった2つの設定だけの問題でした。

重要なポイント:
  • WAN 2.2のスローモーションは通常、低いFPS設定(6-8fps)、高いモーションブラー値、または動きの速度を指定していないプロンプトから生じます
  • 16-24 FPSで、モーションブラーを0.3未満に設定することで、ほとんどの被写体とアクションに対して自然な動きが生成されます
  • 「quickly(素早く)」「rapid(急速に)」「energetic(活発に)」などの速度記述子を使用したプロンプトエンジニアリングは、知覚される動きの速度に大きく影響します
  • サンプラー選択とステップ数は時間的一貫性に影響します - DPM++サンプラーで25-30ステップが速い動きに最適です
  • Apatero.comのようなプラットフォームは、手動設定なしで自然な動きのためにこれらの設定を自動的に最適化します

クイックアンサー: WAN 2.2のスローモーション効果は、FPSが低すぎる(通常6-8fps)、モーションブラーが高すぎる(0.5以上)、またはプロンプトがアクション速度を指定していない場合に発生します。16-24 FPSで生成し、モーションブラーを0.2-0.3に設定し、「quickly(素早く)」や「energetic movement(活発な動き)」などの速度記述子をプロンプトに追加し、DPM++ 2M Karrasサンプラーを25-30ステップで使用し、モーションガイダンス強度をデフォルトの高い値ではなく1.0-1.2に設定することで修正できます。

なぜWAN 2.2はデフォルトでスローモーション効果になるのか?

WAN 2.2のスローモーション傾向は、バグや見落としではありません。モデルの訓練方法と、速くダイナミックなアクションよりも滑らかで安定した動画を優先するデフォルト設定の結果です。

訓練データの現実:

WAN 2.2は主に、滑らかでシネマティックな映像を重視した動画データセットで訓練されました。訓練データには、製品紹介、自然ドキュメンタリー、そして遅く制御された動きに傾向する慎重に撮影された動画が含まれていました。速くぎこちないアクションは高品質な訓練データではあまり一般的ではありません。なぜなら、うまく撮影することが難しく、伝統的な動画制作では美的に魅力的ではないからです。

モデルは「良い動画」が滑らかで計測されたように見えることを学習しました。この学習された好みを明示的に上書きしない場合、訓練中に最も頻繁に見た動きパターン - つまり、より遅くより慎重な動きに偏ったパターン - にデフォルトします。

FPS設定のデフォルト:

多くのWAN 2.2ワークフローは、正当な理由で6-8 FPS生成をデフォルトとしています。低いフレームレートは計算能力が少なくて済み、生成が速く、VRAMの使用量も少なくなります。ワークフローをテストしプロンプトを反復する場合、6 FPSはクイックプレビュー設定として理にかなっています。

問題は、ユーザーがこれがプレビュー設定であり、最終出力設定ではないことを認識していない場合に発生します。6 FPSでは、速いアクションでも遅く見えます。なぜなら、素早い動きを捉えるのに十分なフレームがないからです。現実で0.3秒かかる手の振りは、24 FPSでは自然に見えるために少なくとも5-7フレームが必要ですが、6 FPSでは2フレームしか得られず、鈍く見えます。

モーションブラーの過度な平滑化:

WAN 2.2のモーションブラー設定は、被写体が露出中に動くときにカメラで発生する自然なブラーをシミュレートします。これは現実感を追加しますが、過度のモーションブラーはフレームを混合することで知覚される動きを遅くします。高いモーションブラー値(0.5-1.0)は、すべてのアクションがスナップするのではなく浮いているように見える特徴的な「夢のような」スローモーションルックを作り出します。

時間的一貫性 vs. 自然な動き:

WAN 2.2には、ちらつきを防ぎフレーム間の一貫性を維持する時間的一貫性メカニズムが含まれています。これらのシステムはフレーム間の変化を平滑化します。これは品質にとって不可欠ですが、適切に設定されていない場合、速い動きを過度に平滑化する可能性があります。モデルは急速な変化を捉えることよりも一貫性を優先し、動きが抑制されたように感じられます。

WAN 2.2がAI動画生成の広い景観にどのように適合するかについては、完全なWAN 2.2ガイドをご覧ください。これは完全なワークフローシステムをカバーしています。これらのデフォルトを理解することで、単にFPSを増やすだけでは必ずしも十分ではない理由を説明できます - 複数の相互関連する設定を調整する必要があります。

Apatero.comは、望む出力スタイルに基づいてこれらの設定を自動的に処理しますが、根本的な原因を理解することで、問題をトラブルシューティングし、手動制御が必要な場合に情報に基づいた選択を行うのに役立ちます。

自然な動きのためのFPS設定をどのように構成しますか?

フレームレートは、WAN 2.2で自然に見える動きの基盤です。これを正しく設定することで、他のすべての最適化がより効果的になります。

FPS影響の内訳:

FPS設定 視覚効果 最適な使用例 VRAM影響 生成時間 品質のトレードオフ
6-8 FPS 非常に遅い動き、ぎこちない テストのみ 速い 動きの明瞭性が悪い
12 FPS スローモーション効果 アーティスティックなスローモー 遅いシーンには許容範囲
16 FPS やや遅いが許容範囲 対話、静的シーン 中-高 中程度 遅いアクションに良いバランス
24 FPS 自然なシネマティックモーション ほとんどの一般的な用途 遅い 業界標準
30 FPS 滑らかな自然な動き 速いアクション、スポーツ 非常に高い 非常に遅い 最大の滑らかさ

24 FPS標準:

24 FPSが正当な理由でシネマティック標準です - これは、人間の知覚が動きを一連の離散的な画像ではなく滑らかで自然なものとして解釈する最小フレームレートです。これは恣意的ではありません。視覚システムが時間情報を処理する方法に基づいています。

WAN 2.2では、24 FPSで生成すると、映画やテレビを視聴することで一生涯かけて構築された視聴者の期待に一致する結果が生成されます。動きが「正しい」と感じられるのは、私たちが見慣れている時間解像度と一致するためです。

異なるフレームレートをいつ使用するか:

6-8 FPSは、構成、プロンプト、または他の非動き要素に取り組んでいる場合の迅速なテストと反復のためにのみ使用してください。スライドショーのような効果を特に望む場合を除き、最終出力にはこれを使用しないでください。

12 FPSは、意図的なスローモーション効果または最小限の動きのシーンに適しています。小さなジェスチャーで立って話している人は12 FPSで許容範囲に見えるかもしれませんが、24の方が依然として良いでしょう。

16 FPSは、より速い生成が必要だが12 FPSよりも良い動きが欲しい場合の妥協設定です。完璧な滑らかさが重要でない中程度の動きのシーンに適しています。

24 FPSは、最終出力のデフォルトにすべきです。より高いフレームレートの計算オーバーヘッドなしで、視聴者の期待に一致する自然な動きを提供します。

30 FPSは、速いアクションシーケンス、スポーツ、または動きの明瞭性が最優先のコンテンツに対して、追加の処理時間に値します。24 FPSと30 FPSの間の滑らかさの違いは、速い動きで顕著です。

ComfyUIでの実装:

WAN 2.2ワークフローでは、FPS設定は通常、動画生成ノードに表示され、多くの場合「fps」または「frame_rate」とラベル付けされています。これを総フレーム数と混同しないでください - FPSは時間解像度を決定し、フレーム数は動画の長さを決定します。

24 FPSで3秒の動画の場合、72フレームが必要です。6 FPSの同じ3秒は18フレームしか必要としないため、生成ははるかに速いですが、動きが悪く見えます。

フレームレートとプロンプトの相互作用:

高いフレームレートは、動きの詳細を指定するプロンプトとより良く機能します。24 FPSでは、「person quickly turning their head to look behind them(人が素早く頭を振って後ろを見る)」のようなプロンプトは、動きの加速と減速を捉えることができます。6 FPSでは、同じプロンプトは動き全体に対して1-2フレームしか生成せず、すべてのニュアンスを失います。

この相互作用は、スローモーションを修正するには適切なFPSと望む動きを説明するプロンプトの両方が必要であることを意味します。WAN 2.2の高度なプロンプト技術については、WAN 2.2テキストから動画へのプロンプティングのガイドをご覧ください。

高FPSでのVRAM管理:

高いフレームレートは、より多くのフレームを生成するため、より多くのVRAMを必要とします。8 FPSでの16フレーム生成は、16 FPSでの32フレーム生成のメモリの半分しか使用しませんが、どちらも2秒の動画を生成します。

VRAMの制限に達している場合は、以下を検討してください:

  • 高いFPSで短いシーケンスを生成する
  • より多くのフレームに対応するために解像度をわずかに下げる
  • --lowvramフラグを使用してモデルのオフロードを有効にする
  • セグメントで生成し、後処理でつなぎ合わせる

低VRAM ComfyUIガイドには、品質を維持しながらメモリ制約を管理するための詳細な戦略があります。

Apatero.comのようなプラットフォームは、VRAMの懸念を排除するエンタープライズグレードのハードウェアを提供しますが、これらのトレードオフを理解することで、ローカルハードウェアで作業する際に情報に基づいた決定を行うのに役立ちます。

どのモーションブラー設定がリアリスティックな結果を生み出しますか?

モーションブラーは、シンプルに見えるが知覚される動きの速度に大きな影響を与える設定の1つです。ブラーが多すぎるとすべてが遅く夢のように見えます。少なすぎると動きがカクカクして人工的に見えます。

WAN 2.2におけるモーションブラーの理解:

AI動画生成におけるモーションブラーは、カメラの露出時間中にオブジェクトが動くときに発生する自然なブラーをシミュレートします。実際のカメラでは、より速いシャッタースピードは動きを凍結し(最小限のブラー)、遅いシャッタースピードは軌跡ブラー効果を作り出します。

WAN 2.2のモーションブラーパラメーターは、この効果をシミュレートするためにフレーム間でどれだけのブレンディングが発生するかを制御します。値は通常、0.0(ブラーなし、完全に凍結されたフレーム)から1.0(最大ブラー、フレーム間の重いブレンディング)の範囲です。

モーションブラーの影響分析:

モーションブラー値 視覚効果 知覚速度 最適用途 一般的な問題
0.0-0.1 シャープ、鮮明なフレーム 速い、きびきびした ゲーム、アクション カクカクした感じ
0.2-0.3 自然なシネマティックブラー 通常速度 一般的な使用 通常なし
0.4-0.5 顕著なブラートレイル やや遅い アーティスティック効果 遅く感じ始める
0.6-0.8 重いブラー、夢のような スローモーション 意図的なスローモー 不明瞭な詳細
0.9-1.0 極端なブレンディング 非常に遅いモーション 抽象効果 定義の喪失

自然な動きのスイートスポット:

遅く感じない自然に見える動きの場合、モーションブラーを0.2-0.3に設定してください。この範囲は、カクカクを避けフレーム遷移を滑らかにするのに十分なブラーを提供しますが、動きを鈍く感じさせる過度の軌跡を作り出しません。

24 FPSで0.25モーションブラーを使用すると、標準シャッタースピード(24 FPS動画の場合通常1/48秒、映画撮影の180度シャッタールールに従う)で実際のカメラが捉えるものに近い結果が得られます。

モーションブラーとFPSの相互作用:

モーションブラーとフレームレートは協力して滑らかな動きの知覚を作り出します:

低FPS + 低ブラー(6 FPS、0.1ブラー): ぎこちない、スライドショーのような効果。各フレームはシャープですが、フレーム間のギャップが不快です。

低FPS + 高ブラー(6 FPS、0.7ブラー): スローモーションの夢のような効果。ブラーは少数のフレームを接続しますが、すべてが水中のように感じられます。

高FPS + 低ブラー(24 FPS、0.1ブラー): 滑らかだがやや人工的、高速シャッタースピードのスポーツ映像のよう。アクションには良いですが「明瞭すぎる」と感じることがあります。

高FPS + 中程度のブラー(24 FPS、0.25ブラー): 自然なシネマティックモーション。これがリアリスティックな結果のターゲット構成です。

高FPS + 高ブラー(24 FPS、0.7ブラー): 意図的なスローモーション効果。滑らかで夢のような、アーティスティックな目的には良いですが自然な速度ではありません。

コンテンツタイプに応じたブラーの調整:

速いアクションシーケンス: 低いブラー(0.15-0.2)を使用して、急速な動き中の明瞭性を維持します。スポーツ、武道、または素早いキャラクターアクションは、よりシャープなフレームから恩恵を受けます。

対話と遅い動き: 標準ブラー(0.25-0.3)が完璧に機能します。動きは十分に穏やかで、中程度のブラーが自然に見えます。

意図的なスローモーション: アーティスティックな理由でスローモーション効果が実際に必要な場合は、ブラーを0.5-0.7に増やし、遅くて優雅な動きを説明するプロンプトと組み合わせます。

抽象的または実験的: 高いブラー(0.8+)は、通常の動きのルールが適用されない夢のシーケンス、トランジション、または超現実的な効果を作成します。

実装の詳細:

ComfyUI WAN 2.2ワークフローでは、モーションブラーは通常、動画生成またはサンプリングノードのパラメータとして表示され、多くの場合「motion_blur_strength」または単に「motion_blur」とラベル付けされています。正確な名前はカスタムノードの実装によって異なりますが、概念は一貫しています。

一部の実装では、0.0-1.0ではなく0-100スケールを使用します。その場合、推奨値に100を掛けます(したがって0.25は25になります)。

時間的一貫性の関係:

モーションブラーはWAN 2.2の時間的一貫性メカニズムと相互作用します。高いブラーは、フレーム間の小さな一貫性の問題を滑らかにするのに役立ちますが、知覚される動きの速度を犠牲にします。ちらつきや一貫性の問題が見られる場合、単にモーションブラーを増やす衝動に抵抗してください - それは原因ではなく症状を治療します。

代わりに、サンプラー設定を確認し、ステップ数を増やすか、モーションガイダンス強度を調整してください。高度なWAN 2.2技術ガイドでは、時間的一貫性の最適化を詳しくカバーしています。

設定のテスト:

特定のコンテンツに対してモーションブラーを調整する最良の方法は、さまざまなブラー値でテストシーケンスを生成することです。明確な動き(「person waving their hand(手を振っている人)」など)で簡単なプロンプトを作成し、FPSを24で一定に保ちながら、ブラー値0.1、0.25、0.5、0.7で2秒のクリップを生成します。

結果を比較して、動きがどのように感じられるべきかのビジョンに一致するブラーレベルを見つけます。好みを見つけたら、その設定は類似のコンテンツタイプ全体で一貫して機能します。

Apatero.comは、シーン分析とコンテンツタイプに基づいてモーションブラーを自動的に最適化しますが、これらの関係を理解することで、動きの特性を精密に手動制御する必要がある場合に情報に基づいた選択を行うのに役立ちます。

どのプロンプト技術がアクション速度を効果的に指定しますか?

プロンプトは、WAN 2.2で動きの速度を制御するための最も強力なツールの1つですが、技術設定に有利に見過ごされることがよくあります。モデルは、タイミングとエネルギーを説明する言語に強く反応します。

速度記述子のカテゴリ:

WAN 2.2は、訓練中に記述的な言語と動きの特性との関連を学習しました。適切な記述子を使用すると、同一の技術設定でも知覚速度に劇的な影響を与えることができます。

無料のComfyUIワークフロー

この記事のテクニックに関する無料のオープンソースComfyUIワークフローを見つけてください。 オープンソースは強力です。

100%無料 MITライセンス 本番環境対応 スターを付けて試す

速い動きの記述子:

記述子タイプ 例の単語/フレーズ 生成への影響 使用例
速度副詞 quickly, rapidly, swiftly, hastily 動きの速度を増加 あらゆる速いアクション
エネルギー記述子 energetic, dynamic, vigorous, explosive 動きに勢いを追加 スポーツ、ダンス
アクション固有 dart, snap, whip, burst, sprint シャープで素早い動き 特定のジェスチャー
比較 faster than normal, double-speed, accelerated 明示的により速い動き 速度が重要な場合

遅い動きの記述子(避けるべき):

記述子タイプ 例の単語/フレーズ 生成への影響 いつ避けるか
遅い副詞 slowly, gradually, gently, leisurely 動きの速度を減少 意図的でない限り
夢のような記述子 floating, drifting, ethereal, graceful スローモーション品質を追加 通常速度のシーン
持続時間の強調 taking their time, prolonged, extended アクション持続時間を伸ばす 速いアクションシーケンス
ためらいの言葉 carefully, cautiously, tentatively 動きを遅くし抑制 自信のあるアクション

効果的なプロンプト構造:

自然な速度の場合: の代わりに: "person turning their head" 使用: "person quickly turning their head to look behind them"

の代わりに: "dancer performing moves" 使用: "energetic dancer performing rapid hip-hop moves with sharp movements"

の代わりに: "car driving down street" 使用: "car accelerating swiftly down the street"

特定性の原則:

「person walking」のような曖昧なプロンプトは、動きの速度を曖昧にするため、モデルはより遅く滑らかな動きに向かう訓練バイアスにデフォルトします。「person briskly walking with purpose, quick stride」のような特定のプロンプトは、モデルに明確な方向性を与えます。

この特定性は、予想以上に重要です。テストでは、同一の技術設定でも「quickly」のような単一の単語を追加するだけで、知覚されるスローモーション効果を30-40%削減できます。

アクション動詞 vs. 状態記述:

弱い(状態に焦点を当てた): "woman with flowing hair" 強い(アクションに焦点を当てた): "woman's hair whipping quickly as she turns her head"

弱い: "person dancing" 強い: "person executing sharp, rapid dance movements with high energy"

違いは、静的状態の受動的記述対動きの特性を暗示する能動的動詞です。

複数の速度信号の組み合わせ:

単一の記述子に頼らないでください。最強の効果を得るために、プロンプト全体に複数の速度インジケータをレイヤー化します:

"Athletic basketball player rapidly dribbling the ball, quick crossover moves, explosive acceleration toward the basket, sharp changes in direction"

このプロンプトには「rapidly」「quick」「explosive」「sharp」が含まれています - すべてが望ましい速い動きを強化しています。冗長性は意図的です。複数の信号は、単一の修飾子よりもモデルのスローモーションバイアスを効果的に上書きします。

速度のためのネガティブプロンプティング:

スローモーションの特性を明示的に避けるためにネガティブプロンプトを使用します:

ネガティブ: "slow motion, floating, drifting, gradual, gentle, dreamy, ethereal, languid"

これは、モデルに何を避けるべきかを伝えます。これは、望むものに対するポジティブ記述子と同じくらい効果的です。

コンテキストとシーン設定:

プロンプトのより広いコンテキストは、動きの解釈に影響します。これらを比較してください:

"Person walking through a peaceful zen garden" - 遅く瞑想的な動きを暗示 "Person rushing through crowded city street" - 速く緊急の動きを暗示

明示的な速度記述子がなくても、コンテキストはモデルを特定の動きの特性に誘導します。望む速度を自然に暗示するシーン記述を選択することで、これを有利に活用してください。

キャラクターとオブジェクトの属性:

一部の被写体は暗黙の動きの関連を持っています:

自然に速い: athlete, child, bird, sports car, fighter jet 自然に遅い: elderly person, heavy machinery, cruise ship, sunset

これらを言及すると、明示的な記述子なしでも動きの速度に影響を与えることができます。「athletic teenager(運動選手のティーンエイジャー)」は、別途指定しない限り「elderly person(高齢者)」よりも自然に速く動きます。

プロンプトの長さと詳細のバランス:

長くより詳細なプロンプトはより多くの制御を提供しますが、個々の記述子の影響を希釈する可能性があります。無関係な詳細にそれらを溺れさせることなく、2-3の速度インジケータを含む15-30語を目指してください。

短すぎる: "person running" 長すぎる: "A person wearing red athletic clothing with white stripes and blue shoes running on a sunny day with clouds in the sky while birds fly overhead and trees sway in the background" バランスの取れた: "Athletic person running at full sprint, rapid leg movement, arms pumping quickly"

複雑さをスキップしたいですか? Apatero は、技術的なセットアップなしでプロフェッショナルなAI結果を即座に提供します。

セットアップ不要 同じ品質 30秒で開始 Apateroを無料で試す
クレジットカード不要

バランスの取れたバージョンは、モデルの優先順位を混乱させる可能性のある過度のシーン記述なしで、動きの特性に焦点を当てています。

プロンプトバリエーションのテスト:

プロンプトは動きに非常に強い影響を与えるため、A/Bテストは価値があります。技術設定を同一に保ちながら、ニュートラルなプロンプトと速度最適化されたプロンプトで同じシーンを生成します。

テスト例:

  • バージョンA: "woman turning to camera"
  • バージョンB: "woman quickly whipping around to face camera with rapid head movement"

結果を比較して、特定のワークフローでプロンプトが動きにどれだけ影響するかを調整します。より多くのプロンプトエンジニアリング戦略については、アニメキャラクター生成のための最高のプロンプトのガイドで、動画生成に変換される多くの技術をカバーしています。

Apatero.comのようなプラットフォームは、プロンプトを分析し、説明された動きに一致するように生成パラメータを自動的に調整しますが、これらの技術を理解することで、プラットフォームに関係なくより効果的なプロンプトを書くのに役立ちます。

サンプラーとステップ数は動きの速度にどのように影響しますか?

サンプラーは主に静止画生成における画像品質に影響しますが、動画生成における時間的一貫性と知覚される動きの速度に大きな影響を与えます。異なるサンプラーの背後にある数学は、動きがフレーム間でどれだけ滑らかに展開するかに影響します。

動画生成へのサンプラーの影響:

サンプラー 時間的一貫性 動きの滑らかさ 速度知覚 推奨ステップ 最適用途
Euler 良い 中程度 やや遅い 30-40 テスト、プレビュー
Euler Ancestral 普通 可変 不規則に感じることがある 30-40 アーティスティックなバリエーション
DPM++ 2M Karras 優れている 高い 自然 25-30 一般的な使用、最終出力
DPM++ SDE Karras 優れている 非常に高い 自然 25-35 高品質最終版
DDIM 非常に良い 高い やや遅い 35-50 再現可能な結果
UniPC 良い 中程度 急いで感じることがある 20-25 速い生成

サンプラーが動きに影響する理由:

動画生成では、サンプラーは単一フレームの品質だけでなく、ノイズ除去プロセス中にフレーム間で情報がどのように流れるかにも影響します。より保守的な予測を行うサンプラーは、より滑らかな時間的遷移を作成しますが、速い動きを過度に平滑化してスローモーションにする可能性があります。

自然な動きのためのDPM++サンプラー:

DPM++ 2M KarrasとDPM++ SDE Karrasは、WAN 2.2で一貫して最も自然な動きを生成します。それらの2次予測数学は、時間的一貫性と急速な変化を許可することのバランスを取り、スローモーション効果を作り出す過度の平滑化を防ぎます。

これらのサンプラーは25-30ステップで高品質の収束に達し、効率的かつ効果的です。動画生成では、これが推奨される出発点です。

Euler Ancestralの諸刃の剣:

Euler Ancestral(Euler a)は各ステップで制御されたランダム性を導入します。これは過度に滑らかなスローモーションを打破できますが、時間的一貫性のリスクもあります。複雑な動きの被写体の場合、このランダム性はフレーム間でわずかなジッターや不一致を作り出す可能性があります。

スローモーションと意図的に戦っていて、よりダイナミックな動きのためにわずかに滑らかでない結果を受け入れる意志がある場合に、Euler Ancestralを使用してください。これはデフォルトの推奨ではなく、創造的な選択です。

ステップ数の影響:

より多くのステップは一般的に品質を向上させますが、動きに複雑な影響を与えます:

ステップが少なすぎる(10-20): 不規則な変化を伴う一貫性のない動き。ノイズ除去プロセスには、時間的遷移を適切に平滑化するのに十分な反復がありません。

最適範囲(25-35): 良い時間的一貫性を持つ滑らかで自然な動き。ほとんどのコンテンツのスイートスポット。

ステップが多すぎる(50+): 各フレームを過度に改良し時間的変化を過度に平滑化することで、実際にスローモーション効果を増加させる可能性があります。計算コストの増加に対して品質の収穫逓減。

ステップ数とFPSの相互作用:

高いFPSは、時間的一貫性を必要とするより多くのフレームがあるため、わずかに高いステップ数から恩恵を受けます:

  • 8 FPS生成: 20-25ステップで十分
  • 16 FPS生成: 25-30ステップ推奨
  • 24 FPS生成: 28-35ステップ最適
  • 30 FPS生成: 30-35ステップ最良

高いFPSでの追加フレームは、アーティファクトなしで滑らかな動きを維持するために、より洗練されたノイズ除去を必要とします。

スケジューラーの選択:

スケジューラー(ノイズスケジュール)は、ノイズ除去がどのように進行するかを決定するためにサンプラーと連携します。動画生成と自然な動きの場合:

Karrasスケジューラー(DPM++で使用)は、動きの特性が固まる中間ステップでより多くの改良を行うノイズ除去ステップのより良い分布を提供します。これはWAN 2.2にとってほぼ常に最良の選択です。

Normal/Defaultスケジューラーは機能しますが、ステップ分布が最適でないため、わずかにスローモーション効果が多くなることがよくあります。

Exponentialスケジューラーは、ノイズ除去を前倒しにします。これは動きの速度に役立つ可能性がありますが、時間的一貫性を犠牲にする可能性があります。

実用的な構成:

スローモーションを修正するには、以下から始めてください:

他の115人の受講生に参加

51レッスンで超リアルなAIインフルエンサーを作成

リアルな肌の質感、プロレベルのセルフィー、複雑なシーンを持つ超リアルなAIインフルエンサーを作成。1つのパッケージで2つの完全なコースを取得。技術をマスターするComfyUI Foundationと、AIクリエイターとして自分を売り込む方法を学ぶFanvue Creator Academy。

早期割引終了まで:
--
:
--
時間
:
--
:
--
完全なカリキュラム
買い切り
生涯アップデート
$200節約 - 価格は永久に$399に上昇
初期の学生向けの早期割引。私たちは常により多くの価値を追加していますが、あなたは$199を永久にロックします。
初心者歓迎
本番環境対応
常に最新
  • サンプラー: DPM++ 2M Karras
  • ステップ: 28-30
  • スケジューラー: Karras(別のパラメータの場合)

この構成は、動きの速度、時間的一貫性、生成効率の最適なバランスを提供します。

モーションガイダンス強度:

WAN 2.2ワークフローには、CFGスケールとは別の「motion guidance(モーションガイダンス)」または「motion strength(モーション強度)」パラメータが含まれることがよくあります。これは、モデルがフレーム間の時間的一貫性をどれだけ強く実施するかを制御します。

高すぎる(1.5+): 動きを過度に平滑化し、モデルが急速な変化を捉えることよりも一貫性を優先するため、スローモーション効果を作り出します。

最適(0.8-1.2): 時間的一貫性とダイナミックな動きを許可することのバランスを取ります。1.0から始めて結果に基づいて調整します。

低すぎる(0.5未満): 時間的不一致、ちらつき、フレーム間の不一貫な動き。

FPS、モーションブラー、プロンプトを修正してもまだスローモーションが見られる場合は、モーションガイダンス強度をデフォルト値(多くの場合1.5-2.0)から1.0-1.2に減らしてみてください。

動画のCFGスケール:

画像生成からの標準CFGスケール推奨は、動画には必ずしも当てはまりません。WAN 2.2での自然な動きの場合:

CFG 5-7: より自然なバリエーションを許可し、硬直性を作り出す可能性のあるプロンプトへの過適合を防ぎます。

CFG 8-10: ほとんどのコンテンツの標準範囲、自然な動きでの良いプロンプト遵守。

CFG 11+: 強いプロンプト遵守ですが、モデルが各フレームをプロンプトと正確に一致させることに過度にコミットするため、過度に滑らかなスローモーションを作り出す可能性があります。

低いCFGスケール(6-8)は、モデルがフレーム間の動きをどのように解釈するかについてより多くの自由を許可することで、スローモーション効果を削減することがよくあります。動画コンテキストでのCFGスケールとサンプリングの詳細については、WAN 2.2マルチKSamplerガイドをご覧ください。

テスト方法論:

サンプラーとステップ数の影響を分離するには:

  1. FPSを24に、モーションブラーを0.25に設定し、速度最適化されたプロンプトを使用
  2. Eulerで30ステップで生成
  3. DPM++ 2M Karrasで25ステップで生成
  4. DPM++ 2M Karrasで30ステップで生成
  5. 動きの特性を比較

この制御されたテストは、特定のワークフローとハードウェア構成でサンプラーが動きにどのように影響するかを理解するのに役立ちます。

Apatero.comは、コンテンツ分析に基づいて最適なサンプラーとステップ数を自動的に選択しますが、これらの関係を理解することで、予期しない結果をトラブルシューティングし、手動制御が必要な場合に情報に基づいた選択を行うのに役立ちます。

最も一般的なトラブルシューティング手順は何ですか?

最適な設定でも、微妙な構成の問題やパラメータ間の相互作用により、スローモーション効果が持続する可能性があります。以下は体系的なトラブルシューティングプロセスです。

第一レベル診断:

複雑なデバッグに入る前に、最も一般的な原因から始めます:

問題 クイックチェック 修正 検証
遅いFPS設定 動画生成ノードを確認 最低24 FPSに設定 2秒テストを生成
高いモーションブラー ブラーパラメータを確認 0.2-0.3に設定 視覚的検査
速度記述子の欠如 プロンプトをレビュー 「quickly」「rapid」を追加 あり/なしで比較
間違ったサンプラー サンプラー選択を確認 DPM++ 2M Karrasに切り替え A/Bテスト結果

体系的なパラメータレビュー:

ワークフローをノードごとに確認し、これらの特定のパラメータをチェックします:

動画生成ノード:

  • FPS: 16-24であるべき、最終出力では12未満にしない
  • フレーム数: FPSに十分なフレーム(24 FPS x 3秒 = 72フレーム)
  • モーションブラー: 0.2-0.3範囲

KSamplerノード:

  • サンプラー: DPM++ 2M KarrasまたはDPM++ SDE Karras
  • ステップ: 25-35範囲
  • CFG: 自然な動きの場合6-9
  • スケジューラー: 利用可能な場合Karras

モーション/テンポラルノード:

  • モーションガイダンス: 0.8-1.2(高すぎる場合は減らす)
  • 時間的一貫性: 中程度の設定、最大ではない
  • フレーム補間: 自然な速度の場合は無効(スローモーを引き起こす可能性がある)

プロンプト分析:

プロンプトをエクスポートし、これらのスローモーショントリガーを検索します:

レッドフラグ(これらを削除):

  • "slowly," "gradually," "gently," "floating," "drifting"
  • "graceful," "elegant," "ethereal," "dreamy"
  • "taking their time," "leisurely," "careful"

グリーンフラグ(これらを追加):

  • "quickly," "rapidly," "fast," "swift"
  • "energetic," "dynamic," "sharp," "explosive"
  • アクション固有の動詞: "dash," "whip," "snap," "burst"

モデルとLoRAの互換性:

一部のWAN 2.2モデルまたはファインチューンは、訓練データに基づいてより遅い動きへの固有のバイアスを持っています。すべてのパラメータ調整を試しても成功しない場合は、LoRAやファインチューンなしでベースWAN 2.2モデルでテストしてください。

ベースモデルが通常の速度を生成するがカスタマイズされたバージョンがそうでない場合、問題は構成ではなくモデルの変更にあります。

ハードウェアとソフトウェアの検証:

VRAMプレッシャー: GPUがVRAMを使い果たしている場合、WAN 2.2は時間的一貫性と動きに影響する低品質処理にフォールバックする可能性があります。生成中にGPUメモリを監視します。90%以上の利用率の場合は、解像度、フレーム数を減らすか、--lowvramフラグを有効にします。

ドライバーの問題: 古いGPUドライバーは、微妙な処理問題を引き起こす可能性があります。最新のNVIDIAドライバー(Linux用535+、Windows用536+)を実行していることを確認してください。

ComfyUIバージョン: 非常に古いComfyUIバージョンは、動画処理にバグがある可能性があります。3-4ヶ月以上前のコードを実行している場合は、最新バージョンに更新してください。

ワークフロー固有の問題:

フレーム補間が有効: 一部のワークフローには、中間フレームを生成するフレーム補間ノードが含まれています。これらは、補間されたフレーム全体に動きを伸ばすことでスローモーション効果を作り出す可能性があります。テスト時には補間ノードを無効化またはバイパスします。

複数のKSamplerカスケード: 複雑なワークフローは、複数のサンプラーを順番に実行する可能性があります。各サンプラーパスは平滑化を追加できます。単一のサンプラーパスに簡素化してみてください。

アップスケール/強化: 動画アップスケールまたは強化ノードは、知覚される動きを遅くする時間的平滑化を追加することがあります。問題を分離するために、これらのノードなしでテストします。

比較テストプロトコル:

問題を分離するための制御されたテストを作成します:

  1. 最小限のワークフロー: 必需品に削減 - 動画生成ノード、サンプラー、VAEデコード
  2. シンプルなプロンプト: "athletic person quickly waving their hand"
  3. 既知の良い設定: 24 FPS、0.25ブラー、DPM++ 2M Karras、28ステップ、CFG 7
  4. リファレンスを生成: これが正しく機能する場合、ゆっくりと複雑さを追加し戻す
  5. 二分探索: 削除したノードの半分を追加し、テストし、どの追加が動きを壊すかを分離

一般的な相互作用の問題:

症状 可能性のある原因 解決策
長い生成でのみスローモーション 時間経過とともにVRAMプレッシャー フレーム数または解像度を減らす
最初のフレームは正常、後のフレームが遅い 時間的一貫性の過剰補正 モーションガイダンス強度を減らす
それ以外は正常な動画でランダムな遅いセクション サンプラーの不安定性 サンプラーを切り替えるかステップを増やす
正しい設定にもかかわらずすべてが遅い 間違ったベースモデルまたはLoRA クリーンなベースモデルでテスト

高度なデバッグ:

基本的なトラブルシューティングで問題が解決しない場合:

潜在的な検査: 潜在的なプレビューノードを使用して、進行中の生成を監視します。スローモーションは、連続する潜在的フレーム間の過度の類似性としてしばしば現れます。

フレームエクスポート: 個々のフレームをエクスポートし、連続するフレーム間の実際の変化を調べます。小さな変化は過度の平滑化を示します。

異なる解像度: 256x256、512x512、768x768でテストします。解像度で動きの速度が劇的に変わる場合、潜在空間のスケーリング問題があります。

既知の良好なワークフローとの比較: 良い動きを生成することが知られているコミュニティワークフローをダウンロードしてテストします。環境で正しく機能する場合は、問題のあるワークフローとパラメータを体系的に比較します。

WAN 2.2に特有のトラブルシューティング戦略の詳細については、WAN 2.2動画強化ガイドをご覧ください。これは一般的な問題と解決策をカバーしています。キャラクターアニメーションなどの特定のユースケースで問題がある場合は、WAN Animateガイドが動き固有の課題に対処しています。

体系的なトラブルシューティングで、ハードウェアまたは構成が必要な動きの特性を達成できないことが明らかになった場合、Apatero.comのようなプラットフォームは、一貫した自然な動きのためにこれらの変数が自動的に管理されるプロフェッショナルに最適化された環境を提供します。

よくある質問

FPSを増やすと、良くなるのではなくスローモーションが悪化するのはなぜですか?

他のパラメータを調整せずにFPSを増やすと、VRAMの制限に達するか、モーションブラーと時間的一貫性の設定が高すぎる場合、スローモーションが悪化する可能性があります。8 FPSから24 FPSに跳ね上がると、3倍のフレームを生成することになり、3倍のVRAMが必要になります。これがメモリプレッシャーを引き起こすと、システムは動きを過度に平滑化する低品質処理にフォールバックする可能性があります。さらに、高FPSでの高いモーションブラー(0.5+)は、さらに遅く見える過度のフレームブレンディングを作り出します。FPSを増やすと同時にモーションブラーを0.2-0.3に減らし、十分なVRAMがあることを確認することで修正します。

すでに生成された動画のスローモーションを後処理で修正できますか?

部分的にはできますが、完全にはできません。編集ソフトウェアで動画の再生速度を上げることはできますが、これは欠落している動きの詳細を追加しません - 生成中にFPSが低すぎた場合、ぎこちなく見える可能性のある速いスローモーションを再生するだけです。より良いアプローチには、RIFEやDainAppのようなフレーム補間ソフトウェアが含まれます。これらは、オプティカルフローに基づいて中間フレームを生成し、より高い再生速度でより滑らかな動きを作り出すことができます。ただし、正しい設定で再生成することは、後処理でスローモーションを修正しようとするよりも常に良い結果を生み出します。

動画の一部のアクションが通常の速度で動くのに、他のアクションがスローモーションに見えるのはなぜですか?

これは、モデルが異なるタイプの動きに対して異なる量の訓練データを持っている場合に発生します。歩行、手のジェスチャー、表情などの一般的なアクションは通常に見えるかもしれませんが、特定のスポーツの動きや技術的な活動などのあまり一般的でないアクションは遅く見えます。モデルは、なじみのないアクションに対してより遅くより滑らかな動きにデフォルトします。「rapid tennis serve, explosive upward motion, fast racket acceleration(急速なテニスサーブ、爆発的な上方動き、速いラケット加速)」のようにアクション速度を明示的に説明する非常に具体的なプロンプトで修正します。単に「tennis serve」ではなく。

WAN 2.2で解像度は知覚される動きの速度に影響しますか?

はい、間接的に。高い解像度はフレームごとにより多くの計算を必要とし、処理品質と時間的一貫性に影響を与えるVRAMプレッシャーにつながる可能性があります。さらに、潜在空間のサイズが変わるため、WAN 2.2の時間的メカニズムは非常に低い(256x256)対非常に高い(1024x1024)解像度で異なる動作をする可能性があります。最も一貫した動きのためには、モデルが主に訓練された解像度(通常512x512または768x768)で生成し、極端な解像度で直接生成するのではなく、必要に応じて後処理でアップスケールします。

同じプロンプトで時々通常の速度、時々スローモーションが生成されるのはなぜですか?

確率的サンプラー(Euler Ancestral、DPM++ SDE)を使用している場合、結果を変える可能性のある制御されたランダム性を導入します。さらに、VRAM使用量がバックグラウンドプロセスに基づいて変動する場合、生成品質は実行間で変わる可能性があります。完全に一貫した結果のためには、決定論的サンプラー(DDIM、PLMS)を使用し、一貫したVRAM可用性を確保し、固定シードを設定します。プロンプト解釈における温度のようなランダム性も変動を引き起こす可能性があります - 一部のモデル実装には非決定論的なテキストエンコーディングがあります。

LoRAやファインチューンされたモデルは動きの速度特性を変えることができますか?

絶対に。特定のデータセットで訓練されたLoRAやファインチューンされたモデルは、強い動きのバイアスを持つことができます。スローモーション自然映像で訓練されたLoRAは、速い動きのプロンプトでもすべての生成をより遅い動きにバイアスします。アクション映画でファインチューンされたモデルは、より速くよりダイナミックな動きにデフォルトするかもしれません。LoRAがスローモーションを引き起こしていると疑う場合は、それなしでテストします - LoRAをロードした場合としない場合で同じプロンプトを生成し、その効果を分離します。異なるLoRAを使用する場合は、動きパラメータを調整する必要があるかもしれません。

CFGスケールと動きの速度の関係は何ですか?

高いCFGスケールは、フレームごとにプロンプトへのより強い遵守を強制し、動きを過度に制約してスローモーション効果を作り出す可能性があります。CFG 15では、モデルは各フレームをプロンプトに極めて正確に一致させようとし、フレーム間の急速な変化を妨げます。低いCFG(6-8)は、モデルにフレーム間で動きがどのように進化すべきかを解釈するより多くの自由を与え、多くの場合より自然な速度をもたらします。他のすべてが正しく構成されているが動きがまだ遅く感じられる場合は、CFGスケールを6-7に減らしてみてください。

動きの速度に関してWAN 2.2は他の動画生成モデルとどう比較されますか?

WAN 2.2は、訓練データと時間的一貫性メカニズムのため、AnimateDiffやテキストから動画へのStable Diffusionのような代替品よりも顕著なスローモーション傾向を持っています。ただし、適切に構成されている場合、全体的な品質とより良い時間的一貫性も生成します。ZeroscopeやModelScopeのようなモデルは、デフォルトでより速く感じるかもしれませんが、動きの特性に対する制御が少なくなります。各モデルは、訓練データの構成とアーキテクチャの選択に基づいて異なるデフォルトの動作を持っています。

カメラの動きは通常の速度に見えるのに、被写体の動きが遅く見えるのはなぜですか?

カメラの動き(パン、ズーム)は視点の変化として解釈され、WAN 2.2はこれらを被写体の動きとは異なる方法で処理します。カメラの動きは潜在レベルで発生する幾何学的変換ですが、被写体の動きは解剖学的に正しい中間ポーズをモデルが予測する必要があります。モデルは訓練データからカメラの動きについてより強い事前知識を持っています。これをバランスさせるには、「person rapidly running forward while camera quickly pans to follow(人が素早く前方に走り、カメラが素早くパンして追う)」のように、カメラの動きと同じくらい強い動き記述子を被写体のアクションに使用します。

オーディオドリブン生成はスローモーション問題を修正できますか?

オーディオドリブンWAN 2.5生成は、オーディオが動きの速度についての時間的手がかりを提供するため、役立つ可能性があります - 速い音楽や急速な音声は暗黙的により速い動きを示唆します。ただし、構成問題の魔法の修正ではありません。FPS、モーションブラー、サンプラー設定がスローモーションを作成する場合、オーディオドリブン生成はオーディオに同期されたスローモーションを生成します。オーディオは、適切に構成された視覚生成パラメータと組み合わせた場合に最も良く機能します。WAN 2.5オーディオドリブンガイドでは、この統合をカバーしています。

WAN 2.2で特定の被写体タイプでスローモーションがより一般的ですか?

はい。人間の顔と微妙な表情は、これらが訓練データで大きく表現されているため、多くの場合自然な速度で生成されます。全身アクション、特にダンスやスポーツのような複雑な動きは、このタイプのデータがあまり一般的でなく、うまく捉えるのが難しいため、スローモーションに傾向します。動きの動物、車両、抽象的な動きも遅く傾斜します。自然に遅く生成する被写体タイプに対して、より明示的な速度記述子で補償します。

結論: WAN 2.2で自然な動きを達成する

WAN 2.2でスローモーションを修正することは、単一の魔法の設定を見つけることではありません - 複数のパラメータがどのように相互作用して自然に見える動きを作り出すかを理解することです。FPSは時間解像度の基盤を設定し、モーションブラーは滑らかさの知覚を制御し、プロンプトはモデルの動きの特性の解釈を導き、サンプラー選択は生成がフレーム間でどれだけ滑らかに収束するかを決定します。

最も一般的な間違いは、これらのパラメータを独立したものとして扱うことですが、実際には深く相互接続されています。デフォルト値からモーションブラーを減らさずに24 FPSを設定すると、依然としてスローモーションが生成されます。適切なFPSなしでプロンプトに速度記述子を追加しても、モデルにその速度を表現するのに十分な時間解像度を与えません。ステップ数を調整せずにサンプラーを変更すると、問題を解決するのではなくシフトする可能性があります。

アクションプラン:

基盤から始めます: モーションブラーを0.25に設定した24 FPS生成。これはスローモーションの最も一般的な原因をすぐに排除します。

プロンプト最適化をレイヤー化します: 明示的な速度記述子を追加し、能動的動詞を使用し、プロンプト全体にエネルギー指標を含めます。速度を推測するためにモデルに依存しないでください - 明示的に述べてください。

サンプラーを構成します: DPM++ 2M Karrasを28-30ステップ、CFGスケールを約7で使用します。これらの設定は、時間的一貫性とダイナミックな動きを許可することのバランスを取ります。

体系的にテスト: これらの設定で同じプロンプトを生成し、次に以前の設定で生成します。違いはおそらく劇的で、どのパラメータがスローモーション問題を引き起こしていたかをすぐに確認します。

動きの品質が重要な複雑なプロジェクトまたはプロフェッショナルな作業の場合、Apatero.comのようなプラットフォームは、必要なときに手動制御を提供しながら、これらすべての最適化を自動的に処理します。管理された環境は、すべてのパラメータ相互作用を習得する必要なく、一貫した結果を保証します。

AI動画生成の未来は、モデルがより多様で高品質な動きデータで訓練されるにつれて、より良いデフォルトの動き特性に向かっています。これらの原理を理解することで、WAN 2.5、将来のバージョン、または全く新しいアーキテクチャなど、新しいモデルが登場したときに迅速に適応できる位置につけます。FPS、時間的一貫性、モーションガイダンスの基本は、特定の実装が進化しても関連性を保ちます。

これらのパラメータをマスターすれば、興味深い技術デモンストレーションだけではなく、プロフェッショナルなアプリケーションに真に有用なAI生成動画を可能にする自然でダイナミックな動きを解き放つことができます。

AIインフルエンサーを作成する準備はできましたか?

115人の学生とともに、51レッスンの完全なコースでComfyUIとAIインフルエンサーマーケティングをマスター。

早期割引終了まで:
--
:
--
時間
:
--
:
--
あなたの席を確保 - $199
$200節約 - 価格は永久に$399に上昇