ComfyUI.Tokyo

サイト内検索 help
複数条件の場合はキーワードの間にスペースを入れてください。
例 ksampler controlnet

wan22_SVI_Pro_GGUF 長尺動画

Wan 2.2 SVI Pro (GGUF版) の革新性:なぜ8GBで動くのか?

これまでの動画生成(T2V)は、全フレームを一度に計算するため莫大なVRAMを必要としました。

しかし、この SVI (Spatial-Video-Interpolation / 空間ビデオ補完) プロトコルは、その常識を覆しました。

1. 「GGUF量子化」による軽量化

配布されているモデルが GGUF (Q2_Kなど) であることが最大のポイントです。

  • 圧縮技術: 本来なら28GB以上のVRAMを必要とする14Bモデルを、画質を極力維持したまま2ビット〜4ビット相当に圧縮しています。
  • 8GB VRAM対応: これにより、RTX 3060/4060などのミドルレンジGPUでも、システムをクラッシュさせることなく14Bモデルの知能(複雑なプロンプト理解力)を動かすことが可能になりました。

2. SVI (Spatial-Video-Interpolation) の仕組み

SVIは「最初から最後まで全部作る」のではなく、「要所(キーフレーム)を生成し、その間をAIが賢く埋める」技術です。

  • 4コマ指定の魔法: ユーザーが4つのアクション(プロンプト)を指定すると、SVI Proはそれらを繋ぐ滑らかな動きを最小限の計算リソースで補完します。
  • 一貫性の維持: 前後のコマを意識して補完するため、従来の動画生成でよくあった「背景が急に変わる」「服が脱げる」といった破綻が劇的に少なくなっています。

3. YouTube Shorts 制作に最適な理由

  • 速度: 通常のT2Vなら数十分かかる生成が、数分で完了します。
  • 制御性: 「AのポーズからBのアクションへ」という指示が通りやすいため、音楽に合わせた「決めポーズ」が必要なShorts動画と極めて相性が良いです。
  • アクションの質: Shift値を調整することで、スローから爆速アクションまで自由自在に演出できます。

Workflow

1段目プロンプト

  • Close-up portrait of an Indonesian female mechanic in coveralls. She is focused and serious, examining a car engine with a diagnostic tablet. Workshop background. Photorealistic, sharp detail. --ar 3:5

2段目プロンプト

  • Medium shot of an Indonesian female mechanic in coveralls. She looks directly at the viewer with a sharp, knowing expression, pointing at a car engine component with her gloved finger. Workshop background. Photorealistic. --ar 3:5

3段目プロンプト

  • Action shot of an Indonesian female mechanic in coveralls. She is using a wrench with both hands on an engine bolt, showing determined effort. Workshop background. Photorealistic. --ar 3:5

4段目プロンプト

  • An Indonesian female mechanic in coveralls leans back from the engine bay, wiping her hands with a rag. She gives a confident, bright smile directly to the camera. Workshop background. Photorealistic. --ar 3:5

 

参照画像


RealESRGAN フレーム変換後

動画プレーヤー 小型モード

クリックで再生

思ったより軽い、早い、綺麗。最高です。

無料音楽をAviUtl ExEdit2で入れてみました。

これでYouTube shortsはじゃんじゃんできますよ。


Link