ComfyUI.Tokyo
複数条件の場合はキーワードの間にスペースを入れてください。例 ksampler controlnet
wan22_SVI_Pro_GGUF 長尺動画
- WAN 2.2 Enhanced NSFW high、lowの2種類です。
- SVI Pro 2.0 for Low VRAM (8GB)
Wan 2.2 SVI Pro (GGUF版) の革新性:なぜ8GBで動くのか?
これまでの動画生成(T2V)は、全フレームを一度に計算するため莫大なVRAMを必要としました。
しかし、この SVI (Spatial-Video-Interpolation / 空間ビデオ補完) プロトコルは、その常識を覆しました。
1. 「GGUF量子化」による軽量化
配布されているモデルが GGUF (Q2_Kなど) であることが最大のポイントです。
- 圧縮技術: 本来なら28GB以上のVRAMを必要とする14Bモデルを、画質を極力維持したまま2ビット〜4ビット相当に圧縮しています。
- 8GB VRAM対応: これにより、RTX 3060/4060などのミドルレンジGPUでも、システムをクラッシュさせることなく14Bモデルの知能(複雑なプロンプト理解力)を動かすことが可能になりました。
2. SVI (Spatial-Video-Interpolation) の仕組み
SVIは「最初から最後まで全部作る」のではなく、「要所(キーフレーム)を生成し、その間をAIが賢く埋める」技術です。
- 4コマ指定の魔法: ユーザーが4つのアクション(プロンプト)を指定すると、SVI Proはそれらを繋ぐ滑らかな動きを最小限の計算リソースで補完します。
- 一貫性の維持: 前後のコマを意識して補完するため、従来の動画生成でよくあった「背景が急に変わる」「服が脱げる」といった破綻が劇的に少なくなっています。
3. YouTube Shorts 制作に最適な理由
- 速度: 通常のT2Vなら数十分かかる生成が、数分で完了します。
- 制御性: 「AのポーズからBのアクションへ」という指示が通りやすいため、音楽に合わせた「決めポーズ」が必要なShorts動画と極めて相性が良いです。
- アクションの質: Shift値を調整することで、スローから爆速アクションまで自由自在に演出できます。
Workflow
1段目プロンプト
- Close-up portrait of an Indonesian female mechanic in coveralls. She is focused and serious, examining a car engine with a diagnostic tablet. Workshop background. Photorealistic, sharp detail. --ar 3:5
2段目プロンプト
- Medium shot of an Indonesian female mechanic in coveralls. She looks directly at the viewer with a sharp, knowing expression, pointing at a car engine component with her gloved finger. Workshop background. Photorealistic. --ar 3:5
3段目プロンプト
- Action shot of an Indonesian female mechanic in coveralls. She is using a wrench with both hands on an engine bolt, showing determined effort. Workshop background. Photorealistic. --ar 3:5
4段目プロンプト
- An Indonesian female mechanic in coveralls leans back from the engine bay, wiping her hands with a rag. She gives a confident, bright smile directly to the camera. Workshop background. Photorealistic. --ar 3:5
参照画像
RealESRGAN フレーム変換後
動画プレーヤー 小型モード
思ったより軽い、早い、綺麗。最高です。
無料音楽をAviUtl ExEdit2で入れてみました。
これでYouTube shortsはじゃんじゃんできますよ。


