
インターネットには粗悪なAIコンテンツが溢れており、動画生成ツールは様々な理由で大きな論争の的となっている。多くのプロフェッショナルは態度を決めかねている。生成モデルが自分の仕事にどう役立つのか想像できないのだ。なぜ機械に、ランダムで汎用的なクリップを作らせたいと思うのか?合成が不気味で、自分の声が全く反映されていないものを。こう問われれば、答えはない。しかし、もし自分の声が保たれるなら?そして、実際にAI動画生成ツールが真に役立つワークフローが存在するなら?ベテラン映像作家ドリュー・ジェラチが異なる視点を提供し、AIを用いたハイブリッド動画制作へのアプローチを解説する。
ドリュー・ジェラシは業界で20年以上の経験を持つ著名な撮影監督兼写真家だ。おそらく一度は目にしたことがある、魅惑的なタイムラプスやハイパーラプス作品を制作している。(例えば、『ハウス・オブ・カード 野望の階段』(原題:House of Cards)のオープニングクレジットなど。)最近ドリューは最新コース「未来を演出する:映像制作者向け倫理的AI動画」をMZedで公開した。本記事では同コースの教材を活用し、静止画を動画へ変換する彼のワークフローを先行公開する。
ハイブリッド動画制作とAIの役割
ここ数年、AI動画生成ツールに関する記事を数多く書いてきた。Sora、Google Veo、Dream Machine、Veo 3、Sora 2…生成技術の進歩が猛烈な速さだから、すでに時代遅れのものもある。だが、現状の能力をレポートするためにテストした以外、実際にAI動画生成ツールを使ったことはない。理由は様々だが、倫理的問題が最優先だからだ。それに、生成されたAI動画が自分の映像制作プロセスにどう組み込めるのか、想像すらできなかった。特に、コンセプト作りやインパクトのある映像表現の創造、実在の人物との協働、結果への完全なコントロールを重視しているからだ。率直に言って、AI動画にはそれらが一切当てはまらない。それとも、私の考えは間違っているのだろうか?
ドリュー・ジェラッチの講座では、こうした深層学習ツールへの新たなアプローチとなる様々な活用例が示されている。ハイブリッド動画制作と呼ぼう。AI生成要素と実写映像をシームレスに融合させ、芸術的表現を損なわない制作手法だ。例えば実写写真を基に素材を作成し、After Effectsで丁寧にアニメーション化・後処理を施して説得力のあるショットを構築する手法が挙げられる。



別のアプローチとしては、静止画に動きを加え、生成されたクリップを実写映像とポストプロダクションで組み合わせる方法がある。ここではドリューのワークフローを詳しく見ていこう。
撮影前の入念な計画
今回のデモンストレーションでは、ドリューはモデルとアシスタントを連れて晴れた日にプールで撮影を行った。ほとんどの工程は、他のプロの写真・映像撮影と変わらない。高解像度カメラ(この場合はソニーの a7R Vとa1 II)を使い、照明を調整し、最適な構図を探り、演技の指示を出し、様々な角度から撮影を行った。
しかし、最初からこれがハイブリッド動画制作になることは分かっていたため、そのための計画も立てていた:
- 一部のフレームは静止画として撮影された。他のフレームは動画クリップとして撮影された。これは後述する柔軟性を考慮した措置だった。
- ドリューのモデル、ミカエラは動画の終盤で徐々に人魚へと変身したいと望んでいた。そこで視覚的にその効果を表現できる適切な視点を探す必要があった。結果としてドローンによる真上からの俯瞰ショットが最適だと判明した。

撮影後、ドリュー・ジェラシはいつもの選別プロセスを経て、Adobe Lightroomで写真を編集した。目指していた柔らかく、ほとんど幻想的な雰囲気を表現するためだ。
Google Flowで静止画を動画クリップに変換するコツ
こうしてクライアントに納品可能な美しい静止画コレクションが完成した。しかしドリューはさらに、その一部を動画編集に活用することを決めた。そのためには、他の映像とシームレスに繋げるため、画像にわずかな動きを加える必要があった。ここでAI動画生成技術が活躍する。
ドリュー・ジェラシは自身のコース実演でGoogle Flowを使用している。これはクリエイター向けのプラットフォームで、Veo 3を含むGoogleの最新生成モデルを活用した分かりやすいインターフェースを備えている。(試用版は利用可能だが、本格的な制作にはサブスクリプションが必要だ。)Google Flowはテキストプロンプトを利用する最も優れた生成ツールの一つだ。しかし同時に「Frames-to-Video」という機能も備えている。

ドリューはフレーム・トゥ・ビデオ機能で静止画をアップロードし、動きのテキスト説明を記述する。上の足のクローズアップでは、プロンプトはこうだった:「静止画。女性の足が非常に繊細な動きで、片足ずつ順番にプールに完全に踏み込む。映画的な見た目」。ご覧の通り、非常に詳細なテキストで、多くの正確な指定が含まれている。その理由は、望ましい結果を得るには何度か試行錯誤が必要だからだ。最初の試行では、何かがずれた結果になる可能性が高い。これが、テキストプロンプトをどう修正すべきか、何を具体的に指定すべきかの指針となる。ドリューの経験上、一般的にコマンドが具体的であればあるほど、結果は良くなる。
では結果はどうだったか?Google Flowはドリューの写真を基に、構図・照明・色彩・モデルの足元を保持したまま、テキストプロンプトに基づいて正しい動きのみを推測した。何も創作せず、創造的なビジョンを損なわなかったのだ。
シンプルなVFXトランジション
ドリュー・ジェラシが共有したGoogle Flow活用のもう一つのコツは、ショットごとに異なるAIモデルを試すことだ。ロールダウンメニューで、スクリーンショットのように古いバージョンのVeoを使える。

なぜか?新しいほど高度だと言う人もいるだろう。しかしドリューは、Veo 3の結果が時にプラスチックのように見え、画像の詳細を滑らかにしすぎていると感じる。また、このニューラルネットワークは、確立されたカラーグレーディングのルックから少し外れることがある。そのため、人魚への変身アイデアでは、彼はVeo 2を使用した。

脚から人魚の尾への移行をまともに見せるには、何度か試行錯誤が必要だった。しかし、この効果は事前に計画されており、適切なアングルも選択されていたため、難しい作業ではなかった。
ポストプロダクション
作業を進める前に、ドリューはTopaz Labsを使用してAI生成画像を4Kにアップスケールする。全てのショットが完成した後、DaVinci Resolveで単一のタイムラインに統合し、一つの動画に編集する。Google Flowの結果を扱う際の彼の秘訣は、速度を調整することだ。例えば水中シーンはスローモーションで生成した。だが速度を150%に上げると、突然リアルさが増すのだ。

講座で公開された最終クリップは、AI映像と実写を組み合わせていながら統一感がある。これは、両方に同じタレント、スタイル、照明、カラーパレット、ビジョンが使われているからだ。ドリューが指摘するように、これは短くて楽しいSNS向けクリップになり得る。あるいは、経験豊富なアーティストが手作業でより精巧なマーメイドへのVFXトランジションを施す場合、このクリップはピッチ用の優れた様式化されたプレビズとして機能するだろう。
以上がドリューによるハイブリッド動画制作の考察だ。これは制作プロセスを効率化しつつ、表現力とビジョンを損なわない手法だ。AI動画生成ツールは詐欺や悪用など否定的なイメージが強いが、これは倫理的で持続可能な新たなアプローチとなり得る。ドリューは現在追加のレッスンを制作している。
MZed Proでは他に何が学べるのか?
MZed Proメンバーになれば、数百時間に及ぶ映像制作教育コンテンツにアクセスできる。さらに、新規コースを継続的に追加中だ(現在数コース制作中)。
月額わずか29ドルから(初年度は349ドル一括払い、2年目以降は199ドル、または月額49ドル)。以下はその概要。
- 60以上のコース、800以上の高品質レッスン
- ピューリッツァー賞やアカデミー賞受賞歴を持つ、数十年の経験を持つ教育者による高品質なコース
- 12ヶ月間、全コンテンツを無制限にストリーミング視聴可能
- MZed iOSアプリでのオフラインダウンロード・視聴機能
- ARRIアカデミーオンラインコースの割引(MZed限定)
- ほとんどのコースでは修了時に業界公認の証明書を発行する
- コースを個別購入すると総額9,500ドル以上かかる
- コース内容は撮影技法、演出、照明、カメラ・レンズ、制作、インディーズ映画制作、脚本、編集、カラーグレーディング、音響、タイムラプス、ピッチデッキなど多岐にわたる
- 年間契約限定で、7日間の返金保証がある
MZedはCineDが運営しています。
画像クレジット:Directing the Futureコース / MZed / Drew Geraci


































