YouTubeチャンネルを初期からチェックしている人は、私がランチ動画以外もあげていたことを知っていると思う。散歩であったりガジェットの検証だったり、生成AIを使った動画だったり……。その時は動画生成AIである程度強いものといえばRunwayだったけど、今最も便利なものはGoogleのVeo3だと思う。なにせこの生成AIは環境音や効果音、果てはリップシンク付きの音声まで対応している。

 そこで私も遊んでみたいと思い、色々なサービス経由で試してみた。実際に完成した動画はこちら。

 さて、それでは実際にどうやって作ったかを書いていこうと思う。ちなみにVeo3は何か特殊なのかと思って事前にあれこれチェックしてみたけど、これと言ってプロンプトに特殊な仕様はなさそうだったよ。だからRunwayで動画を生成した時と殆ど変わらない。強いて言えば、「こういうセリフを言わせて」という内容の指示が含まれるくらい。そして今も昔もプロンプトは適当なAI任せがベスト。

 流れとしては、①どういう動画にしたいか考える→②ある程度のカットやシーンで分ける→③ざっくりとした台本を作る→④台本を元に動画生成用のプロンプトを生成させる→⑤プロンプトを元に動画を生成させる……というもの。プロンプト生成はEdgeを使っていたらサイドバーのAIでもいいし、有名どころのAIを好きに使ってもいい。私は普段使いがちなClaudeを使ったよ。

①どういう動画にしたいか考える

 これはそんなに難しくもない。適当でいい。私はなんとなく日本的なものを作りたくて、スーパーで買物してカレーを作ろうとしたけど、なんだかよくわからないものができたという内容にした。普通の動画を作っても意味がないし、現実にやるには難しいことをやったほうがいい。でもあまり突飛すぎないもので、もしかしたらありえるかもしれないというラインを攻めたかった。

②ある程度のカットやシーンで分ける

 これは項目として分けたものの、実際は生成されたAIを見ながら調整することになるとは思う。あらかじめシーンごとに分けておいて、それぞれ画像を参照して作っていくつもりなら有効。動画に連続性(それぞれが一つの動画として繋がって見えるかどうか)を重視する場合は、結構面倒くさい。妥協したらどうとでもなるけど、現実的すぎても面白味はないから難しいところ。

③ざっくりとした台本を作る

 これはもう本当にざっくりでいい。どうせプロンプトを考えてもらう時に肉付けされるから。例えばこんな風に。『場所は日本のスーパー。カメラで男性二人と女性二人が映っている。男性二人が「カレーを作ります!」と言って、それから女性二人が「レッツクッキング!」と言う。』みたいな感じ。それが生成AIによってプロンプト化されて、なんとなくいい感じに仕上がるよ。

④台本を元に動画生成用のプロンプトを生成させる

 さて、それではさっきの台本(と呼んでいいのかも怪しいけど)を元にプロンプト化を進める。さっきの台本と一緒に、もしくは先にこんな要望も書いておいてね。『googleのVeo3向けにプロンプト化して。できれば日本語と英語でしっかり伝えて』とか。別に英語はなくてもいいといえばいいけど、より表現が理想通りになりやすいかもしれないから、ついでに付けてる。

 そして生成されたのがこれ。

【日本語】
昼間の日本のショッピングセンター内にあるスーパーマーケット。
カメラは固定で、男女合計四人(男性二人、女性二人)が横一列に並んで映っている。
彼らは独創的なカレーを作るための具材を探しに来ており、店内で元気よく叫ぶ。
男性二人が「今日はカレーを作ります!」と声を張り上げ、
女性二人が「レッツクッキング!」と続ける。
スーパーの店内の音(買い物客の話し声、カートの音、BGM)や環境音を含む。
映像はリアルで映画的な質感。
【English】
Daytime scene inside a supermarket located in a Japanese shopping center.
The camera is fixed, capturing four people (two men, two women) standing side by side in a row.
They are searching for ingredients to make creative curry and enthusiastically shout in the store.
The two men call out "今日はカレーを作ります!" in Japanese,
The two women follow with "レッツクッキング!" in Japanese.
Include supermarket ambient sounds (customers chatting, shopping cart sounds, background music) and environmental audio.
The visuals are realistic and cinematic.

⑤プロンプトを元に動画を生成させる

 ここまできたら、後はGoogleのVeo3に対応したサービスで動画生成を依頼するだけ。大抵の情報だとGoogle AI Ultra for Businessを進められるけど、これがまあ高い。そこで安く使える環境はないかとあれこれ調べて、とりあえず手を出してみたのがEnvatoのVideoGenと、Google Workspace、そしてDeeVid AI。この辺りが価格と生成出来る量のバランスが比較的マシだった。

 しかしこれさえあれば大丈夫かといえばそうでもなく……。ざっくり簡単に説明するなら、それぞれこんな特徴がある。

EnvatoのVideoGen
状況次第で生成できる本数等が異なる。しかしストックサイトとして契約していれば、それだけでついでに30本ほどは気軽に動画生成できるのは強み。ただ何か設定の問題でもあったのか無音状態での出力だった。つまりVeo3の魅力があまり出ていない。

Google Workspace
基本的に問題なく作成できるが、プランによっては生成出来る本数が恐ろしく少ない。限られた数しか出力できないのに、ガイドラインや規制で出力も失敗する。警告もなしに出力できないものを出力しようとして、動画を生成できていないにも関わらず、生成できる動画本数が減ることも……。

DeeVid AI
比較的安く、Veo3の機能をより多く活用できる。しかしプロンプトの指示をどう変えても何故か日本語でセリフを話してくれなかった。日本語でのセリフについては何らかの手段があるか、後乗せで足す方法がある。手間だけども、英語でよければこれが一番のコスパを誇る。

まとめというか感想

 Veo3は本当にすごい。それっぽい動画が割とすぐ出来るから、動画や文章といった生成AI関連でマネタイズ出来るんだったら、何も考えずにGoogle AI Ultra for Businessを契約してゴリゴリ使い倒せばいいと思う。後乗せで音声も効果音も用意するという人は、Runwayでも使ったほうが便利。でも日本人っぽいものにしたいんだったら微妙かもしれない。リソース不足。

 ついでに音がない状態で出力されたVideoGenで用意した動画もその内公開しようと思う。手間が余計に増えるから、それは気分が乗ったときにでも。もし他にもコスパが良いサービスとか(あらゆるツールが安く使える怪しいやつは省く)が見つかれば追記する。

おすすめ:

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です