どうもです、タドスケです。
今回は以下のMVを投稿しました。
スチームパンクな世界を舞台にした冒険物語です。
世界観が大事なので、AI画像の生成もこれまで以上に難しいものでした。
試行錯誤の跡をここに残したいと思います。
それではいってみよー!
最初に入力したのは以下のプロンプト。
画像生成AI に飛行機に乗っている少年少女の画像を生成させる英語プロンプトを考えてください。 スチームパンクの世界観で、飛行機は昔のデザインです。 絵柄はシリアスなものではなく、アニメ調がいいです。 少年少女の年齢は14歳で、顔は朝日で照らされていて、雲の向こうを見つめています。
↑ の完成画像とくらべてみると、最初は2人組でやろうとしていたことがおわかりいただけたでしょうか。
結果はこちら。
うん、確かに乗ってるね。飛行機に。
でも「乗る」ってそういうことじゃないのよ。
これもはや子どもの電車ごっこみたいなやつだよね?
「乗る」っていう言い方がまずかったかな。AIへの指示は具体的にしなくちゃ。
「乗っている」→「操縦している」に置き換えてみる。
かなりのキメ顔で来られましたけども、君たち飛んでないね。
それなのにこの顔!
「素晴らしいフライトだったわ」とでも言いたげだね。
空を飛ぶことを強調するため、「飛行機に乗って空を飛んでいる」に置き換えてみる。
うん、飛んだねー…だから「乗る」ってそうじゃない!
飛行機をヨギボーみたいに扱うんじゃないよ。
うっかり「乗る」に戻しちゃった…
「飛行機を操縦して空を飛んでいる少年少女」でやり直し!
なんか一人増えてる。
でもようやく操縦して空を飛んでくれた。
背景にやたら飛行機が多いのが気になったのと、歌詞にある「遠ざかる見慣れた町」を表現したかったので、プロンプトを足してみる。
少年少女以外の飛行機は飛んでいません。 空や町が映るように、遠目のアングルから描いてください。
ハイきました電車ごっこ。
そしてこの顔!
飛行機のデザインをもっと具体的にしてみよう。
飛行機のデザインは、ライトフライヤー号にしてください
乗ってるけど、縮尺がおかしい。
あと女の子どこいった?
その後何度も試したけど、やっぱり縮尺がおかしくなる。
飛行機の大きさがわからないように、操縦席だけを描くようにしてみよう。
飛行機全体ではなく、操縦席にいる男の子の斜め後ろから遠くを見るような視点で描いてください。
もはや何の乗り物なのかすらわからない!
一度に多くのことをやろうとするのは良くないなぁと思ったので、要素を削ってみる。
ここでひらめき。
全体を一度に描くのは諦めて、飛行機の全景とキャラクターの表情を別々で生成して、カットインっぽく合成してみよう。
まずは男の子から(男女にするのは諦めました)
「飛行機を操縦している少年の画像」を生成させる英語プロンプトを考えてください。 少年の表情がよく見えるように、斜め下からのアングルで描いてください。 少年の年齢は14歳で、ワクワクした表情で進行方向を見つめています。
操縦というか、もはや落ちる寸前だね。
脱出装置を使ったけどパラシュート装備してないのに気づいて、ギリギリのところで捕まってる感じ。
ワクワクしている場合じゃない!
あとこっちを見ずに、前を見て運転してほしいです。
ネガティブプロンプトに「looking directly at the camera(カメラ目線)」を入れてみる。
よし、だいぶいい感じになってきた!
欲を言えば、もっとワクワクしている感じがほしい。
もっと表情が強調されるように、絵柄の指定を変えてみようかな。
「NHKのアニメ調で」と指定してみる。
うん、主人公はいったんこれでいいかな。
次は飛行機の全景画像。
これは特に問題なくできたので、混ぜてみる。
何この雑コラ感。いや、適当に貼ってるだけだから、雑コラか。
あと作ってみて気付いたけど、これじゃあサムネ映えしないな。
改めて男の子の生成にチャレンジ。
うん。細かいところを見だしたらキリがないので、これでOKにしよう。
以前に自転車でやった時もそうでしたが、モノと人を組み合わせようとすると、おかしくなりがちですね。
特に今回の飛行機は人よりもかなり大きいものなので、構図に工夫が必要だなと思いました。
以上、NG集でした。
コメント