「AIにデザイナーやライターの仕事が奪われる」とよく聞くが、戦々恐々としているだけでは状況は変わらない。
人間は知らない物事に対して漠然とした恐怖を覚えるが、その恐怖心は無知から来ている。恐怖心を抱く対象について知ってしまえば、意外とあっさり「あ、たいしたことないな」と思えるものだ。
対象を知るには、色々と調べてみたり、使ったりするのもよいが、最も手っ取り早いのは殴り合いだろう。達人は握手で相手の力量を見極め、不良は土手でタイマンを張る。
私は達人ではなく、会社勤めをしたことのない野生のグラフィックデザイナーなので、今回はMidjourneyとデザインで殴り合い、最後は寝転がりながら「あははお前強えなあ」とお互いを称え合いたいと思う。
【ルール解説】Midjourneyとデジタルコラージュで戦う
今回の対戦は、Midjourneyと行なう。対戦相手にMidjourneyを指名した理由は、毎月30ドルも支払っているからである。少しでも元をとっていきたい。
対決の前に、ルールを設定しよう。いくら人間VS人工知能であっても、ルール無用のデスマッチではいけない。なにせPCの電源を落としてしまえば、こちらの勝ちが確定してしまうので、以下のルールを作成した。
- デザインするジャンルはデジタルコラージュ(フォトコラージュ)
- テーマは「銀河ヒッチハイク・ガイド」に登場する「宇宙の果てのレストラン」
- MidjourneyのプロンプトはChatGPT(GPT-4)で生成する
デジタルコラージュとは、身も蓋もないことを言ってしまえば、コラージュのデジタル版で、Photoshopなどを使用して、素材をいい感じに加工し、それらをコラージュ(切り貼り)しつつ、いい感じのイメージに作り上げる。もともとバラバラの意味や意図を持つ素材が、最終的にひとつのイメージになるのは、「カットアップ」や「フォールド・イン」のような技法にも近い。
テーマとして設定した「宇宙の果てのレストラン」は、ダグラス・アダムスの「銀河ヒッチハイク・ガイド」に登場する。宇宙の果てのレストランでは、未来にタイムワープして宇宙の終末を見ながら食事ができる。テーブルにつくと牛に似た生き物がやって来て、「こんにちは。私が本日の料理です。私のどこを食べますか? 肩肉なんかオススメですよ?」と哀しそうな顔で注文を訊いてくる。
レストランの話は長くなるので割愛するが、デジタルコラージュは銀河とか惑星とか、やたらデカいものと相性がいいのと、AIといえばSFだろうという安易な発想から、ルールとテーマを選択した。
それでは、対戦よろしくお願いします。
【俺のターン】超簡単、誰でもできるフォトコラージュ
まずは、「宇宙の果てのレストラン」に使えそうな画像素材を探してくる。候補は以下の3つ。
この3枚をいろいろ色々加工していく。切り取ったり、角度を変えたり、色を弄ったりして、いい感じにしていく。
はい。できました。
ちなみに、デジタルコラージュをやってみたい人には、「とにかく小宇宙(コスモ)を醸し出す」のがオススメだ。バカでかい惑星や銀河を風景に配置するだけで、「なんか凄そう」な画像ができる。例えば、
こんな感じとか
こんな感じである。「ありえない場所」に「ありえないもの」を配置し、やたらデカくしたり小さくしたりするとハッタリが利く。技法としてはシュルレアリスムにおけるデペイズマンに近いと言えるかもしれない。正直な話、Photoshopでパス切りができて、レイヤーで無理やり誤魔化す技術があればすぐにできるので、暇な人はやってみてほしい。今回はAIの出力がメインなので、人力デジタルコラージュの話はこのくらいにして、Midjourneyにご登場いただく。
【Midjourneyのターン】ChatGPTとの共作
Midjourneyで画像を出力するにあたり、プロンプトは自分で打とうと考えていたのだが、せっかくなのでChatGPTにお願いすることにした。AIとAIの共作である。取り急ぎ、まずはあいさつを済ませておく。
人間だろうとAIだろうとあいさつは重要である。元気に声かけしたところで、いざ性能の向上とやらを見せてもらおうではないか。ただ、GPT-4でより高性能になったからといって、発注する人間の性能は何ら向上していないことを頭に入れておいて欲しい。これからどんなポンコツな出力がされたとしても、それは多分私のせいである。
プロンプト出力にあたって、簡単な条件を設定した。より細かく設定したり、命令の方法も変えたりしたほうがよいのだろうが、「人間であればこれくらいで解るだろう」程度にしてある。
上記でも十分いけると思うが、念のためにプロンプトを増やしてもらった。
なかなか良さそうな感じである。ガチのプロンプト職人には到底及ばないが、初心者だとも思えない。次に、各要素について説明していただいた。
プロンプトが完全に日本語翻訳されているが、だいたいの意味は解っていただけると思う。ちなみに、「マーヴィン(Marvin)」は「銀河ヒッチハイク・ガイド」に登場するロボットのこと。条件設定の段階では教えていないが、正しい知識を披露してくれるのに驚いた。続いて、出力のクオリティに関するプロンプトについても訊いてみる。
なかなかにいい感じだが、もう少し具体的に指定してくれたらさらにいいのになぁ。と思ったものの、発注したのは私なので、己の発注力が低いだけである。では実際に、上記プロンプトをMidjourneyにブチ込んでみよう。
「Create a 4:5 aspect ratio」は反映されないため、プロンプトの最後にある「–ar 4:5」だけは、画像のアスペクト比を合わせるために手動で追加している。
複数の画像がレイアウトされたデザインについては、ネガティブプロンプトで対処できると思うが、今回は面倒なので指定しない。いい感じになりそうな左下と右下のヴァリエーションを出してみる。左下のバリエーションはこちら。
右下のバリエーションはこちら。
さらに絞り込み、1枚ずつアップスケールさせてみる。
勢いと素材感的には完敗したような気がしないでもないが、やはり手の形やグラスの歪み、なんか後方のわけわからん状態など、突っ込みどころは多々ある。だが、これはChatGPTのプロンプト出力が悪いのであり、それを出力させるための発注をした私が諸悪の根源であるので、Midjourneyは何も悪くない。
もう1枚の方は、椅子やフォークがとんでもないことになってはいるものの、先ほどと比べれば、比較的整合性が取れている。ちょっと本棚なんか出しちゃって、『インターステラー』風である。ただ、よく考えれば「宇宙の果てのレストラン」は、整合性もクソもないような場所なので、1枚めも2枚めもある意味正しい。
個人的には1枚めのテイストが好きなのだが、2枚めの方が整合性、バランスともに優れているので、こちらを採用して、あとはジャッジの判断に委ねよう。
これ、どっちが勝ってますかね?引き分けでいいですかね?
出来た物を並べてみる。左が私、右がMidjourneyである。忖度なしに考えるに、「どちらが好きかは好みの問題」ではないだろうか。だとすれば、今回の勝負は引き分けで手を打ちたい。引き分けでいいんじゃないですかね。どうですか皆さん。
正直な感想としては、発注の仕方がポンコツだったので「こんな適当な発注したのに、AIやるじゃん強えじゃん」の一言である。また、やはりプロンプトを入力してから1分以内に出来上がる速度の速さはとんでもない。「すぐできる」のは既に人を凌駕しているだろうが、これで「仕事がなくなるか」というと、まだまだ時間がかかるだろう。
現状、AIの画像生成は「これでもいい」は出力可能だが、「これでなければいけない」は出力できない。言い方を変えれば、「これでなければいけない」出力をするためには、デザイナーやイラストレーターと同等、あるいはそれ以上の工数をかけなければ不可能だろう。
そして、AIの「誰でも使える(誰でもデザインやイラストができる、文章が書ける)ので、仕事がなくなる」なんてのは神話で、正確には「使える人には多大なる恩恵があるが、使えない人はその恩恵のお零れに預かる」みたいな、とてつもない格差が広がるだろう。
結局のところ、創作においてAIを使うのは人であり、人がAIに使われるのではない。仕事が云々よりも、その格差社会の到来が一番怖いし、残酷でもある。AIに使われる方がまだ幸福なのではないだろうか。
(文:加藤広大)