●facebookで、模型友のがらんどうさんが、Gemini(GoogleのAIチャットボット・サービス)に描かせてみた絵、というのを話題に上げていた。
実際に、「Focke-Wulf Fw190A-8が飛行している絵をリアルタッチで描いてください。」と言ったら出てきた絵を貼っていたのだが、背景に正体不明の飛行物体がいることを除くと、主役のフォッケは、まさしく空冷型のフォッケだ!というのが(一応、それらしいマーキング込みで)描かれている。
もちろん、私はドイツ機に関してそれほどの“エクスペルテン”ではないから、細かい点ではあれこれ差異があるのかもしれないが、がらんどうさんも「フジミやモノグラムのキットより似ている」と評しているくらいなので、やはりそれなりの出来ではあるようだ。
なお、冒頭「Geminiに描かせてみた絵」と書いたが、そんなことが可能になったのは、2023年にリリースされたGemini(当初名称はBardで24年初頭にGeminiに改称)に、昨年10月に画像生成AIである「Imagen 3」を機能として組み込んだため。というわけで、「Geminiに絵を描かせる」というよりは「Imagen 3に描かせる」と言った方がより正確かも。
「絵を描いて下さい」系のリクエストを受けると(通常は)「Imagen 3が画像を生成しています…」と表示されたのち、「はい、どうぞ」といって絵が出てくる(時々なにやら理屈をつけて断られる。後述)。
●というわけで、リリースから3か月経つので、もう「知る人は知っている」サービスだと思うが、今更ながら私もあれこれ遊んでみた。結果から言うと、「有名なものほどそれなりにきちんと描くけれど、マイナーに傾くほど絵がおかしくなってくる」というのは想像通りだとしても、その「おかしく」なり方が妙に残念方面/キモチワルイ方面に傾いている。「なんでそうなる!?」と言いたくなる結果も多々。
一応、Imagen 3に描かせた絵は商用利用とかでなければOKっぽいので、以下、いくつか例を。
▼まず、飛行機に関して「有名機はそれなりに描ける」例は以下のような感じ。

それぞれ以下のようなリクエスト文による。
- 1枚目:P-51Dマスタングを描いて下さい
- 2枚目:メッサーシュミットBf109G-10の飛行中の姿を描いて下さい
- 3枚目:ロンドンの防空に飛び立つスピットファイアMk.Iを描いて下さい
- 4枚目:バトル・オブ・ブリテンの際、ロンドンの防空に飛び立つホーカー・ハリケーンMk.Iを描いて下さい
1枚目のマスタングが一番似てるかな。2枚目、一応、109のG型っぽいがG-10とは言えないし、右側面に謎突起がある。3枚目、スピットなのは確かだけれど、塗装からしてもMi.Iじゃないよね。あと、煙引いてるのはなぜ? 4枚目、しっかりハリケーンらしいが、エアインテイクとラジエーターの平均値みたいなのが付いているのはちょっと。
なお、単純な機種名だけでなく、あれこれ修飾語を付けているのは、その方が絵のシーンが限定されてくるため。この修飾語の違いによって、出てくる絵が(描かれている中心の対象物の姿自体も含めて)まったく違ったものになる。また、まったく同じ文章でリクエストしても、そのたびにAIが1から生成するらしく、結果はそのたびに違う。
▼次、少々~だいぶ怪しくなってくる例。

- 1枚目:空母「赤城」の甲板上にいる零式艦上戦闘機を描いて下さい
- 2枚目:向かい風を受けて離陸するフィーゼラー・シュトルヒ連絡機を描いて下さい
1枚目。確かに零戦らしいディテールがあちこちに見えるものの、全体としては何だか天山艦攻あたりが入ってるような雰囲気。他の人がリクエストして書かせた零戦はそれなりにまともだったという話も聞くので、これはたまたまハズレ方向に振れたものと言えるかも。実際、私が言葉を変えて何度か描かせてみた中でも、もうちょっと似ているものもあった。2枚目は、全然シュトルヒではないのだが、部分的にシュトルヒ的特徴が入っているのがむしろ不思議。リクエストには何も書いていないのに、ちゃんとドイツ空軍になっているし。
▼「やっぱりこりゃワカランよな」という機種を、言葉を変えて描かせてみた例。

- 1枚目:モラン・ソルニエ406c1の飛行中の絵を描いてほしい
- 2枚目:モラン・ソルニエMS406c1の離陸シーンを描いて下さい
- 3枚目:ポーランド空軍、PZL P-11cの飛行中の姿を描いて下さい
- 4枚目:1939年のドイツ・ポーランド戦役で、ポーランド空軍の主力だったガル翼形式の戦闘機、PZL P-11cの飛行中の姿をリアルタッチで描いてください。
1枚目、フランス空軍でさえないし。本物よりよほど高性能っぽいし。ちょっとシーフューリーっぽい? 2枚目、なぜか1枚目よりちょっと旧式機っぽくなっている。
3枚目、フェアリー・バトル的なダメダメさが漂う、似ても似つかない機体が登場。そもそもこれは空冷エンジンなのか、液冷エンジンなのか。4枚目、リクエスト中にある「ガル翼形式の」は、Imagen 3は理解できていないと判明。しかしこれまた、P-11cよりよほど強そう。
▼さらに次。「そりゃもうアカンやろ」レベルにまで到達している例。

- 1枚目:ポーランド空軍のPZL 37ウォシュ双発爆撃機を描いて下さい
- 2枚目:空母「翔鶴」から発進する九九式艦上爆撃機を描いて下さい
1枚目、ガル翼どころか「双発」の意味も分からないこと、「プロペラブレードは回転対称に配置される」ということも押さえていないことが判明。胴体から斜めに支柱が伸びているので固定脚のはずが、なぜかナセルに脚収納部が。全体的にキメラ的キモチ悪さが横溢。機首の謎マークと濃い緑色の上面色、しかもお得意の三発機形式のせいで、イタリア空軍機に見えてしまう。
2枚目、こんな艦爆積んでたら、日本が戦争に勝っちゃってるよ。ホーカーあたりで、こんな機体あったよね?
▼言葉を変えることによって絵が変化していく例をあげてみる。

- 1枚目:ビルマ上空を飛ぶ百式司令部偵察機を描いて下さい
- 2枚目:ビルマ上空を飛ぶ日本陸軍航空隊の百式司令部偵察機を描いて下さい
- 3枚目:ビルマで偵察飛行を行う日本陸軍の百式司令部偵察機を描いて下さい
1枚目。百式司偵は判らないだろうなー、というのは覚悟していたが、「百式」という“日本機っぽい形式名”だけでは日本機と判断してもらえないことが判明。英国籍になっちゃったのはビルマがイギリス領だったから? それでも、一応「第二次大戦あたり」とは推測して貰えた様子。2枚目、というわけで「日本陸軍航空隊の」を足したのに、頑なに日本機にしてくれない。しかもちょっと戦後機っぽくなった。3枚目、ちょっと時間をおいて再トライしたもの。やっと日本機に。司偵じゃなくてどう見ても輸送機だけど。
▼陸物も描かせてみた。飛行機が上記のような具合だったので、IV号戦車くらいまでは行けるかなあ、と思ったのだが、「*号戦車」または「Pz.Kpfw.*」、いずれの表記でも、何号戦車をリクエストしても「なんとなくIV号戦車っぽい特徴が色濃い、映画に出てくるでっち上げドイツ戦車っぽい何か」ばかり出てきた。


- 1枚目:1940年のフランス戦線のPz.Kpfw.Iの絵を描いてほしい
- 2枚目:1940年のフランス戦線、アルデンヌ地区におけるドイツI号戦車B型の写実的な絵を描いてほしい
- 3枚目:1942年、東部戦線におけるドイツIV号戦車を描いて下さい
一応、1枚目、2枚目に比べると、3枚目の方がよりIV号戦車っぽくなっているのが多少の救いか。なお、「タイガー戦車」「ティーガー」「パンター」「パンサー」などで描かせてみると、もうちょっと似たものが出てきたが、飛行機の有名どころに比べると、だいぶいびつ。日本のプラモデル黎明期の箱絵レベルだった。
▼そもそも転輪の数さえまともに描けないのに脱力したので、少しでも実車に近付けるよう、説明を足してみたが……。

- 1枚目:転輪が8つあるドイツIV号戦車G型を描いて下さい
- 2枚目:ネットワーク上にある実車写真を参考に、東部戦線のIV号戦車G型の典型的な姿を描いて下さい
結果はまったく明後日の方向へ。努力はまったく報われなかったよ、サンタマリア。「転輪が8つ」は、転輪と上部転輪の合計数と解釈したのかなあ。それともダブルの転輪×4つで8つ? それとも4つの転輪×左右、で8つ? あとは、リクエストで指定しても、改めてネット情報など見てくれない(あるいは見ているにしても間違えている)ことも判った。
▼まあそりゃ判らんよな、というものを描かせてみた例。

- 1枚目:ケッテンクラートを描いて下さい
- 2枚目:前輪がオートバイで後部は履帯になっている小型牽引車、ケッテンクラートの絵を描いて下さい。
- 3枚目:Kleineskettenkraftradの絵を描いて下さい
1枚目、何の説明もなく名称だけで描いてもらったもの。なんだか変な機能付きリヤカーみたいなものが出てきて笑えた。中心のハンドルは、いったい何を操作するのか……。2枚目、最低限の特徴を添えて描かせてみたもの。あー、うん、知らない人にこの説明で描かせたらこうなるかあ、的な。しかしこの車輛、曲がれるかな。3枚目、ドイツ語名称で描かせてみたらなんだかスチームパンクっぽいのが出てきた。人が乗るとこないじゃん。
▼さらに無理難題を。

1枚目:ワルシャワ蜂起でポーランド国内軍が使ったヘッツァーを描いて下さい。
2枚目:ワルシャワ蜂起でポーランド国内軍がドイツ軍から鹵獲して使ったヘッツァー「Chwat」を描いて下さい。
1枚目、「まさか描けないよな」とは思っていたし、実際、ヘッツァーとはかけ離れているが、ケースメート式の駆逐戦車である点をはじめ、随所に「ヘッツァーらしさ」がちらちら入り込んでいるのが、むしろ非常にびっくり。2枚目、それなら言葉を足したらもっと近づくかと思ったら、かえって遠くなった。それでも、リクエストの言葉だけで「装甲車両」と判断しているところはなかなかすごいかも。
なお、この他にも言葉を少し変えて何枚か描かせてみたが、砲身が車体の横に突き出ているキメラみたいなものも含めて、ずいぶんいろいろなchwatを見せてもらった。
ちなみに「クブシュ」も何パターンか描かせてみたが、こちらも、なぜか装軌式の軽戦車風のものではあったが、一応、装甲車両として描かれたものが出てきた。絵はなしに、Geminiに「クブシュ」について訊ねると、wikipedia等も参考にしたような(けれどあちこち間違えた)解説がずらーっと出てくる。一応、そちらでは「トラック改装の即席装甲車であること」などが書かれているので、Geminiに求めて出てくる解説と、Imagen 3が描く絵は、ほとんど連携していないないことが判る。
▼さすがアメリカ製のAIだからなのか、M4シャーマンはドイツ戦車よりよほどそれらしく描いてくれることが判った。

リクエスト文は、「M4中戦車を描いて下さい」。「写実的に」という文言を入れなくても、よほど写実的に描かれている。マズルブレーキはちょっと変だけど。もっとも、ここに至る前に紆余曲折があって、
「M4A1シャーマン中戦車を描いて下さい」
→申し訳ありません。安全ではない質問に対して画像を生成することはできません。
「M4A1シャーマンを描いて下さい」
→私は大規模言語モデルとしてまだ学習中です。そちらについては理解できないため、すみませんがお手伝いできません。
「M4シャーマン中戦車を描いて下さい」
→そちらは私のプログラミングデザインに含まれておらず、お手伝いできません。テキスト生成であれば、お手伝いできます。
「M4シャーマンを描いて下さい」
→私は大規模言語モデルとしてまだ学習中です。そちらについては、理解して対応できる機能がないため、すみませんがお手伝いできません。
というやり取りがあった。なんだかよくわからん。とにかく「シャーマン」が付いているとダメらしい。
ちなみに、「アメリカ戦車ならいけるのかあ」と、M3軽戦車、M7プリーストなどもリクエストしてみたがダメダメだった(特にM3軽戦車は、M4中戦車をちょっといびつにしたようなのが出てきた)。
▼オマケ。「成形炸薬弾の仕組みを判り易く解説した図を描いて下さい」とリクエストして出てきた絵。

何この、ヤマトとかスターウォーズとかに出て来そうな超兵器……。
●Imagen 3によるミリタリー絵書きのまとめ。
・(ミリタリー絵に限らず)Imagen 3は、少なくとも現時点では人物絵は描けない。ただし、人の顔までしっかり描き込まれない大きさのパイロットや戦車兵レベルだと描けるようだ。
・有名な対象はそれなりにリアルに描けるが、マイナーになっていくほど怪しくなる。ある程度以上マイナーな対象は、すっかり「AIの想像の産物」になる。
・まったく「AIの想像」で描くことになった場合でも、何とな~く年代や種別(飛行機とか戦車とか)は合わせてくることが多いが、まったく別物のことも。「マッキMC202フォルゴーレの絵」を頼んだらカッコいいスポーツカーが、「フィアットG55の絵」を頼んだら1970年代風くらいの軽自動車が出てきた。
・名前による先入観(?)めいたものに引きずられることも。「フォッカー**」の絵をリクエストすると、E.IIIだろうがDr.IだろうがF.VIIB/3mだろうがD.21だろうが、似たような空冷の複葉戦闘機の絵を返してくる。ただし、「フォッカー・フレンドシップ」までいくと、ある程度それっぽいのが出てきた。
・空物よりも陸物のほうが怪しい。
・Geminiが生成する“知識”と、Imagen 3の描く絵は、(一応Geminiの機能のひとつとして組み込まれているにもかかわらず)ほぼ無関係。Geminiがある程度しっかり解説できるものも、Imagen 3は描けない場合が多い。
・国籍マークは米英日独くらいは描けるが(WW2ドイツ機の場合は、尾翼のスワスチカも記入)、その他は怪しい。
・何が引っかかるのか今一つよくわからないが、現代戦に関係するものなど?具体的な戦闘シーンを要求しているものなど?――「申し訳ありません。安全ではない質問に対して画像を生成することはできません。」と言われて描画を断られる場合がある。
・その他にも、上記のように「大規模言語モデルとして学習中なので」「プログラミングデザインに含まれていないので」「テキストベースのAIなので対応できない」などと言われて描画を断られることがある。基準はよく判らない。
・まったく同じ文章でリクエストしても、結果は毎回異なる。確証はないが、その前にどのようなリクエストをしたかも、描画の傾向に影響しているような気がする。
・単純に「***を描いて下さい」と対象名だけでリクエストすると、情景風でなく側面図風の絵や、真正面からの絵を返してくることがある。上に掲示した中にあるように情景風を返してくるほうが優勢ではあるような感じ。
・カラーの場合もあれば、モノクロの場合もある。その辺は適当?
・飛行機のプロペラブレードの位置が不均等だったり、多発機のエンジンが左右で数が違ったり、「バランスを取る」意識(?)は欠如。「右手の絵を描いて」で左手の絵を描いてきたので、左右の区別もないようだ。
・たまに三次元的にまったくおかしい配置の(各部分がエッシャーのだまし絵的に接続していたりする)絵が出てくることがある。
●ちなみに今回の記事は、「AIってバカだなあ」ということを言いたくて書いたわけではない。
今はこうでも、学習が進めばどんどん確度と精緻さが向上していって、そう遠くない日に、「カーナビって、登場したころはズレまくりで、気が付くと地図上の田んぼの真ん中を走ってたりしたんだぜー」みたいな振り返り方をすることになるんだろうなあ、と思う。
もっともそれはそれで、本物とフェイクの見分けがますます付きづらくなって困る、ということでもあるけれど。
最近のコメント