画像生成AI「Midjourney」が「奇妙すぎるゲームコントローラー」を生成すると話題に。“裏側”にスティックとボタンをいっぱい生やす

Image Credit: Florian Gagnepain on Unsplash
Pocket
reddit にシェア
LINEで送る

AIによる画像生成サービス「Midjourney」は、「“ゲームを遊ぶ人”を生成するのが苦手」とするユーザー報告が注目を集めている。巨大であったり背面ボタンがいっぱいであったりと、非常に使いにくそうなコントローラーを持った人の画像が生成されるという。

「Midjouney」は、David Holz氏率いる同名の研究チームが開発するAIによる画像生成サービスだ。コミュニケーションツールDiscord上で提供されている(現在無料での提供は停止中)。Midjourneyは、ユーザーによって入力されたいくつかの言葉をコマンドとして、言葉のイメージに沿うような画像を生成してくれるサービスだ。たとえばMidjourneyの公式サイト上では、「high contrast surreal collage(高コントラストの超現実的なコラージュ画像)」とする入力からは、以下の画像が生成されると説明されている。

Image Credit: Midjourney Documentation and User Guide


今回、ユーザーによりそんなMidjourneyの意外な弱点が報告されている。海外掲示板Redditにてあるユーザーが、同サービスが“ゲームを遊ぶ人”イメージの生成が「すごく苦手」であると指摘。奇妙なコントローラーが生成された画像を紹介しており、注目を集めている。

投稿者はMidjourneyを利用して、「female influencer relaxing playing PlayStation 5 having a blast(女性のインフルエンサーがくつろぎながらPlayStation 5を遊び、楽しんでいる)」というテキストから画像を生成したという。生成された4つの画像ではたしかに女性がソファーでくつろぎながらゲームを遊んでいる。また下2つの画像ではヘッドセットを付けているためインフルエンサーらしさも表現されている。

一方で手元に注目すると、いずれの画像も何やら見慣れないコントローラーらしき物体が握られている。上の2つの画像では、コントローラーはPS5向けのDualSenseと色やデザインが少し似ている。ただしかなり巨大で、スティックやボタンが背面に配置。めちゃくちゃ使いにくそうである。また、不条理に異常増殖したスティックやボタンはよく見ると不気味でもある。左下のコントローラーは黄色や黒の配色。これらもグリップのような部分が背面に伸びていたり、背面にボタンがたくさんあったり。さらに右下の黒のコントローラーに至っては、そもそもプレイヤーが逆向きに持っている。特殊な命令はされていないにもかかわらず、クセの強すぎるコントローラーが提示されている。

こうしたヘンテコなコントローラーが提示された理由について、ユーザーらは訓練用データに原因があるのではないかと推察している。Midjourneyでは、機械学習に用いる訓練データとして、ネット上の無数の画像を用いているとされる。そしてネット上に存在する「コントローラー」という言葉に関連する画像には、スティックやボタンが存在する“表の面”を向いた画像が多いだろう。実際Google画像検索などでコントローラーやDualSenseと検索すると、表向きのコントローラーの画像が数多く結果として表示される。そうした画像をもとに学習したため、Midjourneyがコントローラーの裏面を描写しなかったのではないかという推察だ。

なおスレッド内には、変なコントローラーが誕生してしまった一方で、画像のそのほかの部分についての正確さを評価する声も多く見られる。コントローラーはともかくヘッドセットはかなりそれらしいデザイン。また画像生成AIが苦手とされる手や指についても違和感がない。そうしたコントローラー以外の要素が忠実に生成されている点にも注目が集まっているようだ。ちなみに右下の画像と関連してか、過去に『アーマード・コアV』などのゲームにて、一部プレイヤーが逆向きにコントローラーを持って遊んでいたことを引き合いに出すユーザーも見られる。

訓練データに用いられる画像の偏りからか、不思議な弱点が報告されたMidjourney。同サービスの苦手な分野について注目を集めた先例としては、過去には「泳ぐセフィロス」を生成してくれないという事例があった(連記事)。こちらでは、セフィロスが水面に立つなどする異常な光景が見られた。一方今回のゲームを遊ぶ人の生成については、コントローラー以外の部分にさほど違和感はなく、かなり惜しい生成結果となった。

画像生成含むAIについては、急速な発展を見せる一方で今回のような“弱点”も見られる。また、性能のほかにもAIにまつわる法整備や権利問題など、課題もあるだろう。米国では、訓練データ用画像の権利侵害の可能性を巡って、MidjouneyなどAIによる画像生成サービスの運営・開発元3社を相手取り、集団訴訟が提起されている(The Washington Post)。今後AIはどのように発展し、法的にどのような立ち位置になっていくのか。いずれ突飛な画像を生成して笑うことさえ難しくなるときも来るかもしれない。

Pocket
reddit にシェア
LINEで送る