こんにちは、うたのです(* ᴗ ᴗ) 最近は生成AIにはまっています。
ChatGPT上で画像生成ができるAI「DALL-E3」がリリースされたので早速試してみました。
今回はDALL-E3の使い方とDALL-E3でどんなことができるのか、従来の画像生成AIとどんなところが違うのかも解説していきます。
※2023年10月17日時点
DALL-E3とはOpenAIが開発した最新の画像生成AIです。
2023年10月よりChatGPTの有料版であるChatGPT Plusに実装されました。ChatGPTと統合されたことにより、ChatGPT上でプロンプトを入力することで画像を生成してくれるようになりました。
前バージョンのDALL-E2と比べても格段にクオリティや性能がアップ。SNSでも大いに盛り上がりを見せています。
リアルと間違えるほどのクオリティ
ゲーミングPCの前に座る、20歳のグラビアアイドル。高画質の画像
#DALLE3 pic.twitter.com/4tDki4t6i6— 魔法陣ウガ(旧:AIGoddessGallery) (@Goddess_AI_) October 1, 2023
アニメ調もばっちり
#DALLE3 の一発出力
>神絵師によって超絶技巧で描かれたアニメ少女の高精細、高品質なカラーイラスト#AIart #AIイラスト pic.twitter.com/dshDASOBze— IT navi (@itnavi2022) October 11, 2023
風景も生成してくれる
風景もバチバチに強い!#DALLE3 pic.twitter.com/T1YtqeRZkh
— 賢木イオ@スタジオ真榊 (@studiomasakaki) October 1, 2023
画像生成AIが苦手な文字入れも正確に表現してくれる
おはようございます(* ᴗ ᴗ)
ChatGPTで #DALLE3 が実装されましたね
従来の画像生成AIが苦手だった文字入れもばっちり✨#ブログ仲間募集中#ブログ仲間と繋がりたい pic.twitter.com/OLd8Pvw3pj— うたの@VR×AIブロガー📚目標月間10万PV! (@utano_blog) October 5, 2023
ChatGPTでDALL-E3を使うためには有料版であるChatGPT Plusに入会する必要があります。
DALL-E3はMicrosoftが提供する画像生成AI「Bing Image Creator」でも提供されていて、そちらでは無料で利用できます。
ChatGPT Plusユーザーの方はGPT-4の中に「DALL-E3」という項目があるので選ぶとチェックが入ります。画面下の入力欄にプロンプトを入力すれば画像生成してくれます。
2023年10月17日時点では、まだChatGPT Plusユーザー全員がDALL-E3を使えるわけではないようです。待っていればいずれ使えるようになると思います。
では実際にDALL-E3を使ってみましょう。いろいろな活用方法を試してみました。
まずは一番基本的な使い方である画像生成です。
使い方はMidjoureyやStable Diffusionなどの画像生成AIと同じです。生成したい画像の詳細をテキストで入力すれば生成してくれます。
「かわいい猫を描いてください」と入力すると
1回で4枚生成してくれます。細かい指定はしていないので様々なスタイルの猫ちゃんを生成してくれました。
ChatGPTがプロンプトを考えてそのプロンプトを元にDALL-E3が画像を生成してくれる仕組みです。
画像の大きさは何も指定しないと正方形(1:1)ですが、横長(16:9)や縦長(9:16)に指定することもできます。
「16:9で生成してください」と入力すると
先ほど生成した画像を横長に生成してくれました(正方形の画像を横長にしたので若干デザインは変わっていますが)
今のところ、横長(16:9)や縦長(9:16)以外に指定することはできないようです。いずれはできるようになると思います。
生成した画像に気に入らない部分があれば修正することもできます。
「1枚目の画像の白い猫を黒い猫に変えて下さい」と入力すると
背景は若干変わっていますが見事に黒い猫に変えてくれました。
先ほど生成した4枚の画像は1枚目が実写風、2枚目がイラスト風でしたが、それを組み合わせることもできます。
「1枚目のタッチで2枚目を描き直してください」と入力すると
イラスト風の猫ちゃんを実写風の猫ちゃんに変えてくれました。
DALL-E3は従来の画像生成AIが苦手な文字入れもしてくれます。
「UTANO LOVEと書かれた看板を持ったオレンジ色のトラネコを描いてください」と入力すると
文字入れまで正確に表現された画像を生成してくれました。
日本語の文字入れは正確に表現してくれませんでした。
以上、OpenAIの最新画像生成AI「DALL-E3」について、使い方やどんなことができるのかを解説してきました。
画像生成AIはMidjoureyやStable Diffusionを使っている人が多いと思いますが、そこにDALL-E3が加わったことで覇権争いが激しさを増しそうですね。
今回いろいろ試してみましたが、日本語のプロンプトでも質の高い画像を生成してくれることと、文字入れができることが他の画像生成AIにない利点だと感じました。
ControlNetなどの拡張機能を使わなくてもChatGPTと会話するような感じで画像の修正ができるので、簡単に使えて初心者にもおすすめです。
今回紹介した活用事例はほんの一部です。アイデア次第でいろんな使い方ができそうです。
当ブログでは他にもAIの最新情報や活用方法についていろいろ紹介しています。ぜひ参考にして下さい。