こんにちは、うたのです(* ᴗ ᴗ) 最近は生成AIにはまっています。
今回はリアルタイム画像生成ができるAI「SDXL Turbo」がリリースされたので試してみました。
まだベータ版が始まったばかりなので機能は制限されていますが、従来の画像生成にはない新しい体験ができる画期的なサービスですのでぜひ皆さんも試してみください!
※2023年12月4日時点
SDXL Turboは2023年11月29日にStability AIが新しく発表した画像生成AIです。
SDXL Turbo最大の特徴は、プロンプトを入力するとリアルタイムで画像を生成してくれることです。
実際に使用している様子です。
Introducing SDXL Turbo: A real-time text-to-image generation model.
SDXL Turbo achieves state-of-the-art performance with a new distillation technology, enabling single-step image generation with unprecedented quality, reducing the required step count from 50 to just one.
The… pic.twitter.com/0NA4aUqKkD— Stability AI (@StabilityAI) November 28, 2023
プロンプトを入力した瞬間に画像を生成してくれるのが分かります。
従来の画像生成AIと言えばStable DiffusionやMidjourneyなど色々ありますが、プロンプトを入力して生成ボタンを押さないと画像を生成してくれないので、早くても数秒、遅いときは数分かかることもあります。
思い通りの画像を生成しようと思ったら何度もプロンプトを修正してそのたびに生成ボタンを押す必要がありました。
一方、SDXL Turboは生成ボタンを押さなくてもプロンプトを修正するたびにリアルタイムで画像をどんどんと生成してくれます。
敵対的拡散蒸留(Adversarial Diffusion Distillation 略してADD)と呼ばれる蒸留技術によって、今までは何ステップもかかっていた画像生成が1ステップで可能になり、画像のクオリティも維持しながらリアルタイムで画像を出力できるようになったのです。
画像生成AIの進化は本当にすさまじいですね
SDXL Turboは以下の二つの方法で利用できます。
SDXL Turboはオープンソース(ソースが公開されている)なので、自分のパソコンにダウンロードして環境を構築することもできます。
今回はブラウザ上でのSDXL Turboの使い方について解説します。
SDXL TurboはStability AIが運営している画像編集プラットフォームClip dropでベータ版が公開されています。
まずはClip dropのサイトにアクセスして右上の「サインイン/サインアップ」からアカウント登録を行います。
ログインしてツールの中から「Stable Diffusion Turbo」を選びます。
以下がSDXL Turboの画面です。プロンプトを入力して上に画像が生成されます。
では実際に使っていきます。以下のプロンプトを左から順番に入力していくので、リアルタイムで画像を生成してくれる様子を動画でご覧ください。
a dog,runnning,in the park(公園で走っている1匹の犬)
プロンプトを入力するたびに画像がどんどん変化していくのが分かります。
今度は別のプロンプトで試してみましょう。
1 girl,cute,long hair,wearing a white dress,anime style(白いドレスを着たアニメ調の可愛い女の子)
アニメ調だとクオリティは落ちますがきちんとリアルタイムで画像生成されていますね。
以上、リアルタイム画像生成AI「SDXL Turbo」の使い方についての解説でした。
ブラウザでも利用できますが無料プランだと使用制限があります(2回ほど使用したら制限に引っかかってしまいました)
Clip dorpの有料プランに入るか、Hugging Faceなどにおいてあるソースをダウンロードして自分のPCに環境を構築すれば無制限に利用できるようになります。
まだサービスが始まったばかりのベータ版ということで、画像サイズやプロンプトの文字制限があったりしますが、今後のアップデートで改善されることを期待したいです。
画像生成の進化はとどまることを知りません。今後はリアルタイム生成が画像生成のスタンダードになるかもしれませんね。