DALL-E 2 で画像を作成するための 6 つのヒント + プロンプトの例

公開: 2023-03-06

DALL-E 2 で画像を作成するための 6 つのヒント + プロンプトの例

テクノロジーは、創造性には限界がないことを証明し続けています。 DALL-E 2 を使用して画像を生成したことがある場合は、私たちが話していることを知っています。 アイス スケート リンクのパンダ、アール ヌーボー様式で描かれた高層ビルのある未来的な風景など、想像力を働かせれば、DALL-E 2 が数秒でそれらを作成します。 このようなツールの巧妙さは、人々に AI を取り巻く懐疑論を再考させ、そのような新しい技術をより受け入れやすくしました。

下のジョン・オーデュボンの絵がAIによって生成されたと信じられますか? 以下の DALL-E 2 生成画像は、AI ツールが創造性の世界に大きな波紋を呼んでいることを証明しています。

ソース

DALL-E 2 は非常に使いやすいですが、このような画像を取得するには、最適なプロンプトが必要です。 そのため、このブログでは、ツール自体と、ツールを使用して魅力的な画像を作成するための役立つヒントについて説明します。

  • DALL-E 2 概要
    • バリエーション
    • 修復
    • アウトペインティング
  • DALL-E 2 の概要
  • DALL-E 2 プロンプト – 最良の結果を得るための 6 つのヒント
    • 1. スタイルを具体的にする
    • 2. 画像のあらゆる要素について話す
    • 3. 色について話すことを忘れないでください
    • 4.感情について話す
    • 5. 画像の構成を説明する
    • 6.複雑なプロンプトを避ける
  • DALL-E 2 は Midjourney と比べてどうですか?
  • AI と適切なデザイン アウトソーシング戦略を組み合わせて、クリエイティブ プロセスを再定義する

DALL-E 2 概要

OpenAI は 2021 年 1 月に世界に DALL-E を紹介しました。これは、アボカドのアームチェアについて多くの人が話しているのを見つけたに違いありません!

空欄
DALL-E 2 で生成された画像。プロンプト – アボカドの形をしたアームチェア

2022 年までに、DALL-E 2 がリリースされました。 最大の飛躍は、4 倍の画像解像度のサポートです。 また、見事なフォトリアリスティックな結果で注目を集めました。

当初、DALL-E 2 は限られたユーザーのみが利用できました。 しかし、数か月にわたる段階的な展開の後、OpenAI は最終的に待機リストに終止符を打ち、2022 年 9 月までに DALL-E 2 をすべての人が利用できるようにしました。

空欄
DALL-Eで生成された画像

画像生成は、間違いなく DALL-E 2 の特徴的な機能です。しかし、それでできることは他にもたくさんあります。 探索するいくつかの機能を見てみましょう。

バリエーション

プロンプトごとに、4 つのイメージが生成されます。 それらのいずれかが気に入った場合は、それぞれの画像に表示される [クイック アクション] メニューから、これらの画像のいずれかのバリエーションを作成できます。

このオプションは、選択した画像のバリエーションをさらに 4 つ生成し、ダウンロードしたり、さらにバリエーションを生成したりできます。 これが例です。

空欄
DALL-E 2 で生成された元の画像
空欄
バリエーション
空欄
バリエーション

これらのバリエーションは、特に単純なアニメーション GIF を作成する場合に便利です。

修復

もう 1 つの便利な機能は、修復です。 ここで、既存のデザインを編集し、要件に基づいてレタッチします。 この機能を使用すると、背景を歪めたり、存在する他の要素に影響を与えたりすることなく、要素を追加したり、画像から要素を削除したりできます。 これは、画像にテクスチャや影を追加したり、削除したりするための優れたツールです。

アウトペインティング

下のビデオは、DALL-E 2 がヨハネス フェルメールの人気アートワーク「真珠の耳飾りの少女」のバージョンをどのように塗りつぶす (拡大する) かを示しています。

ソース

この機能は、既存のアートを再考して、AI がアートをどのように解釈し、処理するかを理解するのに最適です。 また、既存のデザインの解像度をクリエイティブに微調整して、別のプラットフォームで使用したり、印刷物で使用したりするのに役立ちます。

DALL-E 2 の概要

DALL-E 2 の最も優れた点の 1 つは、そのシンプルさです。 AI 画像生成機能をアプリに統合したい場合は、インターネット ブラウザーから直接アクセスしたり、API として使用したりできる Web アプリケーションとして利用できます。

無料のアカウントを作成することから始めます。 サインアップすると、アカウントに 50 クレジットが追加され、毎月 15 クレジットが追加されます。 これは無料アカウント用です。 また、無料クレジットを繰り越すことはできません。

クレジットの購入も選択できます。 価格とクレジットの使用は、OpenAI のモデルによって異なることに注意してください。

空欄
ソース

上の画像からわかるように、価格とアカウントでのクレジットの使用は、画像の解像度によって異なります。 有料クレジットは、有効期限が切れる前の 12 か月間、アカウントで利用できます。

アカウントを作成したら、プロセスは非常に簡単です。 プロンプトを入力し、[画像を生成またはアップロード] をクリックして編集を開始します。

空欄
ソース

DALL-E 2 プロンプト – 最良の結果を得るための 6 つのヒント

この投稿をInstagramで見る

James Orrigo (@ladinabattle) がシェアした投稿

DALL-E 2 のような AI 画像ジェネレーターを使用すると、驚くような結果を得ることができます。 違いは、使用するプロンプトにあります。 プロンプトの長さは最大 400 文字です。 最良の結果を得るには、この文字制限を最大限に活用し、できるだけ多くの詳細を追加してください。 より良い画像生成のために完璧な DALL-E 2 プロンプトを作成するためのヒントを見てみましょう。

1. スタイルを具体的にする
この投稿をInstagramで見る

DALL・E by OpenAI(@openaidalle)がシェアした投稿

どんな種類のビジュアル スタイルを念頭に置いているかを AI に伝える必要があります。 それ以外の場合は、キーワードの一般的な表現が得られます。

「都市景観」は、アルゴリズムが探しているものを理解するのに十分単純です。 しかし、デザインの視覚的なスタイルとムードはどうですか? プロンプトで好みのスタイルを明確に指定します。

水彩画のイラスト、または油絵のスタイルが必要ですか? それとも、あなたのイメージが印象派のような大衆芸術運動に共鳴したいですか、それとも大衆芸術家のスタイルを模倣したいですか? スタイルをより具体的にすると、デザインがより良くなります。

以下の画像は、「都市景観」のために DALL-E 2 で生成されました。 ビジュアル スタイルの説明を追加すると、違いが生じることに注意してください。

空欄
DALL-E 2 で生成された画像。 プロンプト: 日没時の街並み
空欄
DALL-E 2 で生成された画像。プロンプト: レトロなベクター イラストの日没時の都市景観

ヒント:すべてのデザイン スタイルには、サブカテゴリがあります。 たとえば、イラストはさまざまなスタイルにすることができます。 鉛筆画や水彩イラストのようなアナログ スタイル、ベクター アートのようなデジタル スタイル、またはロー ポリのいずれかです。 アート スタイルについて話す必要がある場合は、アフロフューチャリズム、スチーム パンク、メンフィス スタイルなどのオプションがあります。 各スタイルが何を表しているかがわかれば、プロンプトに含める正確な用語がわかります。

たとえば、下の画像はどちらも「キッチン テーブルの上の花瓶の絵」のために生成されたものですが、1 つは追加のディテール、つまりメンフィス スタイルを持っていました。

空欄
DALL-E 2 で生成された画像。
空欄
DALL-E 2 で生成された画像。プロンプト: 窓を背景にキッチン テーブルに置かれた花瓶のメンフィス スタイルの絵画。
2. 画像のあらゆる要素について話す

このような AI 画像ジェネレーターを使用しているときによくある間違いの 1 つは、主題については話しますが、背景については忘れてしまうことです。

空欄
DALL-E 2 で生成された画像

上記の例では、「スケートボードに乗ったテディベア」のような単純なプロンプトで、無地の白い背景の画像が生成されます。 場所の詳細を追加すると、画像の精度が向上します。 そのため、プロンプトを作成するときは、デザインの主要な主題だけでなく、主題が存在する背景やシーンについても十分な詳細があることを確認してください。

3. 色について話すことを忘れないでください

被写体の衣装の色、背景の色、または希望する色の雰囲気の概要は、プロンプトに付加価値を与えることができます。

空欄
DALL-E 2 で生成された画像

上記の例では、背景と被写体の色が指定されていなければ、イメージは大きく異なって見えます。

結果をさらに向上させるために、「明るいピンク」や「スカイブルー」などの適切な記述子を色の名前に追加したり、「クリムゾンレッド」や「マゼンタ」などの特定の色の名前を使用したりすることもできます. さらに良いことに、これらの色の HEX コードを持っている場合は、それらをプロンプトに追加して、思い描いている正確な色を取得できます。

4.感情について話す

被写体を幸せにしたいのか、悲しませたのか、怒ったのか、それとも考えにふけってしまったのか。 取り入れたい感情を説明してください。 結局のところ、強い感情指数がなければ、あなたのイメージには深みがありません。

DALL-E 2 によって生成された以下の画像の違いは、プロンプトに「幸せ」という単語が含まれていることだけです。

空欄
DALL-E 2 で生成された画像。 プロンプト: 手にコーヒー マグを持って、リビング ルームのソファに座っている猫のイラスト。
空欄
DALL-E 2 で生成された画像。プロンプト: リビング ルームのソファに座り、手にコーヒー マグを持った幸せな猫のイラスト。

絵文字を追加すると、写真に動物や人間が写っている場合や、擬人化された被写体がある場合でも、表情をより正確に捉えるのに役立ちます。

絵文字だけでプロンプトを作成することもできます。 しかし、はい、解釈は大幅に異なり、常に想像どおりの結果が得られるとは限りません。

空欄
ソース
5. 画像の構成を説明する

人間や動物の場合、感情や表情を特定するのは簡単です。 しかし、画像に無生物しかない場合はどうなるでしょうか? これらの画像にはまだ感情があります。 結局のところ、それがオーディエンスと効果的につながる方法なのです。

このために、画像の構成に関する詳細、次のようなパラメーターを追加できます。

  • 写真の角度 – 被写体のマクロ ショット、オーバーヘッド ショット、またはドローン ショット。
  • 照明 – スタジオ照明、屋内照明、屋外照明、逆光ショット。
  • 写真レンズ効果 – 魚眼レンズ、二重露光
この投稿をInstagramで見る

DALL・E by OpenAI(@openaidalle)がシェアした投稿

慣れ親しんだ小さな微調整、写真編集アプリで通常調整するすべてのパラメーターは、DALL-E 2 プロンプトで貴重な入力を行うことができます。 これらは、シーンを正確に作成し、アイデアに合った構図を実現するのに役立ちます。

6.複雑なプロンプトを避ける

説明的なプロンプトは、間違いなく素晴らしい結果をもたらします。 しかし、複雑な詳細を追加したり、デザイン内のオブジェクトの向きや位置などの要素を非常に正確に口述したりすることは、必ずしも物事を単純化するとは限りません。 プロンプトが具体的すぎると、期待される結果が得られない場合があります。

たとえば、要素の位置とレイアウトについて説明するプロンプトを含むデザインを作成してみました。 「左側に、中央に向かって傾斜した黄色の長方形と、右側の右上隅に配置された大きな赤い円」. プロンプトは単純ですが、結果は正確ではありませんでした。

空欄
DALL.E で生成された画像

同様に、DALL-E 2 (一般的な AI 画像ジェネレーター) は、複数の人物または人々のグループを含む画像を作成するための最適なオプションではない可能性があります。 いくつかのデザインでは、顔がゆがんで表示され、機能を編集するためのプロンプトを微調整して実験することで、クレジットを無駄に費やしています.

これらの推奨事項と禁止事項を念頭に置いて、DALL-E 2 の可能性を探り、マーケティング デザインのインスピレーションを見つけたり、独自の要素を作成して広告に追加したりしてください。 これが、クリエイティブ チームの取り組みを補完するために AI を有効に活用する方法です。

DALL-E 2 は Midjourney と比べてどうですか?

Midjourney も人気のある AI 画像生成ツールで、DALL-E 2 に匹敵します。Midjourney の価格とプロンプトの詳細については、こちらのブログをご覧ください。

これら 2 つの一般的な AI イメージャー ジェネレーターの違いを簡単にまとめると、次のようになります。

  • Midjourney は現在、Discord サーバー経由でのみ利用できますが、DALL-E 2 はブラウザーで API の形式で直接使用できます。
  • イメージのミッドジャーニー ライセンス条件は、選択したプランによって異なります。 また、プランによっては月額料金が発生します。 DALL-E 2 では、サブスクリプション モデルではなく、使用量に応じてクレジットを購入する従量課金制モデルが提供されます。 また、無料のクレジットだけでなく、購入したクレジットで作成された画像は、商用目的で使用できます。

生成されたデザインに関しては、Midjourney と DALL-E 2 の両方がかなり印象的な結果をもたらしました。 どちらのツールも、4 つの異なるバリエーションから選択できます。 DALL-E 2 のアウトペインティング オプションは、Midjourney のアップスケーリング オプションよりもはるかに実用的です。 さらに、前者には、ダウンロードする前に画像を編集するオプションもあります。

これらすべての相違点と類似点を要約すると、DALL-E 2 は、AI 画像生成を探求する初心者にとって、少し便利で機能満載のツールのように感じられます。

AI と適切なデザイン アウトソーシング戦略を組み合わせて、クリエイティブ プロセスを再定義する

世界中のブランドやコンテンツ クリエイターは、DALL-E 2 などの AI 画像ジェネレーターを使用して、デジタル ステッカー、AR テクノロジ、ゲームなどで使用できるクリエイティブでクールなデザインを作成しています。

AI によって生成されたデザインをどのように使用しますか? これらのツールは人間のデザイン機能を強化するだけであり、マーケティング、広告、およびブランディングのためのスタンドアロンのデザインを作成するために使用できないことが多いことを覚えておいてください. 素晴らしいアイデアが頭に浮かんでいて、AI で生成された画像を微調整して、ブランドにとって商業的で役立つものを作成するのに役立つ信頼できるデザイン チームが必要な場合は、Kimp サブスクリプションを選択してください。

今すぐ登録して、Kimp を 7 日間無料でお試しください。