Stable diffusion 人気モデルのAnything系を徹底比較!秘密が明らかに!!

AI is in wonderland
16 May 202318:10

TLDRこの動画では、Stable DiffusionのAnything系のモデル群を徹底的に比較しています。V3, V4, v4.5, V5の4種類のモデルが紹介され、それぞれの特徴や絵風の違いが解説されています。また、イージーネガティブとディープネガティブの3つのネガティブエンベッティングも比較されています。動画では、プロンプトの作成方法や拡張機能の活用も紹介され、具体的なプロンプト例とともに、比較のためにXYZプロットを使用した結果が示されています。最終的に、V3とV5は同じ系列で、ブイヨンとv4.5も同じ系列に属していることが明らかになり、それぞれの絵風に対する好みについても語られています。

Takeaways

  • 🎨 エニシングシリーズのV3, V4, v4.5, V5の4つのバージョンが存在し、それぞれ異なる画風を提供している。
  • 🖼️ V3とV5は同じシリーズで、青みが強い線がはっきりしている特徴があります。
  • 🎭 V4.5は柔らかい感じで、輪郭線が細く色合いが淡く、夢見がちな印象を与える。
  • 🔍 V3, V5系列は輪郭が強く色彩が強く、漫画やアニメ風のイラストでよく見られるスタイル。
  • 📈 V4.5と比較して、V5は全体的に明るく青みが強いが、輪郭線が強く書かれている。
  • 🌐 イージーネガティブV2は背景の描写が細かく、全体的にビビッドな絵になる傾向がある。
  • 🖌️ ディープネガティブは無表情でベタ塗り感があり、イージーネガティブ系とは絵面上での表現が異なる。
  • 📊 XYZプロットを使用して、モデルのイニシング系とネガティブエンベッティングの比較を行う。
  • 💡 プロンプトの傾向を可視化するプログラムを使用して、公開されているプロンプトから学習する。
  • 📚 拡張機能を使用して、プロンプトを書く際に楽しんで、候補に上がる単語を知ることができる。
  • 🔧 ハイレゾを使用することで、画像のアップスケールが可能で、より高品質の画像が生成される。

Q & A

  • Anything系列のモデルで、どのバージョンが一番人気ですか?

    -人気は変動するため一概に断言できませんが、比較视频中ではV3, V4, v4.5, V5の4種類が紹介されており、それぞれ異なる特徴を持っています。

  • ブイヨンとv4.5は同じ作者によるものですが、それらのスタイルはどのように異なりますか?

    -ブイヨンとv4.5は同じ作者によって作られたとされていますが、具体的にはv4.5の方が輪郭が細く、色合いが淡く、柔らかい印象を与えるような絵を生成する傾向があります。

  • Danboardタグを見つけるための拡張機能をインストールする手順は何ですか?

    -まず、オートマティックイレブンイレブンを起動し、エクステンションのボックスを開きます。次に、アウェイラブルをチェックして、オールテストファーストにチェックを入れ、ロードフロムをクリックします。ブールタグオートコンプレッション、プロンプティングという拡張機能をインストールし、アップデートとリスタートUIを行います。

  • プロンプトを書く際に、提案されるタグの数を増やすにはどうすればよいですか?

    -タグオートコンプリートのセッティングボックスに入り、マキシマムレザルトのところに希望する数字を入れ、アプライ&リスタートUIをクリックします。

  • プロンプトの傾向を可視化する方法として、どのようなプログラムを使用しましたか?

    -チャットGPTフォーさんによって作成されたプログラムを使用しました。このプログラムは、公開されているプロンプトから傾向を簡単に可視化することができます。

  • XYZプロットを使って何を比較することができますか?

    -XYZプロットを使用すると、Stable Diffusionの異なるモデルやネガティブエンベッティングの効果を視覚的に比較することができます。これにより、絵風の違いを明確に把握することが可能です。

  • イージーネガティブとディープネガティブの主要な違いは何ですか?

    -イージーネガティブは顔の光り、頬の赤み、表情などを絵に取り入れているのに対して、ディープネガティブはベタ塗りで顔の光をあまり表現しないという違いがあります。

  • V3とV5のモデルでは、絵のスタイルにどのような違いがありますか?

    -V3とV5は同じ系列であり、青みが強く線がはっきりしている傾向があります。V3はキラキラの汗を描写し、個々のオブジェクトやキャラクターがはっきりと際立ちます。

  • v4.5のモデルはどのような絵を生成しますか?

    -v4.5は輪郭が細く色合いが淡く、柔らかい夢見がちな印象を与えるような絵を生成します。視覚的な流れが生まれ、イラスト全体が統一感のある印象を与えます。

  • 動画で使用されたプロンプトはどのような意味を持っていますか?

    -動画で使用されたプロンプトは、マスターピースベスト、クオリティーワ1ガール、ジムユニフォーム、スパークリングアイズ、アウトドアズサライトなどがあります。これらは、生成される画像のスタイルや内容を示唆するキーワードです。

  • RDSRとハイレゾの違いは何ですか?

    -RDSRは画像のアップスケールに関するツールの一種ですが、ハイレゾはその中でも特に高解像度な画像生成に使用されます。動画では、アップスケールを2倍に設定して使用しました。

Outlines

00:00

😀 Introduction and Exploring Art Styles

Alice, the assistant, greets the audience and expresses her intention to explore the differences in art styles across various versions of the Anything series, specifically V3, V4, V4.5, and V5. She clarifies the authorship differences between the versions and mentions rumors about V3's successor. Alice also discusses a browser extension that suggests cardboard tags without needing to visit the cardboard site, guiding viewers through the process of enabling and using the extension.

05:02

📚 Using Google Colab for Prompt Analysis

The assistant demonstrates how to use Google Colab to analyze and visualize the frequency of words in public prompts. She instructs viewers to collect public prompts, save them in a text file, and upload it to Google Colab. Alice provides a step-by-step guide on pasting the provided program into Google Colab, executing it, and interpreting the results. She emphasizes the importance of encoding and file naming conventions for successful analysis.

10:06

🎨 Comparing Art Styles with XYZ Plots

Alice explains the process of using XYZ plots to compare the art styles of different Anything series models and negative embeddings. She guides viewers through selecting models, adjusting settings, and generating images for comparison. The assistant also discusses the visual differences between the models and embeddings, noting the distinct characteristics of each version and the artistic styles they produce.

15:07

🔍 Detailed Comparison and Personal Preferences

The assistant provides a detailed comparison of the art styles produced by the Anything series models and negative embeddings. She discusses the visual differences in terms of coloring, line work, and the portrayal of details. Alice shares her personal preference for the Easy Negative V2 with the V4.5 model, appreciating the softer and more dreamy style it produces. She invites viewers to share their preferences and encourages them to experiment with different versions to find their favorite style.

Mindmap

Keywords

💡Stable diffusion

Stable diffusionは、深層学習を用いて画像を生成する手法のひとつです。この技術は、大量のデータから学習し、新しい画像を創造的に生成することができます。ビデオでは、Stable diffusionを用いて、異なるバージョンのAnythingモデルによる画像生成の違いを比較しています。

💡Anything系

Anything系は、Stable diffusionのモデルの一つで、V3, V4, v4.5, V5の4種類があります。それぞれのバージョンは、異なる作者によって開発され、それぞれ異なる画風を生み出します。ビデオでは、これらのバージョンの画風の違いを詳しく比較しています。

💡ブイヨン

ブイヨンは、Stable diffusionのモデルの一つで、V3の後継モデルとされています。ビデオでは、ブイヨンの画像生成の特徴や、他のバージョンとの違いについて解説しています。

💡ネガティブエンベッティング

ネガティブエンベッティングは、画像生成プロセスで使用される手法で、特定の要素を避けながら画像を生成することができます。ビデオでは、イージーネガティブ、イージーネガティブV2、ディープネガティブの3つの異なるネガティブエンベッティングを比較しています。

💡XYZプロット

XYZプロットは、画像生成プロセスで使用される手法で、異なるパラメータを用いて画像を生成し、それらを比較することができます。ビデオでは、XYZプロットを使って、異なるバージョンのAnythingモデルによる画像生成の違いを可視化しています。

💡プロンプト

プロンプトとは、画像生成プロセスで用いられる入力テキストであり、生成される画像のスタイルや内容に大きな影響を与えます。ビデオでは、プロンプトの構成や、それによって生じる画像の違いについて解説しています。

💡ハイレゾ

ハイレゾとは、高解像度を意味する用語で、画像生成プロセスで使用される場合、より詳細な画像を生成することができます。ビデオでは、ハイレゾを使用して画像をアップスケールし、その結果を比較しています。

💡タグオートコンプリート

タグオートコンプリートは、プロンプト入力時に使用される機能で、入力された文字に応じて、タグを自動的に提案することができます。ビデオでは、タグオートコンプリートを使用して、プロンプト入力を効率化する方法を紹介しています。

💡WEBUI

WEBUIとは、Web User Interfaceの略で、ウェブベースのユーザーインターフェースを意味します。ビデオでは、WEBUIを使用してStable diffusionの操作を行い、画像生成プロセスを管理しています。

💡チャットGPT

チャットGPTとは、自然言語処理を用いて会話を行うAIサービスです。ビデオでは、チャットGPTを使用して、公開されているプロンプトの傾向を可視化するプログラムを生成しています。

💡Googleコラボ

Googleコラボは、Googleが提供するオンラインコラボレーションプラットフォームで、複数のユーザーが同時に文書を編集できる機能があります。ビデオでは、Googleコラボを使用して、プロンプトの可視化プログラムを実行しています。

Highlights

会津inワンダーランドのアシスタントアリスが、Stable diffusionのAnything系の4つのバージョン(V3, V4, V4.5, V5)の画風の違いを比較します。

ブイヨンとV4.5は同じ作者によるが、V3とV5は異なる作者に分かれているとされています。

V3の後継モデルであるとの噂があるV4.5についても解説しています。

拡張機能を使って、オンラインでダンボールタグを検索する方法が紹介されています。

オートコンプリート機能を使って、プロンプトをよりスムーズに作成することができる。

プロンプトの傾向を可視化するプログラムを使用して、公開されているプロンプトから学ぶ方法が説明されています。

Googleコラボを使用して、プロンプトの分析を行う方法が紹介されています。

XYZプロットを使って、Stable diffusionのモデル同士を比較する方法が解説されています。

ネガティブエンベッディングとしてイージーネガティブ、V2、ディープネガティブの3つの比較が行われています。

比較のために、同じシード値を使用することで、モデル間の差異を明確にする方法が提案されています。

画像のアップスケールにハイレゾを使用し、より高品質の画像を生成する方法が紹介されています。

イージーネガティブとディープネガティブの絵の違いが、顔の塗り方と表情の表現で明確にされています。

イージーネガティブV2とV1の比較で、背景の描写方法や全体的な色の明るさが異なることがわかります。

V3とV5の比較で、輪郭線と色彩の強さの違いが、漫画やアニメ風のイラストに適していることが示されています。

V4.5の絵は輪郭が細く色合いが淡く、柔らかい印象を与えるとされています。

V3とV5系では、オブジェクトやキャラクターがはっきりと際立ち、背景は太い筆でラフに描かれている印象があります。

V4.5やV5などの新しいバージョンでは、手の崩れなどのディティールが改善されていると感じられる。

最終的に、アリスはイージーネガティブV2を使用したエニシングv4.5の絵を好むと述べています。