【stable diffusion】画像からフィギュアからポーズを超絶簡単生成!3Dopen Pose! を試してみました。

藤原工務店
12 May 202309:56

TLDRこのビデオでは、3Dオープンポーズというツールを使って、画像からフィギュアのポーズを生成する方法が紹介されています。ツールの使用方法を説明しながら、具体的な手順を紹介し、細かい調整方法や、画像から骨格検出して棒人形を作成する方法も解説されています。さらに、ハンドジェスチャープラグインを使って生成精度を向上させる方法も紹介されています。最後に、生成された画像をブラッシュアップし、高解像度で完成させるまでのプロセスが詳しく説明されています。

Takeaways

  • 🖥️ WEBUIのオープンポーズ機能を使って、直感的に関節を設定して棒人形のポーズを生成できます。
  • 🎨 画像から骨格検出と棒人形を作成ができ、さらにハンドジェスチャープラグインで生成精度を向上させます。
  • 📌 細かな調整が必要な場合は、パラメーターを数値で調整可能です。
  • 🔧 3Dオープンポーズエディタでは、指の関節まで細かく調整できます。
  • 🖼️ パーツの大きさを右のパレットで調整し、書き出し画面で確認できます。
  • 👀 顔の部分はMの字の両側が目、真ん中が鼻になります。
  • 🔗 コントロールネットを使って、画像とモデルを組み合わせて自然なポーズを生成。
  • 📈 ウェイトを調整することで、モデルの影響力を制御できます。
  • 🌟 ポジティブとネガティブプロンプトを使って、生成された画像を導くことができます。
  • 🖼️ ハイレゾフィックスをチェックすることで、高解像度の画像を生成できます。
  • 🎨 設定を繰り返してブラッシュアップし、最終的な画像を完成させることができます。

Q & A

  • 3Dオープンポーズとは何ですか?

    -3Dオープンポーズは、画像からフィギュアを生成し、ポーズを調整することができるツールです。直感的に関節を設定し、パラメーターで細かく調整することが可能です。

  • WEBUIのオープンポーズをインストールするにはどうすればよいですか?

    -WEBUIのエクステンションズのタブから、インストールfrom URLを選択し、3DオープンポーズのURLをペーストしてインストールボタンをクリックします。その後、アプリを再起動します。

  • 棒人形のポーズを生成するためにはどのような手順が必要ですか?

    -まず、3Dオープンポーズエディタで棒人形の関節をクリックしてリグを回して各部位を動かします。次に、パラメーターを調整して指の関節など細かい部分を微調整します。最後に、生成ボタンをクリックしてポーズを生成します。

  • 画像から骨格検出して棒人形を作成するにはどうすればよいですか?

    -3Dオープンポーズの機能を使って、画像から骨格を検出することができます。検出された骨格を基に棒人形を作成し、さらにハンドジェスチャープラグインを使って生成精度を向上させることができます。

  • コントロールネットを設定する際に注意すべき点は何ですか?

    -コントロールネットを設定する際には、顔の部分のボーン配置に注意する必要があります。頭が切りれてしまわないように、ボーンを適切な位置に配置する必要があります。また、ウェイトの数値も調整して、画像が崩壊しないように注意する必要があります。

  • ポジティブプロンプトとネガティブプロンプトとは何ですか?

    -ポジティブプロンプトは、生成された画像に含まれるべき要素を指定するもので、例えば「花のある公園にいる女学生」などが挙げられます。一方、ネガティブプロンプトは、生成された画像から除外したい要素を指定します。

  • 画像生成の忠実度をコントロールするパラメーターは何ですか?

    -画像生成の忠実度をコントロールするパラメーターはcfgスケールです。数値を上げるほど、画像はプロンプトに近くなりますが、あまりに大きな数値を指定すると画像が不自然になる可能性があります。

  • 画像の解像度を向上させるためにはどのような設定が必要ですか?

    -画像の解像度を向上させるためには、ハイレゾフィックスにチェックを入れ、ステップ数を適切に設定することが重要です。また、手のイジングストレージの値も調整して、自然な手の動きを実現することができます。

  • 3Dオープンポーズで生成した画像をブラッシュアップするにはどうすればよいですか?

    -3Dオープンポーズで生成した画像をブラッシュアップするには、まず生成した画像をダウンロードし、PINGビンゴなどのツールを使って画像をアップロードします。その後、画像の周囲の数値を調整して、ハイレゾフィックスや手のイジングストレージを設定し、ブラッシュアップを行います。

  • 画像から検出で生成されたポーズを変更するにはどうすればよいですか?

    -画像から検出で生成されたポーズを変更するには、3Dオープンポーズのファイルを開き、画像から検出という項目を選択します。選択した画像に基づいてポーズが生成されます。その後、必要に応じてポーズを調整し、再度生成することができます。

  • 3Dオープンポーズで生成した画像を改善するためにはどのような手順が必要ですか?

    -3Dオープンポーズで生成した画像を改善するためには、まず生成された画像を確認し、必要に応じてポーズや部位を調整します。次に、コントロールネットの設定を微調整して、画像の質を向上させます。最後に、ブラッシュアップツールを使って細かい部分を修正し、完成させます。

Outlines

00:00

🎨 Intuitive Pose Customization with 3D Open Pose

The video begins with an introduction to the 3D Open Pose feature in a web user interface (WEBUI). The narrator demonstrates how to intuitively set joint positions to create poses for a stick figure. Adjustments can be made numerically through parameters, allowing for fine-tuning even down to the fingers. The video shows how poses can be generated from a rigged figure, and how plugins can improve the accuracy of difficult gestures. The tutorial continues with instructions on how to install the Open Pose extension from a URL, and how to use the feature to manipulate the figure's limbs and facial features. The narrator emphasizes the flexibility and ease of use once one becomes accustomed to the controls. The segment concludes with a brief mention of downloading the created pose and opening a control net for further adjustments.

05:01

🖼️ Enhancing Image Quality and Pose Refinement

The second paragraph focuses on refining the generated pose and enhancing the image quality. The narrator addresses an issue where the bone structure of the left hand is overlapping and appears as a single unit. To resolve this, they adjust the rate from 4 to 4.5 to increase the influence of the depth. The video then proceeds to demonstrate how to brush up the generated image using the 'ping bingo' feature, which allows for adjustments to specific parts of the image. Various settings are discussed, including high-resolution fixes, hand easing, and prompt scale, which controls the fidelity of the generated image to the input prompt. The narrator also touches on the 'best face' option for facial correction and the 'passcale' feature for image refinement. They mention the importance of considering VRAM limits when setting these options and conclude with a reminder to experiment with different settings to find what works best for the desired outcome.

Mindmap

Keywords

💡3Dオープンポーズ

3Dオープンポーズは、3次元のキャラクターのポーズを調整するためのツールです。このツールを使うことで、キャラクターの関節を直感的に操作し、細かくポーズを調整することができます。ビデオでは、3Dオープンポーズを通じて、キャラクターのポーズを自由自在に生成する方法が紹介されています。

💡WEBUI

WEBUIとは、Web User Interfaceの略で、ウェブベースのユーザーインターフェースを意味します。ビデオでは、WEBUIを使用して3Dオープンポーズをインストールし、操作する方法が説明されています。

💡GPU

GPUとは、Graphics Processing Unitの略で、画像処理に特化したコンピュータチップです。ビデオでは、GPUが画像生成プロセスで使用されると触れられており、その高速な処理能力が画像生成の質と速度を向上させるとされています。

💡ハンドジェスチャープラグイン

ハンドジェスチャープラグインとは、手のポーズを生成するための追加ツールです。ビデオでは、このプラグインを使用して手のポーズを生成し、画像生成の精度を向上させる方法が紹介されています。

💡コントロールネット

コントロールネットとは、画像生成プロセスで使用されるネットワークで、生成される画像の質と方向性を制御します。ビデオでは、コントロールネットを使用して、生成された画像の詳細を調整する方法が説明されています。

💡ポジティブプロンプト

ポジティブプロンプトとは、画像生成プロセスで使用される指示で、生成される画像に含めたい要素を指定します。ビデオでは、花のある公園にいる女学生など、具体的なシーンを提示することで、生成された画像のテーマを定義する方法が紹介されています。

💡ネガティブプロンプト

ネガティブプロンプトとは、画像生成プロセスで使用される指示で、生成された画像から除外したい要素を指定します。ビデオでは、イージーネガティブを使用して、不必要な要素を排除する方法が説明されています。

💡ブラー

ブラーとは、画像の模様をぼやけさせる効果で、画像の自然さを高めるために使用されます。ビデオでは、ブラーを適用することで、生成された画像の質を向上させる方法が紹介されています。

💡ハイレゾフィックス

ハイレゾフィックスとは、高解像度を意味する用語で、画像の詳細を強化するために使用されます。ビデオでは、ハイレゾフィックスオプションを使用して、より鮮明で詳細な画像を生成する方法が説明されています。

💡VRAM

VRAMとは、Video Random Access Memoryの略で、画像処理に使用されるメモリのことです。ビデオでは、VRAMの容量が画像生成プロセスに与える影響について触れられており、十分なVRAMがあることで高品質な画像を生成できるとされています。

💡サンプリングメソッド

サンプリングメソッドとは、画像生成プロセスで使用される手法で、生成される画像の質と自然さを向上させるために使用されます。ビデオでは、DTM+sdkなどのサンプリングメソッドを使用して、美しい画像を生成する方法が紹介されています。

Highlights

画像からフィギュアのポーズを生成する「3Dopen Pose」を試してみました。

WEBUIのオープンポーズを使用して、直感的に関節を設定できます。

パラメーター調整で細かい調整が可能で、指の関節まで細かく操作できます。

GPUやバックエンドの性能によって生成速度が変動する可能性がある。

画像から骨格検出を行うことで、棒人形を作成することが可能です。

ハンドジェスチャープラグインで生成精度が向上し、苦手なポーズも生成できるようになる。

WEBUIのエクステンションズタブから3Dオープンポーズをインストールできます。

3Dオープンポーズエディタでは、棒人形のボーンをクリックしてポーズを調整。

顔のパーツは、こめかみ、鼻、目とそれぞれが独立して調整可能。

3Dオープンポーズでは、指の関節まで細かく調整できる特徴があります。

幅を調整することで、キャラクターの中心に焦点を当てることができます。

画像をアップロードし、コントロールネットを使用して画像の影響力を調整。

ポジティブプロンプトとネガティブプロンプトの設定で生成結果を細かく制御。

ブラッシュアップで画像の解像度を向上させることが可能です。

3Dオープンポーズの機能を使って、画像から検出されたポーズを生成。

画像生成の忠実度をコントロールするcfgスケールを使用して、プロンプトに近い画像を生成。

ベストフェイスオプションで顔の崩れを補正し、自然な画像を生成。

VRAMの限界値に応じて、画像の解像度と生成オプションを調整。

3Dオープンポーズを使用して、細部まで調整し、最終的な画像を完成させる。