NoobAI LoRA

NoobAI LoRA


すべてのLoRAは、モデルのv-pred変種の多くのバージョンのいずれかでトレーニングされています。具体的にどのバージョンを使用しているか確認するには、メタデータをチェックすることをお勧めします。

EPSバージョンを使用している場合、明らかにProgressive Distillation for Fast Sampling of Diffusion Modelsの付録Dを読んでいません。ノイズから画像への回転を見てください!素晴らしいですよね!

LoRA一覧


キャラクター
キャラクターLoRAは、Stable Diffusionモデルに特定のキャラクターの一貫した表現を生成することを教える特殊な学習モデルです。これには顔の特徴、体型の比率、衣装、そして特徴的な属性が含まれます。これらの適応は、AIアートコミュニティで、オリジナルキャラクター、有名人、またはフィクションのキャラクターの一貫した表現を作成するために特に人気があります。キャラクターLoRAには、様々な角度や表情からキャラクターの特徴を明確に示す、慎重に選別されたトレーニングデータ(通常20-50枚の高品質な画像)が必要です。主にモデルの注意機構を微調整することで、ポーズや表情の自然な変化を可能にしながら、顔の特徴、体型の比率、特徴的な詳細の一貫性を維持します。トレーニングプロセスは、高レベルの特徴認識と生成を担当するモデルの上位層に焦点を当てています。
コンセプト
コンセプトLoRAは、Stable Diffusionモデルに、元のトレーニングデータでは十分に表現されていなかった特定のオブジェクト、生物、または抽象的な概念を理解し生成することを教えます。これらの適応により、特定の主題に関連する意味的関係と視覚的特徴に対するモデルの理解が修正されます。例えば、コンセプトLoRAは、特定の建築要素、ユニークな生物、または一貫した特徴を持つ特定のオブジェクトをより良く生成するのに役立ちます。コンセプトLoRAは通常、対象となる主題の異なる角度、文脈、バリエーションを捉えるために、スタイルLoRAよりも多様なトレーニングデータ(通常50-100画像)を必要とします。これらは、モデルのクロスアテンションとフィードフォワード層の両方を調整することで、対象となるコンセプトの特徴をより良く認識し再現できるようにします。
スタイル
Stable DiffusionモデルのスタイルLoRAは、特定の芸術的スタイル、視覚的な美学、またはレンダリング技法を再現するためにニューラルネットワークを適応させることに焦点を当てています。これらの適応により、モデルがブラシストローク、カラーパレット、シェーディング技法、全体的な芸術的表現などの視覚要素をどのように解釈し生成するかが変更されます。スタイルLoRAは、印象派やアールヌーボーなどの古典的な芸術運動から、アニメ、ピクセルアート、水彩画などの現代のデジタルアートスタイルまで、あらゆるものに出力を変換することができます。対象となるスタイルに関連する特徴的な視覚パターンと技法を認識し再現するようにモデルの注意層を微調整することで機能し、良好な結果を得るために必要なトレーニング画像は比較的少なく(通常15-50枚の高品質な例)で済みます。