NoobAIノート

NoobAIノート


はじめに

NoobAIは、アニメとファーリーの画像生成に特化したSDXLアーキテクチャをベースにしています。現在、モデルのv-prediction 0.65Sバージョンを使用しています。このガイドは主にそのバージョンに焦点を当てています。DanbooruとE621でトレーニングされました。

ダウンロード

CivitAI

トレーニングのヒント


現在sd3ブランチを使用しているため、以下のパラメータを渡すだけで特に問題ありません:

--v_parameterization
--zero_terminal_snr

24Gb VRAMに収める方法

4090に完全に収まるように、以下の設定を使用しました。

クリックして内容を展開
args=(
    --debiased_estimation_loss
    --max_token_length=225
    --keep_tokens=1
    --keep_tokens_separator="|||"
    --pretrained_model_name_or_path=/home/kade/ComfyUI/models/checkpoints/noobaiXLVpredv06.safetensors
    --v_parameterization
    --zero_terminal_snr
    --log_with=tensorboard
    --seed=1728871242
    --dataset_repeats=1
    --resolution="1024,1024"
    --enable_bucket
    --bucket_reso_steps=64
    --min_bucket_reso=256
    --max_bucket_reso=2048
    --flip_aug
    --shuffle_caption
    --cache_latents
    --cache_latents_to_disk
    --max_data_loader_n_workers=8
    --persistent_data_loader_workers
    --network_dim=100000
    --network_alpha=64
    --network_module="lycoris.kohya"
    --network_args
            "preset=full"
            "conv_dim=100000"
            "decompose_both=False"
            "conv_alpha=64"
            "rank_dropout=0"
            "module_dropout=0"
            "use_tucker=True"
            "use_scalar=False"
            "rank_dropout_scale=False"
            "algo=lokr"
            "bypass_mode=False"
            "factor=16"
            "dora_wd=True"
            "train_norm=False"
    --network_dropout=0
    --optimizer_type=ClybW
    --train_batch_size=14
    --max_grad_norm=1
    --gradient_checkpointing
    --lr_warmup_steps=0
    --learning_rate=0.0003
    --unet_lr=0.0003
    --text_encoder_lr=0.00015
    --lr_scheduler="cosine"
    --lr_scheduler_args="num_cycles=0.375"
    --multires_noise_iterations=12
    --multires_noise_discount=0.4
    --no_half_vae
    --sdpa
    --mixed_precision="bf16"
    --save_model_as="safetensors"
    --save_precision="fp16"
    --save_every_n_steps=100
    --sample_every_n_steps=100
    --sample_sampler="euler_a"
    --sample_at_first
    --caption_extension=".txt"
)

バッチサイズを減らすか、解像度を768xまたは512xに下げることで、任意のGPUに収めることができます。それでも問題がある場合は、8ビットオプティマイザを使用してください。現在私が好んで使用しているオプティマイザはこちらです。sd-scriptsにカスタムオプティマイザを統合する方法については

    <a href="/ja/docs/yiff_toolkit/lora_training/Add-Custom-Optimizers/">こちら</a>のガイドを参照してください。

プロンプトのヒント


日付タグ

日付タグには、年タグと期間タグの2種類があります。

年タグ

xxxx年の形式を使用します。例:2021

期間タグ

期間タグについては、以下の表を参照してください:

年の範囲期間タグ
2005-2010old
2011-2014early
2014-2017mid
2018-2020recent
2021-2024newest