Блог


В чем особенности Pony в Stable Diffusion

Pony Diffusion — это специализированная модель для генерации изображений в рамках Stable Diffusion, которая ориентирована на создание изображений пони (персонажей из вселенной My Little Pony или других антропоморфных лошадей). Эта модель была обучена на большом количестве изображений пони, что позволяет ей генерировать качественные и детализированные изображения в этом стиле.


Она стала популярной среди пользователей благодаря своей способности создавать не только изображения с пони, но и детализированные, стилистически точные и эстетически привлекательные аниме-арты.


Особенности Pony Diffusion:
  1. Специализация на пони:

    • Pony Diffusion оптимизирована для создания изображений пони, включая как каноничных персонажей из My Little Pony, так и оригинальных дизайнов.
    • Модель хорошо справляется с передачей характерных черт, таких как грива, хвост, глаза и другие атрибуты пони.
  2. Специализация на аниме-стиле

    • Pony была обучена на большом наборе данных, состоящем из аниме-артов, манги и других связанных с аниме изображений.

    • Это позволяет модели "понимать" ключевые особенности аниме-стиля: большие глаза, выразительные эмоции, яркие цвета, характерные причёски и пропорции персонажей.

  3. Высокое качество генерации:

    • Благодаря обучению на большом наборе данных, связанных с пони, модель способна создавать изображения с высокой детализацией и точностью.
    • Она учитывает особенности анатомии пони и их стилизованный внешний вид.
  4. Поддержка различных стилей:

    • Pony Diffusion может генерировать изображения в разных стилях, включая реализм, мультяшный стиль, аниме и другие.
    • Пользователи могут настраивать параметры для получения желаемого результата.
  5. Интеграция с Stable Diffusion:

    • Pony Diffusion работает на базе Stable Diffusion, что позволяет использовать все преимущества этой платформы, включая гибкость в настройке и поддержку различных инструментов для генерации изображений.
  6. Поддержка сообщества:

    • Модель активно развивается и поддерживается сообществом фанатов пони и энтузиастов ИИ.
    • Пользователи делятся своими работами, пресетами и советами по использованию модели.
  7. Кастомизация:

    • Pony Diffusion позволяет создавать как каноничных персонажей, так и уникальных пони с индивидуальными чертами, цветами и аксессуарами.
Как использовать Pony Diffusion?
  1. Убедитесь, что у вас установлена Stable Diffusion (например, через Automatic1111 WebUI или ComfyUI).
  2. Загрузите модель Pony Diffusion (обычно это файл .ckpt или .safetensors).
  3. Запустите Stable Diffusion и выберите Pony Diffusion в качестве модели.
  4. Настройте параметры генерации (например, промпты, негативные промпты, шаги, CFG scale) и создавайте изображения.
Пример промпта для Pony Diffusion:
"A beautiful unicorn pony with a rainbow mane, standing in a magical forest, highly detailed, vibrant colors, cartoon style"

Pony Diffusion — это отличный инструмент для фанатов пони и художников, которые хотят создавать уникальные изображения в этом стиле.

Как убрать ошибку RuntimeError: Error(s) in loading state_dict for IntegratedAutoencoderKL

Полный тест ошибки:

RuntimeError: Error(s) in loading state_dict for IntegratedAutoencoderKL: size mismatch for encoder.conv_out.weight: copying a param with shape torch.Size([32, 512, 3, 3]) from checkpoint, the shape in current model is torch.Size([8, 512, 3, 3]). size mismatch for encoder.conv_out.bias: copying a param with shape torch.Size([32]) from checkpoint, the shape in current model is torch.Size([8]). size mismatch for decoder.conv_in.weight: copying a param with shape torch.Size([512, 16, 3, 3]) from checkpoint, the shape in current model is torch.Size([512, 4, 3, 3]).

Как и в случае с этой темой, в моем случае были включены ae.safetensorsclip_l.safetensorst5xxl_fp8_e4m3fn.safetensors в VAE / Text Encoder. После очистки поля, всё заработало.


Примечание:
 UI было включено в ALL



Как убрать ошибку TypeError: 'NoneType' object is not subscriptable

В моем случае были включены ae.safetensors, clip_l.safetensors, t5xxl_fp8_e4m3fn.safetensors в VAE / Text Encoder. После очистки поля, всё заработало.



Примечание: ошибку словил при включенной UI Flux.


Что такое score_9, score_8_up, score_7_up в Pony (Stable Diffusion) ?

В двух словах:
Аналог masterpiece, best quality, high quality для повышения качества изображения. Обычно проставляется в начале промпта.

Что означают эти термины?
  1. score9, score8, score_7:

  2. Это числовые оценки, присвоенные изображениям на основе их качества, детализации, эстетики или соответствия определенным критериям.

    Например, score_9 означает, что изображение получило оценку 9 из 10, что указывает на высокое качество.

  3. score8_up, score7_up:
  4. Эти термины обозначают фильтрацию изображений с оценкой 8 и выше (score8_up) или 7 и выше (score7_up).

    Например, score8_up включает все изображения с оценкой 8, 9 и 10.

Работает ли это?

А теперь самое интересное. Проверим - работает ли такая система оценок изображений. Сделаем несколько тестов.

Тест 1:

Промт: score_9, score_8, girl, red dress


Промт: girl, red dress
Убрано из запроса score_9, score_8


На мой взгляд второй результат получился поинтересней.

Тест 2:

Промт: girl, red dress
Без явных указаний score.


Промт: score_9, score_8, girl, red dress


Промт: score_2, score_1, girl, red dress


В данном случае результат другой. Я бы оценил вторую попытку (где прописывали score_9) как лучшую. Персонаж у нас вышел чуть более взрослый, более правильные пропорции тела, приглушенные цвета, складки ткани.

Третья попытка (где было прописано score2, score1) выглядит, как самая неудачная: пропорции, пластиковая ткань, неестественная поза. 

В данном тесте score_9 отработал.


Материалы 1 - 4 из 4
Начало | Пред. | 1 | След. | Конец