РОБОТ, РИСУЙ КАРТИНКУ!

Email	Картинка-спойлер
КомментарийZ⛙☧>g*81⛾K0n$hFSI⚓l7 ⛰kD/j.s]^4\|yr {#L=&bv♁(5_@⚸X⛐tEW	Справка по разметке
Файл
Пaроль	(Для удаления файлов.)

РОБОТ, РИСУЙ КАРТИНКУ! Доброанон 05.08.2024 18:34:06 (Пн) No.132655 [Показать все]

Развлекаемся с нейронками, пытаемся получить картинки или лулзы. Реквестируем реквесты, выкладываем результаты, офигеваем от неожиданности или крутизны. Все ради того, чтобы зашедшему анону не было скучно.
Предыдущий тред >>104917

Как установить это добро и генерировать офлаен c автоматиком 1111:
нвидия - https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Install-and-Run-on-NVidia-GPUs
амд - https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Install-and-Run-on-AMD-GPUs
КРАЙНЕ РЕКОМЕНДУЕТСЯ приобщиться к этому форку https://github.com/lllyasviel/stable-diffusion-webui-forge автоматика, по ощущениям анона при прочих равных он позволяет выжать больше из того же железа и генерировать больше размером или быстрее.

Так же, говорят ComfyUI хорош, и ты станешь улыбаться едва установив софт
https://github.com/comfyanonymous/ComfyUI

Какое колдунство вписать в поле ввода чтобы не офигеть с результата (на русском):
https://teletype.in/@stablediffusion/artists_for_prompts

Склад моделек, где все навалено как попало, но зато удобно смотреть и много картиночек:
https://civitai.com

Как заставить робота рисовать твою няшечку в том виде в каком тебе нужно? Используй контролнет:
https://www.itshneg.com/controlnet-upravlyaj-pozami-v-stable-diffusion/
https://github.com/Mikubill/sd-webui-controlnet

Для тех, кто хочет иметь большие огромные сочные картинки, но у него маленькая видюха, напоминаем - размер это не главное, главное - выбрать правильный апскейлер:

Тем, кому вообще не охота париться, а охота жениться, посвящается:
Сбербанковская сетка Кандинский: https://fusionbrain.ai/diffusion
Некоторый ресурс от анона:
https://tensor.art/
https://krea.ai/apps/image/realtime

454 поста и 495 ответов с картинкой обрезан. Нажмите ответить, чтобы просмотреть полностью.

Доброанон 14.09.2024 15:15:22 (Сб) No.146589

File: 1726326921825-0.webp (40.26 KB, 1152x896, 1723596607844.webp)

>>145260
Чет не идет никак вообще, звиняйте.

Доброанон 15.09.2024 08:27:10 (Вс) No.146846

>>146589
Тогда давай либо волчицу, либо фею, что у речки пиво пьёт. В одиночестве.

Доброанон 15.09.2024 18:26:06 (Вс) No.147134

File: 1726424766609-0.webp (78.81 KB, 1024x768, 1632006509917.webp)

>>146846
Захотелось попробовать лору на жигули. Ладу получилось, а Сырну никто не тренировал для флюкса.

Доброанон 15.09.2024 18:45:16 (Вс) No.147154

Я создаю итт [Министерство исследований моделей] и начну поиск лучших маловесных моделей.

Предлагаю [активистам] поучаствовать в этом общественно-важно деле и поделиться своим опытом, исследованиями и слухами.

Модели оценивается:
-Глубина(иначе говоря детали персонажей, и других объектов генерации, например цвет глаз сырны)
-Ширина (Знать что такое сад Нургла,знать что такое пожарная машина, что такое Цвергпинчер и тд, не вдаваясь в детали)

Мне кажется что качество само по себе(артефакты и пиксели) и размер набора художественных стилей вторичные параметры для маловесных моделей.

Доброанон 15.09.2024 18:50:37 (Вс) No.147159

File: 1726426237149-0.webp (52.84 KB, 1024x1024, 1643489960784.webp)

>>147154
> Предлагаю поучаствовать в этом общественно-важно деле и поделиться своим опытом
Тогда бы уж сразу постулировал, в каком семействе моделей изыскания собираешься вести.
> Глубина(иначе говоря детали персонажей, и других объектов генерации, например цвет глаз сырны)
Достигается лорами, или твоя модель будет переучена на что-то конкретное и потиряет в "ширине".
> -Ширина (Знать что такое сад Нургла,знать что такое пожарная машина, что такое Цвергпинчер и тд, не вдаваясь в детали)
Дженерик модели самые широкие, но ничего не рисуют в точности. Придется все равно подпирать лорами.
> размер набора художественных стилей вторичные параметры для маловесных моделей
А вот художественность имхо наоборот важный параметр, если без ущерба пониманию промпта.

Доброанон 15.09.2024 18:56:24 (Вс) No.147163

File: 1726426583850.jpg (18.2 KB, 474x454, th-3295003793.jpg)

>>147134
К чёрту жигули, давай футфетиша, да побольше!

Доброанон 15.09.2024 19:12:25 (Вс) No.147171

File: 1726427545027-0.webp (79.58 KB, 1024x1024, 1595710560773.webp)

File: 1726427545027-1.webp (70.86 KB, 1024x1024, 1571634690306.webp)

File: 1726427545027-2.webp (108.88 KB, 1024x1024, 1617736789721.webp)

>>147159
Эмммм, я таким не занимаюсь…

Доброанон 15.09.2024 20:09:10 (Вс) No.147189

>>147159
>Тогда бы уж сразу постулировал, в каком семействе моделей изыскания собираешься вести.
Это не так важно. Какой смысл фильтровать семейства? Разве что из-за эджизма и предубеждений. Модели флюкс самые новые, но уж не знаю насколько 4гб.сейфтензор модель турбо-флюкс лучше 4гб сдхл.сейфтензор джаггернаута. Нужна хорошая проверка.
И если лучше, то в каких случаях.
Ну а если ты знаешь что и глубже и шире из этого то и скажи. В этом и была цель поста >>147154.

Вообще мне кажется дьявол будет крыться в сравнении .ггуф моделей, вес которых нужно брать меньше SDXL из-за того что 2qkm/3qkm.ггуф требует VAE и clip иt5xxl

Да и 1.5 тоже не стоит сбрасывать со счетов, учитывая его скорость и совместимость с лорами. Будет честно сравнить 1.5 с лорами и флюкс без лор. Картинки 512x512 / 728/728 смотрим на итоговое время генерации после нажатия кнопки degenerate.

>Достигается лорами, или твоя модель будет переучена на что-то конкретное и потеряет в "ширине".
Достигается не только лорами но и более тяжелыми моделями.

Но лоры это мухлеж. Сами лоры это отдельные модели, которые занимают вес и тратят другие вычислительные ресурсы. Их использование допускается, но их вес нужно будет складывать и добавлять штраф к основной модели если с лорами медленнее. Чем более тяжеловесный флюкс без лор.

Хотя можно уровнять взять какие-то универсальные лоры для sdxl и взять flux.gguf с обвесами vae и прочим. И смотреть что из этого универсальнее при низком весе.

>Дженерик модели самые широкие, но ничего не рисуют в точности
Нужно узнать какие из них самые широкие и самые глубокие из дженериков. Для "среднего" анона конечно же.

>А вот художественность имхо наоборот важный параметр, если без ущерба пониманию промпта.
Художественность и отсутствие дефектов это для профессионалов, которые занимаются созданием арта. Для прикладного использования(и здесь как раз актуальны низковесные модели) художественность уже не так важна.

Доброанон 15.09.2024 20:18:48 (Вс) No.147191

>А вот художественность имхо наоборот важный параметр, если без ущерба пониманию промпта.
>Художественность и отсутствие дефектов это для профессионалов, которые занимаются созданием арта. Для прикладного использования(и здесь как раз актуальны низковесные модели) художественность уже не так важна.
Иначе говоря я хочу сказать что нельзя сказать что что-то из этого важнее.

[Доброчановский департамент нейронного арта] должен это обязательно учитывать. И в выводах говорить о том, что для прикладного использования лучше это, или же это лучше для ниши по созданию красивого арта.

Доброанон 15.09.2024 22:02:27 (Вс) No.147227

File: 1726437746815.jpg (490.15 KB, 1024x1024, flux_st_2.jpg)

>>147154
> Мне кажется что качество само по себе(артефакты и пиксели) и размер набора художественных стилей вторичные параметры для маловесных моделей.

Флуксовский 16-канальный VAE - это важная фича, потому что без него на мелких разрешениях все мелкие детали (включая те же конечности) будут в кашу превращаться.

>>147189
>Какой смысл фильтровать семейства? Разве что из-за эджизма и предубеждений.

Проблема в том, что самое важное - понимание промпта и сложных концептов. А это без нормального текстового энкодера очень сложно получить. А нормальный энкодер который все любят (т5) - очень уж жирный.

Возможно будет лучше, если кто-то обучит модельку с siglip'ом в качестве текст энкодера, я его по работе использую и он очень крутой для своих размеров.

> самые широкие и самые глубокие из дженериков

Глубина и ширина - очень разные понятия даже для средних анонов. Кому-то, например, полностью всё равно на популярных персонажей и стили (это всё лорами делается), а вот сохранение знаний о реальном мире и понимание промпта - критически важно. А кому-то моделька не мила, если она не знает всех персонажей какой-нибудь популярной гачи, а уж то, что рисует она только на белом фоне - это вторично.

Доброанон 15.09.2024 22:07:06 (Вс) No.147231

>>147227
Аватарить, да еще и кроссбордово - фу таким быть А пикчи хорошие, конечно.

Доброанон 15.09.2024 22:25:30 (Вс) No.147235

File: 1726439130041.jpg (446.95 KB, 1024x1024, flux_sz_6.jpg)

>>147231
Ну у меня скорее есть один персонаж которого я генерю (я должен исправить малое количество на бурах мейд с черными волосами и двумя косичками) и он большую часть моих генераций составляет. Бывает я ещё кого-то скидываю, но обычно в других стилях.

Доброанон 15.09.2024 22:45:12 (Вс) No.147239

>>147227
>Проблема в том, что самое важное - понимание промпта и сложных концептов.
Из-за этой проблемы нельзя сравнить по параметрам выше и расставить по рейтингу уже готовые модели или что? Или не имеет смысла? Для меня это не очевидно, не понимаю.

>очень разные понятия даже для средних анонов
Речь про таких всеядных скучающих анонов, которым может быть интересно чуть более, чем всё. Да еще и интересы которых меняются по дням недели и зависят от текущей луны в созвездии рака. Вот такой пусть будет "средний" анон для которого выбираются понятия "Глубина" и "Ширина".

>а уж то, что рисует она только на белом фоне - это вторично
В таком случае важно, что она знала что как обрисовать общих чертах и квартирный киберпанк интерьер на белом фоне и таксу на белом фоне и бурю в пустыне, библиотеку похожую будто бы из школы магии Хогвардс.
И модели должны сравниваться количеством. Я простой исследователь, я это буду делать руками беря не слишком глубокие(одинаковые по глубине) концепты из головы. И искать самые широкие модели.

Затем я пройдусь по лучшим из "широких" и узнаю какие из них самые "глубокие", по популярным сеттингам, фандомам. (правильно ли рисует шлем космодесантника, и сможет ли дать очки Алукарду или только плащ, шляпу и длинные волосы)

>>147227
>Флуксовский 16-канальный VAE - это важная фича, потому что без него на мелких разрешениях все мелкие детали (включая те же конечности) будут в кашу превращаться.
Насколько я понимаю, оно часто вшивается и это не всегда следует добавлять отдельно.

[Доброчановский департамент нейронного арта]

Доброанон 16.09.2024 00:58:12 (Пн) No.147248

File: 1726448292080.jpg (238.97 KB, 1024x1024, flux_cubes.jpg)

>>147239
> Из-за этой проблемы нельзя сравнить по параметрам выше и расставить по рейтингу уже готовые модели или что? Или не имеет смысла? Для меня это не очевидно, не понимаю.

Я скорее про то, что, имхо, не очень корректно сравнивать модели с одним-двумя мелкими CLIP'ами и модель с т5, который в полном видел еле-еле влезает вместе с основной моделью в 24гб врам. Потому в ограниченных по VRAM окружениях с т5 даже квантованной будет грустно (по времени работы модели в том числе). Это разные весовые категории.

> Насколько я понимаю, оно часто вшивается и это не всегда следует добавлять отдельно.

Ну 16-канальный VAE дает огромное преимущество флуксу, потому что у того же SDXL 4-канальный VAE, который кучу мелких деталей уничтожает просто. Опять-таки, просятся разные категории.

То есть, в каких-то категориях можно, наверное, сравнивать флукс с другими моделями, но, например, в следованию промпту и сохранении мелких деталей - это будет совершенно нечестно к другим моделям просто по техническим причинам.

Да и по "глубине" и "ширине" сравнение - тоже сложный вопрос, но уже потому что флукс рассчитан скорее не под то, что он знает какие-то "имена" концептов, а под длинные промпты, где ты явно описываешь все детали нужного концепта. И кидать ему промпт от 1.5 или сдхл - это плохая идея, он такое не любит и ожидает другого.

То есть мне кажется, что корректнее было бы иметь две весовые категории:
1. Flux/AuraFlow/huayan dit/SD3 (лол)/Kolors - модели этого года с большими (или нестандартными как в Kolors) текст энкодерами
2. SDXL/SD1.5 - старые модели с CLIP'ами внутри в качестве текст энкодеров

Бтв, пример про следование промпту и формату промпта для флукса: An anime-style illustration of a young woman. She is in the top half of the image. She sits on slim tower of three blue, red and green cubes stacked on top of each other on white background. She has black hair in twin braids and brown eyes. Her maid dress features intricate embroidery and a fitted waist, extending into a flowing skirt that covers her thighs. She accessorizes with a delicate choker, heart-shaped silver medallion under the choker and lace-trimmed sleeves. She shows a peace sign with her hand.

И вон картинка приложенная, где выполнено слово в слово, каждая указанная деталь на месте. И это, по сути, первый ролл по этому промпту.

Сделать такое на sdxl или 1.5 чисто по тексту за разумное число роллов - практически невозможно. Перевод этого в теги ничего тоже не решит.

Доброанон 16.09.2024 05:51:30 (Пн) No.147256

>>147227
Ничего, Лада зато красивая получилось. Мне больше всего третья вот здесь понравилась: >>147171
Не Сырно, конечно, но всё равно хорошо.

Доброанон 16.09.2024 06:40:07 (Пн) No.147265

>>147248
> т5, который в полном видел еле-еле влезает вместе с основной моделью в 24гб врам
Имхо, это уже перебор для "пользовательсских" видюх, даже на 16 гигов карточки как я понимаю относительно мало у кого стоят, если только онлайн крутить.
> И вон картинка приложенная, где выполнено слово в слово, каждая указанная деталь на месте.
Подозреваю, что это дефолтные атрибуты для мейды с бур, а может ты еще и дотюнивал свою модельку. Но вообще да, для меня намного вожнее насссколько моделька воспринимает как части промпта друг с другом соотносятся, нежели детальность. Детальность можно лорой потом повысить или тайлом, а вот если моделька не понимает кто кого держит и что на чем лежит, это вот вот уже значимое различие.
другойанон

Доброанон 16.09.2024 10:03:16 (Пн) No.147317

>>147248
>(по времени работы модели в том числе).
А ну тогда модель пожалуй не стоит брать во внимание. Потому что конечно же время работы(ресурсы на обработку) один самых главных параметров сравнения. Мы берём не просто низкий вес, но и чтобы все это легко и быстро обрабатывалась на картошке.

>Ну 16-канальный VAE дает огромное преимущество флуксу, потому что у того же SDXL 4-канальный VAE, который кучу мелких деталей уничтожает просто. Опять-таки, просятся разные категории.
Разумно. Но мне показалось что schnell-flux(турбо) модель может потягаться с sdxl несмотря на свое тяжеловесие? А sdxl можно помочь какой-нибудь универсальной лорой чтобы можно было попробовать состязаться с dev (но наверно это уже весовая категория выше-среднего/ресурсоемкость выше-среднего)?

>То есть, в каких-то категориях можно, наверное, сравнивать флукс с другими моделями, но, например, в следованию промпту и сохранении мелких деталей
Иначе говоря в уже моем понимании это и есть "Глубину" понимания сравнить. Но так ли хорошо понимается глубина/следование промту на двухгиговых флюксах как на sdxl? Интересно узнать.

>флукс рассчитан скорее не под то, что он знает какие-то "имена" концептов, а под длинные промпты, где ты явно описываешь все детали нужного концепта
Тут имеет место быть наверное немного разное трактование нашего этого понятия "глубина". В моем представлении это и, в том числе, следование промту. Общее понятие короче. Может не самое удачное.

Потому что посох в виде полумесяца у Сейлор Мун сама модель может хорошо вспомнить самостоятельно, и, потому что очень хорошо знает какой должен быть посох, но другая модель справится с задачей потому что человек ей немного помог, потому что описал как посох должен выглядеть. Тогда задача на глубину тоже будет выполнена.

[Доброчановский департамент нейронного арта]

Доброанон 16.09.2024 14:55:27 (Пн) No.147395

Что надиффундировать?

Доброанон 16.09.2024 15:01:29 (Пн) No.147397

>>147395
Что если бы Доброчан был городом.

Доброанон 16.09.2024 15:46:38 (Пн) No.147412

File: 1726501598258-0.webp (130.84 KB, 1536x1024, 0.webp)

File: 1726501598258-1.webp (156.5 KB, 1536x1024, 1.webp)

Картинки постите, учёные.

Доброанон 16.09.2024 16:03:07 (Пн) No.147416

>>147412
> 1
Иншалла :3

Доброанон 16.09.2024 16:21:33 (Пн) No.147422

File: 1726503693597.jpeg (3.84 MB, 7961x2897, t55tv97usrid1.jpeg)

>>147265
> Имхо, это уже перебор для "пользовательсских" видюх

С gguf q8 он в целом хорошо влезает, но это скорее просто как показатель того, насколько в разных весовых категориях модели сидят.

> Подозреваю, что это дефолтные атрибуты для мейды с бур

Тут больше интересно, что достаточно сложные для моделей взаимодействия объектов в кадре учтены. "She sits on slim tower of three blue, red and green cubes stacked on top of each other" - достаточно нетривиально для них понять обычно.

> вожнее насссколько моделька воспринимает как части промпта друг с другом соотносятся, нежели детальность

Детальность тоже важна (в смысле хороший VAE - это важно), потому что плохой будет ломать детали и превращать детали изображения в кашу.

>>147317

> Но мне показалось что schnell-flux(турбо) модель может потягаться с sdxl несмотря на свое тяжеловесие?

Мне кажется на слабом железе даже schnell будет медленно работать
относительно sdxl.

> А sdxl можно помочь какой-нибудь универсальной лорой чтобы можно было попробовать состязаться с dev

Не знаю, такого не видел. Какие-то файнтьюны сдхл неплохо работают (но всё равно ощутимо хуже) в плане следования промпту, какие-то совсем плохие.

> Но так ли хорошо понимается глубина/следование промту на двухгиговых флюксах как на sdxl?

Я видел только сравнения квантов до q4, там теряются более сложные мелкие детали, но в целом следование всё равно ощутимо лучше остальных моделей, правда это всё с t5 в fp16.

Доброанон 16.09.2024 16:23:01 (Пн) No.147425

>>147412
Во, то что надо. На первой картинке Сырно немного охорлонизировалась как погляжу, но и так хорошо.

Доброанон 16.09.2024 16:30:02 (Пн) No.147426

File: 1726504202731.webp (130.16 KB, 1536x1024, 2.webp)

>>147425
Да, я там разные планировщики и семплеры потестировал, в с другим. Там так-то и бант от Сырны перетёк в другую сторону.

Доброанон 16.09.2024 16:41:34 (Пн) No.147428

>>147426
Ну это классика, с ней тяжко без контрлнета бороться.

Доброанон 16.09.2024 16:48:39 (Пн) No.147432

>>147428
Регионально было бы лучше, скорее всего, но я написал промпт, поставил генерировать и пошёл ужинать.

Доброанон 16.09.2024 16:53:49 (Пн) No.147434

>>147432
А сколько оно генерировалось по времени? И что за модель? Надо будет тоже опробовать.

Доброанон 16.09.2024 17:19:20 (Пн) No.147445

File: 1726507160744.webp (141.3 KB, 1536x1189, 4.webp)

>>147434
>А сколько оно генерировалось по времени?
3,5 минуты, нно это из-за разрешения. Такое обычно не надо, проще сгенерировать поменьше и потом растянуть другой моделью.
>И что за модель?
flux1-dev-q5_0. Опять же по свободной видеопамяти выбирай, чем больше квантизация тем лучше я вот забыл поменять с тех пор как контролнеты тестировал, но и так сойдёт.
>Надо будет тоже опробовать.
Попробуй, я думал в треде уже все пробовали.

Доброанон 16.09.2024 19:22:49 (Пн) No.147487

File: 1726514569434-0.webp (121.09 KB, 1152x896, 1659937160662.webp)

File: 1726514569434-1.webp (126.79 KB, 1152x896, 1634614073906.webp)

File: 1726514569434-2.png (1.38 MB, 1152x896, 1632542419605.png)

>>147397
Хочется напилить уютных доброчансков, которыми заслуживает быть доброчан, но как-то все лезут мысли про грязные подворотни, гетто и пропавшего участкового. Не знаю как это передать.

Доброанон 16.09.2024 19:29:58 (Пн) No.147489

>>147487
У каждого города есть тёмная сторона, даже у Доброчанска. Получилось хорошо.

Доброанон 16.09.2024 19:48:42 (Пн) No.147490

File: 1726516121628-0.webp (151.71 KB, 1152x896, 1675022245539.webp)

File: 1726516121628-1.webp (116.36 KB, 1152x896, 1591735962808.webp)

File: 1726516121628-2.webp (183.65 KB, 1152x896, 1600268721599.webp)

File: 1726516121628-3.webp (154.39 KB, 1152x896, 1583190709267.webp)

Некоторые картинки довольно омские получаются. Что, видимо, символизирует. Но есть и вроде как няшные.
Это к вопросу о точности соответствия промпту. В картинку то токены пролезли, но.

Доброанон 16.09.2024 19:57:04 (Пн) No.147492

>>147490
Коты очень смешные. А какой промпт был?

Доброанон 16.09.2024 20:03:47 (Пн) No.147493

>>147490
>Кошки
Где там тот анон с своим невероятным рассказом про кошкодевок ворующих пироги?

Доброанон 16.09.2024 20:06:00 (Пн) No.147494

>>147493
Что за рассказ?

Доброанон 16.09.2024 20:10:41 (Пн) No.147495

File: 1726517441336.mp4 (5.61 MB, 512x512, hg2125.mp4)

Доброанон 16.09.2024 20:13:58 (Пн) No.147497

>>147494
Это ненаписанный (или во всяком случае не опубликованный на Доброчане) шедевр. Есть только иллюстрации к нему: >>41623
Впрочем, был ещё рассказ от него, но это совсем другая история.

Доброанон 16.09.2024 20:24:02 (Пн) No.147498

File: 1726518241826-0.webp (115.35 KB, 1152x896, 1689801493095.webp)

File: 1726518241826-1.webp (141.36 KB, 1152x896, 1618902192711.webp)

File: 1726518241826-2.webp (114.7 KB, 1152x896, 1653529311239.webp)

File: 1726518241826-3.webp (183.85 KB, 1152x896, 1696907491297.webp)

>>147492
> Russian low-rise city retro futuristic landscape, anime cat-womans with animal ears on their heads walks under a trees on street, soviet retro futuristic vehicle, detailed drawing , oil painting<lora:Soviet-Poster-Flux:0.85> Soviet poster
Думаю, может это лора тренированная под дев поломала модельки с наследием шнеля.

Доброанон 16.09.2024 20:37:04 (Пн) No.147501

File: 1726519024805.jpg (1013.75 KB, 1920x1080, flux_cg_1.jpg)

>>147498
> cat-womans

Кажется с флуксом так не надо. Можно просто woman with cat ears and cat tail, будет работать

Доброанон 17.09.2024 15:59:26 (Вт) No.147684

>>147422
>Какие-то файнтьюны сдхл неплохо работают (но всё равно ощутимо хуже) в плане следования промпту, какие-то совсем плохие.
А сейчас, спустя некоторое время использования моделей flux, можно ли понять насколько велик был вклад функционала у sdxl и sd1.5?

Неужели, например, негативами можно так спокойно пожертвовать и принять сегодняшние flux модели как следующий виток развития? Не пожертвовали ли ради точности промтов слишком многим?

Я вижу некоторый откат в пуле картинок flux и возможно SDXL все еще "ближе" к золотой середине скорость/качество, и вижу что это связано с тем что многие перестали пользоваться функционалом вроде контролнета или даже апскейла из-за flux и это уже не говоря про негативные промты потому что для большинства пк это уже слишком (а следовательно c софтом и функционалом будет проблема).

[Доброчановский департамент нейронного арта]

Доброанон 17.09.2024 17:20:29 (Вт) No.147709

File: 1726593629533.jpg (564.78 KB, 1024x1024, flux_st_7.jpg)

>>147684
> Неужели, например, негативами можно так спокойно пожертвовать и принять сегодняшние flux модели как следующий виток развития?

Негативы спокойно работают. flux вполне нормально на настоящий CFG откликается, так что все работает.

> вроде контролнета или даже апскейла из-за flux

Контролнеты под него есть, IPAdapter есть, генерация с данным лицом - есть, апскейл с ним не так чтобы уж и нужен. Он и фхд спокойно генерит из коробки без критичных артефактов.

> SDXL все еще "ближе" к золотой середине скорость/качество

Зависит от железа, как мне кажется. На мощном железе флукс выигрывает за счёт того, что надо куда меньше роллить, чтобы получит то, что ты хочешь. То есть с ним, у меня удачная генерация ровно того, что мне нужно - это 1-2 ролла, с сдхл так не выйдет, увы.

Доброанон 17.09.2024 17:51:27 (Вт) No.147724

>>147709
>На мощном железе флукс выигрывает за счёт того, что надо куда меньше роллить, чтобы получит то, что ты хочешь.
Все верно, но по-моему на выходе sdxl люди более активно тренировали новые лоры. Может через полгода ситуация лучше будет, когда больше перейдут на новое поколение.

[Доброчановский департамент нейронного арта]

Доброанон 17.09.2024 17:57:10 (Вт) No.147726

>>147724
У флукса другая архитектура и из-за этого вкупе с гайденс дистилляцией первый месяц с ним вся тренировка лор была либо сломана, либо очень сломана.

Доброанон 17.09.2024 17:58:16 (Вт) No.147727

>>147709
> Негативы спокойно работают. flux вполне нормально на настоящий CFG откликается
Не очень спокойно, как мне показалось, результат заметно ухудшается, если цфг больше одного сделать.
> Контролнеты под него есть
Пока не очень много, и к поломатику вроде пока не прикрутились (или уже прикрутили?).
> с ним, у меня удачная генерация ровно того, что мне нужно - это 1-2 ролла
Зависит конечно от критерия удачности, имхо. Впрочем, возможно у тебя такие промпты, что хорошо заходят. С девочками всегда проще было.
>>147684
Флюкс относительно сд1.5 это все же очень большой шах вперед ,имхо. Просто сравни выдачу дефолтных моделей. Ну и для меня лично весьма важно восприятие промпта моделькой. Имхо, что ХЛ, что тем более полторашка, весьма заметно отстают в этом от флюкса. Негативный промпт это важно, да, надеюсь они что-то сделают с этим, как и с конским потреблением ресурсов.

Доброанон 17.09.2024 18:05:26 (Вт) No.147733

> Не очень спокойно, как мне показалось, результат заметно ухудшается, если цфг больше одного сделать.

Странно, у меня такого эффекта нет. Все что я постил в тред было с тру-кфг 2 и с нег промптами.

> Впрочем, возможно у тебя такие промпты, что хорошо заходят.

Возможно, с другой стороны мои шизопромпты с абстрактными безумными пейзажами и объектами тоже неплохо работали

> поломатику

А, тут не знаю, я им не пользуюсь, я строго по лапше уже год с чем-то.