>>147239> Из-за этой проблемы нельзя сравнить по параметрам выше и расставить по рейтингу уже готовые модели или что? Или не имеет смысла? Для меня это не очевидно, не понимаю.Я скорее про то, что, имхо, не очень корректно сравнивать модели с одним-двумя мелкими CLIP'ами и модель с т5, который в полном видел еле-еле влезает вместе с основной моделью в 24гб врам. Потому в ограниченных по VRAM окружениях с т5 даже квантованной будет грустно (по времени работы модели в том числе). Это разные весовые категории.
> Насколько я понимаю, оно часто вшивается и это не всегда следует добавлять отдельно.Ну 16-канальный VAE дает огромное преимущество флуксу, потому что у того же SDXL 4-канальный VAE, который кучу мелких деталей уничтожает просто. Опять-таки, просятся разные категории.
То есть, в каких-то категориях можно, наверное, сравнивать флукс с другими моделями, но, например, в следованию промпту и сохранении мелких деталей - это будет совершенно нечестно к другим моделям просто по техническим причинам.
Да и по "глубине" и "ширине" сравнение - тоже сложный вопрос, но уже потому что флукс рассчитан скорее не под то, что он знает какие-то "имена" концептов, а под длинные промпты, где ты явно описываешь все детали нужного концепта. И кидать ему промпт от 1.5 или сдхл - это плохая идея, он такое не любит и ожидает другого.
То есть мне кажется, что корректнее было бы иметь две весовые категории:
1. Flux/AuraFlow/huayan dit/SD3 (лол)/Kolors - модели этого года с большими (или нестандартными как в Kolors) текст энкодерами
2. SDXL/SD1.5 - старые модели с CLIP'ами внутри в качестве текст энкодеров
Бтв, пример про следование промпту и формату промпта для флукса: An anime-style illustration of a young woman. She is in the top half of the image. She sits on slim tower of three blue, red and green cubes stacked on top of each other on white background. She has black hair in twin braids and brown eyes. Her maid dress features intricate embroidery and a fitted waist, extending into a flowing skirt that covers her thighs. She accessorizes with a delicate choker, heart-shaped silver medallion under the choker and lace-trimmed sleeves. She shows a peace sign with her hand.
И вон картинка приложенная, где выполнено слово в слово, каждая указанная деталь на месте. И это, по сути, первый ролл по этому промпту.
Сделать такое на sdxl или 1.5 чисто по тексту за разумное число роллов - практически невозможно. Перевод этого в теги ничего тоже не решит.