Как оценить производительность своей системы при генерации изображений (AUTOMATIC1111)

github.com/vladmandic/sd-exte...
vladmandic.github.io/sd-exten...

Пікірлер: 8

  • @Sufir_Havat
    @Sufir_Havat24 күн бұрын

    Я тоже владелец RTX 3070, и хочу обратить внимание, что скорость 8,5-9,0 it/s - это минимальная скорость. Для моделей на базе SD1.5 (Dreamshaper, например) средняя скорость генерации 1 изображения 512x512 с позитивным и негативным промптами и семплером DPM++ 2M Karras (как самый популярный, хотя, я предпочитаю DDIM, на что есть причины) с включенным xformers или torch v2.XX и с дефолтными настройками A1111 составляет 12,56 it/s. Но, в конечном итоге, нас должно интересовать не столько итерации, сколько чистое время генерации в секундах. Генерация одного изображения при указанных выше условиях за 20 шагов в среднем занимает 2,1 сек (от 2,0 до 2,2 сек). Если генерировать пакетами, общее время генерации можно сократить. Прилично сократить. Например, установив Batch count на значение 8, время генерации 8 изображений примерно ~15,5 сек, что в среднем 1.94 сек/картину. Но можно еще больше ускорить процесс, если вместо Batch count изменить параметр Batch size, установив на 8 (для RTX 3070). Тогда общее время генерации 8 изображений составит ~12.2 сек, что в среднем составит 1,525 сек/картинку. На время генерации значительно влияет выбранный семплер и количество шагов генерации (очевидно), в меньшей степени размер промпта и выбранная модель. Учитывая это, можно добиться еще лучших результатов по сокращению времени генерации. Повторюсь, мы еще ничего не трогали в настройках самого A1111 :) Для затравки: выбираем всеми нелюбимый и сильно недооцененный семплер DMP++ SDE Karras (его не любят за низкую скорость, но какое же это заблуждение). Ставим значение Sampling steps на 5 (пять), CFG Scale 3 (три), Batch size - 8, запускаем и погружаемся в нирвану, ибо ~7.3 секунды уходит на генерацию 8 изображений, что в среднем составляет 0,91 сек/картинку. Мы в 2,3 раза сократили среднее время генерации одной картинки. Это вариант для тех, кто после генерации дорабатывает изображения апскейлерами, например, при помощи Hires. fix. Для тех, кто хочет все и сразу, устанавливают Kohya HRFix Integrated и так до бесконечности. С ним, среднее время генерации 1 изображения (при указанных выше условиях) сокращается до 0,85 сек/картинку, так еще и качество лиц вырастает без ADetailer. Нужно сказать, что я сделал undervolting видеокарты, поэтому в нагрузке она работает с частотой ядра 1950 МГц и частотой VRAM 8000 МГц. Если установить TensorRT при указанных выше параметрах скорость возрастает до 18,5 it/s, а среднее время генерации 1 изображения сокращается до ~0,5 сек/картинку. Да, это все для той же RTX 3070. 👍

  • @MamedovInfo

    @MamedovInfo

    24 күн бұрын

    👍

  • @user-fx3hc5zd3j
    @user-fx3hc5zd3j25 күн бұрын

    Все-таки "Apрly and restar" t нажать стоит, потому что "APPLY".

  • @NamikMamedov

    @NamikMamedov

    25 күн бұрын

    Не все расширения будут работать нормально без перезапуска. Тот же control net, например

  • @foxy2912
    @foxy291225 күн бұрын

    Можете помочь пожалуйста?😭🙏🏽

  • @foxy2912
    @foxy291225 күн бұрын

    Пожалуйста помогите

Келесі