2.0.80 (#520)

* Rework many patches and some UI details. * Speed up processing. * Move Colab to independent branch. * Implemented CFG Scale and TSNR correction when CFG is bigger than 10. * Implemented Developer Mode with more options to debug.
2023-10-03 10:36:42 -07:00 · 2023-10-03 10:36:42 -07:00 · bbae307ef2
commit bbae307ef2
parent 225947ac1a
18 changed files with 369 additions and 552 deletions
--- a/colab.ipynb
+++ b/colab.ipynb
@ -1,35 +0,0 @@
 {
 "cells": [
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "id": "VjYy0F2gZIPR"
   },
   "outputs": [],
   "source": [
    "%cd /content\n",
    "!git clone https://github.com/lllyasviel/Fooocus\n",
    "%cd /content/Fooocus\n",
    "!pip install pygit2==1.12.2\n",
    "!python entry_with_update.py --share\n"
   ]
  }
 ],
 "metadata": {
  "accelerator": "GPU",
  "colab": {
   "gpuType": "T4",
   "provenance": []
  },
  "kernelspec": {
   "display_name": "Python 3",
   "name": "python3"
  },
  "language_info": {
   "name": "python"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 0
 }
--- a/fooocus_version.py
+++ b/fooocus_version.py
@ -1 +1 @@
-version = '2.0.78'
+version = '2.0.80'
--- a/launch.py
+++ b/launch.py
@ -12,6 +12,7 @@ from modules.path import modelfile_path, lorafile_path, vae_approx_path, fooocus
 REINSTALL_ALL = False
 def prepare_environment():
    torch_index_url = os.environ.get('TORCH_INDEX_URL', "https://download.pytorch.org/whl/cu118")
    torch_command = os.environ.get('TORCH_COMMAND',
@ -20,8 +21,8 @@ def prepare_environment():
    xformers_package = os.environ.get('XFORMERS_PACKAGE', 'xformers==0.0.20')
-    comfy_repo = os.environ.get('COMFY_REPO', "https://github.com/lllyasviel/ComfyUI_2bc12d.git")
+    comfy_repo = os.environ.get('COMFY_REPO', "https://github.com/comfyanonymous/ComfyUI")
-    comfy_commit_hash = os.environ.get('COMFY_COMMIT_HASH', "2bc12d3d22efb5c63ae3a7fc342bb2dd16b31735")
+    comfy_commit_hash = os.environ.get('COMFY_COMMIT_HASH', "2ef459b1d4d627929c84d11e5e0cbe3ded9c9f48")
    print(f"Python {sys.version}")
    print(f"Fooocus version: {fooocus_version.version}")
@ -95,22 +96,21 @@ def download_models():
    return
-def clear_comfy_args():
+def ini_comfy_args():
    argv = sys.argv
    sys.argv = [sys.argv[0]]
    from comfy.cli_args import args as comfy_args
    comfy_args.disable_cuda_malloc = True
    comfy_args.disable_smart_memory = True
    comfy_args.auto_launch = False
    sys.argv = argv
 def cuda_malloc():
    import cuda_malloc
 prepare_environment()
-clear_comfy_args()
+ini_comfy_args()
 # cuda_malloc()
 download_models()
--- a/modules/async_worker.py
+++ b/modules/async_worker.py
@ -19,7 +19,6 @@ def worker():
    import modules.flags as flags
    import modules.path
    import modules.patch
    import modules.virtual_memory as virtual_memory
    import comfy.model_management
    import modules.inpaint_worker as inpaint_worker
@ -45,8 +44,10 @@ def worker():
    @torch.no_grad()
    @torch.inference_mode()
    def handler(task):
        execution_start_time = time.perf_counter()
        prompt, negative_prompt, style_selections, performance_selction, \
-            aspect_ratios_selction, image_number, image_seed, sharpness, \
+            aspect_ratios_selction, image_number, image_seed, sharpness, adm_scaler_positive, adm_scaler_negative, guidance_scale, adaptive_cfg, sampler_name, \
            base_model_name, refiner_model_name, \
            l1, w1, l2, w2, l3, w3, l4, w4, l5, w5, \
            input_image_checkbox, current_tab, \
@ -68,8 +69,20 @@ def worker():
            use_expansion = False
        use_style = len(style_selections) > 0
        modules.patch.adaptive_cfg = adaptive_cfg
        print(f'[Parameters] Adaptive CFG = {modules.patch.adaptive_cfg}')
        modules.patch.sharpness = sharpness
-        modules.patch.negative_adm = True
+        print(f'[Parameters] Sharpness = {modules.patch.sharpness}')
        modules.patch.positive_adm_scale = adm_scaler_positive
        modules.patch.negative_adm_scale = adm_scaler_negative
        print(f'[Parameters] ADM Scale = {modules.patch.positive_adm_scale} / {modules.patch.negative_adm_scale}')
        cfg_scale = float(guidance_scale)
        print(f'[Parameters] CFG = {cfg_scale}')
        initial_latent = None
        denoising_strength = 1.0
        tiled = False
@ -226,6 +239,10 @@ def worker():
                    height, width = inpaint_worker.current_task.image_raw.shape[:2]
                    print(f'Final resolution is {str((height, width))}, latent is {str((H * 8, W * 8))}.')
                    sampler_name = 'dpmpp_fooocus_2m_sde_inpaint_seamless'
        print(f'[Parameters] Sampler = {sampler_name}')
        progressbar(1, 'Initializing ...')
        raw_prompt = prompt
@ -307,19 +324,13 @@ def worker():
                                              pool_top_k=negative_top_k)
        if pipeline.xl_refiner is not None:
            virtual_memory.load_from_virtual_memory(pipeline.xl_refiner.clip.cond_stage_model)
            for i, t in enumerate(tasks):
                progressbar(11, f'Encoding refiner positive #{i + 1} ...')
-                t['c'][1] = pipeline.clip_encode(sd=pipeline.xl_refiner, texts=t['positive'],
+                t['c'][1] = pipeline.clip_separate(t['c'][0])
                                                 pool_top_k=positive_top_k)
            for i, t in enumerate(tasks):
                progressbar(13, f'Encoding refiner negative #{i + 1} ...')
-                t['uc'][1] = pipeline.clip_encode(sd=pipeline.xl_refiner, texts=t['negative'],
+                t['uc'][1] = pipeline.clip_separate(t['uc'][0])
                                                  pool_top_k=negative_top_k)
            virtual_memory.try_move_to_virtual_memory(pipeline.xl_refiner.clip.cond_stage_model)
        results = []
        all_steps = steps * image_number
@ -331,13 +342,14 @@ def worker():
                f'Step {step}/{total_steps} in the {current_task_id + 1}-th Sampling',
                y)])
-        print(f'[ADM] Negative ADM = {modules.patch.negative_adm}')
+        preparation_time = time.perf_counter() - execution_start_time
        print(f'Preparation time: {preparation_time:.2f} seconds')
        outputs.append(['preview', (13, 'Starting tasks ...', None)])
        for current_task_id, task in enumerate(tasks):
-            try:
+            execution_start_time = time.perf_counter()
                execution_start_time = time.perf_counter()
            try:
                imgs = pipeline.process_diffusion(
                    positive_cond=task['c'],
                    negative_cond=task['uc'],
@ -347,17 +359,16 @@ def worker():
                    height=height,
                    image_seed=task['task_seed'],
                    callback=callback,
                    sampler_name=sampler_name,
                    latent=initial_latent,
                    denoise=denoising_strength,
-                    tiled=tiled
+                    tiled=tiled,
                    cfg_scale=cfg_scale
                )
                if inpaint_worker.current_task is not None:
                    imgs = [inpaint_worker.current_task.post_process(x) for x in imgs]
                execution_time = time.perf_counter() - execution_start_time
                print(f'Diffusion time: {execution_time:.2f} seconds')
                for x in imgs:
                    d = [
                        ('Prompt', raw_prompt),
@ -367,8 +378,11 @@ def worker():
                        ('Performance', performance_selction),
                        ('Resolution', str((width, height))),
                        ('Sharpness', sharpness),
                        ('Guidance Scale', guidance_scale),
                        ('ADM Guidance', str((adm_scaler_positive, adm_scaler_negative))),
                        ('Base Model', base_model_name),
                        ('Refiner Model', refiner_model_name),
                        ('Sampler', sampler_name),
                        ('Seed', task['task_seed'])
                    ]
                    for n, w in loras_user_raw_input:
@ -381,6 +395,9 @@ def worker():
                print('User stopped')
                break
            execution_time = time.perf_counter() - execution_start_time
            print(f'Generating and saving time: {execution_time:.2f} seconds')
        outputs.append(['results', results])
        return
--- a/modules/core.py
+++ b/modules/core.py
@ -10,13 +10,15 @@ import torch
 import numpy as np
 import comfy.model_management
 import comfy.model_detection
 import comfy.model_patcher
 import comfy.utils
 from comfy.sd import load_checkpoint_guess_config
 from nodes import VAEDecode, EmptyLatentImage, VAEEncode, VAEEncodeTiled, VAEDecodeTiled, VAEEncodeForInpaint
-from comfy.sample import prepare_mask, broadcast_cond, load_additional_models, cleanup_additional_models
+from comfy.sample import prepare_mask, broadcast_cond, get_additional_models, cleanup_additional_models
-from comfy.model_base import SDXLRefiner
+from modules.patch import patched_sampler_cfg_function, patched_model_function_wrapper
-from comfy.sd import model_lora_keys_unet, model_lora_keys_clip, load_lora
+from comfy.lora import model_lora_keys_unet, model_lora_keys_clip, load_lora
 from modules.samplers_advanced import KSamplerBasic, KSamplerWithRefiner
@ -29,34 +31,61 @@ opVAEEncodeForInpaint = VAEEncodeForInpaint()
 class StableDiffusionModel:
-    def __init__(self, unet, vae, clip, clip_vision, model_filename=None):
+    def __init__(self, unet, vae, clip, clip_vision):
        if isinstance(model_filename, str):
            is_refiner = isinstance(unet.model, SDXLRefiner)
            if unet is not None:
                unet.model.model_file = dict(filename=model_filename, prefix='model')
            if clip is not None:
                clip.cond_stage_model.model_file = dict(filename=model_filename, prefix='refiner_clip' if is_refiner else 'base_clip')
            if vae is not None:
                vae.first_stage_model.model_file = dict(filename=model_filename, prefix='first_stage_model')
        self.unet = unet
        self.vae = vae
        self.clip = clip
        self.clip_vision = clip_vision
-    def to_meta(self):
+
-        if self.unet is not None:
+@torch.no_grad()
-            self.unet.model.to('meta')
+@torch.inference_mode()
-        if self.clip is not None:
+def load_unet_only(unet_path):
-            self.clip.cond_stage_model.to('meta')
+    sd_raw = comfy.utils.load_torch_file(unet_path)
-        if self.vae is not None:
+    sd = {}
-            self.vae.first_stage_model.to('meta')
+    flag = 'model.diffusion_model.'
    for k in list(sd_raw.keys()):
        if k.startswith(flag):
            sd[k[len(flag):]] = sd_raw[k]
        del sd_raw[k]
    parameters = comfy.utils.calculate_parameters(sd)
    fp16 = comfy.model_management.should_use_fp16(model_params=parameters)
    if "input_blocks.0.0.weight" in sd:
        # ldm
        model_config = comfy.model_detection.model_config_from_unet(sd, "", fp16)
        if model_config is None:
            raise RuntimeError("ERROR: Could not detect model type of: {}".format(unet_path))
        new_sd = sd
    else:
        # diffusers
        model_config = comfy.model_detection.model_config_from_diffusers_unet(sd, fp16)
        if model_config is None:
            print("ERROR UNSUPPORTED UNET", unet_path)
            return None
        diffusers_keys = comfy.utils.unet_to_diffusers(model_config.unet_config)
        new_sd = {}
        for k in diffusers_keys:
            if k in sd:
                new_sd[diffusers_keys[k]] = sd.pop(k)
            else:
                print(diffusers_keys[k], k)
    offload_device = comfy.model_management.unet_offload_device()
    model = model_config.get_model(new_sd, "")
    model = model.to(offload_device)
    model.load_model_weights(new_sd, "")
    return comfy.model_patcher.ModelPatcher(model, load_device=comfy.model_management.get_torch_device(), offload_device=offload_device)
@torch.no_grad()
@torch.inference_mode()
 def load_model(ckpt_filename):
    unet, clip, vae, clip_vision = load_checkpoint_guess_config(ckpt_filename)
-    return StableDiffusionModel(unet=unet, clip=clip, vae=vae, clip_vision=clip_vision, model_filename=ckpt_filename)
+    unet.model_options['sampler_cfg_function'] = patched_sampler_cfg_function
    unet.model_options['model_function_wrapper'] = patched_model_function_wrapper
    return StableDiffusionModel(unet=unet, clip=clip, vae=vae, clip_vision=clip_vision)
@torch.no_grad()
@ -74,20 +103,19 @@ def load_sd_lora(model, lora_filename, strength_model=1.0, strength_clip=1.0):
        key_map = model_lora_keys_clip(model.clip.cond_stage_model, key_map)
        loaded = load_lora(lora, key_map)
-    new_modelpatcher = model.unet.clone()
+    new_unet = model.unet.clone()
-    k = new_modelpatcher.add_patches(loaded, strength_model)
+    loaded_unet_keys = new_unet.add_patches(loaded, strength_model)
    new_clip = model.clip.clone()
-    k1 = new_clip.add_patches(loaded, strength_clip)
+    loaded_clip_keys = new_clip.add_patches(loaded, strength_clip)
    loaded_keys = set(list(loaded_unet_keys) + list(loaded_clip_keys))
    k = set(k)
    k1 = set(k1)
    for x in loaded:
-        if (x not in k) and (x not in k1):
+        if x not in loaded_keys:
-            print("Lora missed: ", x)
+            print("Lora key not loaded: ", x)
-    unet, clip = new_modelpatcher, new_clip
+    return StableDiffusionModel(unet=new_unet, clip=new_clip, vae=model.vae, clip_vision=model.clip_vision)
    return StableDiffusionModel(unet=unet, clip=clip, vae=model.vae, clip_vision=model.clip_vision)
@torch.no_grad()
@ -142,7 +170,7 @@ VAE_approx_model = None
@torch.no_grad()
@torch.inference_mode()
-def get_previewer(device, latent_format):
+def get_previewer():
    global VAE_approx_model
    if VAE_approx_model is None:
@ -181,12 +209,7 @@ def get_previewer(device, latent_format):
 def ksampler(model, positive, negative, latent, seed=None, steps=30, cfg=7.0, sampler_name='dpmpp_fooocus_2m_sde_inpaint_seamless',
             scheduler='karras', denoise=1.0, disable_noise=False, start_step=None, last_step=None,
             force_full_denoise=False, callback_function=None):
-    # SCHEDULERS = ["normal", "karras", "exponential", "simple", "ddim_uniform"]
+    seed = seed if isinstance(seed, int) else random.randint(0, 2**63 - 1)
    # SAMPLERS = ["euler", "euler_ancestral", "heun", "dpm_2", "dpm_2_ancestral",
    #             "lms", "dpm_fast", "dpm_adaptive", "dpmpp_2s_ancestral", "dpmpp_sde", "dpmpp_sde_gpu",
    #             "dpmpp_2m", "dpmpp_2m_sde", "dpmpp_2m_sde_gpu", "ddim", "uni_pc", "uni_pc_bh2"]
    seed = seed if isinstance(seed, int) else random.randint(1, 2 ** 64)
    device = comfy.model_management.get_torch_device()
    latent_image = latent["samples"]
@ -201,11 +224,12 @@ def ksampler(model, positive, negative, latent, seed=None, steps=30, cfg=7.0, sa
    if "noise_mask" in latent:
        noise_mask = latent["noise_mask"]
-    previewer = get_previewer(device, model.model.latent_format)
+    previewer = get_previewer()
    pbar = comfy.utils.ProgressBar(steps)
    def callback(step, x0, x, total_steps):
        comfy.model_management.throw_exception_if_processing_interrupted()
        y = None
        if previewer is not None:
            y = previewer(x0, step, total_steps)
@ -219,7 +243,8 @@ def ksampler(model, positive, negative, latent, seed=None, steps=30, cfg=7.0, sa
    if noise_mask is not None:
        noise_mask = prepare_mask(noise_mask, noise.shape, device)
-    comfy.model_management.load_model_gpu(model)
+    models, inference_memory = get_additional_models(positive, negative, model.model_dtype())
    comfy.model_management.load_models_gpu([model] + models, comfy.model_management.batch_area_memory(noise.shape[0] * noise.shape[2] * noise.shape[3]) + inference_memory)
    real_model = model.model
    noise = noise.to(device)
@ -228,8 +253,6 @@ def ksampler(model, positive, negative, latent, seed=None, steps=30, cfg=7.0, sa
    positive_copy = broadcast_cond(positive, noise.shape[0], device)
    negative_copy = broadcast_cond(negative, noise.shape[0], device)
    models = load_additional_models(positive, negative, model.model_dtype())
    sampler = KSamplerBasic(real_model, steps=steps, device=device, sampler=sampler_name, scheduler=scheduler,
                       denoise=denoise, model_options=model.model_options)
@ -254,12 +277,7 @@ def ksampler_with_refiner(model, positive, negative, refiner, refiner_positive,
                          seed=None, steps=30, refiner_switch_step=20, cfg=7.0, sampler_name='dpmpp_fooocus_2m_sde_inpaint_seamless',
                          scheduler='karras', denoise=1.0, disable_noise=False, start_step=None, last_step=None,
                          force_full_denoise=False, callback_function=None):
-    # SCHEDULERS = ["normal", "karras", "exponential", "simple", "ddim_uniform"]
+    seed = seed if isinstance(seed, int) else random.randint(0, 2**63 - 1)
    # SAMPLERS = ["euler", "euler_ancestral", "heun", "dpm_2", "dpm_2_ancestral",
    #             "lms", "dpm_fast", "dpm_adaptive", "dpmpp_2s_ancestral", "dpmpp_sde", "dpmpp_sde_gpu",
    #             "dpmpp_2m", "dpmpp_2m_sde", "dpmpp_2m_sde_gpu", "ddim", "uni_pc", "uni_pc_bh2"]
    seed = seed if isinstance(seed, int) else random.randint(1, 2 ** 64)
    device = comfy.model_management.get_torch_device()
    latent_image = latent["samples"]
@ -274,11 +292,12 @@ def ksampler_with_refiner(model, positive, negative, refiner, refiner_positive,
    if "noise_mask" in latent:
        noise_mask = latent["noise_mask"]
-    previewer = get_previewer(device, model.model.latent_format)
+    previewer = get_previewer()
    pbar = comfy.utils.ProgressBar(steps)
    def callback(step, x0, x, total_steps):
        comfy.model_management.throw_exception_if_processing_interrupted()
        y = None
        if previewer is not None:
            y = previewer(x0, step, total_steps)
@ -292,7 +311,8 @@ def ksampler_with_refiner(model, positive, negative, refiner, refiner_positive,
    if noise_mask is not None:
        noise_mask = prepare_mask(noise_mask, noise.shape, device)
-    comfy.model_management.load_model_gpu(model)
+    models, inference_memory = get_additional_models(positive, negative, model.model_dtype())
    comfy.model_management.load_models_gpu([model] + models, comfy.model_management.batch_area_memory(noise.shape[0] * noise.shape[2] * noise.shape[3]) + inference_memory)
    noise = noise.to(device)
    latent_image = latent_image.to(device)
@ -303,8 +323,6 @@ def ksampler_with_refiner(model, positive, negative, refiner, refiner_positive,
    refiner_positive_copy = broadcast_cond(refiner_positive, noise.shape[0], device)
    refiner_negative_copy = broadcast_cond(refiner_negative, noise.shape[0], device)
    models = load_additional_models(positive, negative, model.model_dtype())
    sampler = KSamplerWithRefiner(model=model, refiner_model=refiner, steps=steps, device=device,
                                  sampler=sampler_name, scheduler=scheduler,
                                  denoise=denoise, model_options=model.model_options)
--- a/modules/default_pipeline.py
+++ b/modules/default_pipeline.py
@ -2,23 +2,49 @@ import modules.core as core
 import os
 import torch
 import modules.path
 import modules.virtual_memory as virtual_memory
 import comfy.model_management
 from comfy.model_patcher import ModelPatcher
 from comfy.model_base import SDXL, SDXLRefiner
 from modules.patch import cfg_patched, patched_model_function
 from modules.expansion import FooocusExpansion
 xl_base: core.StableDiffusionModel = None
 xl_base_hash = ''
 xl_refiner: core.StableDiffusionModel = None
 xl_refiner_hash = ''
 xl_base_patched: core.StableDiffusionModel = None
 xl_base_patched_hash = ''
 xl_refiner: ModelPatcher = None
 xl_refiner_hash = ''
@torch.no_grad()
@torch.inference_mode()
 def assert_model_integrity():
    error_message = None
    if xl_base is None:
        error_message = 'You have not selected SDXL base model.'
    if xl_base_patched is None:
        error_message = 'You have not selected SDXL base model.'
    if not isinstance(xl_base.unet.model, SDXL):
        error_message = 'You have selected base model other than SDXL. This is not supported yet.'
    if not isinstance(xl_base_patched.unet.model, SDXL):
        error_message = 'You have selected base model other than SDXL. This is not supported yet.'
    if xl_refiner is not None:
        if not isinstance(xl_refiner.model, SDXLRefiner):
            error_message = 'You have selected refiner model other than SDXL refiner. This is not supported yet.'
    if error_message is not None:
        raise NotImplementedError(error_message)
    return True
@torch.no_grad()
@torch.inference_mode()
@ -31,24 +57,13 @@ def refresh_base_model(name):
    if xl_base_hash == model_hash:
        return
-    if xl_base is not None:
+    xl_base = None
-        xl_base.to_meta()
+    xl_base_hash = ''
-        xl_base = None
+    xl_base_patched = None
    xl_base_patched_hash = ''
    xl_base = core.load_model(filename)
    if not isinstance(xl_base.unet.model, SDXL):
        print('Model not supported. Fooocus only support SDXL model as the base model.')
        xl_base = None
        xl_base_hash = ''
        refresh_base_model(modules.path.default_base_model_name)
        xl_base_hash = model_hash
        xl_base_patched = xl_base
        xl_base_patched_hash = ''
        return
    xl_base_hash = model_hash
    xl_base_patched = xl_base
    xl_base_patched_hash = ''
    print(f'Base model loaded: {model_hash}')
    return
@ -64,28 +79,18 @@ def refresh_refiner_model(name):
    if xl_refiner_hash == model_hash:
        return
    xl_refiner = None
    xl_refiner_hash = ''
    if name == 'None':
        xl_refiner = None
        xl_refiner_hash = ''
        print(f'Refiner unloaded.')
        return
    if xl_refiner is not None:
        xl_refiner.to_meta()
        xl_refiner = None
    xl_refiner = core.load_model(filename)
    if not isinstance(xl_refiner.unet.model, SDXLRefiner):
        print('Model not supported. Fooocus only support SDXL refiner as the refiner.')
        xl_refiner = None
        xl_refiner_hash = ''
        print(f'Refiner unloaded.')
        return
    xl_refiner = core.load_unet_only(filename)
    xl_refiner_hash = model_hash
    print(f'Refiner model loaded: {model_hash}')
-    xl_refiner.vae.first_stage_model.to('meta')
+    # Remove VAE
    xl_refiner.vae = None
    return
@ -133,6 +138,15 @@ def clip_encode_single(clip, text, verbose=False):
    return result
@torch.no_grad()
@torch.inference_mode()
 def clip_separate(cond):
    c, p = cond[0]
    c = c[..., -1280:].clone()
    p = p["pooled_output"].clone()
    return [[c, {"pooled_output": p}]]
@torch.no_grad()
@torch.inference_mode()
 def clip_encode(sd, texts, pool_top_k=1):
@ -158,36 +172,20 @@ def clip_encode(sd, texts, pool_top_k=1):
    return [[torch.cat(cond_list, dim=1), {"pooled_output": pooled_acc}]]
@torch.no_grad()
@torch.inference_mode()
 def clear_sd_cond_cache(sd):
    if sd is None:
        return None
    if sd.clip is None:
        return None
    sd.clip.fcs_cond_cache = {}
    return
@torch.no_grad()
@torch.inference_mode()
 def clear_all_caches():
-    clear_sd_cond_cache(xl_base_patched)
+    xl_base.clip.fcs_cond_cache = {}
-    clear_sd_cond_cache(xl_refiner)
+    xl_base_patched.clip.fcs_cond_cache = {}
@torch.no_grad()
@torch.inference_mode()
 def refresh_everything(refiner_model_name, base_model_name, loras):
    refresh_refiner_model(refiner_model_name)
    if xl_refiner is not None:
        virtual_memory.try_move_to_virtual_memory(xl_refiner.unet.model)
        virtual_memory.try_move_to_virtual_memory(xl_refiner.clip.cond_stage_model)
    refresh_base_model(base_model_name)
    virtual_memory.load_from_virtual_memory(xl_base.unet.model)
    refresh_loras(loras)
    assert_model_integrity()
    clear_all_caches()
    return
@ -203,32 +201,7 @@ expansion = FooocusExpansion()
@torch.no_grad()
@torch.inference_mode()
-def patch_all_models():
+def process_diffusion(positive_cond, negative_cond, steps, switch, width, height, image_seed, callback, sampler_name, latent=None, denoise=1.0, tiled=False, cfg_scale=7.0):
    assert xl_base is not None
    assert xl_base_patched is not None
    xl_base.unet.model_options['sampler_cfg_function'] = cfg_patched
    xl_base.unet.model_options['model_function_wrapper'] = patched_model_function
    xl_base_patched.unet.model_options['sampler_cfg_function'] = cfg_patched
    xl_base_patched.unet.model_options['model_function_wrapper'] = patched_model_function
    if xl_refiner is not None:
        xl_refiner.unet.model_options['sampler_cfg_function'] = cfg_patched
        xl_refiner.unet.model_options['model_function_wrapper'] = patched_model_function
    return
@torch.no_grad()
@torch.inference_mode()
 def process_diffusion(positive_cond, negative_cond, steps, switch, width, height, image_seed, callback, latent=None, denoise=1.0, tiled=False):
    patch_all_models()
    if xl_refiner is not None:
        virtual_memory.try_move_to_virtual_memory(xl_refiner.unet.model)
    virtual_memory.load_from_virtual_memory(xl_base.unet.model)
    if latent is None:
        empty_latent = core.generate_empty_latent(width=width, height=height, batch_size=1)
    else:
@ -239,7 +212,7 @@ def process_diffusion(positive_cond, negative_cond, steps, switch, width, height
            model=xl_base_patched.unet,
            positive=positive_cond[0],
            negative=negative_cond[0],
-            refiner=xl_refiner.unet,
+            refiner=xl_refiner,
            refiner_positive=positive_cond[1],
            refiner_negative=negative_cond[1],
            refiner_switch_step=switch,
@ -247,7 +220,9 @@ def process_diffusion(positive_cond, negative_cond, steps, switch, width, height
            steps=steps, start_step=0, last_step=steps, disable_noise=False, force_full_denoise=True,
            seed=image_seed,
            denoise=denoise,
-            callback_function=callback
+            callback_function=callback,
            cfg=cfg_scale,
            sampler_name=sampler_name
        )
    else:
        sampled_latent = core.ksampler(
@ -258,7 +233,9 @@ def process_diffusion(positive_cond, negative_cond, steps, switch, width, height
            steps=steps, start_step=0, last_step=steps, disable_noise=False, force_full_denoise=True,
            seed=image_seed,
            denoise=denoise,
-            callback_function=callback
+            callback_function=callback,
            cfg=cfg_scale,
            sampler_name=sampler_name
        )
    decoded_latent = core.decode_vae(vae=xl_base_patched.vae, latent_image=sampled_latent, tiled=tiled)
--- a/modules/expansion.py
+++ b/modules/expansion.py
@ -4,7 +4,7 @@ import comfy.model_management as model_management
 from transformers import AutoTokenizer, AutoModelForCausalLM, set_seed
 from modules.path import fooocus_expansion_path
-from comfy.sd import ModelPatcher
+from comfy.model_patcher import ModelPatcher
 fooocus_magic_split = [
--- a/modules/flags.py
+++ b/modules/flags.py
@ -9,3 +9,12 @@ upscale_fast = 'Upscale (Fast 2x)'
 uov_list = [
    disabled, subtle_variation, strong_variation, upscale_15, upscale_2, upscale_fast
 ]
 sampler_list = ["euler", "euler_ancestral", "heun", "dpm_2", "dpm_2_ancestral",
                "lms", "dpm_fast", "dpm_adaptive", "dpmpp_2s_ancestral", "dpmpp_sde", "dpmpp_sde_gpu",
                "dpmpp_2m", "dpmpp_2m_sde", "dpmpp_2m_sde_gpu", "dpmpp_3m_sde", "dpmpp_3m_sde_gpu", "ddpm",
                # "ddim",
                "uni_pc", "uni_pc_bh2",
                # "dpmpp_fooocus_2m_sde_inpaint_seamless"
                ]
 default_sampler = 'dpmpp_2m_sde_gpu'
--- a/modules/inpaint_worker.py
+++ b/modules/inpaint_worker.py
@ -1,12 +1,9 @@
 import os.path
 import torch
 import numpy as np
 import modules.default_pipeline as pipeline
 from PIL import Image, ImageFilter
 from modules.util import resample_image
 from modules.path import inpaint_models_path
 inpaint_head = None
--- a/modules/launch_util.py
+++ b/modules/launch_util.py
@ -7,12 +7,15 @@ import sys
 import re
 import logging
 import pygit2
 pygit2.option(pygit2.GIT_OPT_SET_OWNER_VALIDATION, 0)
 pygit2.option(pygit2.GIT_OPT_SET_OWNER_VALIDATION, 0)
 logging.getLogger("torch.distributed.nn").setLevel(logging.ERROR)  # sshh...
 logging.getLogger("xformers").addFilter(lambda record: 'A matching Triton is not available' not in record.getMessage())
 re_requirement = re.compile(r"\s*([-_a-zA-Z0-9]+)\s*(?:==\s*([-+_.a-zA-Z0-9]+))?\s*")
 python = sys.executable
 default_command_live = (os.environ.get('LAUNCH_LIVE_OUTPUT') == "1")
 index_url = os.environ.get('INDEX_URL', "")
@ -22,17 +25,32 @@ script_path = os.path.dirname(modules_path)
 dir_repos = "repositories"
 def onerror(func, path, exc_info):
    import stat
    if not os.access(path, os.W_OK):
        os.chmod(path, stat.S_IWUSR)
        func(path)
    else:
        raise 'Failed to invoke "shutil.rmtree", git management failed.'
 def git_clone(url, dir, name, hash=None):
    try:
        try:
            repo = pygit2.Repository(dir)
-            print(f'{name} exists.')
+            remote_url = repo.remotes['origin'].url
            if remote_url != url:
                print(f'{name} exists but remote URL will be updated.')
                del repo
                raise url
            else:
                print(f'{name} exists and URL is correct.')
        except:
-            if os.path.exists(dir):
+            if os.path.isdir(dir) or os.path.exists(dir):
-                shutil.rmtree(dir, ignore_errors=True)
+                shutil.rmtree(dir, onerror=onerror)
            os.makedirs(dir, exist_ok=True)
            repo = pygit2.clone_repository(url, dir)
-            print(f'{name} cloned.')
+            print(f'{name} cloned from {url}.')
        remote = repo.remotes['origin']
        remote.fetch()
@ -40,7 +58,7 @@ def git_clone(url, dir, name, hash=None):
        commit = repo.get(hash)
        repo.checkout_tree(commit, strategy=pygit2.GIT_CHECKOUT_FORCE)
-        print(f'{name} checkout finished.')
+        print(f'{name} checkout finished for {hash}.')
    except Exception as e:
        print(f'Git clone failed for {name}: {str(e)}')
@ -101,9 +119,6 @@ def run_pip(command, desc=None, live=default_command_live):
        return None
 re_requirement = re.compile(r"\s*([-_a-zA-Z0-9]+)\s*(?:==\s*([-+_.a-zA-Z0-9]+))?\s*")
 def requirements_met(requirements_file):
    """
    Does a simple parse of a requirements.txt file to determine if all rerqirements in it
--- a/modules/model_loader.py
+++ b/modules/model_loader.py
@ -2,6 +2,7 @@ import os
 from urllib.parse import urlparse
 from typing import Optional
 def load_file_from_url(
        url: str,
        *,
--- a/modules/patch.py
+++ b/modules/patch.py
@ -1,5 +1,4 @@
 import torch
 import contextlib
 import comfy.model_base
 import comfy.ldm.modules.diffusionmodules.openaimodel
 import comfy.samplers
@ -13,6 +12,7 @@ import modules.inpaint_worker as inpaint_worker
 import comfy.ldm.modules.diffusionmodules.openaimodel
 import comfy.ldm.modules.diffusionmodules.model
 import comfy.sd
 import comfy.model_patcher
 from comfy.k_diffusion import utils
 from comfy.k_diffusion.sampling import BrownianTreeNoiseSampler, trange
@ -20,11 +20,13 @@ from comfy.ldm.modules.diffusionmodules.openaimodel import timestep_embedding, f
 sharpness = 2.0
-negative_adm = True
+positive_adm_scale = 1.5
 negative_adm_scale = 0.8
 cfg_x0 = 0.0
 cfg_s = 1.0
 cfg_cin = 1.0
 adaptive_cfg = 0.7
 def calculate_weight_patched(self, patches, weight, key):
@ -45,25 +47,26 @@ def calculate_weight_patched(self, patches, weight, key):
                if w1.shape != weight.shape:
                    print("WARNING SHAPE MISMATCH {} WEIGHT NOT MERGED {} != {}".format(key, w1.shape, weight.shape))
                else:
-                    weight += alpha * w1.type(weight.dtype).to(weight.device)
+                    weight += alpha * comfy.model_management.cast_to_device(w1, weight.device, weight.dtype)
        elif len(v) == 3:
            # fooocus
-            w1 = v[0].float()
+            w1 = comfy.model_management.cast_to_device(v[0], weight.device, torch.float32)
-            w_min = v[1].float()
+            w_min = comfy.model_management.cast_to_device(v[1], weight.device, torch.float32)
-            w_max = v[2].float()
+            w_max = comfy.model_management.cast_to_device(v[2], weight.device, torch.float32)
            w1 = (w1 / 255.0) * (w_max - w_min) + w_min
            if alpha != 0.0:
                if w1.shape != weight.shape:
                    print("WARNING SHAPE MISMATCH {} FOOOCUS WEIGHT NOT MERGED {} != {}".format(key, w1.shape, weight.shape))
                else:
-                    weight += alpha * w1.type(weight.dtype).to(weight.device)
+                    weight += alpha * comfy.model_management.cast_to_device(w1, weight.device, weight.dtype)
        elif len(v) == 4:  # lora/locon
-            mat1 = v[0].float().to(weight.device)
+            mat1 = comfy.model_management.cast_to_device(v[0], weight.device, torch.float32)
-            mat2 = v[1].float().to(weight.device)
+            mat2 = comfy.model_management.cast_to_device(v[1], weight.device, torch.float32)
            if v[2] is not None:
                alpha *= v[2] / mat2.shape[0]
            if v[3] is not None:
-                mat3 = v[3].float().to(weight.device)
+                # locon mid weights, hopefully the math is fine because I didn't properly test it
                mat3 = comfy.model_management.cast_to_device(v[3], weight.device, torch.float32)
                final_shape = [mat2.shape[1], mat2.shape[0], mat3.shape[2], mat3.shape[3]]
                mat2 = torch.mm(mat2.transpose(0, 1).flatten(start_dim=1),
                                mat3.transpose(0, 1).flatten(start_dim=1)).reshape(final_shape).transpose(0, 1)
@ -84,19 +87,23 @@ def calculate_weight_patched(self, patches, weight, key):
            if w1 is None:
                dim = w1_b.shape[0]
-                w1 = torch.mm(w1_a.float(), w1_b.float())
+                w1 = torch.mm(comfy.model_management.cast_to_device(w1_a, weight.device, torch.float32),
                              comfy.model_management.cast_to_device(w1_b, weight.device, torch.float32))
            else:
-                w1 = w1.float().to(weight.device)
+                w1 = comfy.model_management.cast_to_device(w1, weight.device, torch.float32)
            if w2 is None:
                dim = w2_b.shape[0]
                if t2 is None:
-                    w2 = torch.mm(w2_a.float().to(weight.device), w2_b.float().to(weight.device))
+                    w2 = torch.mm(comfy.model_management.cast_to_device(w2_a, weight.device, torch.float32),
                                  comfy.model_management.cast_to_device(w2_b, weight.device, torch.float32))
                else:
-                    w2 = torch.einsum('i j k l, j r, i p -> p r k l', t2.float().to(weight.device),
+                    w2 = torch.einsum('i j k l, j r, i p -> p r k l',
-                                      w2_b.float().to(weight.device), w2_a.float().to(weight.device))
+                                      comfy.model_management.cast_to_device(t2, weight.device, torch.float32),
                                      comfy.model_management.cast_to_device(w2_b, weight.device, torch.float32),
                                      comfy.model_management.cast_to_device(w2_a, weight.device, torch.float32))
            else:
-                w2 = w2.float().to(weight.device)
+                w2 = comfy.model_management.cast_to_device(w2, weight.device, torch.float32)
            if len(w2.shape) == 4:
                w1 = w1.unsqueeze(2).unsqueeze(2)
@ -117,13 +124,20 @@ def calculate_weight_patched(self, patches, weight, key):
            if v[5] is not None:  # cp decomposition
                t1 = v[5]
                t2 = v[6]
-                m1 = torch.einsum('i j k l, j r, i p -> p r k l', t1.float().to(weight.device),
+                m1 = torch.einsum('i j k l, j r, i p -> p r k l',
-                                  w1b.float().to(weight.device), w1a.float().to(weight.device))
+                                  comfy.model_management.cast_to_device(t1, weight.device, torch.float32),
-                m2 = torch.einsum('i j k l, j r, i p -> p r k l', t2.float().to(weight.device),
+                                  comfy.model_management.cast_to_device(w1b, weight.device, torch.float32),
-                                  w2b.float().to(weight.device), w2a.float().to(weight.device))
+                                  comfy.model_management.cast_to_device(w1a, weight.device, torch.float32))
                m2 = torch.einsum('i j k l, j r, i p -> p r k l',
                                  comfy.model_management.cast_to_device(t2, weight.device, torch.float32),
                                  comfy.model_management.cast_to_device(w2b, weight.device, torch.float32),
                                  comfy.model_management.cast_to_device(w2a, weight.device, torch.float32))
            else:
-                m1 = torch.mm(w1a.float().to(weight.device), w1b.float().to(weight.device))
+                m1 = torch.mm(comfy.model_management.cast_to_device(w1a, weight.device, torch.float32),
-                m2 = torch.mm(w2a.float().to(weight.device), w2b.float().to(weight.device))
+                              comfy.model_management.cast_to_device(w1b, weight.device, torch.float32))
                m2 = torch.mm(comfy.model_management.cast_to_device(w2a, weight.device, torch.float32),
                              comfy.model_management.cast_to_device(w2b, weight.device, torch.float32))
            try:
                weight += (alpha * m1 * m2).reshape(weight.shape).type(weight.dtype)
@ -133,47 +147,67 @@ def calculate_weight_patched(self, patches, weight, key):
    return weight
-def cfg_patched(args):
+def get_adaptive_weight_k(cfg_scale):
    w = float(cfg_scale)
    w -= 7.0
    w /= 3.0
    w = max(w, 0.01)
    w = min(w, 0.99)
    return w
 def compute_cfg(uncond, cond, cfg_scale):
    global adaptive_cfg
    k = adaptive_cfg * get_adaptive_weight_k(cfg_scale)
    x_cfg = uncond + cfg_scale * (cond - uncond)
    ro_pos = torch.std(cond, dim=(1, 2, 3), keepdim=True)
    ro_cfg = torch.std(x_cfg, dim=(1, 2, 3), keepdim=True)
    x_rescaled = x_cfg * (ro_pos / ro_cfg)
    x_final = k * x_rescaled + (1.0 - k) * x_cfg
    return x_final
 def patched_sampler_cfg_function(args):
    global cfg_x0, cfg_s
-    positive_eps = args['cond'].clone()
+
    positive_eps = args['cond']
    negative_eps = args['uncond']
    cfg_scale = args['cond_scale']
    positive_x0 = args['cond'] * cfg_s + cfg_x0
-    uncond = args['uncond'] * cfg_s + cfg_x0
+    t = 1.0 - (args['timestep'] / 999.0)[:, None, None, None].clone()
-    cond_scale = args['cond_scale']
+    alpha = 0.001 * sharpness * t
    t = args['timestep']
-    alpha = 1.0 - (t / 999.0)[:, None, None, None].clone()
+    positive_eps_degraded = anisotropic.adaptive_anisotropic_filter(x=positive_eps, g=positive_x0)
-    alpha *= 0.001 * sharpness
+    positive_eps_degraded_weighted = positive_eps_degraded * alpha + positive_eps * (1.0 - alpha)
-    eps_degraded = anisotropic.adaptive_anisotropic_filter(x=positive_eps, g=positive_x0)
+    return compute_cfg(uncond=negative_eps, cond=positive_eps_degraded_weighted, cfg_scale=cfg_scale)
    eps_degraded_weighted = eps_degraded * alpha + positive_eps * (1.0 - alpha)
    cond = eps_degraded_weighted * cfg_s + cfg_x0
    return uncond + (cond - uncond) * cond_scale
 def patched_discrete_eps_ddpm_denoiser_forward(self, input, sigma, **kwargs):
    global cfg_x0, cfg_s, cfg_cin
    c_out, c_in = [utils.append_dims(x, input.ndim) for x in self.get_scalings(sigma)]
-    cfg_x0 = input
+    cfg_x0, cfg_s, cfg_cin = input, c_out, c_in
-    cfg_s = c_out
+    eps = self.get_eps(input * c_in, self.sigma_to_t(sigma), **kwargs)
-    cfg_cin = c_in
+    return input + eps * c_out
    return self.get_eps(input * c_in, self.sigma_to_t(sigma), **kwargs)
-def patched_model_function(func, args):
+def patched_model_function_wrapper(func, args):
    global cfg_cin
    x = args['input']
    t = args['timestep']
    c = args['c']
-    # is_uncond = torch.tensor(args['cond_or_uncond'])[:, None, None, None].to(x) * 5e-3
+    # is_uncond = torch.tensor(args['cond_or_uncond'])[:, None, None, None].to(x)
    return func(x, t, **c)
 def sdxl_encode_adm_patched(self, **kwargs):
-    global negative_adm
+    global positive_adm_scale, negative_adm_scale
-    clip_pooled = kwargs["pooled_output"]
+    clip_pooled = comfy.model_base.sdxl_pooled(kwargs, self.noise_augmentor)
    width = kwargs.get("width", 768)
    height = kwargs.get("height", 768)
    crop_w = kwargs.get("crop_w", 0)
@ -181,13 +215,20 @@ def sdxl_encode_adm_patched(self, **kwargs):
    target_width = kwargs.get("target_width", width)
    target_height = kwargs.get("target_height", height)
-    if negative_adm:
+    if kwargs.get("prompt_type", "") == "negative":
-        if kwargs.get("prompt_type", "") == "negative":
+        width = float(width) * negative_adm_scale
-            width *= 0.8
+        height = float(height) * negative_adm_scale
-            height *= 0.8
+    elif kwargs.get("prompt_type", "") == "positive":
-        elif kwargs.get("prompt_type", "") == "positive":
+        width = float(width) * positive_adm_scale
-            width *= 1.5
+        height = float(height) * positive_adm_scale
-            height *= 1.5
+
    # Avoid artifacts
    width = int(width)
    height = int(height)
    crop_w = int(crop_w)
    crop_h = int(crop_h)
    target_width = int(target_width)
    target_height = int(target_height)
    out = []
    out.append(self.embedder(torch.Tensor([height])))
@ -196,15 +237,10 @@ def sdxl_encode_adm_patched(self, **kwargs):
    out.append(self.embedder(torch.Tensor([crop_w])))
    out.append(self.embedder(torch.Tensor([target_height])))
    out.append(self.embedder(torch.Tensor([target_width])))
-    flat = torch.flatten(torch.cat(out))[None, ]
+    flat = torch.flatten(torch.cat(out)).unsqueeze(dim=0).repeat(clip_pooled.shape[0], 1)
    return torch.cat((clip_pooled.to(flat.device), flat), dim=1)
 def text_encoder_device_patched():
    # Fooocus's style system uses text encoder much more times than comfy so this makes things much faster.
    return comfy.model_management.get_torch_device()
 def encode_token_weights_patched_with_a1111_method(self, token_weight_pairs):
    to_encode = list(self.empty_tokens)
    for x in token_weight_pairs:
@ -308,6 +344,7 @@ def patched_unet_forward(self, x, timesteps=None, context=None, y=None, control=
    transformer_options["original_shape"] = list(x.shape)
    transformer_options["current_index"] = 0
    transformer_patches = transformer_options.get("patches", {})
    assert (y is not None) == (
            self.num_classes is not None
@ -338,7 +375,9 @@ def patched_unet_forward(self, x, timesteps=None, context=None, y=None, control=
    transformer_options["block"] = ("middle", 0)
    h = forward_timestep_embed(self.middle_block, h, emb, context, transformer_options)
    if control is not None and 'middle' in control and len(control['middle']) > 0:
-        h += control['middle'].pop()
+        ctrl = control['middle'].pop()
        if ctrl is not None:
            h += ctrl
    for id, module in enumerate(self.output_blocks):
        transformer_options["block"] = ("output", id)
@ -348,6 +387,11 @@ def patched_unet_forward(self, x, timesteps=None, context=None, y=None, control=
            if ctrl is not None:
                hsp += ctrl
        if "output_block_patch" in transformer_patches:
            patch = transformer_patches["output_block_patch"]
            for p in patch:
                h, hsp = p(h, hsp, transformer_options)
        h = torch.cat([h, hsp], dim=1)
        del hsp
        if len(hs) > 0:
@ -362,88 +406,11 @@ def patched_unet_forward(self, x, timesteps=None, context=None, y=None, control=
        return self.out(h)
 def patched_SD1ClipModel_forward(self, tokens):
        backup_embeds = self.transformer.get_input_embeddings()
        device = backup_embeds.weight.device
        tokens = self.set_up_textual_embeddings(tokens, backup_embeds)
        tokens = torch.LongTensor(tokens).to(device)
        if backup_embeds.weight.dtype != torch.float32:
            precision_scope = torch.autocast
        else:
            precision_scope = contextlib.nullcontext
        with precision_scope(comfy.model_management.get_autocast_device(device)):
            outputs = self.transformer(input_ids=tokens, output_hidden_states=self.layer=="hidden")
            self.transformer.set_input_embeddings(backup_embeds)
            if self.layer == "last":
                z = outputs.last_hidden_state
            elif self.layer == "pooled":
                z = outputs.pooler_output[:, None, :]
            else:
                z = outputs.hidden_states[self.layer_idx]
                if self.layer_norm_hidden_state:
                    z = self.transformer.text_model.final_layer_norm(z)
            pooled_output = outputs.pooler_output
            if self.text_projection is not None:
                pooled_output = pooled_output.float().to(self.text_projection.device) @ self.text_projection.float()
        return z.float(), pooled_output.float()
 VAE_DTYPE = None
 def vae_dtype_patched():
    global VAE_DTYPE
    if VAE_DTYPE is None:
        VAE_DTYPE = torch.float32
        if comfy.model_management.is_nvidia():
            torch_version = torch.version.__version__
            if int(torch_version[0]) >= 2:
                if torch.cuda.is_bf16_supported():
                    VAE_DTYPE = torch.bfloat16
                    print('BFloat16 VAE: Enabled')
    return VAE_DTYPE
 def vae_bf16_upsample_forward(self, x):
    try:
        x = torch.nn.functional.interpolate(x, scale_factor=2.0, mode="nearest")
    except:  # operation not implemented for bf16
        b, c, h, w = x.shape
        out = torch.empty((b, c, h * 2, w * 2), dtype=x.dtype, layout=x.layout, device=x.device)
        split = 8
        l = out.shape[1] // split
        for i in range(0, out.shape[1], l):
            out[:, i:i + l] = torch.nn.functional.interpolate(x[:, i:i + l].to(torch.float32), scale_factor=2.0,
                                                              mode="nearest").to(x.dtype)
        del x
        x = out
    if self.with_conv:
        x = self.conv(x)
    return x
 def patch_all():
-    comfy.model_management.vae_dtype = vae_dtype_patched
+    comfy.model_patcher.ModelPatcher.calculate_weight = calculate_weight_patched
    comfy.ldm.modules.diffusionmodules.model.Upsample.forward = vae_bf16_upsample_forward
    comfy.sd1_clip.SD1ClipModel.forward = patched_SD1ClipModel_forward
    comfy.sd.ModelPatcher.calculate_weight = calculate_weight_patched
    comfy.ldm.modules.diffusionmodules.openaimodel.UNetModel.forward = patched_unet_forward
    comfy.ldm.modules.attention.print = lambda x: None
    comfy.k_diffusion.sampling.sample_dpmpp_fooocus_2m_sde_inpaint_seamless = sample_dpmpp_fooocus_2m_sde_inpaint_seamless
    comfy.model_management.text_encoder_device = text_encoder_device_patched
    print(f'Fooocus Text Processing Pipelines are retargeted to {str(comfy.model_management.text_encoder_device())}')
    comfy.k_diffusion.external.DiscreteEpsDDPMDenoiser.forward = patched_discrete_eps_ddpm_denoiser_forward
    comfy.model_base.SDXL.encode_adm = sdxl_encode_adm_patched
    comfy.sd1_clip.ClipTokenWeightEncoder.encode_token_weights = encode_token_weights_patched_with_a1111_method
    return
--- a/modules/samplers_advanced.py
+++ b/modules/samplers_advanced.py
@ -1,14 +1,13 @@
 from comfy.samplers import *
 import comfy.model_management
 import modules.virtual_memory
 class KSamplerBasic:
-    SCHEDULERS = ["normal", "karras", "exponential", "simple", "ddim_uniform"]
+    SCHEDULERS = ["normal", "karras", "exponential", "sgm_uniform", "simple", "ddim_uniform"]
    SAMPLERS = ["euler", "euler_ancestral", "heun", "dpm_2", "dpm_2_ancestral",
                "lms", "dpm_fast", "dpm_adaptive", "dpmpp_2s_ancestral", "dpmpp_sde", "dpmpp_sde_gpu",
-                "dpmpp_2m", "dpmpp_2m_sde", "dpmpp_2m_sde_gpu", "ddim", "uni_pc", "uni_pc_bh2", "dpmpp_fooocus_2m_sde_inpaint_seamless"]
+                "dpmpp_2m", "dpmpp_2m_sde", "dpmpp_2m_sde_gpu", "dpmpp_3m_sde", "dpmpp_3m_sde_gpu", "ddpm", "ddim", "uni_pc", "uni_pc_bh2", "dpmpp_fooocus_2m_sde_inpaint_seamless"]
    def __init__(self, model, steps, device, sampler=None, scheduler=None, denoise=None, model_options={}):
        self.model = model
@ -50,6 +49,8 @@ class KSamplerBasic:
            sigmas = simple_scheduler(self.model_wrap, steps)
        elif self.scheduler == "ddim_uniform":
            sigmas = ddim_scheduler(self.model_wrap, steps)
        elif self.scheduler == "sgm_uniform":
            sigmas = sgm_scheduler(self.model_wrap, steps)
        else:
            print("error invalid scheduler", self.scheduler)
@ -89,8 +90,8 @@ class KSamplerBasic:
        positive = positive[:]
        negative = negative[:]
-        resolve_cond_masks(positive, noise.shape[2], noise.shape[3], self.device)
+        resolve_areas_and_cond_masks(positive, noise.shape[2], noise.shape[3], self.device)
-        resolve_cond_masks(negative, noise.shape[2], noise.shape[3], self.device)
+        resolve_areas_and_cond_masks(negative, noise.shape[2], noise.shape[3], self.device)
        calculate_start_end_timesteps(self.model_wrap, negative)
        calculate_start_end_timesteps(self.model_wrap, positive)
@ -203,10 +204,10 @@ class KSamplerBasic:
 class KSamplerWithRefiner:
-    SCHEDULERS = ["normal", "karras", "exponential", "simple", "ddim_uniform"]
+    SCHEDULERS = ["normal", "karras", "exponential", "sgm_uniform", "simple", "ddim_uniform"]
    SAMPLERS = ["euler", "euler_ancestral", "heun", "dpm_2", "dpm_2_ancestral",
                "lms", "dpm_fast", "dpm_adaptive", "dpmpp_2s_ancestral", "dpmpp_sde", "dpmpp_sde_gpu",
-                "dpmpp_2m", "dpmpp_2m_sde", "dpmpp_2m_sde_gpu", "ddim", "uni_pc", "uni_pc_bh2", "dpmpp_fooocus_2m_sde_inpaint_seamless"]
+                "dpmpp_2m", "dpmpp_2m_sde", "dpmpp_2m_sde_gpu", "dpmpp_3m_sde", "dpmpp_3m_sde_gpu", "ddpm", "ddim", "uni_pc", "uni_pc_bh2", "dpmpp_fooocus_2m_sde_inpaint_seamless"]
    def __init__(self, model, refiner_model, steps, device, sampler=None, scheduler=None, denoise=None, model_options={}):
        self.model_patcher = model
@ -263,6 +264,8 @@ class KSamplerWithRefiner:
            sigmas = simple_scheduler(self.model_wrap, steps)
        elif self.scheduler == "ddim_uniform":
            sigmas = ddim_scheduler(self.model_wrap, steps)
        elif self.scheduler == "sgm_uniform":
            sigmas = sgm_scheduler(self.model_wrap, steps)
        else:
            print("error invalid scheduler", self.scheduler)
@ -304,8 +307,8 @@ class KSamplerWithRefiner:
        positive = positive[:]
        negative = negative[:]
-        resolve_cond_masks(positive, noise.shape[2], noise.shape[3], self.device)
+        resolve_areas_and_cond_masks(positive, noise.shape[2], noise.shape[3], self.device)
-        resolve_cond_masks(negative, noise.shape[2], noise.shape[3], self.device)
+        resolve_areas_and_cond_masks(negative, noise.shape[2], noise.shape[3], self.device)
        calculate_start_end_timesteps(self.model_wrap, negative)
        calculate_start_end_timesteps(self.model_wrap, positive)
@ -332,8 +335,8 @@ class KSamplerWithRefiner:
        refiner_positive = refiner_positive[:]
        refiner_negative = refiner_negative[:]
-        resolve_cond_masks(refiner_positive, noise.shape[2], noise.shape[3], self.device)
+        resolve_areas_and_cond_masks(refiner_positive, noise.shape[2], noise.shape[3], self.device)
-        resolve_cond_masks(refiner_negative, noise.shape[2], noise.shape[3], self.device)
+        resolve_areas_and_cond_masks(refiner_negative, noise.shape[2], noise.shape[3], self.device)
        calculate_start_end_timesteps(self.refiner_model_wrap, refiner_positive)
        calculate_start_end_timesteps(self.refiner_model_wrap, refiner_negative)
@ -351,8 +354,6 @@ class KSamplerWithRefiner:
                                          noise.shape[3], noise.shape[2], self.device, "negative")
        def refiner_switch():
            modules.virtual_memory.try_move_to_virtual_memory(self.model_denoise.inner_model)
            modules.virtual_memory.load_from_virtual_memory(self.refiner_model_denoise.inner_model)
            comfy.model_management.load_model_gpu(self.refiner_model_patcher)
            self.model_denoise.inner_model = self.refiner_model_denoise.inner_model
            for i in range(len(positive)):
--- a/modules/sdxl_styles.py
+++ b/modules/sdxl_styles.py
@ -1,6 +1,3 @@
 from modules.util import join_prompts
 fooocus_expansion = "Fooocus V2"
 default_styles = ["Default (Slightly Cinematic)"]
--- a/modules/virtual_memory.py
+++ b/modules/virtual_memory.py
@ -1,185 +0,0 @@
 import torch
 import time
 import gc
 from safetensors import safe_open
 from comfy import model_management
 from comfy.diffusers_convert import textenc_conversion_lst
 ALWAYS_USE_VM = None
 if isinstance(ALWAYS_USE_VM, bool):
    print(f'[Virtual Memory System] Forced = {ALWAYS_USE_VM}')
 if 'cpu' in model_management.unet_offload_device().type.lower():
    logic_memory = model_management.total_ram
    global_virtual_memory_activated = ALWAYS_USE_VM if isinstance(ALWAYS_USE_VM, bool) else logic_memory < 30000
    print(f'[Virtual Memory System] Logic target is CPU, memory = {logic_memory}')
 else:
    logic_memory = model_management.total_vram
    global_virtual_memory_activated = ALWAYS_USE_VM if isinstance(ALWAYS_USE_VM, bool) else logic_memory < 22000
    print(f'[Virtual Memory System] Logic target is GPU, memory = {logic_memory}')
 print(f'[Virtual Memory System] Activated = {global_virtual_memory_activated}')
@torch.no_grad()
 def recursive_set(obj, key, value):
    if obj is None:
        return
    if '.' in key:
        k1, k2 = key.split('.', 1)
        recursive_set(getattr(obj, k1, None), k2, value)
    else:
        setattr(obj, key, value)
@torch.no_grad()
 def recursive_del(obj, key):
    if obj is None:
        return
    if '.' in key:
        k1, k2 = key.split('.', 1)
        recursive_del(getattr(obj, k1, None), k2)
    else:
        delattr(obj, key)
@torch.no_grad()
 def force_load_state_dict(model, state_dict):
    for k in list(state_dict.keys()):
        p = torch.nn.Parameter(state_dict[k], requires_grad=False)
        recursive_set(model, k, p)
        del state_dict[k]
    return
@torch.no_grad()
 def only_load_safetensors_keys(filename):
    try:
        with safe_open(filename, framework="pt", device='cpu') as f:
            result = list(f.keys())
        assert len(result) > 0
        return result
    except:
        return None
@torch.no_grad()
 def move_to_virtual_memory(model, comfy_unload=True):
    timer = time.time()
    if comfy_unload:
        model_management.unload_model()
    virtual_memory_dict = getattr(model, 'virtual_memory_dict', None)
    if isinstance(virtual_memory_dict, dict):
        # Already in virtual memory.
        return
    model_file = getattr(model, 'model_file', None)
    assert isinstance(model_file, dict)
    filename = model_file['filename']
    prefix = model_file['prefix']
    if hasattr(model, 'virtual_memory_safetensors_keys'):
        safetensors_keys = model.virtual_memory_safetensors_keys
    else:
        safetensors_keys = only_load_safetensors_keys(filename)
        model.virtual_memory_safetensors_keys = safetensors_keys
    if safetensors_keys is None:
        print(f'[Virtual Memory System] Error: The Virtual Memory System currently only support safetensors models!')
        return
    sd = model.state_dict()
    original_device = list(sd.values())[0].device.type
    model_file['original_device'] = original_device
    virtual_memory_dict = {}
    for k, v in sd.items():
        current_key = k
        current_flag = None
        if prefix == 'refiner_clip':
            current_key_in_safetensors = k
            for a, b in textenc_conversion_lst:
                current_key_in_safetensors = current_key_in_safetensors.replace(b, a)
            current_key_in_safetensors = current_key_in_safetensors.replace('clip_g.transformer.text_model.encoder.layers.', 'conditioner.embedders.0.model.transformer.resblocks.')
            current_key_in_safetensors = current_key_in_safetensors.replace('clip_g.text_projection', 'conditioner.embedders.0.model.text_projection')
            current_key_in_safetensors = current_key_in_safetensors.replace('clip_g.logit_scale', 'conditioner.embedders.0.model.logit_scale')
            current_key_in_safetensors = current_key_in_safetensors.replace('clip_g.', 'conditioner.embedders.0.model.')
            for e in ["weight", "bias"]:
                for i, k in enumerate(['q', 'k', 'v']):
                    e_flag = f'.{k}_proj.{e}'
                    if current_key_in_safetensors.endswith(e_flag):
                        current_key_in_safetensors = current_key_in_safetensors[:-len(e_flag)] + f'.in_proj_{e}'
                        current_flag = (1280 * i, 1280 * (i + 1))
        else:
            current_key_in_safetensors = prefix + '.' + k
        current_device = torch.device(index=v.device.index, type=v.device.type)
        if current_key_in_safetensors in safetensors_keys:
            virtual_memory_dict[current_key] = (current_key_in_safetensors, current_device, current_flag)
            recursive_del(model, current_key)
        else:
            # print(f'[Virtual Memory System] Missed key: {current_key}')
            pass
    del sd
    gc.collect()
    model_management.soft_empty_cache()
    model.virtual_memory_dict = virtual_memory_dict
    print(f'[Virtual Memory System] time = {str("%.5f" % (time.time() - timer))}s: {prefix} released from {original_device}: {filename}')
    return
@torch.no_grad()
 def load_from_virtual_memory(model):
    timer = time.time()
    virtual_memory_dict = getattr(model, 'virtual_memory_dict', None)
    if not isinstance(virtual_memory_dict, dict):
        # Not in virtual memory.
        return
    model_file = getattr(model, 'model_file', None)
    assert isinstance(model_file, dict)
    filename = model_file['filename']
    prefix = model_file['prefix']
    original_device = model_file['original_device']
    with safe_open(filename, framework="pt", device=original_device) as f:
        for current_key, (current_key_in_safetensors, current_device, current_flag) in virtual_memory_dict.items():
            tensor = f.get_tensor(current_key_in_safetensors).to(current_device)
            if isinstance(current_flag, tuple) and len(current_flag) == 2:
                a, b = current_flag
                tensor = tensor[a:b]
            parameter = torch.nn.Parameter(tensor, requires_grad=False)
            recursive_set(model, current_key, parameter)
    print(f'[Virtual Memory System] time = {str("%.5f" % (time.time() - timer))}s: {prefix} loaded to {original_device}: {filename}')
    del model.virtual_memory_dict
    return
@torch.no_grad()
 def try_move_to_virtual_memory(model, comfy_unload=True):
    if not global_virtual_memory_activated:
        return
    import modules.default_pipeline as pipeline
    if pipeline.xl_refiner is None:
        # If users do not use refiner, no need to use this.
        return
    move_to_virtual_memory(model, comfy_unload)
--- a/readme.md
+++ b/readme.md
@ -67,7 +67,9 @@ Please open an issue if you use similar devices but still cannot achieve accepta
 | Colab | Info
 | --- | --- |
-[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/lllyasviel/Fooocus/blob/main/colab.ipynb) | Fooocus Colab (Official Version)
+[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/lllyasviel/Fooocus/blob/colab/colab.ipynb) | Fooocus Colab Version
 Note that this link is optimized for Google Colab - the codes may be different from offline Fooocus for better Colab experience.
 Thanks to [camenduru](https://github.com/camenduru)!
@ -129,7 +131,7 @@ Or if you want to open a remote port, use
 ### Linux (AMD GPUs)
-Installation is the same as Linux part. It has been tested for 6700XT. Works for both Pytorch 1.13 and Pytorch 2. 
+Coming soon ...
 ### Mac/Windows(AMD GPUs)
@ -153,6 +155,11 @@ Below things are already inside the software, and **users do not need to do anyt
 11. A carefully designed system for balancing multiple styles as well as prompt expansion.
 12. Using automatic1111's method to normalize prompt emphasizing. This significantly improve results when users directly copy prompts from civitai.
 13. The joint swap system of refiner now also support img2img and upscale in a seamless way.
 14. CFG Scale and TSNR correction (tuned for SDXL) when CFG is bigger than 10.
 ## Changing Model Path
 After the first time you run Fooocus, a config file will be generated at `Fooocus\user_path_config.txt`. This file can be edited for changing the model path.
 ## Advanced Features
--- a/update_log.md
+++ b/update_log.md
@ -1,3 +1,13 @@
 # 2.0.80
 * Rework many patches and some UI details.
 * Speed up processing.
 * Move Colab to independent branch.
 * Implemented CFG Scale and TSNR correction when CFG is bigger than 10.
 * Implemented Developer Mode with more options to debug.
 ### 2.0.72
 (2023 sep 21) The feature updating of Fooocus will be paused for about two or three weeks because we have some events and travelling - we will come back in early or mid October. 
 ### 2.0.72
--- a/webui.py
+++ b/webui.py
@ -137,7 +137,7 @@ with shared.gradio_root:
                                                    choices=[fooocus_expansion] + style_keys,
                                                    value=[fooocus_expansion] + default_styles,
                                                    label='Image Style')
-            with gr.Tab(label='Advanced'):
+            with gr.Tab(label='Model'):
                with gr.Row():
                    base_model = gr.Dropdown(label='SDXL Base Model', choices=modules.path.model_filenames, value=modules.path.default_base_model_name, show_label=True)
                    refiner_model = gr.Dropdown(label='SDXL Refiner', choices=['None'] + modules.path.model_filenames, value=modules.path.default_refiner_model_name, show_label=True)
@ -150,9 +150,30 @@ with shared.gradio_root:
                            lora_ctrls += [lora_model, lora_weight]
                with gr.Row():
                    model_refresh = gr.Button(label='Refresh', value='\U0001f504 Refresh All Files', variant='secondary', elem_classes='refresh_button')
-                with gr.Accordion(label='Advanced', open=False):
+            with gr.Tab(label='Advanced'):
-                    sharpness = gr.Slider(label='Sampling Sharpness', minimum=0.0, maximum=30.0, step=0.01, value=2.0)
+                sharpness = gr.Slider(label='Sampling Sharpness', minimum=0.0, maximum=30.0, step=0.001, value=2.0,
-                    gr.HTML('<a href="https://github.com/lllyasviel/Fooocus/discussions/117">\U0001F4D4 Document</a>')
+                                      info='Higher value means image and texture are sharper.')
                guidance_scale = gr.Slider(label='Guidance Scale', minimum=1.0, maximum=30.0, step=0.01, value=7.0,
                                      info='Higher value means style is cleaner, vivider, and more artistic.')
                gr.HTML('<a href="https://github.com/lllyasviel/Fooocus/discussions/117">\U0001F4D4 Document</a>')
                dev_mode = gr.Checkbox(label='Developer Debug Mode', value=False, container=False)
                with gr.Column(visible=False) as dev_tools:
                    with gr.Tab(label='Developer Control and Debug Tools'):
                        adm_scaler_positive = gr.Slider(label='Positive ADM Guidance Scaler', minimum=0.1, maximum=3.0,
                                                        step=0.001, value=1.5, info='The scaler multiplied to positive ADM (use 1.0 to disable). ')
                        adm_scaler_negative = gr.Slider(label='Negative ADM Guidance Scaler', minimum=0.1, maximum=3.0,
                                                        step=0.001, value=0.8, info='The scaler multiplied to negative ADM (use 1.0 to disable). ')
                        adaptive_cfg = gr.Slider(label='CFG Rescale from TSNR', minimum=0.0, maximum=1.0,
                                                 step=0.001, value=0.3, info='Enabling Fooocus\'s implementation of CFG re-weighting for TSNR (use 0 to disable, more effective when CFG > 7).')
                        sampler_name = gr.Dropdown(label='Sampler', choices=flags.sampler_list, value=flags.default_sampler, info='Only effective in non-inpaint mode.')
                def dev_mode_checked(r):
                    return gr.update(visible=r)
                dev_mode.change(dev_mode_checked, inputs=[dev_mode], outputs=[dev_tools], queue=False)
                def model_refresh_clicked():
                    modules.path.update_all_model_names()
@ -167,7 +188,7 @@ with shared.gradio_root:
        advanced_checkbox.change(lambda x: gr.update(visible=x), advanced_checkbox, right_col, queue=False)
        ctrls = [
            prompt, negative_prompt, style_selections,
-            performance_selction, aspect_ratios_selction, image_number, image_seed, sharpness
+            performance_selction, aspect_ratios_selction, image_number, image_seed, sharpness, adm_scaler_positive, adm_scaler_negative, guidance_scale, adaptive_cfg, sampler_name
        ]
        ctrls += [base_model, refiner_model] + lora_ctrls
        ctrls += [input_image_checkbox, current_tab]