Z-Image Turbo Upscaler + Detailer ComfyUI 工作流完全指南
发布日期:2026-05-13
作者:Z-Image 技术团队
标签:Z-Image Turbo, ComfyUI, Upscaler, Detailer, 工作流, 图片放大
概述
Z-Image Turbo 以其 8 步快速生图能力著称,但原生输出分辨率通常限制在 1024×1024 以内。当我们需要更高分辨率、更细腻细节的图片时,Upscaler + Detailer 双阶段工作流就是最佳解决方案。
本指南将带你搭建完整的 ComfyUI 工作流,仅需 4 个模型文件,即可实现从标准输出到 4K 高清图片的完整放大与细节增强流程。
工作流架构
完整的 Upscaler + Detailer 工作流包含三个阶段:
第一阶段:基础生成(Text-to-Image)
使用 Z-Image Turbo 生成基础图片:
- 模型:
z_image_turbo.safetensors - 采样器:Euler
- 步数:8-12 步
- CFG:1.5-2.0
- 输出分辨率:1024×1024
第二阶段:超分辨率放大(Upscaler)
将基础图片放大 2-4 倍:
- 推荐放大模型:
4x-UltraSharp.pth— 通用放���,细节保留最佳4xFaceUpDAT.pth— 人脸特化,肤色还原准确RealESRGAN-x4plus.pth— 经典选择,速度快
- 放大倍数:2x(推荐)或 4x
- 输出分辨率:2048×2048 或 4096×4096
第三阶段:细节精修(Detailer)
使用 Z-Image Turbo 对放大后的图片进行细节增强:
- 模型:
z_image_turbo.safetensors(与生成阶段相同) - Denoise:0.15-0.35(低值保留结构,高值增加细节)
- 步数:8-12 步
- CFG:1.5-2.0
- 关键:提供详细的细节提示词
ComfyUI 节点配置
核心节点清单
1. CheckpointLoaderSimple — 加载 Z-Image Turbo 模型
2. CLIPTextEncode (Positive) — 正向提示词
3. CLIPTextEncode (Negative) — 负向提示词
4. EmptyLatentImage — 初始 latent(第一阶段)
5. KSampler — 基础生成采样
6. VAEDecode — 解码为像素
7. ImageUpscaleWithModel — 超分辨率放大
8. UpscaleModelLoader — 加载放大模型
9. VAEEncode — 重新编码为 latent(Detailer 阶段)
10. KSampler — 细节精修采样
11. VAEDecode — 最终解码
12. SaveImage — 输出
节点连接流程
CheckpointLoaderSimple → CLIPTextEncode(+/-)
↓
KSampler(Stage 1)
↓
VAEDecode
↓
+-------+-------+
| |
SaveImage(原图) ImageUpscaleWithModel
↓
VAEEncode
↓
KSampler(Stage 2)
↓
VAEDecode
↓
SaveImage(最终)
详细参数调优
放大阶段参数
| 参数 | 推荐值 | 说明 |
|---|---|---|
| 放大模型 | 4x-UltraSharp | 通用场景最佳 |
| 人脸特化场景 | 4xFaceUpDAT | 人像优先 |
| 放大倍数 | 2x | 平衡质量与速度 |
| Tile 模式 | 关闭 | Z-Image Turbo 原生支持大图 |
Detailer 阶段参数
| 参数 | 推荐值 | 说明 |
|---|---|---|
| Denoise | 0.25 | 黄金值,平衡结构与细节 |
| 步数 | 8-12 | Z-Image Turbo 最优范围 |
| CFG | 1.8 | 中等引导强度 |
| 细节提示词 | 见下文 | 增强特定区域 |
细节精修提示词模板
人像精修:
extreme detail, sharp eyes, skin texture, realistic pores, fine hair strands,
professional photography, 8K UHD, highly detailed
产品精修:
product photography, sharp focus, studio lighting, clean background,
high resolution, professional product shot, reflective surfaces,
fine texture details
风景精修:
landscape photography, ultra detailed, atmospheric perspective,
sharp focus, professional camera, 8K, HDR, fine detail
实用工作流模板
模板一:快速人像精修
阶段 1:生成
- 分辨率:1024×1024
- 步数:8
- CFG:1.5
放大:
- 模型:4xFaceUpDAT
- 倍数:2x
阶段 2:精修
- Denoise:0.20
- 步数:10
- 提示词:extreme facial detail, sharp eyes, skin texture, professional portrait
模板二:产品摄影级放大
阶段 1:生成
- 分辨率:1024×1024
- 步数:10
- CFG:2.0
放大:
- 模型:4x-UltraSharp
- 倍数:4x
阶段 2:精修
- Denoise:0.30
- 步数:12
- 提示词:product photography, studio lighting, sharp focus, 8K
模板三:ControlNet 辅助精修
对于需要保持结构一致性的场景,在 Detailer 阶段加入 ControlNet Tile 节点:
放大后图片 → ControlNet Tile Preprocessor → ControlNet Tile Model
↓
KSampler(Stage 2)
优势:
- 防止 Detailer 阶段结构偏移
- 保持原始构图
- 适合建筑、产品等对精度要求高的场景
常见错误与解决方案
问题 1:放大后模糊
原因:放大模型不匹配或 Detailer denoise 值过低。
解决方案:
- 尝试
4x-UltraSharp替代RealESRGAN - 将 denoise 从 0.15 提高到 0.25
- 在细节提示词中明确添加
sharp, crisp, detailed
问题 2:Detailer 阶段过度修改
原因:denoise 值过高,模型"过度创作"。
解决方案:
- 降低 denoise 至 0.15-0.20
- 使用 ControlNet Tile 约束
- 保持正向提示词简洁
问题 3:显存不足
原因:4K 输出需要大量显存。
解决方案:
- 使用 GGUF Q4 量化模型
- 分 Tile 处理(tile size: 512, overlap: 64)
- 分两阶段放大:先 2x 再 2x,而非一次 4x
性能基准
| 配置 | 生成时间 | 放大时间 | 精修时间 | 总时间 | 显存需求 |
|---|---|---|---|---|---|
| RTX 3090, 2x 放大 | ~4s | ~3s | ~5s | ~12s | ~8GB |
| RTX 3090, 4x 放大 | ~4s | ~6s | ~8s | ~18s | ~12GB |
| M4 Mac, 2x 放大 | ~8s | ~6s | ~10s | ~24s | ~16GB |
进阶技巧
1. 多阶段渐进式放大
对于极致质量需求,采用三阶段工作流:
1024px → (2x) → 2048px → (精修) → 2048px → (2x) → 4096px → (精修) → 4096px
2. Face Detailer 专用节点
ComfyUI 社区提供了 Impact Pack 中的 FaceDetailer 节点,可自动检测面部并进行局部精修:
放大后图片 → FaceDetailer → 输出
参数:
- Detection threshold: 0.5
- Detailer denoise: 0.3
- Face mesh: 默认
3. 批量处理
使用 ComfyUI 的 Batch 节点配合文件夹输入,实现批量放大精修:
FolderInput → ImageUpscaleWithModel → VAEEncode → KSampler → VAEDecode → SaveImage
总结
Z-Image Turbo Upscaler + Detailer 工作流是提升图片质量和分辨率的利器:
- 仅需 4 个模型文件,配置简单
- 端到端全自动,从生成到输出无需手动干预
- 8K 输出,满足专业级需求
- 多场景适配,人像、产品、风景均有对应模板
掌握这个工作流后,你的 Z-Image Turbo 生成能力将提升到一个全新的高度。