ernie-image comfyui 怎么用?一篇讲清安装部署、模型下载和工作流配置

4月 20, 2026

ernie-image comfyui 怎么用?一篇讲清安装部署、模型下载和工作流配置

ComfyUI 第一时间支持了 ERNIE-Image 模型

这件事真正有意思的地方,不只是多了一个可用模型,而是 ERNIE-Image 终于可以更顺畅地进入 ComfyUI 工作流:从安装、权重加载,到参数调试、模板复用,再到正式出图,整条链路都更清晰了。

如果你想解决的是这些问题:

  • ERNIE-Image 在 ComfyUI 里怎么安装
  • 模型权重应该放到哪里
  • 工作流如何直接跑起来
  • Base 和 Turbo 应该怎么选
  • 哪些参数更适合实际出图

那这篇文章就从头讲清楚。

ERNIE-Image showcase


先说结论:ERNIE-Image 适合什么场景?

如果你只是想随便生成一张氛围图,其实很多模型都能做。

但 ERNIE-Image 更有辨识度的地方,在于它更适合这些“不能只靠运气出图”的任务:

  • 带文字的海报
  • 信息图和说明图
  • 多面板布局
  • 电商视觉图
  • 产品宣传图
  • 结构化内容图

换句话说,它更强调的是:

  • 文字渲染
  • 复杂指令跟随
  • 结构化图像生成
  • Prompt Enhancer 带来的提示词扩写能力

这也是它放进 ComfyUI 之后特别值得看的原因:
模型本身有可控性,ComfyUI 又把这种可控性进一步变成了可复用工作流。


ERNIE-Image 是什么?

ERNIE-Image 是百度开源的文生图模型,采用 8B 参数 DiT 架构

它的优势并不只是“画面好看”,而是在一些更难的任务上也更稳,比如:

  • 文字排版
  • 中英文字混合内容
  • 多元素关系表达
  • 海报与信息图结构
  • 长提示词理解

目前常见的两个版本是:

1. ERNIE-Image Base

偏质量路线,更适合正式出图。

常见建议:

  • Steps:50
  • CFG:4.0

2. ERNIE-Image-Turbo

偏速度路线,更适合快速试图和批量探索。

常见建议:

  • Steps:8
  • CFG:1.0

如果你刚开始接触 ernie-image comfyui,一个更高效的方式是:

  • 先用 Turbo 找方向
  • 再用 Base 出正式图

这样比一开始就拿 Base 慢慢试,会更省时间。


第一步:安装或更新 ComfyUI

如果你还没装 ComfyUI,可以直接安装最新版。

如果你已经在用 ComfyUI,建议先更新到较新的版本,再继续配置 ERNIE-Image。原因很简单:模板、节点兼容性和模型支持都更稳。

常见安装方式如下:

git clone https://github.com/Comfy-Org/ComfyUI.git
cd ComfyUI
pip install -r requirements.txt
pip install comfyui-workflow-templates==0.9.56

如果你走的是桌面客户端路线,也可以直接安装新版客户端,然后再导入工作流模板。

这一阶段的重点不是“把 ComfyUI 打开”,而是确保它已经能正常识别 ERNIE-Image 的模板和模型加载逻辑。

ERNIE-Image model download


第二步:下载 ernie-image comfyui 所需模型文件

要让 ernie-image comfyui 顺利跑起来,至少要准备四类核心文件。

1. Diffusion Model

常见文件包括:

  • ernie-image.safetensors
  • ernie-image-turbo.safetensors

放到:

ComfyUI/models/diffusion_models/

2. Text Encoder

常见文件包括:

  • ministral-3-3b.safetensors

放到:

ComfyUI/models/text_encoders/

3. Prompt Enhancer

常见文件包括:

  • ernie-image-prompt-enhancer.safetensors

放到:

ComfyUI/models/text_encoders/

4. VAE

常见文件包括:

  • flux2-vae.safetensors

放到:

ComfyUI/models/vae/

这一步最容易踩坑的地方是:
很多人只下载主模型,但忽略了 Text Encoder、Prompt Enhancer 和 VAE。

结果就是工作流能导入,但节点加载不完整,最终无法正常出图。

VAE download

Text encoder download


第三步:导入 ERNIE-Image 工作流模板

如果你已经安装了 workflow templates,那么在 ComfyUI 里通常可以直接看到:

  • Ernie Image:文生图
  • Ernie Image Turbo:文生图

这条路径特别适合新手。

因为它省掉了最容易反复出错的那部分工作:

  • 节点怎么连接
  • 加载顺序怎么配
  • 哪些模块必须带上
  • Prompt Enhancer 放在哪一层

换句话说,如果你的目标是尽快跑通 ernie-image comfyui,那最稳的办法就是先用官方模板,而不是从零开始手搓整条工作流。


第四步:检查节点是否加载正常

模板导入之后,不要急着直接出图。

先确认这几项有没有正常识别:

  • Diffusion Model 是否识别到 ERNIE-Image / ERNIE-Image-Turbo
  • Text Encoder 是否识别到 ministral-3-3b.safetensors
  • Prompt Enhancer 是否识别到对应权重
  • VAE 是否正常加载

如果这些模块都已经能正常显示,说明你的基础环境已经打通。

这一步虽然简单,但非常重要。因为不少人真正的问题,不在提示词,而是在模型组件压根没有完整加载。


ernie-image comfyui 参数怎么配?

很多人把别的模型的参数习惯直接套到 ERNIE-Image 上,结果发现画面不稳定,或者速度、质量都不理想。

这类任务的难点不是参数多,而是参数逻辑不能乱用

Base 和 Turbo 的建议参数

ERNIE-Image Base

  • Steps:50
  • CFG:4.0

适合:

  • 正式图
  • 更复杂的结构画面
  • 对质量要求更高的内容

ERNIE-Image-Turbo

  • Steps:8
  • CFG:1.0

适合:

  • 快速试图
  • 批量探索
  • 高效率预览

Sampler 和 Scheduler

常见建议:

  • Sampler:euler
  • Scheduler:sgm_uniform 或默认 simple

推荐分辨率

常见适配更稳定的尺寸包括:

  • 1024x1024
  • 848x1264
  • 1264x848
  • 768x1376
  • 896x1200
  • 1376x768
  • 1200x896

第一次跑模型时,不建议一上来就冲高分辨率。

更实用的策略是:
先把流程跑顺,再提高规格。

Prompt Enhancer 要不要开?

建议:大多数情况下保持开启。

常见建议参数:

  • max_length1536~2048
  • temperature0.6
  • top_p0.8
  • thinking mode:关闭

Prompt Enhancer 的价值在于,它能把简短提示词进一步扩展成更完整、更结构化的描述。

对不想手写超长提示词、但又想让画面更稳的人来说,这个功能非常有帮助。

ERNIE-Image Base vs Turbo


ERNIE-Image 在 ComfyUI 里适合做什么?

真正决定一个模型值不值得学的,不只是能不能跑起来,而是它能不能解决你手里的任务。

从现有公开案例来看,ERNIE-Image 比较值得重点看的有五类场景。


场景一:带文字的海报和排版图

这是 ERNIE-Image 很有辨识度的一项能力。

很多模型在做海报时最大的问题是:

  • 文字容易乱
  • 标题层级不稳
  • 中英混排容易崩
  • 版式结构不听话

而 ERNIE-Image 更擅长处理的是“图像 + 文字 + 排版”的整体关系。

Prompt 示例

设计一张夏日饮品促销海报,主体为透明玻璃瓶装果饮,画面包含清晰主标题、副标题、价格标签、按钮区,整体风格明亮有商业广告感,版式清晰,适合品牌营销宣传

Text layout example

值得看的地方在于,它不是只把图画出来,而是更接近完整商业视觉稿的表达方式。


场景二:信息卡片与带字设计图

除了大海报,ERNIE-Image 在信息卡片这类内容上的完成度也很高。

Prompt 示例

制作一张日式复古风语言学习卡片,包含清晰主体插画、日文、罗马音、英文释义和例句,整体排版统一,文字清晰,卡片风格完整

Language flashcard example

这类内容特别适合:

  • 知识卡片
  • 教育图文
  • 品牌社媒图
  • 多语言内容图

真正有意思的是,这类图对模型的要求并不低,因为它需要同时兼顾图像风格、信息层级和文字可读性。


场景三:结构化信息图

信息图看起来不像海报那么炫,但对模型的要求往往更高。

因为它不仅要会画,还要理解:

  • 顺序
  • 分区
  • 层级
  • 逻辑关系

Prompt 示例

制作一张教育信息图,主题为咖啡制作流程,采用六步流程布局,上下双排结构,使用箭头连接各步骤,标题清晰,图文关系明确,整体具有插画和信息设计风格

Infographic example

这也是 ERNIE-Image 更有辨识度的一点:
它不仅适合“生成一张图”,还更适合“生成一张有组织的信息图”。


场景四:多面板与结构化构图

多面板内容,本来就是很多文生图模型比较容易失控的地方。

但 ERNIE-Image 在这类结构化构图上有明显优势。

Multi-panel example

如果你的实际需求包括:

  • 漫画分镜
  • 多区域海报
  • 模块化视觉稿
  • 分区信息图

ernie-image comfyui 的价值会比普通单图模型更明显。


场景五:风格化和电影感画面

ERNIE-Image 也并不只是擅长“带文字的图”。

在风格化视觉、电影感氛围和设计感画面上,它同样有不错的发挥空间。

Cinematic example

Style example

Design example

所以更准确地说,ERNIE-Image 不是一个只擅长某种固定风格的模型,而是一个更偏综合型的图像生产力模型。


GGUF 版本适合什么情况?

如果你的设备显存比较紧张,也可以关注 GGUF 路线。

常见思路是:

  • GGUF 扩散模型放到 ComfyUI/models/unet/
  • 使用 Unet Loader (GGUF)
  • 文本编码器使用 CLIP Loader (GGUF)

不过这里有一点需要提前知道:

Prompt Enhancer 的 GGUF 体验,并不一定能完整复现标准版。

所以如果你是第一次接触 ernie-image comfyui,更建议先把标准版完整跑通。等你已经熟悉整个流程之后,再考虑用 GGUF 去降低资源占用。


如果你只是想先体验一下效果

有些人并不是一开始就想把整个 ComfyUI 工作流搭满,而是先想确认几件事:

  • ERNIE-Image 的文字能力到底怎么样
  • 海报和结构图是否足够稳
  • 中文提示词表现是否足够自然
  • 这个模型值不值得继续投入时间

如果你属于这类需求,其实可以先从更轻量的体验方式入手。

ernie-image.app 这种入口,更适合作为前期体验。先感受它的整体风格、结构能力和文字表现,再决定要不要继续深入本地 ComfyUI 工作流,通常效率会更高。

这里并不是替代 ComfyUI,而是两者适合的阶段不同:

  • 线上体验:适合快速感受模型能力
  • ComfyUI 工作流:适合正式生产和精细控制

最后总结

如果你需要的不是简单“出一张图”,而是:

  • 更好的文字渲染
  • 更稳的海报和排版
  • 更强的结构化画面能力
  • 更适合进入工作流的节点式控制
  • 更自然的Prompt 扩写能力

那么 ernie-image comfyui 确实值得花时间上手。

尤其是下面这些方向,最值得关注:

  • 文字渲染
  • 海报与排版
  • 信息图与结构化内容
  • Prompt Enhancer
  • Base / Turbo 双路线

如果你是第一次接触它,一个更稳的顺序是:

  1. 先装好 ComfyUI
  2. 把主模型、Text Encoder、Prompt Enhancer、VAE 放到正确目录
  3. 直接导入官方模板工作流
  4. 先用 Turbo 跑通
  5. 再切 Base 做正式图
  6. 最后根据自己的任务去微调参数和工作流

这条路径最稳,也最适合大多数人。

Z-Image Team

ernie-image comfyui 怎么用?一篇讲清安装部署、模型下载和工作流配置 | Blog