ernie-image comfyui 怎么用？一篇讲清安装部署、模型下载和工作流配置

ComfyUI 第一时间支持了 ERNIE-Image 模型。

这件事真正有意思的地方，不只是多了一个可用模型，而是 ERNIE-Image 终于可以更顺畅地进入 ComfyUI 工作流：从安装、权重加载，到参数调试、模板复用，再到正式出图，整条链路都更清晰了。

如果你想解决的是这些问题：

ERNIE-Image 在 ComfyUI 里怎么安装
模型权重应该放到哪里
工作流如何直接跑起来
Base 和 Turbo 应该怎么选
哪些参数更适合实际出图

那这篇文章就从头讲清楚。

ERNIE-Image showcase

先说结论：ERNIE-Image 适合什么场景？

如果你只是想随便生成一张氛围图，其实很多模型都能做。

但 ERNIE-Image 更有辨识度的地方，在于它更适合这些“不能只靠运气出图”的任务：

带文字的海报
信息图和说明图
多面板布局
电商视觉图
产品宣传图
结构化内容图

换句话说，它更强调的是：

文字渲染
复杂指令跟随
结构化图像生成
Prompt Enhancer 带来的提示词扩写能力

这也是它放进 ComfyUI 之后特别值得看的原因：
模型本身有可控性，ComfyUI 又把这种可控性进一步变成了可复用工作流。

ERNIE-Image 是什么？

ERNIE-Image 是百度开源的文生图模型，采用 8B 参数 DiT 架构。

它的优势并不只是“画面好看”，而是在一些更难的任务上也更稳，比如：

文字排版
中英文字混合内容
多元素关系表达
海报与信息图结构
长提示词理解

目前常见的两个版本是：

1. ERNIE-Image Base

偏质量路线，更适合正式出图。

常见建议：

Steps：50
CFG：4.0

2. ERNIE-Image-Turbo

偏速度路线，更适合快速试图和批量探索。

常见建议：

Steps：8
CFG：1.0

如果你刚开始接触 ernie-image comfyui，一个更高效的方式是：

先用 Turbo 找方向
再用 Base 出正式图

这样比一开始就拿 Base 慢慢试，会更省时间。

第一步：安装或更新 ComfyUI

如果你还没装 ComfyUI，可以直接安装最新版。

如果你已经在用 ComfyUI，建议先更新到较新的版本，再继续配置 ERNIE-Image。原因很简单：模板、节点兼容性和模型支持都更稳。

常见安装方式如下：

git clone https://github.com/Comfy-Org/ComfyUI.git
cd ComfyUI
pip install -r requirements.txt
pip install comfyui-workflow-templates==0.9.56

如果你走的是桌面客户端路线，也可以直接安装新版客户端，然后再导入工作流模板。

这一阶段的重点不是“把 ComfyUI 打开”，而是确保它已经能正常识别 ERNIE-Image 的模板和模型加载逻辑。

ERNIE-Image model download

第二步：下载 ernie-image comfyui 所需模型文件

要让 ernie-image comfyui 顺利跑起来，至少要准备四类核心文件。

1. Diffusion Model

常见文件包括：

ernie-image.safetensors
ernie-image-turbo.safetensors

放到：

ComfyUI/models/diffusion_models/

2. Text Encoder

常见文件包括：

ministral-3-3b.safetensors

放到：

ComfyUI/models/text_encoders/

3. Prompt Enhancer

常见文件包括：

ernie-image-prompt-enhancer.safetensors

放到：

ComfyUI/models/text_encoders/

4. VAE

常见文件包括：

flux2-vae.safetensors

放到：

ComfyUI/models/vae/

这一步最容易踩坑的地方是：
很多人只下载主模型，但忽略了 Text Encoder、Prompt Enhancer 和 VAE。

结果就是工作流能导入，但节点加载不完整，最终无法正常出图。

VAE download

Text encoder download

第三步：导入 ERNIE-Image 工作流模板

如果你已经安装了 workflow templates，那么在 ComfyUI 里通常可以直接看到：

Ernie Image：文生图
Ernie Image Turbo：文生图

这条路径特别适合新手。

因为它省掉了最容易反复出错的那部分工作：

节点怎么连接
加载顺序怎么配
哪些模块必须带上
Prompt Enhancer 放在哪一层

换句话说，如果你的目标是尽快跑通 ernie-image comfyui，那最稳的办法就是先用官方模板，而不是从零开始手搓整条工作流。

第四步：检查节点是否加载正常

模板导入之后，不要急着直接出图。

先确认这几项有没有正常识别：

Diffusion Model 是否识别到 ERNIE-Image / ERNIE-Image-Turbo
Text Encoder 是否识别到 ministral-3-3b.safetensors
Prompt Enhancer 是否识别到对应权重
VAE 是否正常加载

如果这些模块都已经能正常显示，说明你的基础环境已经打通。

这一步虽然简单，但非常重要。因为不少人真正的问题，不在提示词，而是在模型组件压根没有完整加载。

ernie-image comfyui 参数怎么配？

很多人把别的模型的参数习惯直接套到 ERNIE-Image 上，结果发现画面不稳定，或者速度、质量都不理想。

这类任务的难点不是参数多，而是参数逻辑不能乱用。

Base 和 Turbo 的建议参数

ERNIE-Image Base

Steps：50
CFG：4.0

适合：

正式图
更复杂的结构画面
对质量要求更高的内容

ERNIE-Image-Turbo

Steps：8
CFG：1.0

适合：

快速试图
批量探索
高效率预览

Sampler 和 Scheduler

常见建议：

Sampler：euler
Scheduler：sgm_uniform 或默认 simple

Prompt Enhancer 要不要开？

建议：大多数情况下保持开启。

常见建议参数：

max_length：1536~2048
temperature：0.6
top_p：0.8
thinking mode：关闭

Prompt Enhancer 的价值在于，它能把简短提示词进一步扩展成更完整、更结构化的描述。

对不想手写超长提示词、但又想让画面更稳的人来说，这个功能非常有帮助。

ERNIE-Image Base vs Turbo

ERNIE-Image 在 ComfyUI 里适合做什么？

真正决定一个模型值不值得学的，不只是能不能跑起来，而是它能不能解决你手里的任务。

从现有公开案例来看，ERNIE-Image 比较值得重点看的有五类场景。

场景一：带文字的海报和排版图

这是 ERNIE-Image 很有辨识度的一项能力。

很多模型在做海报时最大的问题是：

文字容易乱
标题层级不稳
中英混排容易崩
版式结构不听话

而 ERNIE-Image 更擅长处理的是“图像 + 文字 + 排版”的整体关系。

Prompt 示例

设计一张夏日饮品促销海报，主体为透明玻璃瓶装果饮，画面包含清晰主标题、副标题、价格标签、按钮区，整体风格明亮有商业广告感，版式清晰，适合品牌营销宣传

Text layout example

值得看的地方在于，它不是只把图画出来，而是更接近完整商业视觉稿的表达方式。

场景二：信息卡片与带字设计图

除了大海报，ERNIE-Image 在信息卡片这类内容上的完成度也很高。

Prompt 示例

制作一张日式复古风语言学习卡片，包含清晰主体插画、日文、罗马音、英文释义和例句，整体排版统一，文字清晰，卡片风格完整

Language flashcard example

这类内容特别适合：

知识卡片
教育图文
品牌社媒图
多语言内容图

真正有意思的是，这类图对模型的要求并不低，因为它需要同时兼顾图像风格、信息层级和文字可读性。

场景三：结构化信息图

信息图看起来不像海报那么炫，但对模型的要求往往更高。

因为它不仅要会画，还要理解：

顺序
分区
层级
逻辑关系

Prompt 示例

制作一张教育信息图，主题为咖啡制作流程，采用六步流程布局，上下双排结构，使用箭头连接各步骤，标题清晰，图文关系明确，整体具有插画和信息设计风格

Infographic example

这也是 ERNIE-Image 更有辨识度的一点：
它不仅适合“生成一张图”，还更适合“生成一张有组织的信息图”。

场景四：多面板与结构化构图

多面板内容，本来就是很多文生图模型比较容易失控的地方。

但 ERNIE-Image 在这类结构化构图上有明显优势。

Multi-panel example

如果你的实际需求包括：

漫画分镜
多区域海报
模块化视觉稿
分区信息图

那 ernie-image comfyui 的价值会比普通单图模型更明显。

场景五：风格化和电影感画面

ERNIE-Image 也并不只是擅长“带文字的图”。

在风格化视觉、电影感氛围和设计感画面上，它同样有不错的发挥空间。

Cinematic example

Style example

Design example

所以更准确地说，ERNIE-Image 不是一个只擅长某种固定风格的模型，而是一个更偏综合型的图像生产力模型。

GGUF 版本适合什么情况？

如果你的设备显存比较紧张，也可以关注 GGUF 路线。

常见思路是：

GGUF 扩散模型放到 ComfyUI/models/unet/
使用 Unet Loader (GGUF)
文本编码器使用 CLIP Loader (GGUF)

不过这里有一点需要提前知道：

Prompt Enhancer 的 GGUF 体验，并不一定能完整复现标准版。

所以如果你是第一次接触 ernie-image comfyui，更建议先把标准版完整跑通。等你已经熟悉整个流程之后，再考虑用 GGUF 去降低资源占用。

如果你只是想先体验一下效果

有些人并不是一开始就想把整个 ComfyUI 工作流搭满，而是先想确认几件事：

ERNIE-Image 的文字能力到底怎么样
海报和结构图是否足够稳
中文提示词表现是否足够自然
这个模型值不值得继续投入时间

如果你属于这类需求，其实可以先从更轻量的体验方式入手。

像 ernie-image.app 这种入口，更适合作为前期体验。先感受它的整体风格、结构能力和文字表现，再决定要不要继续深入本地 ComfyUI 工作流，通常效率会更高。

这里并不是替代 ComfyUI，而是两者适合的阶段不同：

线上体验：适合快速感受模型能力
ComfyUI 工作流：适合正式生产和精细控制

最后总结

如果你需要的不是简单“出一张图”，而是：

更好的文字渲染
更稳的海报和排版
更强的结构化画面能力
更适合进入工作流的节点式控制
更自然的Prompt 扩写能力

那么 ernie-image comfyui 确实值得花时间上手。

尤其是下面这些方向，最值得关注：

文字渲染
海报与排版
信息图与结构化内容
Prompt Enhancer
Base / Turbo 双路线

如果你是第一次接触它，一个更稳的顺序是：

先装好 ComfyUI
把主模型、Text Encoder、Prompt Enhancer、VAE 放到正确目录
直接导入官方模板工作流
先用 Turbo 跑通
再切 Base 做正式图
最后根据自己的任务去微调参数和工作流

这条路径最稳，也最适合大多数人。

ernie-image comfyui 怎么用？一篇讲清安装部署、模型下载和工作流配置

Table of Contents

ernie-image comfyui 怎么用？一篇讲清安装部署、模型下载和工作流配置

先说结论：ERNIE-Image 适合什么场景？

ERNIE-Image 是什么？

1. ERNIE-Image Base

2. ERNIE-Image-Turbo

第一步：安装或更新 ComfyUI

第二步：下载 ernie-image comfyui 所需模型文件

1. Diffusion Model

2. Text Encoder

3. Prompt Enhancer

4. VAE

第三步：导入 ERNIE-Image 工作流模板

第四步：检查节点是否加载正常

ernie-image comfyui 参数怎么配？

Base 和 Turbo 的建议参数

ERNIE-Image Base

ERNIE-Image-Turbo

Sampler 和 Scheduler

推荐分辨率

Prompt Enhancer 要不要开？

ERNIE-Image 在 ComfyUI 里适合做什么？

场景一：带文字的海报和排版图

Prompt 示例

场景二：信息卡片与带字设计图

Prompt 示例

场景三：结构化信息图

Prompt 示例

场景四：多面板与结构化构图

场景五：风格化和电影感画面

GGUF 版本适合什么情况？

如果你只是想先体验一下效果

最后总结