ernie-image comfyui 怎么用?一篇讲清安装部署、模型下载和工作流配置
ComfyUI 第一时间支持了 ERNIE-Image 模型。
这件事真正有意思的地方,不只是多了一个可用模型,而是 ERNIE-Image 终于可以更顺畅地进入 ComfyUI 工作流:从安装、权重加载,到参数调试、模板复用,再到正式出图,整条链路都更清晰了。
如果你想解决的是这些问题:
- ERNIE-Image 在 ComfyUI 里怎么安装
- 模型权重应该放到哪里
- 工作流如何直接跑起来
- Base 和 Turbo 应该怎么选
- 哪些参数更适合实际出图
那这篇文章就从头讲清楚。

先说结论:ERNIE-Image 适合什么场景?
如果你只是想随便生成一张氛围图,其实很多模型都能做。
但 ERNIE-Image 更有辨识度的地方,在于它更适合这些“不能只靠运气出图”的任务:
- 带文字的海报
- 信息图和说明图
- 多面板布局
- 电商视觉图
- 产品宣传图
- 结构化内容图
换句话说,它更强调的是:
- 文字渲染
- 复杂指令跟随
- 结构化图像生成
- Prompt Enhancer 带来的提示词扩写能力
这也是它放进 ComfyUI 之后特别值得看的原因:
模型本身有可控性,ComfyUI 又把这种可控性进一步变成了可复用工作流。
ERNIE-Image 是什么?
ERNIE-Image 是百度开源的文生图模型,采用 8B 参数 DiT 架构。
它的优势并不只是“画面好看”,而是在一些更难的任务上也更稳,比如:
- 文字排版
- 中英文字混合内容
- 多元素关系表达
- 海报与信息图结构
- 长提示词理解
目前常见的两个版本是:
1. ERNIE-Image Base
偏质量路线,更适合正式出图。
常见建议:
- Steps:50
- CFG:4.0
2. ERNIE-Image-Turbo
偏速度路线,更适合快速试图和批量探索。
常见建议:
- Steps:8
- CFG:1.0
如果你刚开始接触 ernie-image comfyui,一个更高效的方式是:
- 先用 Turbo 找方向
- 再用 Base 出正式图
这样比一开始就拿 Base 慢慢试,会更省时间。
第一步:安装或更新 ComfyUI
如果你还没装 ComfyUI,可以直接安装最新版。
如果你已经在用 ComfyUI,建议先更新到较新的版本,再继续配置 ERNIE-Image。原因很简单:模板、节点兼容性和模型支持都更稳。
常见安装方式如下:
git clone https://github.com/Comfy-Org/ComfyUI.git
cd ComfyUI
pip install -r requirements.txt
pip install comfyui-workflow-templates==0.9.56
如果你走的是桌面客户端路线,也可以直接安装新版客户端,然后再导入工作流模板。
这一阶段的重点不是“把 ComfyUI 打开”,而是确保它已经能正常识别 ERNIE-Image 的模板和模型加载逻辑。

第二步:下载 ernie-image comfyui 所需模型文件
要让 ernie-image comfyui 顺利跑起来,至少要准备四类核心文件。
1. Diffusion Model
常见文件包括:
ernie-image.safetensorsernie-image-turbo.safetensors
放到:
ComfyUI/models/diffusion_models/
2. Text Encoder
常见文件包括:
ministral-3-3b.safetensors
放到:
ComfyUI/models/text_encoders/
3. Prompt Enhancer
常见文件包括:
ernie-image-prompt-enhancer.safetensors
放到:
ComfyUI/models/text_encoders/
4. VAE
常见文件包括:
flux2-vae.safetensors
放到:
ComfyUI/models/vae/
这一步最容易踩坑的地方是:
很多人只下载主模型,但忽略了 Text Encoder、Prompt Enhancer 和 VAE。
结果就是工作流能导入,但节点加载不完整,最终无法正常出图。


第三步:导入 ERNIE-Image 工作流模板
如果你已经安装了 workflow templates,那么在 ComfyUI 里通常可以直接看到:
- Ernie Image:文生图
- Ernie Image Turbo:文生图
这条路径特别适合新手。
因为它省掉了最容易反复出错的那部分工作:
- 节点怎么连接
- 加载顺序怎么配
- 哪些模块必须带上
- Prompt Enhancer 放在哪一层
换句话说,如果你的目标是尽快跑通 ernie-image comfyui,那最稳的办法就是先用官方模板,而不是从零开始手搓整条工作流。
第四步:检查节点是否加载正常
模板导入之后,不要急着直接出图。
先确认这几项有没有正常识别:
- Diffusion Model 是否识别到 ERNIE-Image / ERNIE-Image-Turbo
- Text Encoder 是否识别到
ministral-3-3b.safetensors - Prompt Enhancer 是否识别到对应权重
- VAE 是否正常加载
如果这些模块都已经能正常显示,说明你的基础环境已经打通。
这一步虽然简单,但非常重要。因为不少人真正的问题,不在提示词,而是在模型组件压根没有完整加载。
ernie-image comfyui 参数怎么配?
很多人把别的模型的参数习惯直接套到 ERNIE-Image 上,结果发现画面不稳定,或者速度、质量都不理想。
这类任务的难点不是参数多,而是参数逻辑不能乱用。
Base 和 Turbo 的建议参数
ERNIE-Image Base
- Steps:50
- CFG:4.0
适合:
- 正式图
- 更复杂的结构画面
- 对质量要求更高的内容
ERNIE-Image-Turbo
- Steps:8
- CFG:1.0
适合:
- 快速试图
- 批量探索
- 高效率预览
Sampler 和 Scheduler
常见建议:
- Sampler:euler
- Scheduler:sgm_uniform 或默认 simple
推荐分辨率
常见适配更稳定的尺寸包括:
1024x1024848x12641264x848768x1376896x12001376x7681200x896
第一次跑模型时,不建议一上来就冲高分辨率。
更实用的策略是:
先把流程跑顺,再提高规格。
Prompt Enhancer 要不要开?
建议:大多数情况下保持开启。
常见建议参数:
max_length:1536~2048temperature:0.6top_p:0.8- thinking mode:关闭
Prompt Enhancer 的价值在于,它能把简短提示词进一步扩展成更完整、更结构化的描述。
对不想手写超长提示词、但又想让画面更稳的人来说,这个功能非常有帮助。

ERNIE-Image 在 ComfyUI 里适合做什么?
真正决定一个模型值不值得学的,不只是能不能跑起来,而是它能不能解决你手里的任务。
从现有公开案例来看,ERNIE-Image 比较值得重点看的有五类场景。
场景一:带文字的海报和排版图
这是 ERNIE-Image 很有辨识度的一项能力。
很多模型在做海报时最大的问题是:
- 文字容易乱
- 标题层级不稳
- 中英混排容易崩
- 版式结构不听话
而 ERNIE-Image 更擅长处理的是“图像 + 文字 + 排版”的整体关系。
Prompt 示例
设计一张夏日饮品促销海报,主体为透明玻璃瓶装果饮,画面包含清晰主标题、副标题、价格标签、按钮区,整体风格明亮有商业广告感,版式清晰,适合品牌营销宣传

值得看的地方在于,它不是只把图画出来,而是更接近完整商业视觉稿的表达方式。
场景二:信息卡片与带字设计图
除了大海报,ERNIE-Image 在信息卡片这类内容上的完成度也很高。
Prompt 示例
制作一张日式复古风语言学习卡片,包含清晰主体插画、日文、罗马音、英文释义和例句,整体排版统一,文字清晰,卡片风格完整

这类内容特别适合:
- 知识卡片
- 教育图文
- 品牌社媒图
- 多语言内容图
真正有意思的是,这类图对模型的要求并不低,因为它需要同时兼顾图像风格、信息层级和文字可读性。
场景三:结构化信息图
信息图看起来不像海报那么炫,但对模型的要求往往更高。
因为它不仅要会画,还要理解:
- 顺序
- 分区
- 层级
- 逻辑关系
Prompt 示例
制作一张教育信息图,主题为咖啡制作流程,采用六步流程布局,上下双排结构,使用箭头连接各步骤,标题清晰,图文关系明确,整体具有插画和信息设计风格

这也是 ERNIE-Image 更有辨识度的一点:
它不仅适合“生成一张图”,还更适合“生成一张有组织的信息图”。
场景四:多面板与结构化构图
多面板内容,本来就是很多文生图模型比较容易失控的地方。
但 ERNIE-Image 在这类结构化构图上有明显优势。

如果你的实际需求包括:
- 漫画分镜
- 多区域海报
- 模块化视觉稿
- 分区信息图
那 ernie-image comfyui 的价值会比普通单图模型更明显。
场景五:风格化和电影感画面
ERNIE-Image 也并不只是擅长“带文字的图”。
在风格化视觉、电影感氛围和设计感画面上,它同样有不错的发挥空间。



所以更准确地说,ERNIE-Image 不是一个只擅长某种固定风格的模型,而是一个更偏综合型的图像生产力模型。
GGUF 版本适合什么情况?
如果你的设备显存比较紧张,也可以关注 GGUF 路线。
常见思路是:
- GGUF 扩散模型放到
ComfyUI/models/unet/ - 使用 Unet Loader (GGUF)
- 文本编码器使用 CLIP Loader (GGUF)
不过这里有一点需要提前知道:
Prompt Enhancer 的 GGUF 体验,并不一定能完整复现标准版。
所以如果你是第一次接触 ernie-image comfyui,更建议先把标准版完整跑通。等你已经熟悉整个流程之后,再考虑用 GGUF 去降低资源占用。
如果你只是想先体验一下效果
有些人并不是一开始就想把整个 ComfyUI 工作流搭满,而是先想确认几件事:
- ERNIE-Image 的文字能力到底怎么样
- 海报和结构图是否足够稳
- 中文提示词表现是否足够自然
- 这个模型值不值得继续投入时间
如果你属于这类需求,其实可以先从更轻量的体验方式入手。
像 ernie-image.app 这种入口,更适合作为前期体验。先感受它的整体风格、结构能力和文字表现,再决定要不要继续深入本地 ComfyUI 工作流,通常效率会更高。
这里并不是替代 ComfyUI,而是两者适合的阶段不同:
- 线上体验:适合快速感受模型能力
- ComfyUI 工作流:适合正式生产和精细控制
最后总结
如果你需要的不是简单“出一张图”,而是:
- 更好的文字渲染
- 更稳的海报和排版
- 更强的结构化画面能力
- 更适合进入工作流的节点式控制
- 更自然的Prompt 扩写能力
那么 ernie-image comfyui 确实值得花时间上手。
尤其是下面这些方向,最值得关注:
- 文字渲染
- 海报与排版
- 信息图与结构化内容
- Prompt Enhancer
- Base / Turbo 双路线
如果你是第一次接触它,一个更稳的顺序是:
- 先装好 ComfyUI
- 把主模型、Text Encoder、Prompt Enhancer、VAE 放到正确目录
- 直接导入官方模板工作流
- 先用 Turbo 跑通
- 再切 Base 做正式图
- 最后根据自己的任务去微调参数和工作流
这条路径最稳,也最适合大多数人。