第 1 步
编写或结构化提示词
用自然语言描述你想要的图片和文字,或者提交结构化 JSON,包含精确的边界框坐标和十六进制色值,实现像素级布局控制。
Ideogram 4 AI 图片生成器
93 亿参数开源文生图模型,专为设计场景打造——0.97 OCR 文字渲染精度、JSON 结构提示词支持、16 色 HEX 调色板、原生 2048px 输出、最高 6:1 宽幅比。文字渲染准确率居开源模型之首。
什么是 Ideogram 4
Ideogram 4 是 Ideogram AI 于 2026 年 6 月 3 日发布的首个开源权重文生图模型。93 亿参数,从零训练而非微调,专攻设计场景——精准排版、结构化布局、可控配色、可靠构图。
与把文字当附属品的通用图片生成器不同,Ideogram 4 在 X-Omni OCR 基准上达到 0.97 准确率,居所有开源模型之首;DesignArena 排名开源第一、全球第四;7Bench 布局控制 0.69 mIoU,超越所有闭源模型。NF4 量化版单张 RTX 4090(24GB)即可运行,API 调用从 $0.03/张起。
使用方法
三步从提示词到设计稿。
第 1 步
用自然语言描述你想要的图片和文字,或者提交结构化 JSON,包含精确的边界框坐标和十六进制色值,实现像素级布局控制。
第 2 步
从 256px 到 2048px 任意选择,宽高比最高支持 6:1。根据需求选择生成质量档位,模型单次输出完整图片,文字直接嵌入图中。
第 3 步
下载为透明 PNG、放大分辨率、扩展或重构画布、编辑指定区域。基于已有结果二次创作,无需从头开始。
核心功能
93 亿参数,在文本渲染和布局控制上超越 8 倍尺寸的模型——架构效率的胜利。
X-Omni OCR 基准 0.97 准确率,开源模型最高。专业盲测中,设计师对其排版的偏好率达 47.9%,超过 Gemini 3.1 Pro(30%)、FLUX.2(15.5%)和 Grok Imagine(15%)。海报、标签、UI 稿第一次生成即可使用。
体验 Ideogram 4提交带有边界框坐标的 JSON 对象,精确定位每个元素的位置;每张图片最多定义 16 个十六进制色值、每个元素 5 色。模型在生成前验证 JSON 结构——无效提示词直接拒绝。这不是碰运气式的布局描述,而是像素级控制。
体验 Ideogram 4从 256px 到 2048px 原生输出,以 16 为步进单位,宽高比最高 6:1。横幅、广告牌、社交媒体头图无需外置放大即可直接使用。1024px 输出软的问题不存在。
体验 Ideogram 4NF4 量化版单张 RTX 4090(24GB VRAM,CUDA)即可运行。FP8 版需要 32GB VRAM。推理代码 Apache 2.0 开源。支持 14+ 平台:Hugging Face、ComfyUI、Replicate、Leonardo AI、Krea AI 等。
体验 Ideogram 4原生 Alpha 通道支持——主体与背景自动分离,无需手动抠图。配合提示词编辑、二次创作、扩展和重构,从概念到生产素材在同一条工作流中完成。
体验 Ideogram 4API 三档定价:Turbo $0.03/张、Standard $0.06/张、Quality $0.09/张。订阅 $8/月起,所有档位含无限慢速生成。企业版支持自托管和微调。
体验 Ideogram 4进阶功能
对比展示每项能力带来的实际变化。


此前:用文字描述布局,结果靠运气。现在:提交 JSON,写入精确的边界框坐标和十六进制色值,模型按你的坐标放置每个元素。7Bench 布局基准 0.69 mIoU,超越所有闭源模型。
试试这个功能
此前:设计迭代被锁定在专有平台内。现在:在本地 24GB GPU 上运行 Ideogram 4、通过 API 集成、或在 ComfyUI 中使用——你的工作流、你的基础设施、你的数据。
试试这个功能使用场景
任何需要文字可读、布局精准、设计迭代快速的工作流。
把标题、副标题和视觉方向直接变成一张以排版为核心的海报,无需因为文字渲染错误而重新设计。
试试这个场景生成多个广告变体,每个都包含产品卖点、促销文案和平台适配构图,无需等待设计师手动放置每行文字。
试试这个场景用锁定十六进制色值的调色板探索 Logo 概念、品牌视觉和图形系统。Ideogram 4 尊重品牌色,通用模型只能「差不多」匹配。
试试这个场景生成嵌入价格标签和行动号召的产品图。透明 PNG 导出直接跳过手动去背景步骤。
试试这个场景把创意简报直接变成方形推文图、故事图和缩略图,文字清晰可读,无需单独排版层。
试试这个场景创建带产品名、配料表和品牌文案的包装概念图,无需手动合成即可呈现真实的打样效果。
试试这个场景用户评价
来自真实使用场景的反馈。
"作为品牌设计师,我用 Ideogram 4 一次生成带精确品牌色和可读字体的客户样稿。从概念到确认的时间缩短了大约一半。"
- Danny Williamson, 品牌设计师
"作为产品设计师,结构化的 JSON 提示词是 Ideogram 4 最打动我的功能。生成前定义好边界框和色值——这是布局控制,不是碰运气。它在用设计师的方式工作。"
- Brad Gray, 产品设计师
"作为电商创意负责人,我直接在 Ideogram 4 里生成带价格和标签的产品图。透明 PNG 导出省掉了抠图步骤,每张图都是直接的成本节省。"
- Jim Davis, 电商创意负责人
"作为 AI 算法工程师,Ideogram 4 真正让我印象深刻的是它用 93 亿参数做到了 8 倍尺寸模型都做不到的文字和布局效果。这说明架构是为任务设计的,而不是靠堆参数。"
- Tammy Wallace, AI 算法工程师
"作为 AI 艺术家,我在 32GB 的 ComfyUI 上运行 Ideogram 4 FP8 版。2048px 输出并且文字拼写正确——这是其他开源模型目前做不到的。"
- Irene Chambers, AI 艺术家
"作为教学设计师,我用 Ideogram 4 生成带标注和多语种说明的教育图表。文字直接渲染在图中,不需要单独叠加文本层。这大幅加快了教育素材的制作速度。"
- Andrea Williamson, 教学设计师
常见问题
Ideogram 4 是 Ideogram AI 于 2026 年 6 月 3 日发布的 93 亿参数开源权重文生图模型。它专为设计场景打造:0.97 OCR 文字渲染精度、支持结构化 JSON 提示词(含边界框坐标和十六进制色值)、原生 256px 到 2048px 输出、最高 6:1 宽高比。
完全免费体验,无需登录。写一段提示词或提交结构化 JSON,选择分辨率和宽高比,点击生成即可。模型单次输出完整图片(含嵌入文字),支持 PNG 和透明 PNG 格式下载。
可以。Ideogram 4 在 X-Omni 英文 OCR 基准上达到 0.97 准确率,开源模型最高。专业盲测中设计师对其排版偏好率达 47.9%,超过 Gemini 3.1 Pro(30%)和 FLUX.2(15.5%)。海报、标识、Logo、标签首次生成即可使用。
模型权重以非商业许可开源发布,推理代码为 Apache 2.0 协议。NF4 量化版单张 RTX 4090(24GB VRAM)可运行,FP8 版需 32GB VRAM。商业使用需要企业授权许可。
原生支持 256px 到 2048px,以 16 为步进单位,最高宽高比 6:1。从社交媒体正方形贴文到宽幅广告牌都不需要外置放大。
API 定价:Turbo $0.03/张、Standard $0.06/张、Quality $0.09/张。订阅 $8/月起(400 张优先生成),所有档位含无限慢速生成。企业版支持自托管服务器和模型微调。
不用自然语言描述,而是提交一个 JSON 对象,包含每个元素的边界框坐标(归一化 0–1000)、最多 16 个十六进制色值和文字内容。模型在生成前会验证 JSON 结构——无效提示词直接拒绝。这是像素级布局控制,而不是文字近似描述。
支持 14+ 平台:Hugging Face、ComfyUI、Replicate、Leonardo AI、Krea AI、Picsart、Cloudflare、fal、Runware、Magnific 等。本地部署 NF4 版只需一张 RTX 4090(24GB VRAM)。API 访问请访问 developer.ideogram.ai。
93 亿参数 · 0.97 OCR 精度 · 原生 2K 输出 · JSON 布局控制 · API 调用 $0.03/张起 · 支持 14+ 平台 · 单卡本地可跑
免费体验 Ideogram 4无需信用卡。支持本地部署、API 调用和 14+ 平台集成。