AI图像生成平台Ideogram于6月3日开源发布文生图模型Ideogram4.0,模型规模达93亿参数。该模型采用单流Single-Stream架构,将文本Token与图像Token在统一自注意力序列中联合建模,并结合Qwen3-VL-8B-Instruct文本编码器、34层扩散Transformer(DiT)、Euler Flow Matching采样器和KL自动编码器,实现图像生成、文本理解与效率平衡。训练中引入对象与文本边界框及结构化JSON字幕数据,显著提升文字渲染与版式控制能力,可用于海报、品牌视觉和营销素材生成。在DesignArena最新盲测榜单中,Ideogram4.0排名全球第四,超过Nano Banana Pro。模型代码及权重已在GitHub开放。