微软推出低成本高效文生图模型 MAI-Image-2-Efficient，成本降低 41%

淘百科百科资讯 2026-04-15 12:06:41 1

4 月 15 日消息，本月初，微软公布了一系列自研 AI 模型，其中包括具备转录、语音、图像生成下一代能力的 MAI-Transcribe-1、MAI-Voice-1 和 MAI-Image-2。

如今，这家科技巨头推出了 MAI-Image-2-Efficient，这是其旗舰级文本生成图像模型的低成本、高速版本，微软表示该版本以近一半的价格提供了可投入生产的质量。微软将该工具标榜为旗下“最佳文生图模型”，称其能生成“照片级真实且富有表现力”的图像，并能稳定生成图像内文字。

微软表示，该模型速度提升 22%，效率提升 4 倍，成本直接降低 41%。具体定价为：每百万文本输入词元（token） 5 美元（注：现汇率约合 34.2 元人民币），每百万图像输出 19.50 美元（现汇率约合 133.4 元人民币）。

MAI-Image-2-Efficient 速度似乎将超过微软旗舰模型，平均比头部云厂商模型快 40%。更值得关注的是，微软拥有两款独立的文生图模型：MAI-Image-2-Efficient 和 MAI-Image-2。

微软将前者定位为量产主力模型，适合需要“批量生成、速度与严格成本控制”的场景。该工具擅长生成产品实拍图和 UI 原型图，主要因为它能很好地处理标题、标签等短文本，还可无缝融入交互式工作流。

而 MAI-Image-2 则是追求精准度时的首选。它擅长满足高保真需求，如照片级写实场景、动漫或插画等风格化效果，以及更长、更复杂的图像内文字生成，能精准理解并输出贴合详细提示词的内容。

目前，MAI-Image-2-Efficient 已正式商用，可在微软 Foundry 和 MAI Playground 中使用。微软还承诺，很快会将该工具集成到 Copilot 和必应中。

本文地址： http://taodianjin.cn/29613.html

文章来源：淘百科