微软推出低成本高效文生图模型 MAI-Image-2-Efficient,成本降低 41%

淘百科 百科资讯 1

4 月 15 日消息,本月初,微软公布了一系列自研 AI 模型,其中包括具备转录、语音、图像生成下一代能力的 MAI-Transcribe-1、MAI-Voice-1 和 MAI-Image-2。

如今,这家科技巨头推出了 MAI-Image-2-Efficient,这是其旗舰级文本生成图像模型的低成本、高速版本,微软表示该版本以近一半的价格提供了可投入生产的质量。微软将该工具标榜为旗下“最佳文生图模型”,称其能生成“照片级真实且富有表现力”的图像,并能稳定生成图像内文字。

微软表示,该模型速度提升 22%,效率提升 4 倍,成本直接降低 41%。具体定价为:每百万文本输入词元(token) 5 美元(注:现汇率约合 34.2 元人民币),每百万图像输出 19.50 美元(现汇率约合 133.4 元人民币)。

MAI-Image-2-Efficient 速度似乎将超过微软旗舰模型,平均比头部云厂商模型快 40%。更值得关注的是,微软拥有两款独立的文生图模型:MAI-Image-2-Efficient 和 MAI-Image-2。

微软将前者定位为量产主力模型,适合需要“批量生成、速度与严格成本控制”的场景。该工具擅长生成产品实拍图和 UI 原型图,主要因为它能很好地处理标题、标签等短文本,还可无缝融入交互式工作流。

而 MAI-Image-2 则是追求精准度时的首选。它擅长满足高保真需求,如照片级写实场景、动漫或插画等风格化效果,以及更长、更复杂的图像内文字生成,能精准理解并输出贴合详细提示词的内容。

目前,MAI-Image-2-Efficient 已正式商用,可在微软 Foundry 和 MAI Playground 中使用。微软还承诺,很快会将该工具集成到 Copilot 和必应中。