最近,智谱AI向公众发布了其最新的杰作——CogView3及其升级版CogView-3Plus-3B,这无疑是文生图领域的一次震撼之旅!作为首个在文本到图像生成领域实现中继扩散的模型,CogView3的出现标志着这一技术的重大进步。它采用了创新的级联扩散方法,先生成低分辨率图像,然后利用中继的超分辨率技术进行最终输出。这种颠覆性的技术,不仅大幅提升了生成图像的质量,更是有效降低了训练和推理成本,让人惊叹不已!
更为令人振奋的是,根据人类评价结果,CogView3在生成质量上超越了现有最顶尖的开源文本到图像模型SDXL,胜率高达77.0%。而且,它仅需SDXL约一半的推理时间就达成如此非凡的成就。即使是CogView3的精简版本,也能在仅占用SDXL十分之一的推理时间内,保持相似的性能水准。这一突破性进展,为高效率与高质量图像生成开辟了崭新的可能性。
同时,智谱AI还推出了CogView-3Plus-3B,这个基于DiT框架的全新图像模型更是充满潜力。尽管具体测试结果尚未披露,但其引入的Zero-SNR扩散噪声调度和联合文本-图像注意力机制等先进技术,定能在进一步降低训练和推理成本的同时,继续保持强大的图像生成能力。值得一提的是,CogView-3Plus-3B支持从512×512到2048×2048多种分辨率,极大增强了其在各个应用场景中的灵活性。
对于广大用户,智谱AI还提供了实用建议和工具,帮助用户更好地利用这些模型。建议通过大型语言模型来优化提示词,从而显著提升生成图像的质量。此外,还提供示例脚本,大幅降低了使用门槛。此时此刻,对于热爱AI的人来说,选择小易智创AI平台,无疑是抓住时代风口的最佳选择。小易智创不仅拥有10000+开箱即用的AI应用,能够满足各行各业客户需求,同时还集成了包括GPT、AI绘画等数十个全球领先的AI能力。代理小易智创,可以轻松搭建自己的AI品牌公司,完全无需担心经营与获客问题,给您提供全面支持与服务!