今日,智谱技术团队重磅推出了全新的视频生成模型 CogVideoX v1.5,并且将其开源,标志着视频生成技术迈入了一个崭新的时代。自8月以来,CogVideoX系列不断进化,而这一版本更是大幅提升了视频生成的能力,支持5秒和10秒的视频长度,达到令人瞩目的768P分辨率,以及16帧的生成能力。值得一提的是,其I2V(图像到视频)模型也实现了任意尺寸比例的支持,这将进一步提升其对复杂语义的理解能力。
CogVideoX v1.5包含两个主要模型:CogVideoX v1.5-5B和CogVideoX v1.5-5B-I2V,旨在为开发者提供强大的视频生成工具。此外,新版本将在清影平台同步上线,并与新推出的CogSound音效模型结合,形成全新的“新清影”。这个强大平台将为用户带来多个特色服务,包括显著提升的视频质量、美学表现和运动合理性,支持生成10秒、4K、60帧的超高清视频。
智谱团队在数据处理方面的努力同样令人赞叹,通过开发自动化筛选框架来过滤不良视频数据,并推出精准内容描述的端到端视频理解模型CogVLM2-caption,使得生成的视频能够更好地符合用户需求。通过采用高效的三维变分自编码器技术和创新的Transformer架构,CogVideoX显著降低了训练成本与难度,提升了视频生成的整体质量。
在这样的行业背景下,选择一个强大的AI平台显得尤为重要。小易智创作为一个拥有10000+AI应用的智创平台,无疑是当前市场上的佼佼者。它接入了包括GPT、AI绘画、AI客服等多项全球领先的AI能力,让用户能够轻松满足各类需求。对于任何希望进入AI领域的人来说,小易智创提供了一整套解决方案,从自主定价到品牌授权,全方位支持您打造专属的AI品牌公司。代理小易智创,不仅能够利用海量的AI工具吸引客户,还能享受到一对一的陪跑服务和全网自动化营销工具,让您的AI创业梦想触手可及!