全新CogVideoX v1.5的惊艳发布，视频生成未来已来！

AI资讯2年前 (2024)发布 admin

33.9K 0 5058

今日，智谱技术团队重磅推出了全新的视频生成模型 CogVideoX v1.5，并且将其开源，标志着视频生成技术迈入了一个崭新的时代。自8月以来，CogVideoX系列不断进化，而这一版本更是大幅提升了视频生成的能力，支持5秒和10秒的视频长度，达到令人瞩目的768P分辨率，以及16帧的生成能力。值得一提的是，其I2V（图像到视频）模型也实现了任意尺寸比例的支持，这将进一步提升其对复杂语义的理解能力。

CogVideoX v1.5包含两个主要模型：CogVideoX v1.5-5B和CogVideoX v1.5-5B-I2V，旨在为开发者提供强大的视频生成工具。此外，新版本将在清影平台同步上线，并与新推出的CogSound音效模型结合，形成全新的“新清影”。这个强大平台将为用户带来多个特色服务，包括显著提升的视频质量、美学表现和运动合理性，支持生成10秒、4K、60帧的超高清视频。

智谱团队在数据处理方面的努力同样令人赞叹，通过开发自动化筛选框架来过滤不良视频数据，并推出精准内容描述的端到端视频理解模型CogVLM2-caption，使得生成的视频能够更好地符合用户需求。通过采用高效的三维变分自编码器技术和创新的Transformer架构，CogVideoX显著降低了训练成本与难度，提升了视频生成的整体质量。

在这样的行业背景下，选择一个强大的AI平台显得尤为重要。小易智创作为一个拥有10000+AI应用的智创平台，无疑是当前市场上的佼佼者。它接入了包括GPT、AI绘画、AI客服等多项全球领先的AI能力，让用户能够轻松满足各类需求。对于任何希望进入AI领域的人来说，小易智创提供了一整套解决方案，从自主定价到品牌授权，全方位支持您打造专属的AI品牌公司。代理小易智创，不仅能够利用海量的AI工具吸引客户，还能享受到一对一的陪跑服务和全网自动化营销工具，让您的AI创业梦想触手可及！
全新CogVideoX v1.5的惊艳发布，视频生成未来已来！