SkyReels-V2开源:突破视频生成技术边界 开启无限时长电影生成新时代

证券日报 04-22 15:40


本报讯 (记者李乔宇)4月21日,昆仑万维科技股份有限公司(以下简称“昆仑万维”)SkyReels团队正式发布并开源SkyReels-V2——全球首个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型,其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(ReinforcementLearning)和扩散强迫(Diffusion-forcing)框架实现协同优化。

SkyReels-V2不仅在技术上实现了突破,还提供了多种有用的应用场景,包括故事生成、图生视频、运镜专家和多主体一致性视频生成(SkyReels-A2)。

SkyReels-V2现已支持生成30秒、40秒的视频,且具备生成高运动质量、高一致性、高保真视频的能力。

SkyReels-V2不仅在技术上实现了突破,还为多个实际应用场景提供了强大的支持。第一,SkyReels-V2能够生成理论上无限时长的视频,通过滑动窗口方法,模型在生成新帧时会参考之前生成的帧和文本提示。这种方法不仅支持时间上的扩展,还能生成具有连贯叙事的长镜头视频;第二,SkyReels-V2提供了两种图像到视频(I2V)的生成方法;第三,SkyReels-V2在标注摄像机运动方面表现出色;第四,基于SkyReels-V2基座模型,昆仑万维研发了SkyReels-A2方案,并提出了一种新的多元素到视频(E2V)任务,能够将任意视觉元素(如人物、物体和背景)组合成由文本提示引导的连贯视频,同时确保对每个元素的参考图像的高保真度。这一功能适合短剧、音乐视频和虚拟电商内容创作等应用。

作为首个商业级E2V开源模型,SkyReels-A2在E2V评估Benchmark A2-Bench中的结果表明,其一致性和质量维度上评估与闭源模型相当。未来,昆仑万维计划扩展框架以支持更多输入模态,如音频和动作,旨在构建一个统一的视频生成系统,以支持更广泛的应用。

(文章来源:证券日报)

文章来源:证券日报
原标题:SkyReels-V2开源:突破视频生成技术边界 开启无限时长电影生成新时代
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
特朗普政府被起诉!关税又生变数?
特朗普政府被起诉!关税又生变数?
证券时报网 256评论
凌晨!美联储重磅发布!107次提及“关税”
凌晨!美联储重磅发布!107次提及“关税”
证券时报网 664评论
再放宽!新版市场准入负面清单发布 无人驾驶航空器、电子烟等新业态被纳入
再放宽!新版市场准入负面清单发布 无人驾驶航空器、电子烟等新业态被纳入
央视新闻客户端 60评论
公募基金2025年一季报数据榜单出炉!
公募基金2025年一季报数据榜单出炉!
东方财富Choice数据 155评论
打开东方财富APP查看更多内容
24小时点击排行
机器人减速器核心标的
3300附近震荡意欲何为?两类股注意风险,坚决回避的品种。同时明天重点关注一个无
美股大涨 中概股拉升 A股?
刺激消费之辩证之舞
机器人灵巧手
点击查看更多内容
写评论 ...