京东称,JoyAI-Echo能够解决行业头疼已久的“长视频生成三大难题”——角色易崩、声音乱变、生成缓慢。该框架引入智能“导演助理”DirectorAgent,可以对话式编辑,用户无需重跑整条视频即可修改镜头。此外,该框架内置跨模态记忆库,可在多镜头生成中持续保存并调用角色的外观特征和说话人音色信息,还通过DMD技术实现7.5倍推理加速,长视频生成更快。
(文章来源:上海证券报·中国证券网)
文章来源:上海证券报·中国证券网
原标题:京东宣布开源JoyAI-Echo长音视频生成框架
