国家重点研发计划项目课题,执行期:2021.09-2024.08,经费:950万
项目内容简介:
目标为,给定特定事件能够快速生成符合相关人物、声音、背景等的音视频内容。主要研究内容:(1)虚拟音视频关键内容快速迁移技术。针对特定事件视频流,识别关键目标,采用基于人体动作参数合成的数字人体技术进行虚实融合的内容修改;基于对抗式生成网络、目标迁移的图形绘制和音色自适应合成技术,完成目标人物、声音或背景的动态无缝替换,生成高真实感特定场景图像、声场环境及短视频。(2)基于脚本的多媒体内容生成。针对指定脚本进行时空域环境信息及目标人物行为动作分析,建立视频结构化模型;采用影视级虚拟场景预演技术获取演员人体运动及面部表情参数并迁移至目标人物,叠加特定场景背景及声场实现快速高真感多媒体内容生成。