使用场景
使用CelebV-Text数据集进行人脸文本-视频生成任务的研究
使用CelebV-Text数据集进行人脸文本-视频相关性分析
使用CelebV-Text数据集构建人脸文本-视频生成任务的基准
产品特色
大规模人脸文本-视频数据集
70,000个野外人脸视频剪辑
每个视频剪辑都配有20个文本
涵盖40种一般外观、5种详细外观、6种光照条件、37种动作、8种情绪和6种光线方向
全面的统计分析验证数据集的优越性
构建了一个基准来标准化人脸文本-视频生成任务的评估
使用场景
使用CelebV-Text数据集进行人脸文本-视频生成任务的研究
使用CelebV-Text数据集进行人脸文本-视频相关性分析
使用CelebV-Text数据集构建人脸文本-视频生成任务的基准
产品特色
大规模人脸文本-视频数据集
70,000个野外人脸视频剪辑
每个视频剪辑都配有20个文本
涵盖40种一般外观、5种详细外观、6种光照条件、37种动作、8种情绪和6种光线方向
全面的统计分析验证数据集的优越性
构建了一个基准来标准化人脸文本-视频生成任务的评估