Miradata_视频

Miradata

类别：AI视频生成,AI数据集,视频数据集,长视频,结构化字幕,GPT-4V,优质新品,开源,

官网:https://github.com/mira-space/MiraData 更新时间：2025-08-01 18:34:34
使用场景
研究人员使用MiraData训练视频内容理解模型。
开发者利用MiraData进行视频生成算法的测试和优化。
教育机构使用MiraData作为教学资源，教授视频处理和字幕生成技术。
产品特色
长视频时长：平均72秒的视频片段，全面建模视频内容。
结构化字幕：提供不同视角的详细描述，平均318字。
数据集版本：发布四个版本的数据集，包含不同数量的数据。
视频收集与注释：从YouTube等平台手动选择频道，下载并分割视频。
字幕生成：使用GPT-4V生成多维度字幕，提高语义理解的准确性。
评估基准：设计17个评估指标，从六个角度评估长视频生成。
许可协议：数据集仅供信息目的使用，版权归原始视频所有者所有。
使用教程
1. 从Google Drive或HuggingFace Dataset下载MiraData的元数据文件。
2. 使用提供的脚本下载视频样本。
3. 根据需要对视频样本进行分割和处理。
4. 使用GPT-4V等工具生成视频字幕。
5. 利用MiraBench评估生成的视频质量。
6. 遵循许可协议，合理使用数据集进行研究或开发。

Miradata