AI视频生成 AI视频编辑 视频理解 多语言模型 因果交叉注意力 普通产品 开源
使用场景在 Video-MME 基准测试中,Video-CCAM-14B 在 96 帧情况下的无字幕和有字幕成绩分别为 53.2 和 57.4。Video-CC...