2025年9月25日,生数科技正式发布新一代图生视频大模型 Vidu Q2,该模型在极致表情变化、推拉运镜、生成速度及语义理解等方面取得重大突破,实现了从“生成视频”到“生成演技”,从“动态流畅”到“情感表达”的跨越,标志着 AI 视频生成技术正式从追求“形似”进入“神似”新阶段。
一、技术突破:让 AI 拥有“有趣的灵魂”
此前,AI 视频生成的角色常因表情僵硬、眼神空洞,缺乏情感表达而被诟病为“面瘫”。Vidu Q2 的诞生突破了这一瓶颈,它能够理解并生成极其细腻的面部微表情,如嘴角不经意的抽动、眼神中一闪而过的犹豫、眉头微蹙表达的疑虑等。这些细微表情是人类传递复杂、真实情感的关键,Vidu Q2 的成功攻克使数字角色展现出生动且充满感染力的演技,赋予了 AI 角色以生命力。生数科技首席执行官骆怡航表示:“Vidu Q2 的突破在于我们首次让 AI 角色拥有了‘有趣的灵魂’。我们教会了 AI‘演戏’,这不仅是技术的里程碑,更是通向更高级别人工智能不可或缺的一步。”
二、技术创新:多模态理解与生成深度融合
Vidu Q2 的成功得益于其在多模态理解与生成技术上的深度融合。模型通过深度理解情感文本、图文解析,并结合对人体面部动作单元的精细解构与物理模拟,从而在视频中驱动角色面部肌肉、肢体肌肉产生符合情感逻辑的细微运动。除了微表情,Vidu Q2 在生成可控及一致性等方面也有了多方位提升。
三、功能升级:满足多样化创作需求
Vidu Q2 主要包括图生视频、首尾帧视频、时长可选(2 - 8s)、电影大片及闪电出片两种模式。在复杂表情变化的文戏,常见的多人打斗场景的武戏,及影视剧情中令人震撼的炫酷特效中表现出彩,能够通过媲美人类的 AI 真实表演,将 AI 演技强力渗透影视、短视频剧情创作、广告创意等生产力场景。此外,为了满足用户对于生成速度和生成质量的不同需求,Vidu Q2 图生视频分为闪电模式和电影大片模式。闪电模型下 20 秒就能生成 5 秒 1080P 视频片段,满足极速出片的需求;电影大片模式则主要满足对于复杂表演、运镜等有更高要求的用户。
四、应用拓展:推动多领域发展升级
Vidu Q2 的推出将为内容创作、影视产业、广告营销等领域带来全新升级。其生动的 AI 演技、丰富的镜头语言、准确的语义理解和灵活的时长选择,能够满足不同场景下的创作需求,提升创作效率和质量,为创作者提供更强大的工具和更广阔的空间。
生数科技 Vidu Q2 模型的发布,无疑是图生视频领域的一次重大突破,它不仅推动了 AI 视频生成技术的进步,更为相关产业的发展注入了新的活力,开启了图生视频“演技生成”的新时代。
AD:精心整理了2000+好用的AI工具!点此获取