2月16日早上,王祚的手机里收到了一条公众号推送,文章标题直白且不加掩饰——“现实,不存在了。”
这句看似从科幻小说《三体》中借鉴来的标题吸引了王祚,出于好奇,他打开了这篇推文。文章中讲述的是美国开放人工智能研究中心(OpenAI)推出的视频生成模型sora,它使用Transformer架构,可根据文本指令创建现实且富有想象力的场景,生成多种风格、不同画幅、最长60秒的高清视频。
继推出大语言模型ChatGPT后,OpenAI又进军了视频生成领域,虽然发布的视频只是预览版本,但其视觉效果已然令人咋舌。
“Sora的视觉效果让我十分惊讶。”王祚对新京报记者说道。他目前就读于中国传媒大学,是数字媒体艺术专业的硕士研究生,还对人工智能绘画进行过广泛的研究。王祚补充道,Sora生成的视频整体相对舒适,构图色彩也都在一定程度上满足了当下的需求,“专业师生的整体评价也都是以夸赞为主。”
惊讶于人工智能技术日新月异的同时,外界的担忧也随之到来。OpenAI对Sora的期许是“世界模拟器”,在模拟世界的过程中,人工智能生成视频似乎在进一步模糊现实世界本就脆弱的真假界限,推动“深度伪造”(deepfake)不断涌现,正如最开始吸引王祚的那篇推文所发出的感叹,现实是否就此不复存在?
向前一大步
Sora的出现很快在王祚的同学和老师间引发了讨论,从视觉效果到背后技术,以及人工智能可能对数字媒体专业产生的影响。
根据OpenAI的介绍,Sora能够生成包含多个角色、特定运动类型,精确主题以及背景细节的复杂场景,它不仅了解用户在文本提示中的要求,还能理解所述内容在物理世界中的存在方式。
Sora并不是同类产品中的第一个,谷歌、Meta等公司也都有类似的技术,但OpenAI展示出的几个高质量预告视频,让不少观察者惊诧不已。在王祚看来,Sora的整体性逻辑以及视觉观感其实都已经远远超越之前一些所谓的人工智能生成视频的工具,“从这一点来说,Sora取得了飞跃式的进步。”