近日,快手旗下可灵 AI 正式推出新一代图像生成模型 “可图 2.1”,该模型在指令遵循、人像美感、电影质感以及文字生成效果等多个维度实现全面跃升。即日起至 7 月 17 日,所有会员用户均可限时免费体验该模型 7 天,畅享文生图、单图参考、多图参考等核心功能。
一、指令遵循能力大幅提升
可图 2.1 在理解复杂指令方面表现尤为出色,能够精准捕捉提示词中的多元元素、复杂逻辑以及颜色、位置等细节要求。例如,输入 “3D 微缩沙盘模型,展示其独特的横截面剖面,海底火山爆发的剧烈瞬间,史诗级灾难场景,CG 特效,光影对比,冷暖对比” 后,模型生成图像清晰呈现宏大的灾难场景,并通过精细的光影控制与冷暖色调对比,细腻还原了火山爆发的震撼瞬间。
二、画面质量显著突破
可图 2.1 在画面质量上取得显著突破,清晰度、元素丰富度与细节真实感均达到新高度。尤其在人像美感方面表现突出,无论是 “水下摄影,一位欧洲少女,梦幻光影,水透明肌理反光,迷乱,折射光影,光影弥散,棕黑色系” 指令下肌肤纹理细腻、光影自然的人物图像,还是 “黑白照片,复古风格的摄影棚照片,一位时尚女性斜倚在天鹅绒贵妃椅上,身着流苏裙,佩戴珍珠项链,展现二十年代摩登女郎不经意的优雅” 提示词所生成的人物姿态与服饰细节,都栩栩如生。
三、风格响应能力丰富
可图 2.1 支持超过 180 种风格响应,覆盖包括特殊材质、数字艺术、绘画技法等在内的多种风格。同时,该模型还支持导演风格化(如韦斯·安德森风)及高级构图,强化画面美学。在文字设计方面也进行了进一步调整,支持可生成设计感中英文文字,适配海报、封面等创意需求。
四、技术迭代与用户基础
作为全球领先的视觉生成大模型平台,可灵 AI 上线一年多来已快速迭代超过 20 次,成功发展为融合 AI 图片、视频、音频能力的多模态创意生产力平台。用户累计生成的图片已达 3.44 亿张、视频 1.68 亿个。此次可图 2.1 的推出,进一步彰显了可灵 AI 在图片生成领域的强大技术实力。
AD:精心整理了2000+好用的AI工具!点此获取