Whisk 施展魔法！Google 全新 AI 图像生成工具，以图生图无需提示词！

AI 2025-07-30 18:35:52

资讯

在 AI 图像生成领域，传统的文本提示方式已较为常见。然而，Google 推出的 Whisk 带来了一种全新的视觉优先的方法。它允许用户使用图像作为输入来生成和重新混合创意，为创作者提供了一种更直观、更具创意的图像生成体验。

Hero_hmKlSP6.width-1600.format-webp.png

Whisk 简介

Whisk 是 Google Labs 推出的一款创新的生成式 AI 工具。它借助 Gemini 和 Imagen 3 模型，通过用户输入的代表主体、场景和风格的图像来生成新的图像。该工具主要定位于创意探索，旨在帮助用户快速生成和迭代各种创意想法，而非用于精确的图像编辑。目前，Whisk 仅对美国用户（美国IP）开放，用户可在 labs.google/whisk 上使用该工具并提供反馈。

截屏2024-12-17 下午3.45.28.jpg

Whisk 功能亮点

图像驱动的生成：用户可以通过上传图像来确定主体、场景和风格，而不是使用文本提示，这为不擅长撰写文本提示的用户提供了更便捷的方式，例如用户可以上传一张猫的图片作为主体，一张荷叶的图片作为场景，一张有闪亮元素的图片作为风格来生成独特的图像。
自动生成详细字幕：Gemini 模型会自动为用户上传的图像编写详细的字幕描述，这些描述会被输入到 Imagen 3 模型中，以更好地捕捉图像的关键特征并生成符合用户意图的新图像。
创意重新混合：能够将不同的主体、场景和风格图像进行重新混合，创造出独特的设计，如数字玩偶、珐琅别针等各种创意产品。
本质捕捉而非复制：它捕捉的是输入图像的本质特征，而不是精确复制，这使得生成的图像具有更多的创意变化空间，但也可能导致结果与用户预期不完全一致。
可编辑提示：用户可以查看和编辑底层的提示信息，以便根据自己的需求对生成的图像进行调整和优化，例如修改颜色、图案等特征。

截屏2024-12-17 下午3.50.10.jpg

适用场景

创意设计：设计师可以使用 Whisk 快速探索不同的设计方向，通过上传各种相关的图像来生成创意灵感，如为一款新产品设计独特的外观形象。

艺术创作：艺术家可以利用 Whisk 进行艺术创作的前期构思，将不同的元素通过图像输入的方式进行融合和尝试，例如创作一幅奇幻主题的绘画，通过上传相关的奇幻生物、场景等图片来获取创作思路。

个性化产品定制：对于个性化产品定制行业，如定制徽章、贴纸等，Whisk 可以帮助用户快速生成各种可能的设计方案，用户只需上传代表自己喜好的主体、场景和风格的图像，即可得到独特的定制设计。

广告营销：广告策划人员可以使用 Whisk 生成各种具有创意的广告素材，通过上传与产品相关的主体图像以及符合品牌形象的场景和风格图像，快速得到吸引人的广告图片，用于线上线下的广告宣传。

教育领域：在教育中，教师可以使用 Whisk 来辅助教学，例如在美术课上，让学生通过上传自己感兴趣的事物图片来激发创作灵感，培养学生的创造力和想象力。

截屏2024-12-17 下午3.48.01.jpg

Whisk 使用教程

访问工具：美国 IP 用户可访问 labs.google/whisk 进入 Whisk 工具页面。

上传图像：根据需要生成的图像内容，上传代表主体、场景和风格的图像。如果没有合适的图像，也可点击骰子图标获取一些建议图像（这些图像可能也是 AI 生成的）。

生成图像：上传图像后，Whisk 会自动根据这些图像生成新的图像以及对应的文本提示。

查看与调整：查看生成的图像，如果不满意，可以通过编辑文本框中的提示信息，或者点击图像并编辑其相关文本提示来对图像进行调整和优化。

下载或收藏：如果对生成的图像满意，可以将其下载保存，或者添加到收藏夹中以便后续使用。

截屏2024-12-17 下午3.46.32.jpg

结语

Whisk 作为一款具有创新性的 AI 图像生成工具，以其独特的图像输入方式和创意重新混合功能，为用户带来了全新的创意体验。它在创意设计、艺术创作、个性化产品定制等多个领域都具有潜在的应用价值。虽然目前它仅对美国用户开放且可能存在一些生成结果不够完美的情况，但它所代表的视觉优先的 AI 图像生成方向值得我们关注。

如果你对创意和 AI 图像生成感兴趣，不妨点赞、评论并持续关注 Whisk 的发展，期待它在未来能为我们带来更多的惊喜和可能性。