简体 | 繁体
loading...
新闻频道
  • 首页
  • 新闻
  • 读图
  • 财经
  • 教育
  • 家居
  • 健康
  • 美食
  • 时尚
  • 旅游
  • 影视
  • 博客
  • 群吧
  • 论坛
  • 电台
  • 焦点新闻
  • 图片新闻
  • 视频新闻
  • 生活百态
  • 娱乐新闻
您的位置: 文学城 » 新闻 » 焦点新闻 » 9个案例实测谷歌的AI能力:设计行业“变天了”

9个案例实测谷歌的AI能力:设计行业“变天了”

文章来源: 虎嗅APP 于 2025-03-13 21:23:06 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数


Google 总算放出了他们去年承诺的“可连续对话改图”的 Gemini 文生图能力。

照例先给总体评价:

1. Gemini (或者说 Imagen3)是当下最值得全设计行业,甚至全碳基社会使用的文生图 AI;

2.它在自然语言的修改指令理解、材质质感复现、局部细节微调方面,达到了部分生产创作环节完全可用的水准(当然也有些 Case 还差点意思);

3.这几乎可以算 AI 许愿机、超级嘴炮魔法了,甚至说句“快变天了”不为过。

本文将用 4 项能力测试,5 个应用案例,带你理解 Gemini 的能力边界。

主要测试,挑战 AI 能力边界

主测试 1:简单形体的材质变换、连续微调形态细节,并大幅度改变视角

先用一些变态的 Case 开始,测试 Gemini 文生图的能力边界。

这是我测试的第一个 Case,因为一上来也不知道它到底边界在哪,先从简单的形体开始,让它画个正方体。

整个 Case 看下来非常连贯,指令理解到位,材质变换没问题,基础形态从未变形,甚至还能大幅更改相机视角,添加模特也完全没问题。

PS:我说这个“简单” Case 已经秒了其他的所有文生图 AI,不过分吧。

主测试 2:手绘稿转设计渲染图,顺便拍出产品宣传图

继续测,在测试 1 的基础上,我们上到设计生产级别,用一张手绘图打底,让 Gemini 完成全流程的产品造型概念设计推敲。

这个应该是很多设计公司在乎的 Case:

这张图已经是最好的证明,感觉也不需要多说什么解读的话语了。

虽然在实测中,在产品穿到人身上这不算稳定,总会带着一些人像与产品的变形。

就这手稿转 3D 产品渲染图,还能再微调局部设计的水平,已经完全超出本科设计专业的毕业生水平(对,因为我自己就是工业设计毕业的)。

还能快速在概念设计阶段,生成模特使用场景图,进一步验证设计方案的效果。

对了, 如果你还不服气,我再补一句:每张图的生成时间不超过 10s……这还不算“炸裂”,那还有什么算呢?

主测试 3:一次性生成多套不同风格的设计

我发誓,这是本文最后一个工业设计的 Case 了,后面还有游戏设计、自媒体应用等更多元的 Case,一个比一个精彩。

我其实一贯 AI 评测挺克制的,但在测试 Gemini 文生图的 4 小时内,基本每分钟都在发出粗鄙的感慨……

这个 Case 就是进一步模拟工业设计的造型推敲环节。

原本我们会需要大量的时间在犀牛(一套工业设计建模软件)中花数天时间建模,再花数天在 keyshot(一套工业设计渲染软件)中调整材质、打光出图。

而且一旦建模完成后,想要再对模型进行造型调整,简直是对设计师无尽的折磨。

现在,Gemini 在 20s 内就给你一次性生成 12 张 ……

主测试 4:抠图、换背景、打光影

搞定了产品设计,正常商业流程中,我们还要解决一下最终宣发的物料问题。

这时候离不开抠图、换背景、打光影拍照的工作流程。

先抠个图,无中生有地换背景:

没问题,换的非常好。

再看看商业级别的背景合成与打光:

再引用一个 WaytoAGI 上看到的例子:

绝了,每次都只用一句嘴炮,就能在 10s 内取得相当稳定的预期结果。甚至复杂的形体打光,也能做的有模有样。

OK,fine,测到这里,我只想说:

大碳基恭迎硅基老爷重塑人类社会。

社区实例一览

再看一些社区里大家在尝试的应用实例,也帮助我们获得更多启发。

更多应用 1:游戏角色与道具设计

对游戏行业可能的影响与启发之一:游戏内容设计(来自群友@z.z.h)

更多应用 2:家装设计

来自群友@Zhenyuan_Branton,家装设计也不含糊,你也可以直接把自己的手稿、房子照片拍给它,让它自己添加家具,完成设计推演。

更多应用 3:创作教育、自媒体内容素材

如果 Gemini 这么强的能力,用在教育、自媒体内容创作领域呢?

更多应用 4:漫画绘制与改色

来自推特@Linaqruf:

更多应用 5:游戏复杂场景与动作变换预览

来自推特@Cristian Peñas:

如何使用?

1. 登录 Google AI studio,链接:https://aistudio.google.com/prompts/new_chat

2.在 Model 中选择PREVIEW - Gemini 2.0 Flash Experimental(new)

3.确认选择“Images and text”

好,接下来也和我一起参与到恭迎硅基老爷重塑人类社会的行列吧~

Btw:我有个设计师朋友对此评价:

以前我可以假装建模、抠图磨洋工,现在老板只会跟我说赶紧 AI 生产改完发他了。

  • 海外省钱快报,掌柜推荐,实现买买买自由!
查看评论(3)
  • 文学城简介
  • 广告服务
  • 联系我们
  • 招聘信息
  • 注册笔名
  • 申请版主
  • 收藏文学城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小时热点排行

中国学生涌入伊利诺伊“玉米地”,中餐也“火”了
宗庆后杜建英合影曝光 女方主动又热情 看对方眼神…
53岁,她的10万积蓄消失在“养老金骗局”
读完985大学,我们成了“高学历废物”
马斯克推出二次元“AI女友”,月费30美元




24小时讨论排行

中国好感度反超,美国全球民调出现“逆转”
美女议员AOC称川普是“强奸犯” 白宫官员:可悲可怜
知情人士:宗庆后不止四孩 顾虑公众形象未入家谱
宗馥莉叔叔批她自私:要那么多钱干么 天堂又不能用
宗馥莉的妈妈 才是狠人 以柔克刚 有容乃大
有损国格!一切西方伪史论 本质都是辱华的高级黑
开除一个被偷拍的女大学生,才是有损国格
消息人士:特朗普对俄变脸,普京“并不畏惧”
国会推"尊严法案" 非法移民交$7000 可申请永久身份
巴西咖啡恐大涨!业者抢50%关税前加速向美国运货
别被川普“临阵软脚”骗了 他要的就是关税!越高越好…
华裔夫妇疯狂代孕案中案:保姆涉虐童遭FBI通缉
全球民调曝"对中国改观",美国好感度仅剩35%
iPhone稀土不靠中国!苹果砸5亿建立美国供应链
全美炸锅!华裔夫妇找代孕疯狂生21娃 被剥夺监护权
中领馆:所有在美中国公民尽快完成"海外公民登记"
文学城新闻
切换到网页版

9个案例实测谷歌的AI能力:设计行业“变天了”

虎嗅APP 2025-03-13 21:23:06


Google 总算放出了他们去年承诺的“可连续对话改图”的 Gemini 文生图能力。

照例先给总体评价:

1. Gemini (或者说 Imagen3)是当下最值得全设计行业,甚至全碳基社会使用的文生图 AI;

2.它在自然语言的修改指令理解、材质质感复现、局部细节微调方面,达到了部分生产创作环节完全可用的水准(当然也有些 Case 还差点意思);

3.这几乎可以算 AI 许愿机、超级嘴炮魔法了,甚至说句“快变天了”不为过。

本文将用 4 项能力测试,5 个应用案例,带你理解 Gemini 的能力边界。

主要测试,挑战 AI 能力边界

主测试 1:简单形体的材质变换、连续微调形态细节,并大幅度改变视角

先用一些变态的 Case 开始,测试 Gemini 文生图的能力边界。

这是我测试的第一个 Case,因为一上来也不知道它到底边界在哪,先从简单的形体开始,让它画个正方体。

整个 Case 看下来非常连贯,指令理解到位,材质变换没问题,基础形态从未变形,甚至还能大幅更改相机视角,添加模特也完全没问题。

PS:我说这个“简单” Case 已经秒了其他的所有文生图 AI,不过分吧。

主测试 2:手绘稿转设计渲染图,顺便拍出产品宣传图

继续测,在测试 1 的基础上,我们上到设计生产级别,用一张手绘图打底,让 Gemini 完成全流程的产品造型概念设计推敲。

这个应该是很多设计公司在乎的 Case:

这张图已经是最好的证明,感觉也不需要多说什么解读的话语了。

虽然在实测中,在产品穿到人身上这不算稳定,总会带着一些人像与产品的变形。

就这手稿转 3D 产品渲染图,还能再微调局部设计的水平,已经完全超出本科设计专业的毕业生水平(对,因为我自己就是工业设计毕业的)。

还能快速在概念设计阶段,生成模特使用场景图,进一步验证设计方案的效果。

对了, 如果你还不服气,我再补一句:每张图的生成时间不超过 10s……这还不算“炸裂”,那还有什么算呢?

主测试 3:一次性生成多套不同风格的设计

我发誓,这是本文最后一个工业设计的 Case 了,后面还有游戏设计、自媒体应用等更多元的 Case,一个比一个精彩。

我其实一贯 AI 评测挺克制的,但在测试 Gemini 文生图的 4 小时内,基本每分钟都在发出粗鄙的感慨……

这个 Case 就是进一步模拟工业设计的造型推敲环节。

原本我们会需要大量的时间在犀牛(一套工业设计建模软件)中花数天时间建模,再花数天在 keyshot(一套工业设计渲染软件)中调整材质、打光出图。

而且一旦建模完成后,想要再对模型进行造型调整,简直是对设计师无尽的折磨。

现在,Gemini 在 20s 内就给你一次性生成 12 张 ……

主测试 4:抠图、换背景、打光影

搞定了产品设计,正常商业流程中,我们还要解决一下最终宣发的物料问题。

这时候离不开抠图、换背景、打光影拍照的工作流程。

先抠个图,无中生有地换背景:

没问题,换的非常好。

再看看商业级别的背景合成与打光:

再引用一个 WaytoAGI 上看到的例子:

绝了,每次都只用一句嘴炮,就能在 10s 内取得相当稳定的预期结果。甚至复杂的形体打光,也能做的有模有样。

OK,fine,测到这里,我只想说:

大碳基恭迎硅基老爷重塑人类社会。

社区实例一览

再看一些社区里大家在尝试的应用实例,也帮助我们获得更多启发。

更多应用 1:游戏角色与道具设计

对游戏行业可能的影响与启发之一:游戏内容设计(来自群友@z.z.h)

更多应用 2:家装设计

来自群友@Zhenyuan_Branton,家装设计也不含糊,你也可以直接把自己的手稿、房子照片拍给它,让它自己添加家具,完成设计推演。

更多应用 3:创作教育、自媒体内容素材

如果 Gemini 这么强的能力,用在教育、自媒体内容创作领域呢?

更多应用 4:漫画绘制与改色

来自推特@Linaqruf:

更多应用 5:游戏复杂场景与动作变换预览

来自推特@Cristian Peñas:

如何使用?

1. 登录 Google AI studio,链接:https://aistudio.google.com/prompts/new_chat

2.在 Model 中选择PREVIEW - Gemini 2.0 Flash Experimental(new)

3.确认选择“Images and text”

好,接下来也和我一起参与到恭迎硅基老爷重塑人类社会的行列吧~

Btw:我有个设计师朋友对此评价:

以前我可以假装建模、抠图磨洋工,现在老板只会跟我说赶紧 AI 生产改完发他了。