Gemini 2.0的“用嘴改图”终于上线了,这是AI绘图的新范式。 * { margin: 0; padding: 0; outline: 0; } body { font-family: “PingFang SC”, system-ui, -apple-system, BlinkMacSystemFont, “Helvetica Neue”, “Hiragino Sans GB”, “Microsoft YaHei UI”, “Microsoft YaHei”, Arial, sans-serif; line-height: 1.6; } .__page_content__ { max-width: 667px; margin: 0 auto; padding: 20px; text-size-adjust: 100%; color: rgba(0, 0, 0, 0.9); padding-bottom: 64px; } .title { user-select: text; font-size: 22px; line-height: 1.4; margin-bottom: 14px; font-weight: 500; } .__meta__ { color: rgba(0, 0, 0, 0.3); font-size: 15px; line-height: 20px; hyphens: auto; word-break: break-word; margin-bottom: 50px; } .__meta__ .nick_name { color: 576B95; } .__meta__ .copyright { color: rgba(0, 0, 0, 0.3); background-color: rgba(0, 0, 0, 0.05); padding: 0 4px; margin: 0 10px 10px 0; } blockquote.source { padding: 10px; margin: 30px 0; border-left: 5px solid ccc; color: #333; font-style: italic; word-wrap: break-word; } blockquote.source a { cursor: pointer; text-decoration: underline; } .item_show_type_0 > section { margin-top: 0; margin-bottom: 24px; } a { color: 576B95; text-decoration: none; cursor: default; } .text_content { margin-bottom: 50px; user-select: text; font-size: 17px; white-space: pre-wrap; word-wrap: break-word; line-height: 28px; hyphens: auto; } .picture_content .picture_item { margin-bottom: 30px; } .picture_content .picture_item .picture_item_label { text-align: center; } img { max-width: 100%; } .pay_subscribe_notice { margin: 30px 0; padding: 20px; background: fffbe6; border: 1px solid ffe58f; border-radius: 8px; } .pay_subscribe_badge { display: inline-block; padding: 4px 12px; background: faad14; color: fff; border-radius: 4px; font-size: 14px; font-weight: 500; margin-bottom: 12px; } .pay_subscribe_desc { font-size: 15px; line-height: 1.8; color: rgba(0, 0, 0, 0.7); margin-bottom: 12px; } .pay_subscribe_hint { font-size: 13px; color: rgba(0, 0, 0, 0.4); } .__bottom-bar__ { display: flex; justify-content: space-between; align-items: center; position: fixed; bottom: 0; left: 0; right: 0; height: 64px; padding: 8px 20px; background: white; box-sizing: border-box; border-top: 1px solid rgba(0, 0, 0, 0.2); } .__bottom-bar__ .left { display: flex; align-items: center; font-size: 15px; white-space: nowrap; } .__bottom-bar__ .right { display: flex; } .__bottom-bar__ .sns_opr_btn { display: flex; align-items: center; user-select: none; background: transparent; border: 0; color: rgba(0, 0, 0, 0.9); font-size: 14px; } .__bottom-bar__ .sns_opr_btn:not(:last-child) { margin-right: 16px; } .__bottom-bar__ .sns_opr_btn > img { margin-right: 4px; }
Gemini 2.0的“用嘴改图”终于上线了,这是AI绘图的新范式。
原创 数字生命卡兹克 数字生命卡兹克 2025-03-13 20:07 北京
Google这两天动作蛮多。
昨天刚开源Gemma3,然后今天夜里,鸽了N久的Gemini 2.0的原生多模态生图功能,也终于开放了。
这也是我对Gemini 2.0最期待的功能。
在出门回来,玩了一下午后,我觉得终于可以给你们分享一下,这玩意的有趣之处了。
先给你们直观的感受一下,它能干啥。
比如我现在有一张图,是一个很酷的小姐姐。
我想让这个小姐姐,变成长头发。
你无需PS,无需局部重绘,只需要一句话就行。
Gemini 2.0,就会瞬间保证所有的其他细节不变的情况下,把小姐姐变成长发。
我们还可以,一句话,让她把眼睛闭上。
再把她的脸,换成特朗普。。。
这个效果,emmmm,我无法评价。。。
又或者,这是一套扑克牌的图。
我想把把最右边的红桃A扑克牌,变成梅花2。
一句话,就成。
不过这个得roll,我roll了3次才roll出来。
你也可以改文字。
甚至,可以扔一个草图进去,然后说:
请你根据这张手绘线稿图,生成对应的一张真实房屋渲染图。
对这个屋子材质不满意,你还可以,改成木质的。
这,就是言出法随的力量。、
得益于Gemini 2.0的多模态能力,类似于之前的GPT4o,GPT4o是语音端到端,而Gemini 2.0,则是图片端到端。
集图片理解和生成为一身。
而且,画出的图,审美也还凑合,虽然还远远达不到类似MJ、Flux那种质量,泛化能力也差点意思,但,能用了。
在多模态大模型上,能用的言出法随,是非常关键的一点。
说下怎么用。
打开https://aistudio.google.com/
正常你登录后会看到这个界面(需要魔法)。
然后,在右侧把模型,切换成Gemini 2.0 Flash Experimental。
目前限免,可以随意白嫖。
同时记得output这块,一定是Images and text,千万别只选Text,那你就生成不了图了。
接下来,直接在对话框里,传你图片,加上文字描述就OK。
比如我把我的头像,变成3D实物。
而且你不止可以传一张图,你也可以,传两张图,然后,融图。
虽然它换logo换的还有点贴片感,比较这个太难了,但是产品图,就会好很多了。
比如1和2结合。
光影还是有一些不匹配,有一些贴图感,但不妨碍很准确。
再给半年时间迭代,我觉得,一切都不是问题。
甚至你还可以,不只是图+文字进去,你还可以,直接让它给你生成图文混排的教程。
比如这个做番茄炒蛋的case。
你现在,是真的拥有一个图文混排的教程了。。。
甚至,你还可以,给一个平面图,直接做每个房间的渲染图。
我随手生成了一个两室一厅的平面图。
然后,扔给了Gemini。
怎一个离谱了得。。。
这种一致性,做故事、做分镜,真的就是手到擒来。
两年多了,生成式AI在图像编辑领域的进步,真的也就像悄悄进行的大革命。
从最初需要苦学多年Photoshop和图像处理技术,到如今只需一句话就能实现你的所有创意。
我们不再受限于专业技能的掌握程度,就算是从来没用过PS的小白,也可以轻松地用嘴,将脑海中的创意转化为现实。
言出法随,从这一刻,成真了。
这或许。
就是AI时代。
它们给予我们最珍贵的礼物。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:卡兹克
>/ 投稿或爆料,请联系邮箱:wzglyay@gmail.com
数字生命卡兹克
 阅读 赞  分享 ‘%3E %3Cg transform=‘translate(0 -2.349)‘%3E %3Cpath d=‘M0 2.349h24v24H0z’/%3E %3Cpath fill=‘%23576B95’ d=‘M16.45 7.68c-.954 0-1.94.362-2.77 1.113l-1.676 1.676-1.853-1.838a3.787 3.787 0 0 0-2.63-.971 3.785 3.785 0 0 0-2.596 1.112 3.786 3.786 0 0 0-1.113 2.687c0 .97.368 1.938 1.105 2.679l7.082 6.527 7.226-6.678a3.787 3.787 0 0 0 .962-2.618 3.785 3.785 0 0 0-1.112-2.597A3.687 3.687 0 0 0 16.45 7.68zm3.473.243a4.985 4.985 0 0 1 1.464 3.418 4.98 4.98 0 0 1-1.29 3.47l-.017.02-7.47 6.903a.9.9 0 0 1-1.22 0l-7.305-6.73-.008-.01a4.986 4.986 0 0 1-1.465-3.535c0-1.279.488-2.56 1.465-3.536A4.985 4.985 0 0 1 7.494 6.46c1.24-.029 2.49.4 3.472 1.29l.01.01L12 8.774l.851-.85.01-.01c1.046-.951 2.322-1.434 3.59-1.434 1.273 0 2.52.49 3.472 1.442z’/%3E %3C/g%3E %3C/g%3E %3C/g%3E%3C/svg%3E) 推荐 ’ fill=‘%23000’ fill-opacity=’.9’/%3E%3C/svg%3E) 留言