Skip to content

这一次,门槛真的消失了!深度体验 Gemini 3 和 Nano Banana Pro

Published:

大家好,我是大圣不是圣。

Google 最近一周陆续发布了 Gemini 3 和 Nano Banana Pro,我也第一时间深度的测试和使用了,整个使用过程都是处在一种比较兴奋的状态,感叹 AI 太强大了。

这一次,门槛真的“消失”了。

于是昨天晚上在内部群临时做了一个关于 Gemini 3 与 Nano Banana Pro 的分享,没怎么准备,但一个小时能产出的内容还是让人惊艳。

把这次分享的核心内容整理出来,也希望能给你有一些启发。

Gemini 之前有 2.5 Pro,Nano Banana 也有 1.0,相关的资料在网上已经有很多了,因此这次分享更多是展现一些与之前不一样的功能使用情况

一、Nano Banana Pro - 人人都设计师

当前要使用 Nano Banan Pro 有不少渠道,下面这三个是我用得比较多的,各有特色:

下面的例子这三个渠道都会用到。

个人感觉,这次 Nano Banana Pro 的升级,最大的亮点便是对中文的支持更加友好了,以前通过 Nano Banana 生成图,最大的痛点就是中文字的处理,生成的中文要么是错别字,要么是奇奇怪怪的像中文的符号。

这次 Google 终于把这个问题解决了。而且解决得比目前市面上的其它大模型都要好。

还是来看几个例子。

1. 配图翻译

之前下载或翻译一些国外的文章,里面的配图文章很不好处理,有了 Nano Banana Pro,简直不要太简单。

下面是我临时找的一张英文字配图,而且字比较多。

在 Gemini 中使用 Nano Banana Pro,上传这张图片,提示词很简单:

将图中的文字全部翻译成中文,重新输出这张图

直接看效果。

2. 信息图生成

再来看一个例子。我刚好在读一篇关于生成式 UI 的英文论文,希望将这篇论文的核心思想和流程转化为一幅白板信息图。

直接上传这篇论文的 PDF,使用工具:官方的 Gemini,提示词:

将这篇论文的内容,转化为一幅教学白板图像,包括:图表、箭头、方框和说明核心思想的标题。同时使用不同颜色文字来做区分。图中的文字使用简体中文。

下面是输出的效果,也出奇的好。

3. 配图生成

这也是一个比较常见的应用场景,为博客文章配图,下面是我拿自己以前写过的一篇文章做的测试。

使用工具:lovart,提示词超级简单:

根据下面的文字内容生成合适的配图

{文章内容}

除了提示词,我还垫了一张我自己喜欢风格的图作为参考。

生成的效果也挺满意的,下面是其中一张。

注意,直接在 Gemini 生成也没问题呢,这次只是多介绍一个使用渠道。

4. 知识绘本生成

这次我们在 NotebookLM 中使用。

NotebookLM 是一个 AI 知识库管理工具,也是 Google 的产品,你可以方便的通过各种来源上传资料(包括 PDF、网站、YouTube 视频、音频等),然后可以利用 Gemini 大模型的超强理解能力,让这些资料成为你的研究与思考伙伴。

在 NotebookLM 中,涉及到图片的部分也升级为了 Nano Banana Pro,因此我们也可以直接利用 Nano Banana Pro 的能力,尤其在生成 Slide(幻灯片)这部分。

通过自定义提示词,可以让幻灯片发挥出超越普通幻灯片的能力,比如接下来这个“一休讲数学系列”。

首先,我在 NotebookLM 中新建了一个笔记(Notebook),并且上传了一份关于分数讲解的 PDF 文档。

然后在右侧为幻灯片添加了自定义提示词。

提示词如下:

针对小学三年级的小朋友,生成一个“一休讲数学“系列的绘本,根据知识库内容帮我设计一些有挑战和趣味的情节,保证人物形象的一致性。

然后就是耐心的等待,大概几分钟后,一个完整的知识点讲解绘本就生成了(共 16 页)。

下面是选择的其中几幅,效果也很不错:

特别注意:对于这种知识点讲解的图片生成,一定要注意生成的内容正确性,虽然生成的图从美观,包括对内容的理解,都挺不错,但仍然会有不少事实性的知识错误,一定要小心!

二、Gemini 3 - 人人都是开发者

首先来看一份关于 Gemini 3 的基准测试报告结果,从推理、数学、多模型理解、长上下文处理能力以及多语言处理这 5 个方面来看,Gemini 3 基本上都排到了第一名,有些甚至是碾压式的。

尽管测试本身无法反映出准备的实际价值,但它仍然是衡量不同模型质量的重要途径之一。

比如下面这张图,是其中关于推理这一块的测试结果。可以看到, Gemini 3 Deep Think 在三种类型的推理测试上都是第一名。

其它测试结果就不展示了,感兴趣的大家可以通过文章最后的链接去查看全部测试结果。

使用 Gemini 3 也有三种渠道。

我们今天只会用前两种。而且主要集中自己创建可交互应用和工具,而不是简单的文字问答。

1. 知识点测试

Canvas 是 Gemini 中的全新交互空间,旨在让创作、打磨和分享作品变得轻松便捷。只需在提示栏中选择”Canvas”,即可实时书写和编辑文档或代码,所有修改都会即时呈现。

如果把 Canvas 用好,可以做很多意思的事情。

下面这个例子是真实的,女儿 12 月要去考 GESP C++ 二级,为此,我 上传了一份二级相关的知识点及典型题资料,在 Gemini 中让它帮我生成一份可交互、带验证的测试,直接就可以做了。

操作很简单,分三步:

  1. 通过下方的选项卡切换到 Canvas 模式
  2. 上传相关的复习内容资料
  3. 按下面的提示语,让 Gemini 帮我生成测试

提示词:

根据上传的资料,帮我创建一个测验挑战,使学习更具趣味性

![[testing.gif]]

2. 算法可视化交互

对编程和算法不太了解也没关系,这里只是一个示例呈现,了解对于这种比较复杂的可视化也可以快速实现即可。

这也是一个真实的示例,我平时在带一些孩子学习算法,正好最近讲到 DFS(深度优先搜索算法)这一块,以前讲到这里我一般是通过手动画图的方式来呈现整理搜索的过程,但这里面涉及到递归调用、回溯以及访问状态的观测,我自己去画也很麻烦,而且并不太直观。

想着用 Gemini 做一个测试,也没料到效果比想像的更好。一个流程把上面我想的几块全动态呈现出来了。

这次使用的是 Google AI Studio,这是 Google 出的一个基于浏览器的集成开发环境,让你可以选择不同的模型去快速尝试并生成应用。

使用的是 Gemini 3 Pro Preview 模型。整个过程只用两轮会话(用了两次提示语)。

第一次提示语:

帮我用 SVG 绘制一个演示二叉树深度优先搜索算法的动画

一次得到的结果已很好了,因为前面没指定界面用中文呈现,所以界面上的文字全是英文,所以才增加了一轮会话。

第二次提示语:

将整个界面的文字内容更改为简体中文

在右侧就可以体验一个完整的交互式演示 DFS 算法的应用了。

![[dfs.gif]]

结语

学 AI,更是通过 AI 去学习。

当然,Gemini 3 和 Nano Banana Pro 能做的事远不止这里举的这些例子,这里只是借这些例子(基本上都是一两句提示语就可以搞定)让大家看到:

AI 已然如此强大,普通人想要做一个工具、一个小产品,或者仅仅是帮自己解决一个具体问题的路径,被彻底打通了

这次的分享比较碎片,但核心其实就一点:AI 正在把创造的权力,交还给每一个有想法,愿意去尝试的人

分享中演示到的很多例子,在以前都需要专业的设计师、程序员才能做出来,而现在,只要你愿意,每个人都可以是设计师,每个也都可以是程序员

面对这么快的技术迭代,焦虑是难免的,对抗焦虑的最好办法,就是去用它,把它们放到你的学习和工作流程中去,去解决你身边哪怕最小的一个问题。

【全文完】


广告时间

我建了一个相关的付费微信群,这个群大概会涉及到的一些内容:

感兴趣的可以单独加我上面的微信,麻烦备注 “申请入群”,期待更多有趣、深入的讨论!

注:为了保证社群交流的质量,设了一个门槛费用,99 元/人/永久!若介意,请勿扰!

另外,符合下面条件的,可申请折扣或免费加入:

  1. 在读学生,29 元/人
  2. 以前参加过我在竹白发起的针对小朋友的 dailyup 每日挑战的付费朋友,可免费加入
  3. 有其它正当理由,希望折扣或免费加入的朋友

上一篇
Martin Fowler 深度访谈:AI 是软件工程 40 年来的最大变局
下一篇
为什么在AI时代,你更应该坚持频繁地记录自己?