深度体验 Gemini 3 和 Nano Banana Pro

大家好，我是大圣不是圣。

Google 最近一周陆续发布了 Gemini 3 和 Nano Banana Pro，我也第一时间深度的测试和使用了，整个使用过程都是处在一种比较兴奋的状态，感叹 AI 太强大了。

这一次，门槛真的“消失”了。

于是昨天晚上在内部群临时做了一个关于 Gemini 3 与 Nano Banana Pro 的分享，没怎么准备，但一个小时能产出的内容还是让人惊艳。

把这次分享的核心内容整理出来，也希望能给你有一些启发。

Gemini 之前有 2.5 Pro，Nano Banana 也有 1.0，相关的资料在网上已经有很多了，因此这次分享更多是展现一些与之前不一样的功能使用情况。

一、Nano Banana Pro - 人人都设计师

当前要使用 Nano Banan Pro 有不少渠道，下面这三个是我用得比较多的，各有特色：

直接通过 Google Gemini 来使用
通过 Google NotebookLM 来使用
通过第三方集成了 Nano Banana Pro 的服务来使用，比如 Lovart

下面的例子这三个渠道都会用到。

个人感觉，这次 Nano Banana Pro 的升级，最大的亮点便是对中文的支持更加友好了，以前通过 Nano Banana 生成图，最大的痛点就是中文字的处理，生成的中文要么是错别字，要么是奇奇怪怪的像中文的符号。

这次 Google 终于把这个问题解决了。而且解决得比目前市面上的其它大模型都要好。

还是来看几个例子。

1. 配图翻译

之前下载或翻译一些国外的文章，里面的配图文章很不好处理，有了 Nano Banana Pro，简直不要太简单。

下面是我临时找的一张英文字配图，而且字比较多。

在 Gemini 中使用 Nano Banana Pro，上传这张图片，提示词很简单：

将图中的文字全部翻译成中文，重新输出这张图

直接看效果。

2. 信息图生成

再来看一个例子。我刚好在读一篇关于生成式 UI 的英文论文，希望将这篇论文的核心思想和流程转化为一幅白板信息图。

直接上传这篇论文的 PDF，使用工具：官方的 Gemini，提示词：

将这篇论文的内容，转化为一幅教学白板图像，包括：图表、箭头、方框和说明核心思想的标题。同时使用不同颜色文字来做区分。图中的文字使用简体中文。

下面是输出的效果，也出奇的好。

3. 配图生成

这也是一个比较常见的应用场景，为博客文章配图，下面是我拿自己以前写过的一篇文章做的测试。

使用工具：lovart，提示词超级简单：

根据下面的文字内容生成合适的配图

{文章内容}

除了提示词，我还垫了一张我自己喜欢风格的图作为参考。

生成的效果也挺满意的，下面是其中一张。

注意，直接在 Gemini 生成也没问题呢，这次只是多介绍一个使用渠道。

4. 知识绘本生成

这次我们在 NotebookLM 中使用。

NotebookLM 是一个 AI 知识库管理工具，也是 Google 的产品，你可以方便的通过各种来源上传资料（包括 PDF、网站、YouTube 视频、音频等），然后可以利用 Gemini 大模型的超强理解能力，让这些资料成为你的研究与思考伙伴。

在 NotebookLM 中，涉及到图片的部分也升级为了 Nano Banana Pro，因此我们也可以直接利用 Nano Banana Pro 的能力，尤其在生成 Slide（幻灯片）这部分。

通过自定义提示词，可以让幻灯片发挥出超越普通幻灯片的能力，比如接下来这个“一休讲数学系列”。

首先，我在 NotebookLM 中新建了一个笔记（Notebook），并且上传了一份关于分数讲解的 PDF 文档。

然后在右侧为幻灯片添加了自定义提示词。

提示词如下：

针对小学三年级的小朋友，生成一个“一休讲数学“系列的绘本，根据知识库内容帮我设计一些有挑战和趣味的情节，保证人物形象的一致性。

然后就是耐心的等待，大概几分钟后，一个完整的知识点讲解绘本就生成了（共 16 页）。

下面是选择的其中几幅，效果也很不错：

特别注意：对于这种知识点讲解的图片生成，一定要注意生成的内容正确性，虽然生成的图从美观，包括对内容的理解，都挺不错，但仍然会有不少事实性的知识错误，一定要小心！

二、Gemini 3 - 人人都是开发者

首先来看一份关于 Gemini 3 的基准测试报告结果，从推理、数学、多模型理解、长上下文处理能力以及多语言处理这 5 个方面来看，Gemini 3 基本上都排到了第一名，有些甚至是碾压式的。

尽管测试本身无法反映出准备的实际价值，但它仍然是衡量不同模型质量的重要途径之一。

比如下面这张图，是其中关于推理这一块的测试结果。可以看到， Gemini 3 Deep Think 在三种类型的推理测试上都是第一名。

其它测试结果就不展示了，感兴趣的大家可以通过文章最后的链接去查看全部测试结果。

使用 Gemini 3 也有三种渠道。

官方 Gemini 站点
Google AI Studio
集成了 Gemini 3 的一些工具（如 Cursor）

我们今天只会用前两种。而且主要集中自己创建可交互应用和工具，而不是简单的文字问答。

1. 知识点测试

Canvas 是 Gemini 中的全新交互空间，旨在让创作、打磨和分享作品变得轻松便捷。只需在提示栏中选择”Canvas”，即可实时书写和编辑文档或代码，所有修改都会即时呈现。

如果把 Canvas 用好，可以做很多意思的事情。

下面这个例子是真实的，女儿 12 月要去考 GESP C++ 二级，为此，我上传了一份二级相关的知识点及典型题资料，在 Gemini 中让它帮我生成一份可交互、带验证的测试，直接就可以做了。

操作很简单，分三步：

通过下方的选项卡切换到 Canvas 模式
上传相关的复习内容资料
按下面的提示语，让 Gemini 帮我生成测试

提示词：

根据上传的资料，帮我创建一个测验挑战，使学习更具趣味性

2. 算法可视化交互

对编程和算法不太了解也没关系，这里只是一个示例呈现，了解对于这种比较复杂的可视化也可以快速实现即可。

这也是一个真实的示例，我平时在带一些孩子学习算法，正好最近讲到 DFS（深度优先搜索算法）这一块，以前讲到这里我一般是通过手动画图的方式来呈现整理搜索的过程，但这里面涉及到递归调用、回溯以及访问状态的观测，我自己去画也很麻烦，而且并不太直观。

想着用 Gemini 做一个测试，也没料到效果比想像的更好。一个流程把上面我想的几块全动态呈现出来了。

这次使用的是 Google AI Studio，这是 Google 出的一个基于浏览器的集成开发环境，让你可以选择不同的模型去快速尝试并生成应用。

使用的是 Gemini 3 Pro Preview 模型。整个过程只用两轮会话（用了两次提示语）。

第一次提示语：

帮我用 SVG 绘制一个演示二叉树深度优先搜索算法的动画

一次得到的结果已很好了，因为前面没指定界面用中文呈现，所以界面上的文字全是英文，所以才增加了一轮会话。

第二次提示语：

将整个界面的文字内容更改为简体中文

在右侧就可以体验一个完整的交互式演示 DFS 算法的应用了。

结语

学 AI，更是通过 AI 去学习。

当然，Gemini 3 和 Nano Banana Pro 能做的事远不止这里举的这些例子，这里只是借这些例子（基本上都是一两句提示语就可以搞定）让大家看到：

AI 已然如此强大，普通人想要做一个工具、一个小产品，或者仅仅是帮自己解决一个具体问题的路径，被彻底打通了。

这次的分享比较碎片，但核心其实就一点：AI 正在把创造的权力，交还给每一个有想法，愿意去尝试的人。

分享中演示到的很多例子，在以前都需要专业的设计师、程序员才能做出来，而现在，只要你愿意，每个人都可以是设计师，每个也都可以是程序员。

面对这么快的技术迭代，焦虑是难免的，对抗焦虑的最好办法，就是去用它，把它们放到你的学习和工作流程中去，去解决你身边哪怕最小的一个问题。

【全文完】

广告时间

我建了一个相关的付费微信群，这个群大概会涉及到的一些内容：

与 AI 相关的一手信息分享
围绕 AI 时代如何学习与创造的实践分享
不定时的直播分享
群友自由讨论交流

感兴趣的可以单独加我上面的微信，麻烦备注 “申请入群”，期待更多有趣、深入的讨论！

注：为了保证社群交流的质量，设了一个门槛费用，99 元/人/永久！若介意，请勿扰！

另外，符合下面条件的，可申请折扣或免费加入：

在读学生，29 元/人
以前参加过我在竹白发起的针对小朋友的 dailyup 每日挑战的付费朋友，可免费加入
有其它正当理由，希望折扣或免费加入的朋友