
之前有公众号的读者反馈说,我写的好多内容都偏方法论和理念比较多,能不能多写一点偏实操、实践性的文章。
当然可以,后面我会多写一点。
这次要介绍的是 Obsidian Web Clipper,一个浏览器插件,这个插件太好用了,对我来说,它已经不是一个简单的剪藏插件,而是我的知识库重要的数据入口之一了。
而且有很多有意思的用法,值得写专门一篇介绍的文章。
00
前言
相信大家或多或少都会用到过剪藏相关的插件,我们在网上,无论是读到一篇好文章,还是看到某个有价值的 YouTube 视频,我们往往都想把它存下来,希望以后会用到,这也是为什么有那么多剪藏插件的原因之一。
但大部分的剪藏方式都有一个致命的问题。他们虽然保存了内容,但这些内容没有结构化,很难真正进入到你的知识库,也很难被检索、被链接和复用。
对于这个问题,Obsidian 官方推出的 Web Clipper 提供了一种优雅的解决方案。
下面我一步一步来,尽可能把是什么(What)、为什么(Why)、怎么用(How)这三个点讲清楚。
注:作为数据输入的重要一环,大部分笔记相关的工具都有自己的剪藏插件,像 Notion Clipper, YouMind AI Web Clipper、Bear Web Clipper 等。
01
Web Clipper 是什么
Obsidian Web Clipper 是 Obsidian 官方推出的免费开源浏览器扩展。
它的核心能力可以用一句话概括:在浏览器里一键把网页内容转化为干净的 Markdown 文件并存入 Obsidian 知识库,直接解决了把外部信息变成 AI 可读、可检索、可复用的结构化输入问题。
当我看到一篇好的文章,使用 Web Clipper 扩展,可以几秒内自动完成下面几件事:
- 自动抓取主体内容(如果是 Youtube 视频,甚至可得到字幕文本)
- 通过预设的模板和 AI 预处理器,自动填入标题、来源,摘要、标签等元数据
- 把干净的 Markdown 文件,自动存入到我知识库预设的文件夹下面
- 进入知识库工作流程,等待下一步处理
02
从网页数据到Markdown文本
网页复制最大的痛点是什么?格式污染。
从网页复制的内容,往往会带着隐藏的 HTML 标签、奇怪的字符编码、不一致的标题层级。这些东西在你的 Markdown 文件中会变成一团乱麻。
Obsidian Web Clipper 内置了 Defuddle 工具,这是一个专门把 HTML 转为干净 Markdown 的解析引擎。
它做的事情是包括:
- 提取正文,过滤导航、广告、侧边栏
- 保留标题层级(h1/h2/h3 → #/##/###)
- 保留链接、图片、代码块
- 过滤掉所有无关的样式和脚本
最终产出的是一个干净得可以直接使用的 Markdown 文件。
而我们知道,干净、清洁的 Markdown 文本,对 AI 天然友好,是与 AI 协作的基础。
1. 一键转换并保存网页
安装好 Obsidian Web Clipper 扩展后,哪怕不做任何配置,一键点击插件图标,就可以将一个网页转换成干净的 Markdown 文件,并保存到 Obsidian 仓库。
2. Obsidian Reader 阅读模式
如果你安装了 Web Clipper,打开一个网页,按快捷键 Shift + Option + r 试试,立即可以得到一个非常干净的阅读页面,而且自动提取文章结构,帮你生成了内容目录。
实际上,这是 Web Clipper 内置的 Obsidian Reader 阅读模式,本质上也是使用的 Defuddle 进行了过滤处理,提升阅读体验。
不仅对普通的网页起作用,你在观看 YouTube 视频的时候,也可以打开阅读模式,不仅页面变得非常干净,甚至连字幕都提取出来了。

不得不说,就 Obsidian Reader 这一个功能,就值得你去下载安装这个浏览器扩展了。
3. 获取任何网页的 Markdown 文件
你甚至可以不用安装 Obsidian Web Clipper 扩展,直接使用官方提供的 Defuddle 把任何网页变成干净的 Markdown 文件。
最简单的使用方式是,在任何需要转换的网页地址前加上 defuddle.md,打开这个新的地址,就可以得到一份干净、结构化的 Markdown 文件了。
例如,Obsidian CEO Steph Ango 写的一篇文章,地址是:https://stephango.com/vault
在前面加上 defuddle.md,地址变为:https://defuddle.md/stephango.com/vault,打开后,直接得到了过滤转换后干净的 Markdown 内容。

然后你就可以直接复制 Markdown 内容,或者下载到本地。
简直太方便了,而且这个转换速度非常快。
之前在 Twitter 看到 Obsidian CEO 发的文章,他们为了这个转换速度,花了大量的时间来做优化,追求极致,感觉这也是 Obsidian 一贯的风格。
03
强大的自定义功能配置
默认情况下,Web Clipper 插件对转换后的 Markdown 文件已经提供了大量元数据的填入,比如文章的标题、来源、作者等等,也提供了默认的存储位置,默认是存储在当前打开的 Obsidian 仓库的 Clippings 目录下。
但我们真正在使用时,默认的配置很多时候没办法满足我们的需求。
比如说我希望根据文章的内容自动帮我打上标签,自动对文章做摘要或总结。我们也希望自定义存储的位置,这样在存储的时候就自动进入到我的知识库的处理流程当中去。
这些都没问题,Web Clipper 插件提供了非常强大的自定义配置功能,
1. AI 解释器配置
AI 解释器,让你在剪藏时可以调用大语言模型,对网页内容做一些额外处理,如:摘要、总结、要点提取,甚至翻译等等。
这个功能一下就把可用性拓宽了,剪藏就不是简单的“保存原文”,而是升级成了“保存原文 + 过滤处理 + 初步理解”。
Obsidian Web Clipper 并不限定你必须使用什么大模型,完全可以自由配置。
进入插件的设置页面,左侧点选 “解释器” 进入解释器配置页面,根据自己需要可以配置提供商和模型。

我个人目前配置了三个模型:
- 通过 OpenRouter 服务,配置了
gemini-3.1-flash-lite-preview模型。 - DeepSeek 官方的两个模型:
deepseek-v4-flash和deepseek-v4-pro

上面的模型都是通过 API 去使用的,使用时会产生费用,不同的模型的消耗费用也不同,这一点大家需要知道,通常从质量、速度、费用三个方面去综合权衡选择。
2. 自定义模板
实际上绝大部分的自定义功能都是通过模板来实现的。
安装好插件后,插件提供了一个默认的 Default 模板。刚开始大家可以自己去看一看这个模板下的各个配置项,对模板的基本功能有一个基本了解。
熟悉过后,你就可以自己新建模板来自定义各项功能了。
AI 解释器配合自定义模板才是真正释放 Obsidian Web Clipper 潜力的正确方式。
3. 我自己用的模板
我自己新建了 3 个模板,分别是
content,文章剪藏通用模板content-summary,带 AI 摘要的文章剪藏模板youtube,针对 YouTube 视频的剪藏模板
下面把这三个模板的具体配置内容分享给大家,仅供参考。
content 模板
主要用于保存博客、文档、公众号转载页、产品文章等普通网页。

这是个通用模板,保证了让每篇文章进来之后,都有来源、有状态、有后续处理入口。
content-summary 模板
主要用于一些阅读难度比较大,尤其是英文原文的内容。
这个模板方便我再回看剪藏内容时,可以快速理解文章核心要点,为下一步处理提供部分判断依据。

这里的模板设计,参考了 Nick Milo 使用的三层结构,我很喜欢:
- 摘要:5 秒知道大意
- 三个要点:15 秒看到重点
- 关键概念:通过人物、术语、概念,进一步了解内容
这个结构比简单的帮我总结一下更适合我的知识库流程。
youtube 模板
视频内容最大的问题是:信息密度高,但不容易引用。
如果只是收藏一个 YouTube 链接,其实没多大价值,因此我为 YouTube 视频单独提供了一个模板(这里 Web Clipper 提供的字幕获取功能作用也显现出来了)。

这样,一个视频就不再只是“看过”,而是变成了可以被搜索、引用、提炼的文本材料。
需要注意的是,上面 3 个模板,前面的属性字段部分是完全一致的,对我来说够用了,大家也可以根据自己的需要进行调整,比如说针对 youtube 视频,单独设定一些字段。
4. 其它配置说明
笔记存储位置
可以在设置 ⭢ 常规 ⭢ 保管库下面添加自己的仓库,可以添加多个仓库。

然后再模板编辑页面,可以选择剪藏的文章放在哪个仓库的哪个位置下。

属性变量使用
在上面截图中,笔记名称部分,可以看到一段有点复杂的设置:
clip_{{title|split:" "|join:"-"|lower}}
这是 Web Clipper 插件另一个有意思的地方,无论是剪藏的内容里面,还是文件名称,都支持预设的属性变量,可以通过属性变量预填充页面属性。
属性变量包括在花括号里,如 {{变量名}},内置的属性变量很多,大家可以下来自行查文档了解。
Web Clipper 除了支持属性变量,还支持通过 filters 去修改属性变量的值。
像上面那段稍微有点复杂的设置,作用是:对获取到的标题,如果中间有空格,会将空格替换为 - 短横线,然后统一转成小写字母,最后统一在前面加上 clip_。
举个例就明白了,我在剪藏文章时经常发现获取到的文章标题是这样的
My Vision A Forgotten History
从实践上来说,文件名含有空格不太好,而且我自己的习惯规范是文件名全小写,通过上面的简单处理,就会自动变成下面这样:
clip_my-vision-a-forgotten-history
完美实现了我的需求。
AI 解释器的应用
我们在前面配置了 AI 解释器,接下来就可以在模板当中来使用 AI 的功能了。
可以看到我前面三个模板里面都有用到 AI 的功能,比如说,让 AI 自动帮我从文章内容提取三个标签;让 AI 自动帮我总结摘要、关键要点等等。
比如说下面这张截图就是我使用 youtube 模板对一个 YouTube 视频 的剪藏。

操作的时候,注意下面三个部分。
- 选择剪藏的模板,这里选择的是
youtube - 选择存储的仓库,剪藏存储的路径
- 选择 AI 解释器,点击 “解释” 按钮进行 AI 处理
下面是剪藏并存储到我的 Obsidian 仓库后的内容效果。

可以看到 AI 解释器起了作用,帮我进行了视频摘要,提取了关键要点,甚至有对应的时间戳。
说明:这里我只挑了我自己比较常用的几个自定义功能配置来分享,Obsidian Web Clipper 支持的自定义功能远不止这些,大家可以去查看官方的文档,自己去探索一下,其实还有一些好玩的用法。
04
从收藏到进入知识库
一个好的输入系统,不能只追求快。它还要让信息在进入系统时,就有基本秩序,适配你自己的工作流程。
Web Clipper 太方便之后,会出现一个新问题:
什么都想剪。
这时候,知识库很容易变成另一个稍微高级一点的收藏夹。
为了解决这个问题,我自己的知识库中设定了一套简单的输入工作流。
1. 输入工作流
外部信息
↓
Web Clipper # 剪藏
↓
References # 参考资料池
↓
阅读与判断
↓
知识卡片
↓
文章 / 课程 / 项目 / 产品
在我的 Obsidian 仓库结构里,所有剪藏的内容都不会直接进入正式知识卡片区,而是先进入指定的文件夹:
05_References/01_Inbox/
这里是外部材料的暂存区。
等我阅读、判断、提炼之后,真正有价值的观点、概念、案例,才会进一步转换到知识卡片去:
04_Knowledge/00_Cards/
这个区分很重要。
因为“原文剪藏”和“知识卡片”不是一回事。
原文剪藏是材料。 知识卡片是经过理解、改写、连接之后的资产。
2. 剪藏内容状态
另外,每篇剪藏都会带一个 status 状态属性,共有四个状态:
inbox → reading → extracted → archived
- 每篇剪藏刚进来时状态是
inbox。 - 读过但还没处理,状态可以改成
reading。 - 已经提炼成卡片,状态改成
extracted,并自动归档到05_References下对应主题的文件夹中去。 - 不再需要处理,但可以留作参考,状态改成
archived。
这个状态属性看起来很小,但它解决了我的一个实实在在的问题:
你知道每篇材料现在处于哪里,知道哪些内容已经处理,哪些内容还欠着。
关键是,整个流程的流转,我们现在都可以通过 AI 来简化实现,你直接告诉 AI 就是。
比如,我可以直接问 AI:我的剪藏内容,有哪些待处理?
AI 会告诉我结果以及接下来的建议,因为剪藏的内容已经进入我的知识库工作流程里了

05
结语
我们经常会高估收藏的价值,但往往低估了输入秩序的价值。
收藏只是把信息放进某个地方。
输入秩序则是让信息进入你的系统之后,还能被理解、被找到、被连接、被重新使用。
Obsidian Web Clipper 最值得用的地方就在这里:
它帮你把外部世界的信息,变成个人知识系统可以处理的干净原材料。
经过简单配置,这些原材料还可以直接进入你的知识库工作流程。
只有这样,后面的思考、写作、课程设计和 AI 协作,才越有可能真正发生。
[全文完]
如果你对 AI 时代如何创作与学习 感兴趣
请添加下方微信,一起学习交流