什么是 MD-This-Page?
MD-This-Page 是一个浏览器扩展,它提取文章或网页的主要内容,去除干扰元素,并将结果转换为格式良好的 Markdown。它针对需要将网页内容转为更干净、结构化格式的用户——特别是用于发送内容到大语言模型 (LLMs) 的工作流。
该扩展的核心目的是将“网页”(通常充斥导航、脚本、广告和深度嵌套 HTML)转为“LLM 就绪文档”。通过聚焦简化结构,它有助于减少无关 UI 和样板代码的噪音,同时保留标题和章节等内容元素。
主要功能
- 一键转换:通过上下文菜单或键盘快捷键 (Alt+M) 快速转换当前页面。
- 智能提取,使用 Mozilla 的 Readability 库,隔离主要文章或网页内容,忽略广告、导航栏和不必要元素。
- 专用预览标签页,打开干净界面查看提取的 Markdown 并进行优化。
- 可自定义 Markdown 输出选项,包括切换 移除/保留图片、移除/保留链接,以及 显示/隐藏元数据(标题、作者、日期)。
- 文档结构 / 页面地图生成,生成文档结构的表示。
- 导出选项,如 复制到剪贴板、下载为 .md 文件,以及 复制为提示 用于 AI 工作流。
如何使用 MD-This-Page
- 安装扩展,从仓库的 releases 下载,或从源代码构建。
- 打开任意网页(例如,文章页面)。
- 右键点击页面,从上下文菜单选择 “.MD this page”(或使用 Alt+M)。
- 使用 预览标签页 检查提取的 Markdown。
- 根据需要调整输出设置(例如,图片、链接、元数据),通过剪贴板、.md 下载或“复制为提示”导出 Markdown。
使用场景
- 为 LLM 准备文章文本:将文章网页转换为结构化 Markdown,使下游提取、摘要或问答获得比原始 HTML 更干净的输入。
- 为提示构建紧凑“源文档”:使用“复制为提示”选项,将转换内容传输到 AI 工作流,减少布局噪音。
- 文档归档或笔记记录:导出为 .md 文件,以一致格式存储网页的可读版本。
- 可调节保真度的内容审查:切换 图片、链接 和 元数据,匹配分析或引用所需的细节级别。
- 长页面更快导航:生成 文档结构 / 页面地图,在提取或摘要前了解页面组织。
常见问题
-
MD-This-Page 如何决定保留哪些内容? 它使用 Mozilla 的 Readability 库隔离主要内容,同时忽略广告、导航和其他不必要页面元素。
-
扩展支持哪些输入/输出格式? 它将网页转换为 Markdown,支持通过 复制到剪贴板、下载为 .md 文件 和 复制为提示 导出。
-
安装扩展后如何转换页面? 使用右键上下文菜单中的 “.MD this page” 条目,或按 Alt+M。
-
我能控制 Markdown 中的内容吗? 可以。扩展提供切换 移除/保留图片、移除/保留链接 和 显示/隐藏元数据(标题、作者、日期)的选项,以及生成 文档结构/页面地图 的功能。
-
在哪里预览提取的 Markdown? 扩展打开 专用预览标签页,您可以在其中查看和优化提取的 Markdown。
替代方案
- Readability 风格的内容提取工具或扩展:这些也专注于从杂乱网页提取主要文本。它们可能在输出格式上不同;有些生成纯文本或清理后的 HTML 而非 Markdown。
- “HTML to Markdown” 转换器:通用转换器可将 HTML 转为 Markdown,但通常不进行主要内容隔离。这意味着相比 MD-This-Page 基于 Readability 的提取,可能保留更多导航/样板代码。
- 手动复制粘贴并清理:某些工作流依赖浏览器阅读模式或手动选择后格式化。这可能更可控,但通常不如 MD-This-Page 一键便捷。
- 开发者端提取脚本:自动化管道可获取并解析网页创建结构化文档。这些需要设置和维护,且可能无法提供相同的浏览器内预览/导出流程。
替代品
AakarDev AI
AakarDev AI 是一个强大的平台,通过无缝的向量数据库集成简化 AI 应用程序的开发,实现快速部署和可扩展性。
Nolain OCR
Nolain OCR 是一款先进的光学字符识别解决方案,旨在从各种文档格式中准确提取文本和数据,从而简化文档处理工作流程。
BookAI.chat
BookAI允许您通过简单提供书名和作者与您的书籍进行AI聊天。
skills-janitor
skills-janitor 插件用于审计和跟踪 Claude Code 技能使用情况,并与九个聚焦的斜杠命令进行对比,零依赖。
Jenni
Jenni 是 AI 学术写作与研究工作区:阅读 PDF、写作与编辑论文,并以 2.6k+ 引用格式生成文内引注。
FeelFish
FeelFish AI 小说写作助手PC客户端,支持人物与设定规划、章节生成与编辑,并凭上下文一致性续写剧情。