PDF to Markdown Converter icon

PDF to Markdown Converter

PDF to Markdown Converter 将 PDF 文档转换为结构化 Markdown,适合浏览器用户、开发者和 AI agent 使用。支持浏览器内匿名转换,并提供 API 和托管 MCP 访问,便于自动化工作流。

PDF to Markdown Converter

PDF to Markdown Converter 的功能

PDF to Markdown Converter 是一项用于将 PDF 文档转换为干净、结构化 Markdown 的服务。它面向需要把结果直接粘贴到笔记、提示词或文档中的用户和 agent,而不是获得扁平的文本提取结果。

该产品通过 Chrome 扩展、基于浏览器的工作台、REST API 和托管 MCP 端点提供相同的转换引擎。这样一来,用户可以在浏览器中转换本地文件或 PDF URL,而开发者和 agent 可以通过带有 API 密钥的 HTTPS 自动化同一流程。

来源特别强调保留文档结构:标题、列表、阅读顺序、表格、公式、链接、脚注以及扫描 PDF 中的 OCR 文本。它还描述了图片处理选项,可根据工作流选择嵌入 base64 图片或轻量级占位符。

在运行层面,该服务使用带状态轮询的排队任务、结果下载和槽位清理。浏览器端支持匿名转换,而 API 和 MCP 访问则使用免费的 Google 账户生成 Bearer 密钥,用于付费或自动化用途。

核心功能

结构化 Markdown 输出

将 PDF 转换为保留标题、列表和阅读顺序的结构化 Markdown,而不是扁平的纯文本导出。浏览器应用、API 和托管 MCP 共用同一转换引擎。

表格保留

将表格提取为真正的 Markdown 表格,使列内容对人和下游工具都保持可读。产品强调保留文档结构,而不是把内容全部重排成纯文本。

富内容处理

尽可能保留公式、链接和脚注,并将图片嵌入为 base64 或替换为占位符。这让输出更适合编辑、审阅和 LLM 提示词使用。

扫描件 OCR

对扫描件和纯图像 PDF 运行 OCR,包括西里尔文,因此非文本文档也能转换为可选中的 Markdown。用户在需要时可以强制启用 OCR。

多种接入方式

通过多个入口使用:Chrome 扩展、网页应用、REST API 和托管 MCP。扩展和网页应用可匿名使用,而 API 和 MCP 使用 Bearer API 密钥。

可预测的任务生命周期

创建任务、轮询状态、获取 Markdown,然后在完成后删除任务。付费层级还支持 webhook 和批量创建,适合自动化工作流。

常见用法

  • 在浏览器中手动转换

    使用 Chrome 扩展或网页应用将 PDF 转换为 Markdown,然后粘贴到笔记、文档或编辑器中。当用户只想快速完成转换而不需要集成时,这是最合适的方式。

  • 程序化 PDF 处理

    当你需要在自己的应用或脚本中完成转换时,可将 PDF URL 或上传字节发送到 REST API。文档化流程是创建任务、轮询状态、下载 Markdown,以及清理槽位。

  • agent 工具集成

    当你希望把转换作为 MCP 兼容工作流中的一个工具时,可通过托管 MCP 端点连接 agent。托管 MCP 使用与 API 相同的底层限制和生命周期。

  • 扫描文档的 OCR 清理

    转换需要先进行 OCR 的扫描件或图片占比较高的 PDF,以便它们在下游工具中可用。产品强调为扫描文档提供可选中的 Markdown 输出,包括西里尔文文本。

  • LLM 与知识工作输入

    将 PDF 内容整理为适合 LLM 提示词、RAG 流水线或知识库的输入,这些场景通常比原始 PDF 文本更适合结构化 Markdown。产品明确将其输出定位为可用于 ChatGPT、Claude、Notion、Obsidian、GitHub 及类似工作流。

Pros and Cons

Pros

  • 保留标题、列表、表格、公式、链接和脚注等结构。
  • 支持对扫描件或纯图像 PDF 进行 OCR,包括西里尔文。
  • 可通过浏览器、API 和托管 MCP 访问。
  • 浏览器内可匿名转换,无需注册。
  • 付费层级增加更多容量、保留期、webhook 和队列优先级。

Cons

  • 来源未显示对非 PDF 输入格式的支持。
  • 免费使用在文件大小、活动槽位和文档处理时间方面有较严格的限制。
  • 长文档如果超出时间预算,可能只返回部分内容,并被标记为截断。

FAQ

转换 PDF 需要账户吗?

不需要。Chrome 扩展和网页应用可匿名用于日常转换。如果你想使用 API 密钥、托管 MCP 或付费方案,则只需要一个免费的 Google 账户。

API 密钥如何使用?

使用 Google 登录,生成 API 密钥,然后通过 HTTPS 以 Bearer token 的形式发送。该密钥需要妥善保管,之后也可以撤销。

什么是托管 MCP?

托管 MCP 是一个受管理的 Model Context Protocol 端点,可将转换流程以 agent 工具的形式暴露出来。它被描述为对同一 REST API 的轻量封装,因此遵循相同的槽位、限制和保留规则。

付费方案增加了什么?

付费方案会增加更多槽位、更大的文件限制、更长的文档处理时间预算、更长的保留期、webhook、批量创建和更高的队列优先级。

支持哪些文件类型和输出?

该服务支持将 PDF 转换为 Markdown。来源强调了对扫描件的 OCR、真实的 Markdown 表格、公式、图片、链接和脚注,但没有说明支持其他输入格式。

Quick Facts

类别
PDF 转换 / 开发者工具
平台
Chrome 扩展、网页应用、REST API、托管 MCP
主要输出
干净的 Markdown
身份验证
浏览器内匿名;API 和 MCP 使用 Bearer API 密钥
来源域名
pdf2md.huskyhaul.online
典型工作流
创建任务,等待就绪,获取 Markdown,然后删除槽位