MD-This-Page
MD-This-Page одним кликом конвертирует любую веб-страницу в чистый Markdown: извлекает основную статью, убирает лишнее и экспортирует для чтения и AI-процессов.
Что такое MD-This-Page?
MD-This-Page — это расширение для браузера, которое извлекает основное содержимое статьи или веб-страницы, убирает лишнее и преобразует результат в хорошо отформатированный Markdown. Оно ориентировано на пользователей, которым нужен веб-контент в более чистом, структурированном формате — особенно для рабочих процессов, передающих контент в большие языковые модели (LLM).
Основная цель расширения — превращать «веб-страницы» (часто заполненные навигацией, скриптами, рекламой и глубоко вложенным HTML) в «документы, готовые для LLM». Сосредоточившись на упрощённой структуре, оно помогает уменьшить шум от нерелевантных элементов UI и шаблонного кода, сохраняя при этом такие элементы контента, как заголовки и разделы.
Ключевые возможности
- Конвертация одним кликом из контекстного меню или горячей клавишей (Alt+M) для быстрого преобразования текущей страницы.
- Умная экстракция с использованием библиотеки Mozilla’s Readability для выделения основной статьи или содержимого веб-страницы и игнорирования рекламы, навигационных панелей и ненужных элементов.
- Выделенная вкладка предварительного просмотра, которая открывает чистый интерфейс для просмотра извлечённого Markdown и его доработки.
- Настраиваемые опции вывода Markdown, включая переключатели для удаления/сохранения изображений, удаления/сохранения ссылок и показа/скрытия метаданных (заголовок, автор, дата).
- Генерация структуры документа / карты страницы для создания представления о структуре документа.
- Опции экспорта, такие как копирование в буфер обмена, скачивание как .md-файл и копирование как промпт для AI-процессов.
Как использовать MD-This-Page
- Установите расширение из релизов репозитория или соберите из исходного кода.
- Откройте любую веб-страницу (например, страницу статьи).
- Щёлкните правой кнопкой мыши по странице и выберите “.MD this page” в контекстном меню (или нажмите Alt+M).
- Используйте вкладку предварительного просмотра, чтобы проверить извлечённый Markdown.
- При необходимости настройте параметры вывода (например, изображения, ссылки, метаданные) и экспортируйте Markdown через буфер обмена, скачивание .md или «копирование как промпт».
Сценарии использования
- Подготовка текста статьи для LLM: Преобразуйте веб-страницу статьи в структурированный Markdown, чтобы последующая экстракция, суммаризация или Q&A получали более чистый ввод по сравнению с сырым HTML.
- Создание компактных «исходных документов» для промптов: Используйте опцию «copy as a prompt» для передачи преобразованного контента в AI-процессы с меньшим шумом от верстки.
- Архивация документов или ведение заметок: Экспортируйте результат как .md-файл для хранения читаемых версий веб-страниц в единообразном формате.
- Просмотр контента с регулируемой детализацией: Переключайте изображения, ссылки и метаданные, чтобы соответствовать нужному уровню детализации для анализа или ссылок.
- Быстрая навигация по длинным страницам: Генерируйте структуру документа / карту страницы, чтобы понять организацию страницы перед экстракцией или суммаризацией.
Часто задаваемые вопросы
-
Как MD-This-Page определяет, какой контент сохранять?
Оно использует библиотеку Mozilla’s Readability для выделения основного контента, игнорируя такие элементы, как реклама и навигация/другие ненужные части страницы.
-
Какие форматы ввода/вывода поддерживает расширение?
Оно преобразует веб-страницы в Markdown и поддерживает экспорт через копирование в буфер обмена, скачивание как .md-файл и копирование как промпт.
-
Как преобразовать страницу после установки расширения?
Используйте пункт контекстного меню по правому клику, помеченный как “.MD this page”, или нажмите Alt+M.
-
Могу ли я контролировать, что появляется в Markdown?
Да. Расширение предоставляет переключатели для удаления/сохранения изображений, удаления/сохранения ссылок и показа/скрытия метаданных (заголовок, автор, дата), а также опции для генерации структуры документа/карты страницы.
-
Где можно просмотреть извлечённый Markdown?
Расширение открывает выделенную вкладку предварительного просмотра, где можно просмотреть и доработать извлечённый Markdown.
Альтернативы
- Инструменты или расширения для экстракции контента в стиле Readability: Они тоже фокусируются на извлечении основного текста страницы из загромождённых веб-страниц. Они могут отличаться форматом вывода; некоторые производят обычный текст или очищенный HTML вместо Markdown.
- Конвертеры «HTML в Markdown»: Общие конвертеры могут переводить HTML в Markdown, но обычно не выполняют изоляцию основного контента. Это значит, что больше навигации/шаблонного кода может остаться по сравнению с экстракцией MD-This-Page на базе Readability.
- Ручное копирование-вставка с очисткой: Некоторые процессы полагаются на режимы чтения браузера или ручной выбор с последующим форматированием. Это может быть более контролируемым, но обычно менее удобным, чем один клик в MD-This-Page.
- Скрипты экстракции на стороне разработчика: Автоматизированные пайплайны могут загружать и парсить веб-страницы для создания структурированных документов. Они требуют настройки и поддержки и могут не предоставлять такой же поток предварительного просмотра/экспорта в браузере.
Альтернативы
AakarDev AI
AakarDev AI — это мощная платформа, которая упрощает разработку приложений ИИ с бесшовной интеграцией векторных баз данных, позволяя быстрое развертывание и масштабируемость.
Nolain OCR
Nolain OCR — это передовое решение оптического распознавания символов, предназначенное для точного извлечения текста и данных из различных форматов документов, оптимизирующее рабочие процессы обработки документов.
BookAI.chat
BookAI позволяет вам общаться с вашими книгами, просто предоставив название и автора.
skills-janitor
skills-janitor для Claude Code: аудит и учет навыков, сравнение с девятью командами /janitor-* и поиск дублей без зависимостей.
Jenni
Jenni — AI-рабочее пространство для чтения PDF, черновиков эссе и статей, а также генерации внутритекстовых ссылок в 2,6k+ стилях.
FeelFish
FeelFish AI Novel Writing Agent — клиент для ПК: планируйте персонажей и мир, генерируйте и редактируйте главы, продолжайте сюжет с сохранением контекста.