UStackUStack
MD-This-Page icon

MD-This-Page

MD-This-Page одним кликом конвертирует любую веб-страницу в чистый Markdown: извлекает основную статью, убирает лишнее и экспортирует для чтения и AI-процессов.

MD-This-Page

Что такое MD-This-Page?

MD-This-Page — это расширение для браузера, которое извлекает основное содержимое статьи или веб-страницы, убирает лишнее и преобразует результат в хорошо отформатированный Markdown. Оно ориентировано на пользователей, которым нужен веб-контент в более чистом, структурированном формате — особенно для рабочих процессов, передающих контент в большие языковые модели (LLM).

Основная цель расширения — превращать «веб-страницы» (часто заполненные навигацией, скриптами, рекламой и глубоко вложенным HTML) в «документы, готовые для LLM». Сосредоточившись на упрощённой структуре, оно помогает уменьшить шум от нерелевантных элементов UI и шаблонного кода, сохраняя при этом такие элементы контента, как заголовки и разделы.

Ключевые возможности

  • Конвертация одним кликом из контекстного меню или горячей клавишей (Alt+M) для быстрого преобразования текущей страницы.
  • Умная экстракция с использованием библиотеки Mozilla’s Readability для выделения основной статьи или содержимого веб-страницы и игнорирования рекламы, навигационных панелей и ненужных элементов.
  • Выделенная вкладка предварительного просмотра, которая открывает чистый интерфейс для просмотра извлечённого Markdown и его доработки.
  • Настраиваемые опции вывода Markdown, включая переключатели для удаления/сохранения изображений, удаления/сохранения ссылок и показа/скрытия метаданных (заголовок, автор, дата).
  • Генерация структуры документа / карты страницы для создания представления о структуре документа.
  • Опции экспорта, такие как копирование в буфер обмена, скачивание как .md-файл и копирование как промпт для AI-процессов.

Как использовать MD-This-Page

  1. Установите расширение из релизов репозитория или соберите из исходного кода.
  2. Откройте любую веб-страницу (например, страницу статьи).
  3. Щёлкните правой кнопкой мыши по странице и выберите “.MD this page” в контекстном меню (или нажмите Alt+M).
  4. Используйте вкладку предварительного просмотра, чтобы проверить извлечённый Markdown.
  5. При необходимости настройте параметры вывода (например, изображения, ссылки, метаданные) и экспортируйте Markdown через буфер обмена, скачивание .md или «копирование как промпт».

Сценарии использования

  • Подготовка текста статьи для LLM: Преобразуйте веб-страницу статьи в структурированный Markdown, чтобы последующая экстракция, суммаризация или Q&A получали более чистый ввод по сравнению с сырым HTML.
  • Создание компактных «исходных документов» для промптов: Используйте опцию «copy as a prompt» для передачи преобразованного контента в AI-процессы с меньшим шумом от верстки.
  • Архивация документов или ведение заметок: Экспортируйте результат как .md-файл для хранения читаемых версий веб-страниц в единообразном формате.
  • Просмотр контента с регулируемой детализацией: Переключайте изображения, ссылки и метаданные, чтобы соответствовать нужному уровню детализации для анализа или ссылок.
  • Быстрая навигация по длинным страницам: Генерируйте структуру документа / карту страницы, чтобы понять организацию страницы перед экстракцией или суммаризацией.

Часто задаваемые вопросы

  • Как MD-This-Page определяет, какой контент сохранять?

    Оно использует библиотеку Mozilla’s Readability для выделения основного контента, игнорируя такие элементы, как реклама и навигация/другие ненужные части страницы.

  • Какие форматы ввода/вывода поддерживает расширение?

    Оно преобразует веб-страницы в Markdown и поддерживает экспорт через копирование в буфер обмена, скачивание как .md-файл и копирование как промпт.

  • Как преобразовать страницу после установки расширения?

    Используйте пункт контекстного меню по правому клику, помеченный как “.MD this page”, или нажмите Alt+M.

  • Могу ли я контролировать, что появляется в Markdown?

    Да. Расширение предоставляет переключатели для удаления/сохранения изображений, удаления/сохранения ссылок и показа/скрытия метаданных (заголовок, автор, дата), а также опции для генерации структуры документа/карты страницы.

  • Где можно просмотреть извлечённый Markdown?

    Расширение открывает выделенную вкладку предварительного просмотра, где можно просмотреть и доработать извлечённый Markdown.

Альтернативы

  • Инструменты или расширения для экстракции контента в стиле Readability: Они тоже фокусируются на извлечении основного текста страницы из загромождённых веб-страниц. Они могут отличаться форматом вывода; некоторые производят обычный текст или очищенный HTML вместо Markdown.
  • Конвертеры «HTML в Markdown»: Общие конвертеры могут переводить HTML в Markdown, но обычно не выполняют изоляцию основного контента. Это значит, что больше навигации/шаблонного кода может остаться по сравнению с экстракцией MD-This-Page на базе Readability.
  • Ручное копирование-вставка с очисткой: Некоторые процессы полагаются на режимы чтения браузера или ручной выбор с последующим форматированием. Это может быть более контролируемым, но обычно менее удобным, чем один клик в MD-This-Page.
  • Скрипты экстракции на стороне разработчика: Автоматизированные пайплайны могут загружать и парсить веб-страницы для создания структурированных документов. Они требуют настройки и поддержки и могут не предоставлять такой же поток предварительного просмотра/экспорта в браузере.

Альтернативы

AakarDev AI icon

AakarDev AI

AakarDev AI — это мощная платформа, которая упрощает разработку приложений ИИ с бесшовной интеграцией векторных баз данных, позволяя быстрое развертывание и масштабируемость.

Nolain OCR icon

Nolain OCR

Nolain OCR — это передовое решение оптического распознавания символов, предназначенное для точного извлечения текста и данных из различных форматов документов, оптимизирующее рабочие процессы обработки документов.

BookAI.chat icon

BookAI.chat

BookAI позволяет вам общаться с вашими книгами, просто предоставив название и автора.

skills-janitor icon

skills-janitor

skills-janitor для Claude Code: аудит и учет навыков, сравнение с девятью командами /janitor-* и поиск дублей без зависимостей.

Jenni icon

Jenni

Jenni — AI-рабочее пространство для чтения PDF, черновиков эссе и статей, а также генерации внутритекстовых ссылок в 2,6k+ стилях.

FeelFish icon

FeelFish

FeelFish AI Novel Writing Agent — клиент для ПК: планируйте персонажей и мир, генерируйте и редактируйте главы, продолжайте сюжет с сохранением контекста.

MD-This-Page | UStack