UStackUStack
MD-This-Page icon

MD-This-Page

MD-This-Page convierte cualquier página web a Markdown legible con un clic: extrae el artículo principal, elimina ruido y exporta para lectura o IA.

MD-This-Page

¿Qué es MD-This-Page?

MD-This-Page es una extensión de navegador que extrae el contenido principal de un artículo o página web, elimina el desorden y convierte el resultado en Markdown bien formateado. Está dirigida a usuarios que necesitan contenido web en un formato más limpio y estructurado, particularmente para flujos de trabajo que envían contenido a modelos de lenguaje grandes (LLMs).

El propósito principal de la extensión es transformar «páginas web» (a menudo llenas de navegación, scripts, anuncios y HTML profundamente anidado) en «documentos listos para LLMs». Al centrarse en una estructura simplificada, ayuda a reducir el ruido de interfaces irrelevantes y elementos estándar, preservando elementos de contenido como encabezados y secciones.

Características principales

  • Conversión con un clic desde el menú contextual o atajo de teclado (Alt+M) para convertir la página actual rápidamente.
  • Extracción inteligente usando la biblioteca Mozilla’s Readability para aislar el artículo principal o contenido de la página web e ignorar anuncios, barras de navegación y elementos innecesarios.
  • Pestaña de vista previa dedicada que abre una interfaz limpia para ver el Markdown extraído y refinarlo.
  • Opciones de salida Markdown personalizables, incluyendo interruptores para quitar/mantener imágenes, quitar/mantener enlaces y mostrar/ocultar metadatos (título, autor, fecha).
  • Generación de estructura del documento / mapa de página para producir una representación de la estructura del documento.
  • Opciones de exportación como copiar al portapapeles, descargar como archivo .md y copiar como prompt para flujos de trabajo de IA.

Cómo usar MD-This-Page

  1. Instala la extensión desde los lanzamientos del repositorio, o compílala desde el código fuente.
  2. Abre cualquier página web (por ejemplo, una página de artículo).
  3. Haz clic derecho en la página y selecciona “.MD this page” del menú contextual (o usa Alt+M).
  4. Usa la pestaña de vista previa para revisar el Markdown extraído.
  5. Ajusta las configuraciones de salida según sea necesario (p. ej., imágenes, enlaces, metadatos) y exporta el Markdown mediante portapapeles, descarga .md o «copiar como prompt».

Casos de uso

  • Preparar texto de artículos para un LLM: Convierte una página web de artículo en Markdown estructurado para que la extracción, resumen o P&R downstream obtenga una entrada más limpia que HTML crudo.
  • Construir «documentos fuente» compactos para prompts: Usa la opción «copiar como prompt» para transferir el contenido convertido a flujos de trabajo de IA con menos ruido de diseño.
  • Archivado de documentos o toma de notas: Exporta el resultado como archivo .md para almacenar versiones legibles de páginas web en un formato consistente.
  • Revisión de contenido con fidelidad ajustable: Activa/desactiva imágenes, enlaces y metadatos para ajustar el nivel de detalle necesario para análisis o referencias.
  • Navegación más rápida por páginas largas: Genera una estructura del documento / mapa de página para entender la organización de la página antes de extraerla o resumirla.

Preguntas frecuentes

  • ¿Cómo decide MD-This-Page qué contenido mantener? Usa la biblioteca Mozilla’s Readability para aislar el contenido principal mientras ignora elementos como anuncios y navegación/u otras partes innecesarias de la página.

  • ¿Qué formatos de entrada/salida soporta la extensión? Convierte páginas web en Markdown y soporta exportación mediante copiar al portapapeles, descargar como archivo .md y copiar como prompt.

  • ¿Cómo convierto una página una vez instalada la extensión? Usa la entrada del menú contextual de clic derecho etiquetada como “.MD this page” o presiona Alt+M.

  • ¿Puedo controlar qué aparece en el Markdown? Sí. La extensión ofrece interruptores para quitar/mantener imágenes, quitar/mantener enlaces y mostrar/ocultar metadatos (título, autor, fecha), junto con opciones para generar una estructura del documento/mapa de página.

  • ¿Dónde puedo previsualizar el Markdown extraído? La extensión abre una pestaña de vista previa dedicada donde puedes ver y refinar el Markdown extraído.

Alternativas

  • Herramientas o extensiones de extracción de contenido estilo Readability: También se centran en extraer texto principal de páginas web desordenadas. Pueden diferir por formato de salida; algunas producen texto plano o HTML limpio en lugar de Markdown.
  • Convertidores «HTML a Markdown»: Los convertidores generales pueden traducir HTML a Markdown, pero típicamente no realizan aislamiento de contenido principal. Eso significa que puede quedar más navegación/elementos estándar en comparación con la extracción basada en Readability de MD-This-Page.
  • Copia y pegado manual con limpieza: Algunos flujos de trabajo dependen de modos de lectura del navegador o selección manual seguida de formateo. Esto puede ser más controlado, pero suele ser menos «un clic» que MD-This-Page.
  • Scripts de extracción del lado del desarrollador: Pipelines automatizados pueden obtener y analizar páginas web para crear documentos estructurados. Requieren configuración y mantenimiento, y pueden no ofrecer el mismo flujo de previsualización/exportación en el navegador.
MD-This-Page | UStack