MD-This-Page
MD-This-Page convierte cualquier página web a Markdown legible con un clic: extrae el artículo principal, elimina ruido y exporta para lectura o IA.
¿Qué es MD-This-Page?
MD-This-Page es una extensión de navegador que extrae el contenido principal de un artículo o página web, elimina el desorden y convierte el resultado en Markdown bien formateado. Está dirigida a usuarios que necesitan contenido web en un formato más limpio y estructurado, particularmente para flujos de trabajo que envían contenido a modelos de lenguaje grandes (LLMs).
El propósito principal de la extensión es transformar «páginas web» (a menudo llenas de navegación, scripts, anuncios y HTML profundamente anidado) en «documentos listos para LLMs». Al centrarse en una estructura simplificada, ayuda a reducir el ruido de interfaces irrelevantes y elementos estándar, preservando elementos de contenido como encabezados y secciones.
Características principales
- Conversión con un clic desde el menú contextual o atajo de teclado (Alt+M) para convertir la página actual rápidamente.
- Extracción inteligente usando la biblioteca Mozilla’s Readability para aislar el artículo principal o contenido de la página web e ignorar anuncios, barras de navegación y elementos innecesarios.
- Pestaña de vista previa dedicada que abre una interfaz limpia para ver el Markdown extraído y refinarlo.
- Opciones de salida Markdown personalizables, incluyendo interruptores para quitar/mantener imágenes, quitar/mantener enlaces y mostrar/ocultar metadatos (título, autor, fecha).
- Generación de estructura del documento / mapa de página para producir una representación de la estructura del documento.
- Opciones de exportación como copiar al portapapeles, descargar como archivo .md y copiar como prompt para flujos de trabajo de IA.
Cómo usar MD-This-Page
- Instala la extensión desde los lanzamientos del repositorio, o compílala desde el código fuente.
- Abre cualquier página web (por ejemplo, una página de artículo).
- Haz clic derecho en la página y selecciona “.MD this page” del menú contextual (o usa Alt+M).
- Usa la pestaña de vista previa para revisar el Markdown extraído.
- Ajusta las configuraciones de salida según sea necesario (p. ej., imágenes, enlaces, metadatos) y exporta el Markdown mediante portapapeles, descarga .md o «copiar como prompt».
Casos de uso
- Preparar texto de artículos para un LLM: Convierte una página web de artículo en Markdown estructurado para que la extracción, resumen o P&R downstream obtenga una entrada más limpia que HTML crudo.
- Construir «documentos fuente» compactos para prompts: Usa la opción «copiar como prompt» para transferir el contenido convertido a flujos de trabajo de IA con menos ruido de diseño.
- Archivado de documentos o toma de notas: Exporta el resultado como archivo .md para almacenar versiones legibles de páginas web en un formato consistente.
- Revisión de contenido con fidelidad ajustable: Activa/desactiva imágenes, enlaces y metadatos para ajustar el nivel de detalle necesario para análisis o referencias.
- Navegación más rápida por páginas largas: Genera una estructura del documento / mapa de página para entender la organización de la página antes de extraerla o resumirla.
Preguntas frecuentes
-
¿Cómo decide MD-This-Page qué contenido mantener? Usa la biblioteca Mozilla’s Readability para aislar el contenido principal mientras ignora elementos como anuncios y navegación/u otras partes innecesarias de la página.
-
¿Qué formatos de entrada/salida soporta la extensión? Convierte páginas web en Markdown y soporta exportación mediante copiar al portapapeles, descargar como archivo .md y copiar como prompt.
-
¿Cómo convierto una página una vez instalada la extensión? Usa la entrada del menú contextual de clic derecho etiquetada como “.MD this page” o presiona Alt+M.
-
¿Puedo controlar qué aparece en el Markdown? Sí. La extensión ofrece interruptores para quitar/mantener imágenes, quitar/mantener enlaces y mostrar/ocultar metadatos (título, autor, fecha), junto con opciones para generar una estructura del documento/mapa de página.
-
¿Dónde puedo previsualizar el Markdown extraído? La extensión abre una pestaña de vista previa dedicada donde puedes ver y refinar el Markdown extraído.
Alternativas
- Herramientas o extensiones de extracción de contenido estilo Readability: También se centran en extraer texto principal de páginas web desordenadas. Pueden diferir por formato de salida; algunas producen texto plano o HTML limpio en lugar de Markdown.
- Convertidores «HTML a Markdown»: Los convertidores generales pueden traducir HTML a Markdown, pero típicamente no realizan aislamiento de contenido principal. Eso significa que puede quedar más navegación/elementos estándar en comparación con la extracción basada en Readability de MD-This-Page.
- Copia y pegado manual con limpieza: Algunos flujos de trabajo dependen de modos de lectura del navegador o selección manual seguida de formateo. Esto puede ser más controlado, pero suele ser menos «un clic» que MD-This-Page.
- Scripts de extracción del lado del desarrollador: Pipelines automatizados pueden obtener y analizar páginas web para crear documentos estructurados. Requieren configuración y mantenimiento, y pueden no ofrecer el mismo flujo de previsualización/exportación en el navegador.
Alternativas
AakarDev AI
AakarDev AI es una plataforma poderosa que simplifica el desarrollo de aplicaciones de IA con integración fluida de bases de datos vectoriales, permitiendo un despliegue y escalabilidad rápidos.
Nolain OCR
Nolain OCR es una solución avanzada de Reconocimiento Óptico de Caracteres diseñada para extraer texto y datos con precisión de diversos formatos de documentos, optimizando los flujos de trabajo de procesamiento de documentos.
BookAI.chat
BookAI te permite chatear con tus libros usando IA simplemente proporcionando el título y el autor.
skills-janitor
skills-janitor audita y registra el uso de tus habilidades de Claude Code, comparándolas con 9 acciones de slash y sin dependencias.
Jenni
Jenni es un espacio de escritura e investigación con IA para leer PDFs, redactar ensayos y generar citas en el texto en 2.6k+ estilos.
FeelFish
FeelFish AI Novel Writing Agent para PC ayuda a planificar personajes y escenarios, generar y editar capítulos y continuar tramas con consistencia.