MD-This-Page
MD-This-Page convertit n’importe quelle page web en Markdown lisible en un clic : extraction du contenu principal, suppression du superflu, export pour lecture ou workflows AI.
Qu’est-ce que MD-This-Page ?
MD-This-Page est une extension de navigateur qui extrait le contenu principal d’un article ou d’une page web, supprime le superflu et convertit le résultat en Markdown bien formaté. Elle cible les utilisateurs qui ont besoin de contenu web dans un format plus propre et structuré — particulièrement pour des workflows qui envoient le contenu à des grands modèles de langage (LLM).
L’objectif principal de l’extension est de transformer les « pages web » (souvent remplies de navigation, scripts, publicités et HTML profondément imbriqué) en « documents prêts pour les LLM ». En se concentrant sur une structure simplifiée, elle réduit le bruit des éléments UI inutiles et du code boilerplate tout en préservant les éléments de contenu tels que les titres et sections.
Fonctionnalités principales
- Conversion en un clic via le menu contextuel ou le raccourci clavier (Alt+M) pour convertir rapidement la page courante.
- Extraction intelligente à l’aide de la bibliothèque Mozilla’s Readability pour isoler le contenu principal de l’article ou de la page web et ignorer les publicités, barres de navigation et éléments inutiles.
- Onglet de prévisualisation dédié qui ouvre une interface propre pour visualiser le Markdown extrait et l’affiner.
- Options de sortie Markdown personnalisables, incluant des interrupteurs pour supprimer/conserver les images, supprimer/conserver les liens, et afficher/masquer les métadonnées (titre, auteur, date).
- Génération de structure de document / carte de page pour produire une représentation de la structure du document.
- Options d’exportation telles que copier dans le presse-papiers, télécharger en fichier .md, et copier comme invite pour les workflows AI.
Comment utiliser MD-This-Page
- Installez l’extension depuis les releases du dépôt, ou compilez-la depuis la source.
- Ouvrez n’importe quelle page web (par exemple, une page d’article).
- Clic droit sur la page et sélectionnez «.MD this page» dans le menu contextuel (ou utilisez Alt+M).
- Utilisez l’onglet de prévisualisation pour examiner le Markdown extrait.
- Ajustez les paramètres de sortie si nécessaire (ex. : images, liens, métadonnées) et exportez le Markdown via presse-papiers, téléchargement .md ou « copier comme invite ».
Cas d’utilisation
- Préparation de texte d’article pour un LLM : Convertissez une page web d’article en Markdown structuré pour que l’extraction, la synthèse ou les Q&R en aval reçoivent un input plus propre que le HTML brut.
- Construction de « documents sources » compacts pour invites : Utilisez l’option « copier comme invite » pour transférer le contenu converti dans des workflows AI avec moins de bruit de mise en page.
- Archivage de documents ou prise de notes : Exportez le résultat en fichier .md pour stocker des versions lisibles de pages web dans un format cohérent.
- Révision de contenu avec fidélité ajustable : Activez/désactivez images, liens et métadonnées pour correspondre au niveau de détail nécessaire à l’analyse ou à la référence.
- Navigation plus rapide dans les longues pages : Générez une structure de document / carte de page pour comprendre l’organisation de la page avant de l’extraire ou de la résumer.
FAQ
-
Comment MD-This-Page décide-t-il du contenu à conserver ? Il utilise la bibliothèque Mozilla’s Readability pour isoler le contenu principal tout en ignorant les éléments tels que les publicités et la navigation/autres parties inutiles de la page.
-
Quels formats d’entrée/sortie l’extension prend-elle en charge ? Elle convertit les pages web en Markdown et prend en charge l’exportation via copier dans le presse-papiers, téléchargement en fichier .md, et copier comme invite.
-
Comment convertir une page une fois l’extension installée ? Utilisez l’entrée du menu contextuel en clic droit intitulée «.MD this page» ou appuyez sur Alt+M.
-
Puis-je contrôler ce qui apparaît dans le Markdown ? Oui. L’extension propose des interrupteurs pour supprimer/conserver les images, supprimer/conserver les liens, et afficher/masquer les métadonnées (titre, auteur, date), ainsi que des options pour générer une structure de document/carte de page.
-
Où puis-je prévisualiser le Markdown extrait ? L’extension ouvre un onglet de prévisualisation dédié où vous pouvez visualiser et affiner le Markdown extrait.
Alternatives
- Outils ou extensions d’extraction de contenu style Readability : Ceux-ci se concentrent aussi sur l’extraction du texte principal des pages web encombrées. Ils peuvent différer par le format de sortie ; certains produisent du texte brut ou du HTML nettoyé plutôt que du Markdown.
- Convertisseurs « HTML vers Markdown » : Les convertisseurs généraux peuvent traduire le HTML en Markdown, mais ils n’isolent généralement pas le contenu principal. Cela signifie que plus de navigation/boilerplate peut rester comparé à l’extraction basée sur Readability de MD-This-Page.
- Copier-coller manuel avec nettoyage : Certains workflows reposent sur les modes lecture du navigateur ou une sélection manuelle suivie d’un formatage. Cela peut être plus contrôlé mais généralement moins en un clic que MD-This-Page.
- Scripts d’extraction côté développeur : Les pipelines automatisés peuvent récupérer et analyser les pages web pour créer des documents structurés. Ils nécessitent une configuration et un entretien et ne fournissent peut-être pas le même flux de prévisualisation/exportation dans le navigateur.
Alternatives
AakarDev AI
AakarDev AI est une plateforme puissante qui simplifie le développement d'applications d'IA avec une intégration fluide des bases de données vectorielles, permettant un déploiement rapide et une évolutivité.
Nolain OCR
Nolain OCR est une solution de reconnaissance optique de caractères (OCR) avancée conçue pour extraire avec précision le texte et les données de divers formats de documents, rationalisant ainsi les flux de travail de traitement documentaire.
BookAI.chat
BookAI vous permet de discuter avec vos livres en utilisant l'IA en fournissant simplement le titre et l'auteur.
skills-janitor
skills-janitor audite, suit l’usage et compare vos compétences Claude Code avec neuf actions d’analyse par commandes slash, sans dépendances.
Jenni
Jenni est un espace de travail IA pour lire les PDF, rédiger des essais et générer des citations in-text dans 2,6k+ styles.
FeelFish
FeelFish AI Novel Writing Agent est un client PC pour auteurs : planifiez personnages et décors, générez et modifiez des chapitres, continuez avec cohérence.