MD-This-Page
MD-This-Pageで任意のWebページをワンクリックで読みやすいMarkdownに変換。本文抽出で無駄を除き、AIワークフローにも対応。
MD-This-Pageとは?
MD-This-Pageは、記事やWebページの本文を抽出して不要な要素を除去し、整形されたMarkdownに変換するブラウザ拡張機能です。Webコンテンツをよりクリーンで構造化された形式で必要とするユーザー向け、特に大規模言語モデル(LLM)へコンテンツを送信するワークフローに適しています。
拡張機能の主な目的は、「Webページ」(ナビゲーション、スクリプト、広告、複雑なHTMLで埋め尽くされたもの)を「LLM対応ドキュメント」に変換することです。簡素化された構造に焦点を当てることで、無関係なUIや定型文のノイズを減らし、見出しやセクションなどのコンテンツ要素を保持します。
主な機能
- **コンテキストメニューまたはキーボードショートカット(Alt+M)**でワンクリック変換し、現在のページを素早く変換。
- MozillaのReadabilityライブラリを使ったスマート抽出で、本文を分離し、広告、ナビゲーションバー、不必要な要素を無視。
- 専用プレビュータブで抽出されたMarkdownをクリーンなインターフェースで確認・調整。
- カスタマイズ可能なMarkdown出力オプション:画像の削除/保持、リンクの削除/保持、メタデータ(タイトル、著者、日付)の表示/非表示のトグル。
- ドキュメント構造/ページマップ生成でドキュメントの構造表現を作成。
- エクスポートオプション:クリップボードにコピー、.mdファイルとしてダウンロード、プロンプトとしてコピー(AIワークフロー用)。
MD-This-Pageの使い方
- リポジトリのリリースから拡張機能をインストール、またはソースからビルド。
- 任意のWebページ(例: 記事ページ)を開く。
- ページを右クリックし、コンテキストメニューから**“.MD this page”を選択(またはAlt+M**)。
- プレビュータブで抽出されたMarkdownを確認。
- 必要に応じて出力設定(例: 画像、リンク、メタデータ)を調整し、クリップボード、.mdダウンロード、または「プロンプトとしてコピー」でMarkdownをエクスポート。
ユースケース
- LLM向け記事テキストの準備:記事ページを構造化Markdownに変換し、下流の抽出、要約、Q&Aで生HTMLよりクリーンな入力に。
- プロンプト用コンパクトな「ソースドキュメント」構築:「プロンプトとしてコピー」オプションでレイアウトノイズを減らしてAIワークフローに転送。
- ドキュメントアーカイブやノート取り:結果を**.mdファイル**としてエクスポートし、Webページの読みやすいバージョンを一貫した形式で保存。
- 調整可能な詳細度でのコンテンツレビュー:画像、リンク、メタデータをトグルして、分析や参照に必要な詳細度に調整。
- 長ページの高速ナビゲーション:ドキュメント構造/ページマップを生成して、抽出や要約前にページの構成を把握。
FAQ
-
MD-This-Pageはどのコンテンツを保持するかをどう判断する? MozillaのReadabilityライブラリを使い、本文を分離して広告やナビゲーション/その他の不要なページ要素を無視。
-
拡張機能がサポートする入出力形式は? WebページをMarkdownに変換し、クリップボードにコピー、.mdファイルとしてダウンロード、プロンプトとしてコピーでエクスポート可能。
-
インストール後、ページをどう変換する? 右クリックコンテキストメニューの**“.MD this page”を選択、またはAlt+M**を押す。
-
Markdownの内容を制御できる? はい。画像の削除/保持、リンクの削除/保持、メタデータ(タイトル、著者、日付)の表示/非表示のトグルやドキュメント構造/ページマップ生成オプションあり。
-
抽出Markdownをどこでプレビューできる? 拡張機能が専用プレビュータブを開き、抽出Markdownを確認・調整可能。
代替手段
- Readabilityスタイルのコンテンツ抽出ツールや拡張機能:これらも散らかったWebページから本文を抽出。出力形式が異なり、一部はMarkdownではなくプレーンテキストやクリーンHTMLを出力。
- 「HTML to Markdown」コンバーター:一般的なコンバーターはHTMLをMarkdownに変換するが、本文分離は行わず、MD-This-PageのReadabilityベース抽出に比べてナビゲーション/定型文が残りやすい。
- 手動コピー&ペーストによるクリーニング:ブラウザの読取モードや手動選択後の整形に依存。制御性が高いが、MD-This-Pageよりワンクリック性が低い。
- 開発者側抽出スクリプト:自動パイプラインでWebページを取得・解析して構造化ドキュメント作成。セットアップとメンテナンスが必要で、ブラウザ内プレビュー/エクスポートフローがない場合あり。
代替品
AakarDev AI
AakarDev AIは、シームレスなベクターデータベース統合を通じてAIアプリケーションの開発を簡素化し、迅速な展開とスケーラビリティを実現する強力なプラットフォームです。
Nolain OCR
Nolain OCRは、さまざまなドキュメント形式からテキストとデータを正確に抽出するように設計された高度な光学文字認識ソリューションであり、ドキュメント処理ワークフローを合理化します。
BookAI.chat
BookAIは、書名と著者を提供するだけで、AIを使って本とチャットできるサービスです。
skills-janitor
skills-janitorでClaude Codeのスキルを監査・使用状況を追跡し、9つの/コマンドと比較。重複や不備もチェック。依存なし。
Jenni
JenniはAI研究・学術執筆ワークスペース。PDFを読み取り、論文作成を支援し、2,600超の引用スタイルで本文引用を生成。
FeelFish
FeelFish AI Novel Writing Agentは、PCで小説制作を支援。登場人物・設定計画、章生成/編集、文脈管理でプロットを継続します。