UStackUStack
MD-This-Page icon

MD-This-Page

MD-This-Pageで任意のWebページをワンクリックで読みやすいMarkdownに変換。本文抽出で無駄を除き、AIワークフローにも対応。

MD-This-Page

MD-This-Pageとは?

MD-This-Pageは、記事やWebページの本文を抽出して不要な要素を除去し、整形されたMarkdownに変換するブラウザ拡張機能です。Webコンテンツをよりクリーンで構造化された形式で必要とするユーザー向け、特に大規模言語モデル(LLM)へコンテンツを送信するワークフローに適しています。

拡張機能の主な目的は、「Webページ」(ナビゲーション、スクリプト、広告、複雑なHTMLで埋め尽くされたもの)を「LLM対応ドキュメント」に変換することです。簡素化された構造に焦点を当てることで、無関係なUIや定型文のノイズを減らし、見出しやセクションなどのコンテンツ要素を保持します。

主な機能

  • **コンテキストメニューまたはキーボードショートカット(Alt+M)**でワンクリック変換し、現在のページを素早く変換。
  • MozillaのReadabilityライブラリを使ったスマート抽出で、本文を分離し、広告、ナビゲーションバー、不必要な要素を無視。
  • 専用プレビュータブで抽出されたMarkdownをクリーンなインターフェースで確認・調整。
  • カスタマイズ可能なMarkdown出力オプション画像の削除/保持リンクの削除/保持メタデータ(タイトル、著者、日付)の表示/非表示のトグル。
  • ドキュメント構造/ページマップ生成でドキュメントの構造表現を作成。
  • エクスポートオプションクリップボードにコピー.mdファイルとしてダウンロードプロンプトとしてコピー(AIワークフロー用)。

MD-This-Pageの使い方

  1. リポジトリのリリースから拡張機能をインストール、またはソースからビルド。
  2. 任意のWebページ(例: 記事ページ)を開く。
  3. ページを右クリックし、コンテキストメニューから**“.MD this page”を選択(またはAlt+M**)。
  4. プレビュータブで抽出されたMarkdownを確認。
  5. 必要に応じて出力設定(例: 画像、リンク、メタデータ)を調整し、クリップボード、.mdダウンロード、または「プロンプトとしてコピー」でMarkdownをエクスポート。

ユースケース

  • LLM向け記事テキストの準備:記事ページを構造化Markdownに変換し、下流の抽出、要約、Q&Aで生HTMLよりクリーンな入力に。
  • プロンプト用コンパクトな「ソースドキュメント」構築:「プロンプトとしてコピー」オプションでレイアウトノイズを減らしてAIワークフローに転送。
  • ドキュメントアーカイブやノート取り:結果を**.mdファイル**としてエクスポートし、Webページの読みやすいバージョンを一貫した形式で保存。
  • 調整可能な詳細度でのコンテンツレビュー画像リンクメタデータをトグルして、分析や参照に必要な詳細度に調整。
  • 長ページの高速ナビゲーションドキュメント構造/ページマップを生成して、抽出や要約前にページの構成を把握。

FAQ

  • MD-This-Pageはどのコンテンツを保持するかをどう判断する? MozillaのReadabilityライブラリを使い、本文を分離して広告やナビゲーション/その他の不要なページ要素を無視。

  • 拡張機能がサポートする入出力形式は? WebページをMarkdownに変換し、クリップボードにコピー.mdファイルとしてダウンロードプロンプトとしてコピーでエクスポート可能。

  • インストール後、ページをどう変換する? 右クリックコンテキストメニューの**“.MD this page”を選択、またはAlt+M**を押す。

  • Markdownの内容を制御できる? はい。画像の削除/保持リンクの削除/保持メタデータ(タイトル、著者、日付)の表示/非表示のトグルやドキュメント構造/ページマップ生成オプションあり。

  • 抽出Markdownをどこでプレビューできる? 拡張機能が専用プレビュータブを開き、抽出Markdownを確認・調整可能。

代替手段

  • Readabilityスタイルのコンテンツ抽出ツールや拡張機能:これらも散らかったWebページから本文を抽出。出力形式が異なり、一部はMarkdownではなくプレーンテキストやクリーンHTMLを出力。
  • 「HTML to Markdown」コンバーター:一般的なコンバーターはHTMLをMarkdownに変換するが、本文分離は行わず、MD-This-PageのReadabilityベース抽出に比べてナビゲーション/定型文が残りやすい。
  • 手動コピー&ペーストによるクリーニング:ブラウザの読取モードや手動選択後の整形に依存。制御性が高いが、MD-This-Pageよりワンクリック性が低い。
  • 開発者側抽出スクリプト:自動パイプラインでWebページを取得・解析して構造化ドキュメント作成。セットアップとメンテナンスが必要で、ブラウザ内プレビュー/エクスポートフローがない場合あり。
MD-This-Page | UStack