サイト全体から特定の単語を検索して、単語があるページのURLを一覧にする方法

HTML

サイトの更新で、「〇〇」という単語を全部修正するみたいな作業が発生する場合があるのですがその際対象ページのURLを出したい場合の方法です。

DreamWeaverで検索してxmlとして出力する

まずDreamWeaverでサイト全体を検索します。

下のウインドウの箇所に「レポートの保存」というのがあります。

これを押すとxmlデータで保存することが出来ます。

VS Code等のエディタを使って開く

そのxmlデータをVS Code等正規表現が使えるエディタで開きます。そうするとこのようなコードが表示されます

ここの<mm_file>という行だけ使うので、他を正規表現など使って削除していきます。

特定の行以外を選択して削除する

まずは<mm_file>以外の行を削除します。Ctrl+Fで出る検索窓に正規表現を使うアイコンを押した後下の文字列をいれます。

^(?!.*<mm_file>).*$

これで置換を空にして全置換すると、不要な行が削除されます。

改行を削除する

次に同じ手順で改行を削除します。

^\s*$\n

行頭と行末のタグをURLに置き換える

次に行頭のタグと空白をURLに置き換えます。

    <mm_file>
↓
https://~~~.com/

行末のタグを削除します

</mm_file>

バックスラッシュをスラッシュに置換する

最後にURL途中に残っているバックスラッシュを普通のスラッシュに置換します。

\\ 検索
/ 置換

これでURLリストが完成しました。

1ページに複数単語が出てくるばあい

1ページに何回も同じ単語が出てくる場合は、xmlに同じURLが何個も出ることになります。

その場合URLリストにしたあとに目視で消してます。

コメント

タイトルとURLをコピーしました