一覧ページを指定するだけで、詳細ページを自動巡回。店舗名、電話番号、診療時間、休診日などを瞬時にパースし、Excelでそのまま使えるBOM付きCSV/JSONで保存します。
自動化と使いやすさを追求した、プロ仕様の設計
一覧ページを自動的に巡回し、その中の紹介記事リンクを全自動で網羅。手動での遷移は一切不要です。
診療時間テーブルや休診日テキスト、住所、電話番号の特殊なフォーマットも自動解析し、規則的な形式に平準化します。
リクエスト間にカスタム待機秒を設定可能。マイナビクリニック側のサーバーに負担をかけずに安全に実行できます。
抽出したデータは、Excelで開いた際に文字化けしない「BOM付きUTF-8」形式のCSV、またはJSONでエクスポートできます。
業界最高レベルの解析精度で、以下の詳細データを抽出
| 出力列名 | 概要 | パース元のHTML構造 |
|---|---|---|
| 記事タイトル | クリニックが紹介されている記事の見出し | h1.heading__title をパース |
| 診療科目 | 対象の市区町村・エリア名(例: 新宿区、川口市) | 記事タイトル内の都道府県名からエリアを自動推測 |
| 電話番号 | クリニックの直通電話番号 | 「電話番号」ラベル、またはテキストの正規表現マッチ |
| 医院名 | クリニックの正式名称 | .post-clinic-block_title などのヘッダーから抽出 |
| 午前始 / 午前終 | 午前の診療時間(開始・終了) | 診療時間テーブルの午前スロットをパース |
| 午後始 / 午後終 | 午後の診療時間(開始・終了) | 診療時間テーブルの午後スロットをパース |
| 休診日 | クリニックの定休日・臨時休診 | テーブルの「休」マークやテキスト内の休診記述 |
わずか3ステップで、すぐにスクレイピングを開始可能
リポジトリからフォルダをダウンロードし、Chromeの chrome://extensions/ からデベロッパーモードを有効にして「パッケージ化されていない拡張機能を読み込む」で読み込みます。
Chromeの拡張機能バーのアイコンをクリックし、「スクレイパーを開く」 をクリックします。別タブでコントロールパネルが開きます。
マイナビクリニックの一覧ページURLを入力し、巡回上限や待機秒を設定して「実行」をクリック。処理が完了したら「CSV保存」をクリックします。