Web上の情報を手作業で収集していると、時間がかかるうえにミスも起きやすくなります。そんなときに便利なのが「スクレイピング」です。と聞くと、プログラミングの知識が必要だと思われがちですが、実は**Power Automate for Desktop(PAD)**を使えば、ノーコードでスクレイピングが可能です。本記事では、Power Automateを使ったスクレイピングの基本から応用までを、初心者にもわかりやすく解説します。業務効率化を目指す方に必見の内容です。
Power Automate(旧称:Microsoft Flow)は、Microsoftが提供する業務自動化ツールです。クラウド版とデスクトップ版(Power Automate for Desktop)に分かれており、特にスクレイピングで使われるのは後者のPADです。
PADはWindows 10/11ユーザーであれば無料で利用可能で、GUIで操作を組み合わせるだけでロボットを作成できます。スクレイピングだけでなく、Excel操作やメール送信など幅広い用途に使えるのも魅力です。
スクレイピングとは、Webサイトから情報を自動的に収集する技術です。以下のような場面で活用されています。
今まではPythonなどのプログラミングが必要でしたが、Power Automateを使えば、HTMLタグを選択して抽出するだけで完了します。
まず、Power Automate for Desktop(PAD)をインストールしましょう。
Microsoftの公式サイトにアクセスし、「Power Automate for Desktop」をダウンロードしてインストールします。
Microsoftアカウントでログインが必要です。業務アカウントであれば、Azure ADでも可能です。
PADでスクレイピングするには、使用するブラウザに拡張機能を追加する必要があります。
ここでは「楽天市場」などのショッピングサイトから、商品の価格情報を取得する流れを紹介します。
「+新しいフロー」を選択し、わかりやすい名前を付けます(例:「楽天価格取得」)。
アクション「Webブラウザーを起動」→「Webページを開く」で対象のURLを入力します。
「Webデータの抽出」を使用し、マウスで欲しい要素(例:価格)を選択。PADが自動的にXPathを解析してくれます。
取得した価格を「変数に格納」や「Excelに保存」といったアクションに接続します。
「Excelの起動」「新しいワークブックの作成」「セルに書き込む」などのアクションで出力可能です。
一部のWebページはJavaScriptで動的に生成されており、PADだけでは読み込めない場合があります。その場合は「待機時間」を入れるか、ブラウザ制御を工夫する必要があります。
スクレイピングはサイトによっては禁止行為に該当することもあります。商用目的での使用時は必ず利用規約を確認しましょう。
サイトに過剰なアクセスを与えないよう、処理間に待機時間(例:2~3秒)を入れるのがマナーです。
価格比較サイトなど、複数ページに情報が分かれている場合は、「ループ処理(For each)」と「次のページボタンのクリック」を使います。
これにより、1ページごとに手動でアクセスせずとも全データを一括取得できます。
⇒ Webページのレイアウト変更や広告の挿入が原因。XPathを再指定する。
⇒ ページの読み込み前に実行されている可能性。ページの読み込み完了まで「待機アクション」を追加する。
⇒ Excelの起動がうまくいっていない。ファイルパスや保存先の確認を行う。
PADで取得したデータは、以下のように活用できます。
これにより「情報収集→分析→報告」がすべて自動化可能です。
Power Automate for Desktopを活用すれば、面倒な情報収集業務を手間なく自動化できます。特にプログラミング経験がない方でも、直感的な操作でスクレイピングを始められる点は大きな魅力です。今回紹介した基本的な手順に慣れてきたら、ループ処理やフィルタリングと組み合わせて、より高度な自動化にもチャレンジしてみましょう。
業務の時短や精度向上に向けて、ぜひPower Automateのスクレイピング機能を取り入れてみてください。