Excelで大量のデータを扱っていると、同じ情報が重複してしまうことがあります。
そんなときに便利なのが「Power Query」の重複削除機能です。
従来の「重複の削除」機能よりも柔軟で、複数列の条件指定や結合処理との組み合わせも可能。
この記事では、Power Queryで重複を削除する基本操作から、応用的な使い方、注意点までを詳しく解説します。
データ整理を効率化したい方や、分析前の前処理を自動化したい方におすすめの内容です。
Power Queryは、Excelに標準搭載されている「データ取得と変換」ツールで、データの抽出・整形・統合を簡単に行える機能です。
たとえば、
特に魅力的なのは、処理を自動化できる点です。
一度作成したクエリは、ワンクリックで更新でき、毎回同じ操作を手動で行う必要がありません。
重複削除もそのひとつで、Power Queryを使えば「何列を基準に重複を削除するか」を柔軟に指定できます。
ここでは、Excelのテーブルに登録されたデータを例に、Power Queryで重複を削除する手順を説明します。
この時点で、ExcelのデータがPower Queryに読み込まれます。
メニューから次の操作を行います。
これで、選択した列を基準に重複した行が削除されます。
この処理は、元データが更新されても「更新」ボタンを押すだけで最新の状態に再適用できます。
単一列ではなく、「顧客名」と「日付」など複数条件で重複を削除したい場合も、Power Queryは簡単です。
これで、すべての選択列が完全に一致する行のみが重複と判断され、1行にまとめられます。
たとえば次のような場合:
| 顧客名 | 日付 | 金額 |
|---|---|---|
| 山田太郎 | 2025/01/01 | 1000 |
| 山田太郎 | 2025/01/01 | 1000 |
| 山田太郎 | 2025/01/02 | 2000 |
→ 「顧客名+日付」を基準にすると、1行目と2行目が重複とみなされ、1つにまとめられます。
実は、Power Queryでは「重複を削除する」だけでなく、「重複している行だけを抽出する」こともできます。
手順は以下の通りです。
これにより、重複している行のみが残り、ユニークなデータは除外されます。
たとえば、データの重複チェックをしたい場合や、入力ミスを発見したいときに便利です。
| 項目 | Power Query | Excelの「重複の削除」 |
|---|---|---|
| 処理の自動化 | 可能(再利用・更新可) | 不可(都度実行) |
| 複数データソース対応 | 可(CSV・Web・DBなど) | 不可 |
| 元データ保持 | 元データを壊さない | 元データが変更される |
| 条件付き削除 | 柔軟に設定可能 | 基本的な条件のみ |
Power Queryを使う最大のメリットは「再利用性」です。
一度クエリを作成すれば、毎月の更新作業や他のファイルでも同じ処理を使い回すことができます。
Power Queryで作成したクエリは、「更新」ボタンをクリックするだけで最新データに再適用できます。
たとえば、毎日新しい注文データをExcelに追記する場合でも、
また、Power Queryを使用して作成した処理手順はM言語(Power Queryの内部コード)で記録されており、編集画面の「詳細エディター」から確認や再利用ができます。
重複データを削除する代わりに、「重複をグループ化」して集計することも可能です。
たとえば、同じ顧客の購入金額を合計したい場合は:
これで、顧客ごとの重複データが1行にまとめられ、合計値が算出されます。
データ分析やレポート作成を行う前には、「正しいデータ」に整えることが最も重要です。
Power Queryの重複削除を使えば、
また、Power Queryの処理はボタン1つで再実行できるため、
毎月のデータ更新にも非常に効率的です。
Power Queryを使えば、重複削除をはじめとするデータ整形作業を簡単に自動化できます。
Excelの作業効率を上げたい方は、ぜひPower Queryを活用してみてください。
単なる「重複削除ツール」ではなく、データ前処理を自動化する最強の武器になります。