Excelで大量のデータを扱っていると、同じ情報が重複してしまうことがあります。
そんなときに便利なのが「Power Query」の重複削除機能です。
従来の「重複の削除」機能よりも柔軟で、複数列の条件指定や結合処理との組み合わせも可能。
この記事では、Power Queryで重複を削除する基本操作から、応用的な使い方、注意点までを詳しく解説します。
データ整理を効率化したい方や、分析前の前処理を自動化したい方におすすめの内容です。
Power Queryとは?Excelのデータ整形ツールの基本
Power Queryは、Excelに標準搭載されている「データ取得と変換」ツールで、データの抽出・整形・統合を簡単に行える機能です。
たとえば、
- CSVファイルやWebデータを取り込む
- 文字列を置換・分割する
- 不要な列を削除する
- データを集計・結合する
など、さまざまな処理を「クエリ」として記録できます。
特に魅力的なのは、処理を自動化できる点です。
一度作成したクエリは、ワンクリックで更新でき、毎回同じ操作を手動で行う必要がありません。
重複削除もそのひとつで、Power Queryを使えば「何列を基準に重複を削除するか」を柔軟に指定できます。
Power Queryで重複を削除する手順
ここでは、Excelのテーブルに登録されたデータを例に、Power Queryで重複を削除する手順を説明します。
手順1:Power Queryエディタを開く
- Excelで対象のデータ範囲を選択します。
- 「データ」タブ →「データの取得と変換」グループ →「テーブルまたは範囲から」をクリック。
- Power Queryエディタが開きます。
この時点で、ExcelのデータがPower Queryに読み込まれます。
手順2:重複を削除したい列を選択
- 重複を削除したい列のヘッダーをクリックして選択します。
- 複数列を基準にしたい場合は、Ctrlキーを押しながら複数列をクリックします。
手順3:「重複の削除」を実行
メニューから次の操作を行います。
- 上部リボンの「ホーム」タブ →「行の削除」→「重複の削除」
これで、選択した列を基準に重複した行が削除されます。
手順4:結果をExcelに読み込む
- 「ホーム」タブ →「閉じて読み込む」をクリック。
- 新しいシートに重複のないデータが出力されます。
この処理は、元データが更新されても「更新」ボタンを押すだけで最新の状態に再適用できます。
複数列を基準に重複を削除する方法
単一列ではなく、「顧客名」と「日付」など複数条件で重複を削除したい場合も、Power Queryは簡単です。
手順
- 削除の基準としたいすべての列を選択(Ctrlキーを押しながらクリック)
- 「重複の削除」をクリック
これで、すべての選択列が完全に一致する行のみが重複と判断され、1行にまとめられます。
たとえば次のような場合:
| 顧客名 | 日付 | 金額 |
|---|---|---|
| 山田太郎 | 2025/01/01 | 1000 |
| 山田太郎 | 2025/01/01 | 1000 |
| 山田太郎 | 2025/01/02 | 2000 |
→ 「顧客名+日付」を基準にすると、1行目と2行目が重複とみなされ、1つにまとめられます。
重複を残したい場合の「重複の保持」機能
実は、Power Queryでは「重複を削除する」だけでなく、「重複している行だけを抽出する」こともできます。
手順は以下の通りです。
- 基準列を選択
- 「行の削除」→「重複の保持」をクリック
これにより、重複している行のみが残り、ユニークなデータは除外されます。
たとえば、データの重複チェックをしたい場合や、入力ミスを発見したいときに便利です。
Power QueryとExcelの「重複の削除」機能の違い
| 項目 | Power Query | Excelの「重複の削除」 |
|---|---|---|
| 処理の自動化 | 可能(再利用・更新可) | 不可(都度実行) |
| 複数データソース対応 | 可(CSV・Web・DBなど) | 不可 |
| 元データ保持 | 元データを壊さない | 元データが変更される |
| 条件付き削除 | 柔軟に設定可能 | 基本的な条件のみ |
Power Queryを使う最大のメリットは「再利用性」です。
一度クエリを作成すれば、毎月の更新作業や他のファイルでも同じ処理を使い回すことができます。
Power Queryで重複削除を自動更新する方法
Power Queryで作成したクエリは、「更新」ボタンをクリックするだけで最新データに再適用できます。
たとえば、毎日新しい注文データをExcelに追記する場合でも、
- 「データ」タブ →「すべて更新」
で、重複削除後のデータを自動的に出力可能です。
また、Power Queryを使用して作成した処理手順はM言語(Power Queryの内部コード)で記録されており、編集画面の「詳細エディター」から確認や再利用ができます。
応用編:グループ化機能との併用
重複データを削除する代わりに、「重複をグループ化」して集計することも可能です。
たとえば、同じ顧客の購入金額を合計したい場合は:
- 「顧客名」列を選択
- 「変換」タブ →「グループ化」
- 「新しい列名」を「合計金額」などに設定し、「操作」を「合計」に変更
これで、顧客ごとの重複データが1行にまとめられ、合計値が算出されます。
Power Queryでの重複削除はデータ分析の第一歩
データ分析やレポート作成を行う前には、「正しいデータ」に整えることが最も重要です。
Power Queryの重複削除を使えば、
- 入力ミスの防止
- 二重登録の排除
- 集計ミスの回避
など、多くの問題を未然に防げます。
また、Power Queryの処理はボタン1つで再実行できるため、
毎月のデータ更新にも非常に効率的です。
まとめ
Power Queryを使えば、重複削除をはじめとするデータ整形作業を簡単に自動化できます。
- 単一列・複数列の重複削除が可能
- 元データを壊さずに安全に操作できる
- 一度作成したクエリは再利用・自動更新できる
- 「重複の保持」で重複チェックも可能
Excelの作業効率を上げたい方は、ぜひPower Queryを活用してみてください。
単なる「重複削除ツール」ではなく、データ前処理を自動化する最強の武器になります。
