名寄せとは、重複や表記ゆれが発生している顧客のデータを整理し、1つの正規データとしてまとめる作業のことです。エクセルに備わっている機能や関数を活用することで、名寄せを効率的に実施できます。

データクレンジング入門ガイド
〜顧客データを正し、活かすための基本・手法・ツール活用〜 データクレンジング入門ガイド
- データクレンジング概要
- データクレンジングの手法
- データクレンジング実行時のポイント
- HubSpotのAIアシスタント
今すぐダウンロードする
全てのフィールドが必須です。
本記事では、エクセルを使った名寄せの実施手順を画像付きでわかりやすく解説します。基本的な流れを理解したうえで実践することで、効率的な名寄せが可能になるでしょう。
エクセルを用いた名寄せの手順
エクセルで名寄せを行うには、大きく分けて4つのステップがあります。
- データ調査:名寄せ作業の準備を行う
- データ抽出・統合:必要なデータを集めて1つにまとめる
- データ修正:表記ゆれを修正し形式を統一する
- マッチング:データを照合し重複を特定する
それぞれの手順を見ていきましょう。
1. データ調査
まずは、名寄せしたいデータの状態を把握し、目的と照らし合わせて作業の方針を定めます。
- 名寄せに利用するデータは何か(顧客リスト、取引先情報など)
- データはどこに保管されているか
- 名寄せしたい項目は何か(氏名、住所、電話番号など)
大まかな方向性が決まったら、「株式会社と(株)のどちらに統一するのか」など、名寄せの細かいルールを決めましょう。現状のデータと名寄せの方向性を整理しておくことで、効率的に作業を進めることが可能です。
2. データ抽出・統合
名寄せの方向性が定まったら、必要な項目を抽出・整理します。その際に、データベースごとの項目名やデータ入力のルールの違いに注意しましょう。
あるデータベースで「企業名」と名づけられている項目が、別のデータベースでは「社名」や「会社名」になっていることもあります。また、住所が1列にまとめて入力されているツールがある一方で、郵便番号・都道府県・市町村・番地などに細かく分かれているケースも考えられます。
個別のデータ修正は次のステップで行うため、データ抽出・統合のステップでは、データベースごとの項目名やデータの入力箇所を調整することを意識しましょう。
3. データ修正
このステップでは、個別のデータの表記ゆれや入力ミスを修正します。データが完全に一致していないと別のデータとみなされ、正しく名寄せできない場合があります。名寄せの精度を高めるには、こうした違いを正確に処理しなければなりません。
「(株)」を「株式会社」に統一したり、半角・全角を揃えたりするなど、明確なルールに従って修正を行いましょう。エクセルの置換機能やJIS関数、TRIM関数などを活用すると効率的に修正できます。
4. マッチング
マッチングは、複数のデータを照合し、それらが同一の個人や企業を指しているのかどうかを判断するプロセスです。マッチングを行うことで重複しているデータが特定され、最終的にそれらを統合するための準備ができます。
マッチングは、指定のルールをもとに行います。例えば、氏名と電話番号が完全に一致するデータを探したり、会社名と住所の一部が一致するものを同一企業の可能性が高い候補としてリストアップしたりします。エクセルでは氏名や電話番号といったキー項目を基準に、VLOOKUP関数などを活用して条件に合うデータを探すことができます。
名寄せに活用できるエクセルの機能・関数
ここでは、データの重複を修正・統合するマッチングの工程に便利なエクセルの機能や関数を紹介します。
マッチングの前段階で必要なデータ修正に役立つエクセルの機能や関数は、次の記事で詳しく解説していますので、あわせて参考にしてください。
関数は、直接セルに入力するか、関数を入れたいセルを選択し、「fx」をクリックしましょう。
「関数の検索」もしくは「関数名」の一覧から目的の関数を選択し、「OK」をクリックします。
フィルター機能
エクセルのフィルター機能は、特定の条件に合致するデータを抽出できる機能です。フィルター機能を活用すると、重複しているデータを簡単に見つけることができます。
データを抽出したい表のいずれかの項目(例:会社)をクリックし、リボン(エクセルの上部にあるメニュー欄)の[データ]>[フィルター]をクリックすると、見出しに「▼」が表示されます。
例えば、電話番号の「▼」を押すと、次のようなフィルター画面が表示されるので、抽出したい文字列にチェックを入れて「OK」をクリックします。
電話番号が重複しているデータがまとめて表示されました。
ピボットテーブル
ピボットテーブルは、データを項目ごとに自動で集計できる機能です。
今回は、重複している企業の月間売上データを1つのセルにまとめてみましょう。まずは、データを抽出したい表を選択します。
リボンの[挿入]>「ピボットテーブル」をクリックします。
「テーブルまたは範囲からのピボットテーブル」が表示されます。
テーブル/範囲(T)に記載されている範囲が、抽出したい範囲であることを確認したら、「場所:(L)」にピボットテーブルを作成したい場所のセルを入力し、「OK」をクリックします。
「ピボットテーブルのフィールド」の入力画面が右側に表示されました。
必要なフィールドにチェックを入れることで、会社(または電話番号)ごとの月間売上を表示できます。
SUMIF関数
SUMIF関数は、指定した検索条件に一致するセルの値を合計するための関数です。
【電話番号「xxx2342345」の月間売上を合計する場合】
合計を表示するためのセル(「F」列)を用意します。
セル「E2」に、抽出したい電話番号「xxx2342345」を入力し、セル「F2」にSUMIF関数を入力します。
(範囲,検索条件,合計範囲)
今回は、セル「B2~B9」に入っている電話番号「xxx2342345」(=E2セル)を検索し、一致したセルと同じ行にあるセル「C2~C9」の値を合計したいため、「=SUMIF(B2:B9,E2,C2:C9)」と入力します。
電話番号「xxx2342345」に一致する月間売上の合計値が、セル「F2」に入りました。
VLOOKUP関数
VLOOKUP関数は、特定のデータと一致した値の抽出が可能な関数です。複数のデータベースから情報を抽出・集約したい場合や、データの重複をチェックする際に役立ちます。
ここでは、顧客データと売上データをマッチングし、顧客データのシートに月間売上列を加える手順を紹介します。
どちらの表でも、会社コードが共通しているため、会社コードをもとにマッチングが可能です。顧客データシートのD列に月間売上列を作成し、関数を入力していきます。
=VLOOKUP(検索値,範囲,列番号,[検索方法])
今回は、月間売上を顧客データに加えたいので、会社コードの「A2」セルを指定し、「範囲」にはシート「売上データ」のセル「A2~B5」を設定します。列番号には、表示したい「月間売上」の列の数字(指定した範囲の何列目にあるか)を指定しましょう。
式内の「検索方法」には、「0」もしくは「-1」を入力します。「0:FALSE」は完全一致の値を表示し、「-1:TRUE」は近似一致の値を表示します。近似一致は、完全一致の値がない場合の「検索値」未満の最大値です。
セルD2に「=VLOOKUP(A2,売上データ!$A$2:$B$5,2,0)」と入力します。
「$」は絶対参照(参照するセルの固定)を意味します。例えば、A2セルを絶対参照する場合は「$A$2」と入力しましょう。絶対参照にしないままVLOOKUP関数の入ったセルをコピーすると、売上データのリスト範囲がずれてエラーが出てしまうため注意が必要です。
セル「D2」をコピーして、セル「D3~D5」に貼り付けましょう。
売上データが入力されました。
ここまで紹介したエクセルの機能や関数を使う方法は、データ量が少ない場合や簡易的な名寄せにおすすめです。データ量が多い複雑な名寄せには、専用のツールを活用すると良いでしょう。
名寄せ作業のおすすめのツールは、次の記事で紹介しています。
名寄せにエクセルを活用してデータを整理しよう
エクセルに標準搭載されている機能や関数を活用すると、専用のツールがなくても名寄せが可能です。
データ量が増えてきた場合など、エクセルでは対応が難しいと感じたら、HubSpotのOperations Hubを試してみてください。HubSpotの無料CRM(顧客関係管理)ツールをとあわせて活用することで、CRMに入力した顧客情報が自動で整理されるため、名寄せの作業を行う必要がなくなります。
Operations Hubの無料プランでは、基本的な機能を一通り試していただくことができます。詳しくは次のページをご覧ください。
データ品質管理(クレンジング)ツール | HubSpot(ハブスポット)詳細はこちら→
