この記事でわかること
- 顧客名寄せの定義: 大企業グループで「同一企業」を一つのレコードに統合する作業の意味と目的
- 難しい3つの理由: 法人名の表記ゆれ・法人格の違い・グループ会社別管理という固有の課題
- 4ステップの実装手順と精度設計: 法人番号DBからLLMジャッジまでの処理フロー、80%スタートが正解である理由
基本情報
| 項目 | 内容 |
|---|---|
| 対象 | 大企業グループの経営企画部長・情シス部長・営業企画部長 |
| 難易度 | 中級 |
| 関連クラスター | C5:データ統合・顧客理解 |
| 読了目安 | 5分 |
顧客名寄せ グループ会社 別管理から統合マスタへの概念図
顧客名寄せの定義——何を、なぜ統合するのか
「同じ企業を指す複数のレコードを一つにまとめる」がシンプルな定義
顧客名寄せとは、異なるシステムやリストに分散して登録されている「同一企業」を指す複数のレコードを、一つの正規レコード(Golden Record:統合正規レコード)に統合する作業を指します。「トヨタ」「Toyota㈱」「トヨタ自動車株式会社」は表記が違っても同一法人を指しますが、子会社ごとにCRMへ別々に登録されるため、システム上は「別々の顧客」として扱われている状態が大企業グループでは日常的に発生します。
名寄せによってこの散在状態を解消し、グループ全体でどの企業とどれだけの取引関係があるかを一元的に把握できるようにすることが目的です。
なぜ名寄せが必要か——バラバラなままでは顧客が「見えない」
名寄せをしないと、グループ横断の顧客構造の可視化が実現できません。子会社Aと子会社Bが同じ企業X社と取引しているにもかかわらず、それぞれ別顧客として管理されていると、「どこにどれだけの関係資産があるか」を把握する術がなくなります。Validity 2025の調査では、76%のCRMユーザーが「自社CRMデータの半分以下しか正確でない」と回答しており、この問題は多くの組織に共通しています。
名寄せは技術的な作業に見えますが、その本質は「既にある関係資産から取りこぼしている売上機会を可視化するための経営インフラ整備」です。クロスセルとはの記事でも触れているように、グループ横断のクロスセルを動かすには、まず顧客の全体像を把握することが前提となります。
大企業グループで名寄せが難しい3つの理由
理由①——法人名の表記ゆれ(略称・旧字体・カタカナ⇔英語)
日本の法人名は、同一企業に対して複数の表記が並存します。代表的なパターンは次のとおりです。
- 略称: 「日立製作所」→「日立」
- 旧字体: 「髙島屋」→「高島屋」
- カタカナ⇔英語: 「ソニー」→「Sony」
- 商号変更後: 「JR東日本」の旧社名「東日本旅客鉄道」
- 合併による消滅: 旧社名のまま登録されたレコード
これらは担当者ごとに入力ルールが異なるため、一つの企業が5〜10通りの表記でシステムに入っているケースも珍しくありません。機械的な文字列一致では対処できないため、専用の処理が必要になります。
理由②——法人格の違い(「株式会社〇〇」と「㈱〇〇」と「〇〇」)
「株式会社」「(株)」「㈱」「(株)」といった法人格の表記ゆれは、データクレンジングの第一工程として正規化が必要です。このステップを省略すると、後工程の一致率が大幅に下がります。全角・半角の統一や旧字体から新字体への変換も同様に前処理として欠かせません。
理由③——グループ会社別管理(同一企業が複数社のシステムに分散)
最も根本的な課題は、グループ会社ごとに担当営業・CRM・データ入力ルールが異なる点です。子会社Aの「〇〇製作所」と子会社Bの「〇〇製作所」が同一企業を指しているか、それとも別法人かを正確に判定するには、名称の一致だけでなく所在地・業種・法人番号などの複合的な照合が必要になります。Plauti社による120億件のSalesforceレコード分析では、API連携経由のレコードでは80%が重複していたという結果が出ており、大規模な名寄せ作業なしには正確な顧客基盤の全体像は把握できません。
顧客マスタの整備で躓く3つの瞬間では、この問題をさらに深掘りしています。
顧客名寄せの実装手順——4つのステップ
グループ横断の名寄せは、正規化から人手レビューまでの4段階で進めます。各ステップの役割を理解することで、プロジェクト全体の工数と精度の見通しが立ちます。
顧客名寄せ 実装手順 4ステップ フロー図
| ステップ | 処理内容 | 解決率の目安 | 特徴 |
|---|---|---|---|
| 1. 正規化 | 法人格・文字・住所の統一 | — | 後工程の精度を左右する前処理 |
| 2. 確定的マッチング | 法人番号DB照合 | 全体の70〜80% | 無料・誤マッチがほぼゼロ |
| 3. 曖昧マッチング | ルールベース + LLMジャッジ | 残りの60〜80% | 表記ゆれ・略称に対応 |
| 4. 人手レビュー | 難判定ケースを人が判断 | 残り全件 | ビジネスルールの最終決定 |
ステップ1——データ収集・正規化(法人格・文字・住所の統一)
まず各社のCRMや基幹システムからデータをエクスポートし、クレンジングを行います。具体的な処理は3点です。法人格正規化(株式会社・(株)・㈱の統一)、全角半角統一と旧字体から新字体への変換、住所の正規化(都道府県名の有無・番地表記の統一)です。
このクレンジングを先に行わないと、後工程の一致率が大幅に下がります。「正規化に手を抜くと後で倍の工数がかかる」という認識でプロジェクトを設計してください。
ステップ2——確定的マッチング(法人番号DBで70〜80%を解決)
国税庁が提供する法人番号APIを使って、各レコードに法人番号を付与します。法人番号は日本の法人に一意に付与された13桁の識別番号であり、無料で利用できます。企業名の表記がどれだけ異なっていても、同じ法人であれば同じ法人番号が付与されているため、表記ゆれに左右されない確定的マッチング(誤マッチほぼゼロで判定できる手法)が実現します。
この工程で全体の70〜80%のレコードが解決します。残り20〜30%が次工程に進みます。
ステップ3——曖昧マッチング(ルールベース・LLMで残りを処理)
法人番号で解決できなかったレコードに対して、Levenshtein距離・Jaro-Winklerといった文字列類似度アルゴリズム(ルールベース)でさらに絞り込みます。それでも判定が難しいケースには、LLMジャッジ(企業名・所在地・業種などの文脈情報をAIが複合判定)を組み合わせます。
LLMを使った日本語法人名の名寄せは、表記ゆれへの対応で期待以上の結果が出るケースが多く、実務家からも評価されています。LLM活用の詳細な実装手法はLLMで顧客名寄せ精度を引き上げる方法|4層カスケード処理で解説しています。
この工程の処理構造を示したのが下の図解です。
名寄せ 4層カスケード 法人番号 LLMジャッジ 構造図
ステップ4——人手レビューと検証(5〜10%の難判定を人が判断する)
確信度が低い残り5〜10%は人手で判断します。「NTTデータ関西を本社に統合するか、独立レコードとして扱うか」「支社・支店を本社レコードに統合するかどうか」といったビジネスルールの決定は、技術で自動化できない領域です。このビジネスルールを組織として合意形成することが、名寄せプロジェクト全体の質を決めます。
精度設計の考え方——「80%スタート」が正解である理由
「100%の精度を目指す」とプロジェクトが止まる
完璧なデータ統合を目指すと、プロジェクトが動き出すまでに半年以上かかるケースが多くあります。その間、ビジネスは止まったままです。名寄せはクロスセルを実行するための手段であり、ゴールではありません。「名寄せが完璧になってからクロスセルを始める」という発想が、最大の落とし穴です。
「データ統合に数億円かけて動かない」を避ける設計の勘所では、この問題が大企業グループでどのように起きるかを詳述しています。
名寄せ 精度設計 80%スタート 考え方 比較図
80%の精度から始めて、運用しながら上げていく設計
80%を目安に始める理由は、「残り20%を追うコストが、20%の不正確さがもたらすビジネス損失より大きくなる」という判断です。また、個人名レベルの精度を求めない設計——企業名と役職レベルで十分という方針——は、法的リスクを下げながら実装スピードを上げる効果もあります。個人情報保護法の観点からのデータ設計については個人情報を共有せずにクロスセル推進する設計を参照してください。
80%の精度でグループ全体の顧客構造を把握し、残り20%は運用の中で随時修正していく方が、結果的に早く成果につながります。名寄せ完了後に顧客スコアリングやホワイトスペース分析に進む設計が標準的な流れです。
グループ会社特有の注意点——同一顧客をどう定義するか
「支社・支店は本社に統合する」か「独立レコードとして扱う」かのビジネスルール
「NTTデータ関西」と「NTTデータ」は同一法人か別法人か。技術的には判定できますが、ビジネス的にどう扱うかは経営側の判断です。担当営業が違うなら別レコードの方が運用しやすく、グループ横断の関係性を見るには統合が正解になります。このトレードオフを意識した上で、プロジェクト開始前にビジネスルールを決めておくことが重要です。顧客ティアリングを経営層と合意形成する方法も参考になります。
グループ会社間の競合顧客問題(子会社Aと子会社Bが同一顧客を持つ場合の扱い)
子会社Aと子会社Bが同一顧客X社を持つ場合、「重複している顧客」としてフラグを立てることが、クロスセルの候補特定に直結します。この重複フラグこそがホワイトスペース分析とは|未導入領域を見つける4ステップの基盤になります。名寄せ後の次工程として、ぜひあわせてご確認ください。
M&A後のデータ統合についての文脈では統合後の顧客名簿をどう統合するか、子会社間クロスセルの法的論点については子会社間クロスセルの法的論点も参照してください。
よくある質問(FAQ)
Q1. 顧客名寄せとはどういう作業ですか?
顧客名寄せとは、異なるシステムやリストに分散して登録されている「同一企業」を指す複数のレコードを、一つの正規レコード(Golden Record)に統合する作業を指します。大企業グループでは、子会社ごとに顧客データが別々に管理されており、「トヨタ」「Toyota㈱」「トヨタ自動車株式会社」が同一企業と認識されていない状態が多く発生します。名寄せによってグループ横断の顧客構造を可視化し、どこにどれだけの取引機会があるかを把握できるようになります。
Q2. 大企業グループで名寄せが難しい最大の理由は何ですか?
最大の理由は「グループ会社別管理の構造的問題」です。子会社ごとに担当営業・CRM・データ入力のルールが異なるため、同一法人を指すレコードが複数社のシステムに分散して存在します。加えて、法人名の表記ゆれ(略称・旧字体・カタカナ⇔英語)と法人格の違い(「株式会社〇〇」「㈱〇〇」「〇〇」)が重なり、機械的な一致判定が機能しないケースが頻発します。Plauti社の調査では、SalesforceレコードのAPI連携経由では80%が重複していることが確認されており、大規模な名寄せ作業なしには正確な顧客基盤の全体像は把握できません。
Q3. 名寄せに法人番号を使うとなぜ精度が上がるのですか?
国税庁が提供する法人番号は、日本の法人に一意に付与された13桁の識別番号です。企業名の表記がどれだけ異なっていても、同じ法人であれば同じ法人番号が付与されています。この番号をキーに照合すると、表記ゆれに左右されない確定的なマッチングが実現できます。法人番号APIは無料で利用でき、全体の70〜80%のレコードをほぼ誤マッチなしで解決できるため、名寄せプロジェクトのコストと期間を大幅に短縮できます。
Q4. LLMを使った名寄せはどんな場面で有効ですか?
法人番号DBやルールベースでも判定できない難ケース——例えば「日立製作所と日立ソリューションズは同じ法人か」「NTTデータ関西は本社に統合するか独立レコードとして扱うか」——の判断に有効です。LLMは企業名だけでなく、所在地・業種・取引金額帯などの文脈情報を複合的に判断し、「同一・別・不明」を根拠付きで出力できます。詳しい実装手法はLLMで顧客名寄せ精度を引き上げる方法|4層カスケード処理で解説しています。
Q5. 名寄せの精度は何%を目指すべきですか?
80%を目安に始め、運用しながら上げていく設計が現実的です。完璧な精度を目指すと、プロジェクトが動き出すまでに半年以上かかるケースが多く、その間ビジネスが止まります。名寄せはクロスセルを実行するための手段であり、ゴールではありません。80%の精度でグループ全体の顧客構造を把握し、残り20%は運用の中で随時修正していく方が、結果的に早く成果につながります。
Q6. 名寄せが完了したら次に何をすればよいですか?
名寄せが完了して統合顧客マスタが得られたら、次はホワイトスペース分析とは|未導入領域を見つける4ステップに進みます。ホワイトスペース分析とは、顧客と自社グループの製品・サービスのマトリクスを作り、未取引の領域(白地)を可視化する手法です。どの顧客にどのグループ会社のサービスを提案できるかが一目でわかるようになります。
Q7. 名寄せと顧客マスタ統合は何が違いますか?
名寄せは「同一企業を指す複数レコードの統合判定」であり、技術的な処理作業を指します。一方、CRM統合とはの記事でも解説しているように、顧客マスタ統合は名寄せを含む上位概念であり、データモデルの設計・アクセス権限の設定・運用ルールの策定など組織設計の要素も含みます。大企業グループでは、顧客マスタを物理的に一つのシステムに統合しなくても、名寄せ済みIDを各社のシステムで参照する「論理統合」の方が現実的なケースも多くあります。
Q8. グループ各社のCRMを統合しなくても名寄せはできますか?
はい、できます。名寄せは各社のシステムを物理的に統合しなくても、それぞれからデータをエクスポートして突合作業を行うことで実現できます。子会社のCRMをそのまま維持しながら、グループ横断の統合ビューだけを別途作成する「論理統合」のアプローチが、多くの大企業グループで現実的な選択肢となっています。詳しくはグループ各社のCRMを「全社統合」せずに横展する方法をご参照ください。
Q9. 名寄せのコストや期間の目安はどのくらいですか?
規模によって大きく異なりますが、数百社〜数千社の顧客データを対象とした初回名寄せの場合、システム処理で2〜3日、人手レビューを含めると10〜15営業日が一般的な目安です。M&A後に2社分のデータを突合する場合も同様の期間感が参考になります(統合後の顧客名簿をどう統合するかも参照)。精度を100%に近づけようとすると期間が倍以上になるため、80%スタートの設計が工期短縮の鍵になります。
Q10. 名寄せ後に顧客データが劣化しないようにするには?
B2Bの顧客データは年間22〜70%の速度で劣化するというデータがあります(Landbase 2024。業種・更新頻度によって変動幅が大きいため、範囲で示しています)。名寄せを「一度やれば終わり」ではなく、四半期ごとに差分データを取り込み、新規取引先・企業名変更・合併を反映する定期更新の仕組みを設計することが重要です。具体的な運用フローはホワイトスペースマップを四半期で更新する運用フローで詳しく解説しています。
まとめ——名寄せは精度を求めすぎず、まず全体像を把握することから
主要ポイント
- 顧客名寄せの目的は全体像の把握: 同一企業を指す複数レコードを統合し、グループ横断の顧客構造を可視化することが目的です。技術的な完璧さよりも、経営インフラとして機能させることを優先します。
- 法人番号DBで70〜80%を解決: 国税庁の法人番号APIを使った確定的マッチングが最も効率的な第一手です。無料かつ誤マッチがほぼゼロで、プロジェクト全体のコストと期間を大幅に圧縮できます。
- 80%スタートで運用しながら精度を上げる: 完璧な統合を目指してプロジェクトが止まることが最大のリスクです。80%の精度でビジネスを動かし始め、運用の中で残り20%を修正していく設計が現実的な正解です。
次のステップ
- ホワイトスペース分析とは|未導入領域を見つける4ステップで名寄せ後の次工程に進む
- LLMで顧客名寄せ精度を引き上げる方法でステップ3の精度をさらに改善する
- 顧客スコアリングとはで統合マスタを活用した確度予測を設計する