Dubletten im ERP: Warum Ihre Kundendaten Ihre Vertriebsstrategie verzerren

Dubletten im ERP kosten mehr als Nerven: Falsche Prioritäten, verzerrte Umsätze, falsche Entscheidungen. So finden und beheben Sie das Problem.

von

David Gierse

18 Min. Lesezeit

NOAVIA Prozessautomatisierung Mittelstand: Vernetztes Systemdiagramm zeigt KI-gestütztes Wissensmanagement als Grundlage für automatisierte Workflows und digitale Assistenten

Der Moment, in dem eine Auswertung aufhört zu stimmen

Der Vertriebsleiter eines B2B-Dienstleisters mit 140 Mitarbeitenden zeigt seinem Geschäftsführer die monatliche Top-10-Auswertung. Sauber formatiert, direkt aus dem ERP gezogen. Platz 10: Müller Industrie GmbH, 1,8 Millionen Euro Jahresumsatz. Der Geschäftsführer nickt.

Drei Tage später ruft ein neuer Vertriebler an. Er hat einen Interessenten: Müller Industrie GmbH. Ob man denen ein Angebot machen könne, er habe noch keine Beziehung zu denen. Der Vertriebsleiter schaut nach.

Müller Industrie steht dreimal im System. „Müller Industrie GmbH", „Müller Industries GmbH", „Müller I. GmbH". Alle drei mit eigener Kundennummer, alle drei mit separat verbuchten Umsätzen, alle drei von verschiedenen Mitarbeitenden angelegt ohne zu prüfen ob dieser Kunde schon existiert. Zusammengerechnet: 2,6 Millionen Euro. Nicht Platz 10. Platz 3.

Dieser Kunde war seit vier Jahren Top-3-Kunde. Kein Mensch im Unternehmen wusste es.

Dubletten sind dabei nicht das einzige stille Datenproblem im Mittelstand. Wer verstehen will warum manuelle Eingaben überhaupt so fehleranfällig sind, findet in unserem Artikel zu Medienbrüchen im Mittelstand den strukturellen Hintergrund.

Warum Stammdaten-Probleme entstehen — und warum sie bleiben

Niemand legt Dubletten absichtlich an. Sie entstehen systematisch an drei Stellen, die in jedem mittelständischen Unternehmen vorkommen.

Bei ERP-Migrationen werden historische Datenbestände importiert ohne vollständige Deduplizierung. Der neue Stammsatz wird angelegt, der alte bleibt aus Sicherheitsgründen erhalten. Nach der Migration existieren beide.

Bei Messekontakt-Importen kommen hunderte neue Adressen auf einmal ins System. Wer prüft manuell ob Schneider Maschinenbau AG schon als Schneider Maschinen AG im CRM steht? Niemand hat die Zeit. Der Import läuft durch.

Bei manueller Anlage im Tagesgeschäft tippt ein Mitarbeitender eine neue Bestellung ein. Der Kunde soll schnell angelegt werden, die Suche ergibt keinen Treffer — weil der bestehende Eintrag mit Umlaut geschrieben ist und die Suche nach dem Umlaut-freien Namen sucht. Neuer Eintrag. Dritte Kundennummer.

Das Ergebnis ist immer dasselbe: Daten die formal korrekt sind, aber inhaltlich lügen. Umsätze die real existieren, aber auf mehrere Einträge verteilt unsichtbar werden. Entscheidungen die auf verzerrten Grundlagen getroffen werden.

Laut Gartner liegt die durchschnittliche Dubletten-Rate in Mittelstands-ERPs zwischen 10 und 25 Prozent. In CRMs teilweise bis zu 30 Prozent. Bitkom bestätigt: 62 Prozent der Mittelständler bewerten ihre Stammdaten als verbesserungsbedürftig. Aus NOAVIA-Projekten wissen wir: Stammdaten-Analysen decken im Schnitt 14 Prozent Dubletten in Kundendaten und 19 Prozent in Artikeldaten auf.

Das bedeutet konkret: Bei 10.000 Kundenstammsätzen haben Sie statistisch gesehen 1.400 Einträge die keine eigenständigen Kunden sind, sondern bereits vorhandene Kunden unter einem anderen Namen.

Was Dubletten wirklich kosten

Die naheliegenden Kosten sind die offensichtlichen: falsche Auswertungen, doppelte Mailings, Angebote die an eine veraltete Adresse gehen. Das ärgert, aber es ist quantifizierbar.

Die unsichtbaren Kosten sind größer.

Wenn Ihr Top-3-Kunde in Ihrer Auswertung als Top-10-Kunde erscheint, investieren Sie Vertriebszeit in die falschen Beziehungen. Sie priorisieren Kundenbesuche nach einer Rangliste, die nicht stimmt. Sie berechnen Ihre Abhängigkeit von einzelnen Kunden falsch. Sie treffen strategische Entscheidungen auf der Basis von Zahlen, die keine Grundlage haben.

Ein weiterer Effekt, der selten direkt mit Stammdaten in Verbindung gebracht wird: Wenn Mahnungen an falsche Adressen oder doppelte Einträge gehen, verzögert sich der Zahlungseingang systematisch. Wie eng Datenqualität und Liquidität zusammenhängen, zeigt unser Artikel zum automatisierten Mahnwesen im Mittelstand.

Der B2B-Dienstleister aus dem Eingangsbeispiel hat nach der Bereinigung seinen Kundenstamm von 12.000 Einträgen auf 9.471 aktive Stammsätze reduziert. Dabei entdeckt: 2.100 echte Dubletten, 340 Tochterunternehmen ohne klare Verknüpfung, 89 Karteileichen ohne Aktivität seit 2019 und einen bisher unsichtbaren Kunden mit 890.000 Euro Jahresumsatz, verteilt über drei Einträge.

Die Vertriebsstrategie dieses Unternehmens wurde nach der Bereinigung komplett neu priorisiert. Nicht weil sich die Umsätze geändert hatten. Sondern weil zum ersten Mal sichtbar wurde, welche Kunden diese Umsätze wirklich verantworten.

Was Sie diese Woche konkret tun können

Eine Stunde, kein Budget, kein neues Tool:

Montag, 15 Minuten: Exportieren Sie Ihren Kundenstamm als CSV. Öffnen Sie ihn in Excel. Sortieren Sie alphabetisch nach Firmenname. Scrollen Sie von A bis C durch — nur bis C. Was Sie dort sehen, ist repräsentativ für den Rest.

Dienstag, 30 Minuten: Suchen Sie Ihre zehn umsatzstärksten Kunden in drei Varianten in der Suchmaske: mit Umlaut, ohne Umlaut, mit Abkürzung. Wie viele Einträge erscheinen jeweils?

Mittwoch, eine Stunde: Addieren Sie für jeden Fund die kumulierten Umsätze. Vergleichen Sie mit Ihrer Top-10-Liste. Notieren Sie die Abweichung. Diese Zahl ist Ihr Argument für alle weiteren Schritte — intern und extern.

Stammdaten-Bereinigung in drei Phasen

Eine Bereinigung klingt nach einem großen Projekt. In der Praxis beginnt sie mit einem Export und drei Stunden Aufmerksamkeit.

Phase 1: Analyse — wo sind die Dubletten?

Der erste Schritt ist immer ein Export: alle Kunden oder Lieferanten aus dem ERP oder CRM, sortiert nach Firmenname. Schon beim alphabetischen Durchscrollen werden die offensichtlichsten Probleme sichtbar: gleiche Firmen mit verschiedenen Rechtsformen, mit und ohne Leerzeichen, mit und ohne Umlaute.

Für eine systematischere Analyse empfiehlt sich eine Ähnlichkeitsanalyse nach Levenshtein-Distanz — ein Algorithmus, der misst wie ähnlich zwei Zeichenketten sind. „Müller Industrie GmbH" und „Müller Industries GmbH" haben eine Levenshtein-Distanz von zwei: ein Buchstabe hinzugefügt, das war es. Das ist kein Zufall, das ist eine Dublette. In Excel lässt sich das mit FUZZY-Formeln abbilden, in Python mit zwei Zeilen Code. Für Bestände ab 5.000 Einträgen lohnt sich das. Bis dahin reicht die manuelle Methode.

Phase 2: Bereinigung — zusammenführen, nicht löschen

Der häufigste Fehler bei der Bereinigung ist das Löschen. Alte Einträge sollten nicht gelöscht, sondern zusammengeführt werden. Alle historischen Transaktionen, Angebote und Kontakte werden auf den Hauptstammsatz übertragen, der Nebenstammsatz wird deaktiviert.

Warum nicht löschen? Weil in älteren Systemen historische Buchungen auf bestimmte Kundennummern referenzieren. Ein gelöschter Stammsatz kann Buchungshistorie unzugänglich machen.

Die Bereinigung läuft in zwei Durchgängen: regelbasiert für eindeutige Dubletten (gleiche Adresse, gleiche Steuer-ID, ähnlicher Name) und manuell für Grenzfälle (mögliche Tochterunternehmen, Namenswechsel nach Übernahme).

Phase 3: Governance — wie verhindern Sie neue Dubletten?

Eine einmalige Bereinigung löst das Problem für sechs bis zwölf Monate. Danach beginnt der Kreislauf von vorne — es sei denn die Anlage neuer Stammsätze wird strukturiert.

Drei Maßnahmen verhindern neue Dubletten systematisch:

Erstens eine Pflichtprüfung bei der Neuanlage: Bevor ein neuer Stammsatz gespeichert werden kann, zeigt das System ähnliche bestehende Einträge. Der Mitarbeitende muss aktiv bestätigen dass es sich um einen neuen Kunden handelt. Diese Konfiguration existiert in den meisten modernen ERP-Systemen — sie muss nur aktiviert werden. In SAP Business One heißt die Einstellung „Dubletten-Prüfung bei Geschäftspartneranlage", in DATEV gibt es eine Adressähnlichkeits-Warnung, in Dynamics 365 ist es die „Duplicate Detection Rule". Wer Lexware nutzt: dort ist eine manuelle Prüfung nötig, da die Funktion nicht nativ vorhanden ist.

Zweitens eine klare Verantwortlichkeit: Eine Person ist für Stammdatenqualität zuständig — nicht als Vollzeitjob, aber als definierte Rolle mit dem Mandat Dubletten zusammenzuführen. Ohne Verantwortlichkeit passiert nichts.

Drittens eine quartalsweise Routine: Einmal pro Quartal ein Export, fünfzehn Minuten Blick auf neue Einträge der letzten drei Monate. Der B2B-Dienstleister hat seit sechs Monaten keine neue Dublette — weil die Prüfung bei der Anlage jetzt verpflichtend ist.

Was das mit Prozesskontinuität zu tun hat

Saubere Stammdaten und stabile Prozesse hängen enger zusammen als oft gedacht. Wenn Prozesse an einzelnen Personen hängen — wer die Konditionen kennt, wer den Kundenstamm pflegt, wer bei Sonderfällen entscheidet — entsteht dasselbe Muster wie bei Dubletten: Wissen das unsichtbar ist, weil es nirgends strukturiert vorliegt. Wie Mittelstandsunternehmen diese Personenabhängigkeit auflösen, beschreibt unser Artikel Warum Abwesenheit zum Betriebsrisiko wird.

Praxisbeispiel: B2B-Dienstleister, 140 Mitarbeitende

Das Unternehmen hatte 12.000 Kundenstammsätze im ERP und war überzeugt seinen Kundenstamm gut zu kennen. Die Stammdaten-Analyse ergab: 2.100 echte Dubletten, 340 Tochterunternehmen ohne Verknüpfung, 89 inaktive Karteileichen.

Nach der Bereinigung: 9.471 aktive Einträge, eine vollständig neue Top-20-Liste und ein bisher unsichtbarer Kunde mit 890.000 Euro Jahresumsatz über drei Stammsätze verteilt.

Das Unternehmen hat seither eine Dubletten-Prüfung bei der Neuanlage eingeführt. Zeitaufwand für die Bereinigung: vier Wochen mit externer Unterstützung. Zeitaufwand für die laufende Governance: zwei Stunden pro Monat. Seit sechs Monaten keine neue Dublette.

Häufige Fragen zur Stammdaten-Bereinigung

Woran erkenne ich dass meine Stammdaten ein Problem haben? Das sicherste Zeichen: zwei Mitarbeitende nennen denselben Kunden mit unterschiedlichen Umsatzzahlen. Oder: Ihr Export hat mehr Einträge als Sie aktive Kundenbeziehungen haben.

Kann ich Stammdaten-Bereinigung automatisiert machen? Teilweise. Die Identifikation verdächtiger Dubletten lässt sich vollständig automatisieren. Die Entscheidung bei Grenzfällen braucht menschliches Urteil — besonders bei Konzernen und Umstrukturierungen.

Was ist der Unterschied zwischen Dublette und Tochterunternehmen? Eine Dublette ist dieselbe Firma unter zwei Einträgen. Ein Tochterunternehmen ist eine eigenständige juristische Person, die aber mit dem Mutterunternehmen verknüpft werden sollte um Konzernumsätze sichtbar zu machen. Beide brauchen unterschiedliche Behandlung.

Wie oft sollte man Stammdaten bereinigen? Eine vollständige Bereinigung einmalig, danach quartalsweise eine Schnellprüfung. Mit einer Dubletten-Prüfung bei der Neuanlage reduziert sich der laufende Aufwand auf unter zwei Stunden pro Monat.

Was kostet eine Stammdaten-Bereinigung? Das hängt von der Datenmenge ab. Bei Beständen bis 10.000 Einträge rechnen wir mit zwei bis vier Wochen. Die eigentliche Investition ist nicht die Bereinigung — es ist die Governance danach.

Wenn Sie wissen möchten wie viele Dubletten in Ihrem Kundenstamm stecken: Jetzt kostenloses Erstgespräch buchen.

Dubletten im ERP: Warum Ihre Kundendaten Ihre Vertriebsstrategie verzerren

ERP im Mittelstand 2026: Wo steht Ihr System?

ERP im Mittelstand 2026: Wo steht Ihr System?

Wer hat das eigentlich bestellt? Bis zu 50 Prozent der Bestellungen laufen am Einkauf vorbei

Wer hat das eigentlich bestellt? Bis zu 50 Prozent der Bestellungen laufen am Einkauf vorbei

Wer hat das eigentlich bestellt? Bis zu 50 Prozent der Bestellungen laufen am Einkauf vorbei

70 % weniger Einarbeitungsaufwand: Was ein digitaler Mitarbeiter im Onboarding leistet

70 % weniger Einarbeitungsaufwand: Was ein digitaler Mitarbeiter im Onboarding leistet

70 % weniger Einarbeitungsaufwand: Was ein digitaler Mitarbeiter im Onboarding leistet

Wo verliert Ihr Betrieb täglich Zeit?

Wo verliert Ihr Betrieb täglich Zeit?

Wo verliert Ihr Betrieb täglich Zeit?