Telefonnummern, E-Mail- und Post-Adressen potenzieller Kunden zählen weltweit zu den mit steigender Tendenz nachgefragten Datensätzen, sogenannten Leads. Vor wenigen Jahren zählte im Geschäft mit den Kontaktdaten nur eines: große Datenmengen zu einem möglichst kleinen Preis.

Neue Gesetze, ein verändertes Verbraucherverhalten aber auch der eigene Raubbau in der Direktmarketing-Branche haben das Lead-Geschäft in den letzten Jahren nachhaltig verändert. Während der Anteil falscher Datensätze immer höher und die Tricks der Datenfälscher immer raffinierter werden, werden die Validierungsprozesse immer ausgefeilter.

Über ein modernes Katz- und Maus-Spiel in der Online-Welt schreibt Yvonne Thierfeld, Team Leader Performance Marketing bei eGentic.

Falsche und gefälschte Daten

Trotz steigender falscher und gefälschter Einträge, ist der Anteil echter Einträge in den meisten Ländern noch immer sehr hoch. Eigenen Untersuchungen zufolge entsprechen etwa 60-70 Prozent der in Deutschland generierten Leads den Qualitätsanforderungen von Unternehmen. Skandinavische Länder liegen mit 75 Prozent und mehr deutlich höher, der Mittelmeerraum leicht darunter.

Von den 30 bis 40 Prozent falscher Daten resultiert fast die Hälfte aus unabsichtlichen Fehlern.

Fehlerquelle Nummer Eins sind Eingabefehler, beispielsweise Zahlendreher, Rechtschreib- oder Tippfehler. Hier zeigen sich innerhalb Europas deutlich kulturelle Unterschiede: generell scheinen Nordeuropäer sorgfältiger und korrekter bei der Eingabe ihrer Daten vorzugehen, während in Südeuropa Daten eher locker, schnell und damit auch häufiger falsch eingetragen werden.

Die andere Hälfte der falschen Daten sind absichtlich manipulierte Daten.

Diese stammen zu einem geringen Teil von Konsumenten, die bewusst ihre Daten verfälschen, um nicht kontaktiert werden zu können. Die überwiegende Zahl bewusst gefälschter Daten stammt allerdings von Anbietern beziehungsweise Publishern, die für Kampagnen zur Lead-Generierung beauftragt werden. Diese Anbieter werden meist pro generierten Lead vergütet. Mehr Leads bedeuten automatisch mehr Gewinn. Die Versuchung gefälschte Daten einzuspielen ist darum groß.

„Die wenigen unseriösen Partner unter der hohen Zahl der heute für erfolgreiche Lead-Generierung benötigten Affiliate-Partner herauszufiltern, ähnelt der Suche nach der Stecknadel im Heuhaufen.“

Manipulationen fallen vergleichsweise leicht.

Es ist nicht schwer, einen Datensatz zu erstellen, der real wirkt oder es auch ist, ohne dass eine Einwilligung vorliegt. Der „worst case“, nämlich die Vermarktung realer Konsumentendaten, ohne deren Einwilligung, passiert seriösen Anbietern mittlerweile glücklicherweise äußerst selten. Viel häufiger werden heutzutage gefälschte Daten in Kampagnen eingespielt, sprich Daten, die echt wirken, hinter denen aber keine reale Person steht. Solche Daten lassen sich schwer ermitteln. Unmöglich ist es aber nicht.

Moderne Filter und kriminalistischer Spürsinn

Im Lead-Generierungsprozess stehen zahlreiche technische Möglichkeiten zur Verfügung um die Echtheit (Validität) der Daten zu prüfen. Zusätzlich ist mittlerweile geradezu kriminalistischer Spürsinn gefragt und die menschliche Komponente neben nötiger und wichtiger Software unerlässlich.

„Die Methoden der Datenfälscher werden raffinierter, die Möglichkeiten diese aufzuspüren auch.“

60 verschiedene Filter und mehr begleiten in Echtzeit den Lead-Generierungsprozes.

Neben rein technischen Filtern beispielsweise gegen „Mass Subscriptions“, also Massen-Einträgen, die von nur einer IP Adresse oder einem IP-Adressen-Block stammen, zählt das Filtern nach sogenannten „Bad-Word“-Listen zu den bekanntesten Instrumenten gegen unechte Daten. Die Bezeichnung „Bad Word“ bezieht sich nicht auf die Eigenschaften der Worte oder Namen, sondern auf die Wahrscheinlichkeit, dass der Datensatz falsch beziehungsweise gefälscht ist. Namen wie Mickey Mouse, Biene Maja und Max Mustermann tauchen genauso reihenweise auf wie historische Figuren von Julius Caesar über Albert Einstein oder Personen des öffentlichen Lebens wie Dieter Bohlen, Jogi Löw oder Angela Merkel. Das Filtern dieser Daten ist leicht, herausfordernd ist die Aktualität der Listen. Denn aktuelle Ereignisse oder auch Namen von Casting-Show Teilnehmern finden sehr schnell den Weg in Daten-Generierungsprozesse.

Muster erkennen.

Wesentlich komplexer als das Filtern nach Listen oder IP-Adressen ist das Erkennen beziehungsweise Aufspüren von bestimmten Mustern. Leads über eine Quelle (Traffic-Source) weisen dabei eine bestimmte Anomalie auf, zum Beispiel fortlaufende Muster in der Verwendung von Zahlen, Großbuchstaben, Punkten, Geburtsdaten etc. Moderne Filtersysteme erkennen immer komplexere Muster. Eine große Bedeutung hat hierbei ebenfalls die manuelle Prüfung. Denn die Leistungen, die das Gehirn vollbringen kann, lassen sich meist kaum oder gar nicht in Algorithmen für eine technische Umsetzung fassen. Geschulte und erfahrene muttersprachliche Mitarbeiter hingegen erkennen mit sehr hoher Wahrscheinlichkeit, ob eine Datenreihe valide ist oder gefälscht.

Ein Beispiel für aus der Praxis:

Ein Buchstabe, Punkt, sieben Buchstaben (z.B. m.mueller) – so sehen zahlreiche E-Mail-Adresse aus. Wenn in immer gleichen Zeitabfolgen aber Mails eintreffen, die nachfolgend zwei Buchstaben, Punkt, sechs Buchstaben, dann drei Buchstaben, Punkt, fünf Buchstaben usw. aufweisen, die zumal noch alle über den gleichen Publisher generiert wurden, lohnt sich genaueres Hinschauen. Die Methoden der Datenfälscher werden raffinierter, die Möglichkeiten diese aufzuspüren auch. Insbesondere wenn technische und menschliche Fähigkeiten optimal Hand in Hand arbeiten. Moderne und schnelle Pinging-Prozesse helfen dabei ebenso weiter wie die zahlreichen neuen Echtzeit-Validierungsprozesse.

 Zukunftsmarkt Lead-Generierung

„Der Trend zu Qualität und Nachhaltigkeit bei der Lead-Generierung wird sich in dem Maße durchsetzen, wie Anbieter und Unternehmen lernen, dass sich diese Investitionen für beide Seiten lohnen.“

Die Zahlen der Onliner sowie der Mobilfunknutzer steigen rasant. Die Möglichkeiten der Neukundengewinnung über Online Lead-Generierung steigen damit ebenfalls – allerdings auch die Risiken. Großbritannien und die USA zählen zu den Märkten, in den Lead-Generierung am weitesten fortgeschritten ist. Und genau diese Märkte sind durch extrem hohe Anteile schlechter Daten zu großen Teilen abgewirtschaftet. Es wird noch Jahre dauern, um in diesen Ländern einen Turnaround zu schaffen.

In vielen anderen Ländern und in den Marketing- und Vertriebsabteilungen zahlreicher Unternehmen lässt sich erfreulicherweise ein anderer Trend erkennen: der Wunsch nach besserer Datenqualität, um weniger Streuverluste und bessere Conversion-Rates zu erzielen. Insbesondere Unternehmen, die langfristig und nachhaltig in einem Wirtschaftsraum aktiv sein wollen, sehen mehr und mehr die Notwendigkeit, dafür entsprechende Investitionen zu tätigen.

Auf der anderen Seite stehen im Lead-Geschäft die Anbieter und Netzwerke, die ebenfalls an langfristigem Wachstum und damit an nachhaltigem Wirtschaften interessiert sind. In Deutschland und Europa sind darum beispielsweise die Traffic-Anbieter sehr viel mehr daran interessiert, einzelne, unseriöse Publisher zu isolieren als sich das in anderen Ländern bzw. Kontinenten beobachten lässt. Auch setzen immer mehr Anbieter bei der Lead-Generierung auf eine vertraglich festgelegte Beschränkung der Kommunikationsfrequenz.

Über den Autor:

Yvonne Thierfeld, geboren 1978 in Leonberg, arbeitet seit fünf Jahren im internationalen Marketing der eGENTIC GmbH mit Sitz in Sulzbach bei Frankfurt. Als Team Leiter Performance Marketing verantwortet sie den Gesamtbereich Performance für Europa und ist gleichzeitig Schnittstelle zu eGENTIC Asia Pacific mit Sitz in Singapur. Der Datenbank-Marketer eGENTIC  ist einer der weltweit  führenden Anbieter für moderne Lead- Generierung (Datengewinnung, Datenvermarktung und Online-Marketing).