Zum Inhalt springen

Methodik

Wie die Fake-Daten auf fake-name.de entstehen

Jede generierte Identität auf fake-name.de basiert auf realen, öffentlich verfügbaren Datensätzen, die so kombiniert werden, dass keine Person der realen Welt eindeutig zugeordnet werden kann. Diese Seite dokumentiert die genutzten Quellen, Pflege­zyklen und unsere Korrektur­policy.

Datenquellen

  • Vornamen (deutsch): Statistik der Standesämter sowie offene Datensätze des Gesellschaft für deutsche Sprache-Vornamen­rankings (jährlich aktualisiert).
  • Nachnamen (deutsch): Häufigkeits­verteilung aus dem Deutschen Namen­wörterbuch und der Telekom-Verzeichnis­statistik 2022.
  • Vornamen / Nachnamen (türkisch, polnisch, italienisch, französisch): Standes­amts-Statistiken der jeweiligen Länder; bei türkischen Namen zusätzlich die Häufigkeits­liste des türkischen Statistik­instituts TÜİK.
  • PLZ und Ortsnamen: Offizielle PLZ-Datei der Deutschen Post (Datei PLZ_DDP_Volltext.xlsx), Stand jeweils 1. Januar des Jahres.
  • Straßennamen: Aggregierte Liste der häufigsten 1.000 Straßen­namen aus OpenStreetMap (Overpass-Abfrage, geofiltert nach DACH-Raum).
  • Geburtsdaten: Pseudo­zufällige Werte innerhalb eines vom Nutzer gewählten Altersbereichs. Wir setzen niemals Geburtsdaten lebender Personen ein.

Generierungs­logik

Pro generierter Identität wird zunächst ein Locale ausgewählt (Default: de-DE). Anschließend werden Vorname, Nachname, Geschlecht und Geburtsjahr zufällig, gewichtet nach Häufigkeit, aus den Locale-Listen gezogen. Adresse und PLZ werden als plausible Kombination erzeugt: die PLZ entscheidet das Bundesland, der Straßenname wird aus dem Pool gezogen, die Hausnummer ist gleichverteilt zufällig im Bereich 1–99.

Wir prüfen nicht aktiv gegen reale Adress­datenbanken, ob die Kombination zufällig einen realen Anwohner trifft. Die Wahrscheinlichkeit dafür liegt rechnerisch unter 1 zu 10 Millionen pro Datensatz, ist aber theoretisch nicht null. Aus diesem Grund darf fake-name.de nicht für offiziellen Schriftverkehr, Verträge oder Anmeldungen bei realen Diensten verwendet werden.

Review-Zyklus

Die Datenbasis wird halbjährlich überprüft (jeweils Januar und Juli). Im Review gleichen wir:

  • aktuelle Vornamen-Hitlisten ein,
  • neue PLZ-Zuweisungen der Deutschen Post auf,
  • archivierte und nicht mehr existierende Ortsnamen aus dem Datenbestand heraus,
  • und prüfen die Locale-Verteilung auf realistische Plausibilität.

Korrektur-Policy

Wir machen Fehler. Wenn dir einer auffällt: info@akara-solutions.de anschreiben. Bestätigte Korrekturen dokumentieren wir öffentlich auf Korrekturen mit Datum, Sachverhalt und Behebung. So können Nutzer­innen und Nutzer nachvollziehen, was wann geändert wurde.

Verantwortung

Für die hier beschriebene Methodik und ihre redaktionelle Pflege ist Mateusz Viola zuständig. Inhaltlich Verantwortlicher gem. § 18 Abs. 2 MStV ist Eike-Christian Ramcke, Geschäftsführer der AKARA Solutions GmbH (vollständige Angaben im Impressum).