Methodik
Wie die Fake-Daten auf fake-name.de entstehen
Jede generierte Identität auf fake-name.de basiert auf realen, öffentlich verfügbaren Datensätzen, die so kombiniert werden, dass keine Person der realen Welt eindeutig zugeordnet werden kann. Diese Seite dokumentiert die genutzten Quellen, Pflegezyklen und unsere Korrekturpolicy.
Datenquellen
- Vornamen (deutsch): Statistik der Standesämter sowie offene Datensätze des Gesellschaft für deutsche Sprache-Vornamenrankings (jährlich aktualisiert).
- Nachnamen (deutsch): Häufigkeitsverteilung aus dem Deutschen Namenwörterbuch und der Telekom-Verzeichnisstatistik 2022.
- Vornamen / Nachnamen (türkisch, polnisch, italienisch, französisch): Standesamts-Statistiken der jeweiligen Länder; bei türkischen Namen zusätzlich die Häufigkeitsliste des türkischen Statistikinstituts TÜİK.
- PLZ und Ortsnamen: Offizielle PLZ-Datei der Deutschen Post
(Datei
PLZ_DDP_Volltext.xlsx), Stand jeweils 1. Januar des Jahres. - Straßennamen: Aggregierte Liste der häufigsten 1.000 Straßennamen aus OpenStreetMap (Overpass-Abfrage, geofiltert nach DACH-Raum).
- Geburtsdaten: Pseudozufällige Werte innerhalb eines vom Nutzer gewählten Altersbereichs. Wir setzen niemals Geburtsdaten lebender Personen ein.
Generierungslogik
Pro generierter Identität wird zunächst ein Locale ausgewählt (Default:
de-DE). Anschließend werden Vorname, Nachname, Geschlecht und
Geburtsjahr zufällig, gewichtet nach Häufigkeit, aus den Locale-Listen gezogen.
Adresse und PLZ werden als plausible Kombination erzeugt: die PLZ entscheidet
das Bundesland, der Straßenname wird aus dem Pool gezogen, die Hausnummer ist
gleichverteilt zufällig im Bereich 1–99.
Wir prüfen nicht aktiv gegen reale Adressdatenbanken, ob die Kombination zufällig einen realen Anwohner trifft. Die Wahrscheinlichkeit dafür liegt rechnerisch unter 1 zu 10 Millionen pro Datensatz, ist aber theoretisch nicht null. Aus diesem Grund darf fake-name.de nicht für offiziellen Schriftverkehr, Verträge oder Anmeldungen bei realen Diensten verwendet werden.
Review-Zyklus
Die Datenbasis wird halbjährlich überprüft (jeweils Januar und Juli). Im Review gleichen wir:
- aktuelle Vornamen-Hitlisten ein,
- neue PLZ-Zuweisungen der Deutschen Post auf,
- archivierte und nicht mehr existierende Ortsnamen aus dem Datenbestand heraus,
- und prüfen die Locale-Verteilung auf realistische Plausibilität.
Korrektur-Policy
Wir machen Fehler. Wenn dir einer auffällt: info@akara-solutions.de anschreiben. Bestätigte Korrekturen dokumentieren wir öffentlich auf Korrekturen mit Datum, Sachverhalt und Behebung. So können Nutzerinnen und Nutzer nachvollziehen, was wann geändert wurde.
Verantwortung
Für die hier beschriebene Methodik und ihre redaktionelle Pflege ist Mateusz Viola zuständig. Inhaltlich Verantwortlicher gem. § 18 Abs. 2 MStV ist Eike-Christian Ramcke, Geschäftsführer der AKARA Solutions GmbH (vollständige Angaben im Impressum).