Im zunehmend digitalisierten Umfeld stellt die Überprüfung der Echtheit von Ausweisdokumenten eine kritische Herausforderung dar, insbesondere aufgrund des Mangels an öffentlich verfügbaren Daten echter Ausweise aus Datenschutzgründen. Um dieses Problem zu adressieren, schlagen Javier Muñoz-Haro und sein Team in Exploring a Patch-Wise Approach for Privacy-Preserving Fake ID Detection einen neuartigen, auf Patch-basierten Ansatz zur datenschutzfreundlichen Erkennung gefälschter Ausweise vor.
Der Kern des Ansatzes liegt in der Balance zwischen Datenschutz und Leistung. Dies wird erreicht durch:
- Zwei Anonymisierungsstufen: Vollständig und pseudo-anonymisierte Ausweisdokumente.
- Verschiedene Patch-Größenkonfigurationen: Die Menge der sichtbaren sensiblen Daten wird durch unterschiedliche Patch-Größen (128×128, 64×64, 32×32 Pixel) variiert.
Die Methode umfasst einen datenschutzfreundlichen Patch-Extraktor und einen Detektor für gefälschte Patches. Für die Klassifizierung der Patches als echt oder gefälscht werden modernste Deep-Learning-Modelle wie ResNet-18, Vision Transformer (ViT-B/16) und DINOv2 eingesetzt.
Ein wesentlicher Beitrag dieser Studie ist die Veröffentlichung der ersten öffentlich zugänglichen Datenbank, die 48.400 Patches von echten und gefälschten Ausweisdokumenten enthält, zusammen mit dem experimentellen Framework und den Modellen.
Die experimentelle Bewertung auf einer ungesehenen Datenbank (DLC-2021) zeigt, dass der vorgeschlagene Ansatz eine Fehlerrate (EER) von 13,91 % auf Patch-Ebene und 0 % auf ID-Dokument-Ebene erreicht, was eine gute Generalisierungsfähigkeit auf andere Datenbanken belegt. Die optimale Konfiguration, die ein Gleichgewicht zwischen Leistung und Datenschutz bietet, ist das DINOv2-Modell mit 64×64 Patches und vollständig anonymisierten IDs.
“Patches” kleine, rechteckige Bildausschnitte oder Segmente eines Ausweisdokuments. Anstatt das gesamte Ausweisdokument auf einmal zu analysieren, wird es in diese kleineren Patches unterteilt.
Der Hauptgrund für die Verwendung von Patches in dieser Studie ist die Verbesserung des Datenschutzes. Indem man nur kleine Teile des Ausweises betrachtet, wird die Menge an sensiblen Informationen, die gleichzeitig sichtbar ist, reduziert. Das Dokument beschreibt verschiedene Patch-Größen (z.B. 128×128, 64×64, 32×32 Pixel) und Anonymisierungsstufen (pseudo-anonymisiert, vollständig anonymisiert), bei denen bestimmte Bereiche des Ausweises abgedeckt werden, bevor die Patches extrahiert werden.
Diese Patches werden dann einzeln von Deep-Learning-Modellen daraufhin untersucht, ob sie echt oder gefälscht sind. Die Ergebnisse der einzelnen Patches werden schließlich aggregiert, um eine Entscheidung über die Echtheit des gesamten Ausweisdokuments zu treffen. Dies ermöglicht eine Erkennung gefälschter Ausweise, während gleichzeitig die Privatsphäre der auf dem Dokument abgebildeten Person geschützt wird.