Adressdaten den Schrecken nehmen
Adressdaten den Schrecken nehmen
Adressen automatisch und korrekt zu verarbeiten, ist eine Herausforderung. Ob in Rechnungsanschriften, Lieferadressen oder bei Vertragspartnern: Unterschiedliche Reihenfolgen, Abkürzungen oder Auslassungen erfordern regelmäßig ein manuelles Eingreifen, damit ein Vorgang erfolgreich verarbeitet werden kann. Wir zeigen, wie eine kluge Kombination aus bewährten Techniken und bekannten Diensten dieses Problem beseitigen kann.
Die Fachkraft sitzt fluchend vor dem Bildschirm: Ein Großkunde hat zahlreiche Lieferanschriften in einer Bestellung übermittelt. Bei deren Erfassung hat ein Mitarbeiter den Ort ausgelassen. Ein anderer Mitarbeiter hat irrtümlich den Straßennamen doppelt in das Adressfeld geschrieben. Ein weiterer Kollege hat die Lieferanschrift lieber in einem Kommentarfeld erfasst und mit Zusatzanweisungen versehn. Die Annahme dahinter: Der Empfänger wird alles schon finden und richten. Der Kreativität des menschlichen Geistes sind keine Grenzen gesetzt, besonders wenn die Zeit drängt und Genauigkeit hinderlich ist. Der normale Alltag in einer arbeitsteiligen Welt.
Deshalb sollte die menschliche Schöpfenskraft auch nicht mit monotonen Tätigkeiten vergeudet werden, wenn diese Aufgaben automatisiert bewältigt werden können – und das bei geringeren Kosten und höherer Verarbeitungsgeschwindigkeit.
Für den Empfänger solch elektronischer Dokumente und Datensätzen ist die Erfassung ein Albtraum. Regelmäßig bedeuten Adressdaten an verschiedenen Orten in einem Dokument und das in unterschiedlicher Qualität die vollständige manuelle Eingabe im Folgesystem. Aber das muss nicht sein!
| Heterogenität bei Adressdaten ist handhabbar
Mithilfe einer Kombination aus intelligenter Textinterpretation und einer Geocoding API wie Google Maps, Here, what3words oder Geoapify lassen sich wahre Wunder bewirken. So wird mittels bewährten RegEx-Methoden eine Adresse in ihre Komponenten aufgeteilt: Firma, Straße, Hausnummer, Ort, Postleitzahl, Land usw.. Sollte sich dabei herausstellen, dass Teile der vollständigen Adresse fehlen, so werden diese mithilfe eines der vorgenannten Geocoding-Dienste über einen API-Aufruf automatisch gesucht und gefunden. Anschließend fügt die Prüfroutine jene fehlenden Teile ein, sodass die Adresse vollständig und korrekt ist.
Das funktioniert auch bei unterschiedlichen Ländern, da die RegEx-Muster in den Aufteilungsalgorithmus “injiziert” werden können, d.h. dynamisch von außerhalb der Automatisierung eingeschleust werden können. Zudem kann bei dieser Gelegenheit auch protokolliert werden, bei welchen Adressen oder Dokumenten die meisten Fehler passieren, um durch Rücksprache mit den Erstellern eine systematische Verbesserung herbeizuführen.
Ähnlich verfahren wir bei der Extraktion von Adressinformationen aus unstrukturierten Feldern wie Kommentaren, Freitexten oder Bemerkungen. Dies ist eine besondere Herausforderung, da kein marktgängiger Dienst dies anbietet. Viele Geschäftspartner schreiben Adressinformationen in irgendein Textfeld in der Annahme, dass der Empfänger diese dank menschlicher Intelligenz erkennen und nutzen wird. Das kann jedoch nicht das Ziel sein. Also war unsere Lösungskreativität gefragt. Auch hier muss eine maschinelle Verarbeitung greifen und die unstrukturierten Adressangaben in unterschiedlichen Freitextfeldern erkennen sowie für die Weiterverarbeitung aufbereiten. Dazu haben wir einen speziellen Algorithmus entwickelt, der in beliebigen Geschäftsprozessautomatisierungen genutzt werden kann. Zur Absicherung des Ergebnisses kann ein Geolocation API-Aufruf folgen, sodass die Korrektheit sichergestellt ist.
| Freitexte, Kommentare und Bemerkungen sind automatisiert lesbar
Geocoding Dienste bieten jedoch noch weitere interessante Funktionen: So kann eine Adresse als Ganzes an Google Maps, what3words, Geoapify oder Here übertragen werden. Die Antwort des aufgerufenen Dienstes enthält dann zumeist weitergehende Informationen wie Längen- und Breitengrad oder den Typ der Adresse. So kann herausgefunden werden, ob es sich um eine Gebäude, eine Straße sowie deren Beschaffenheit, ein Restaurant oder einen bestimmten Geschäftstyp handelt. Dies ist in Fällen relevant, wo Zusatzdaten wie z.B. Transportbeschränkungen für LKWs bei Routenplanungen nützlich sind.
Exaktheit und Vollständigkeit sind eine Voraussetzung erfolgreicher Automatisierungen. Nur verlässliche Ergebnisse sind brauchbare Ergebnisse. Andernfalls übersteigen die manuellen Aufwände zur Korrektur fehlerhafter Daten die Vorteile einer maschinellen Verarbeitung. Richtig implementiert, lässt sich die gewünschte Ergebnisqualität bei überschaubaren Kosten hingegen sehr schön erreichen.
Über Business Automatica GmbH:
Business Automatica senkt Prozesskosten durch Automatisierung manueller Tätigkeiten, hebt die Qualität beim Datenaustausch in komplexen Systemarchitekturen und verbindet On-premise Systeme mit modernen Cloud- und SaaS-Architekturen.