Ein ähnlichkeitsbasiertes Matching-Verfahren für die Integration räumlicher Datenbanken

- Autor/en:
- Michael Schäfers
- Umfang:
- 331
- EAN/ISBN:
- 978-3-89838-509-1
- Erscheinungsdatum:
- Monday, 11 January 2016
- Band:
- 109
- Buchreihe:
- Dissertationen zu Datenbanken und Informationssystemen
- Categories:
- Buch
- Dissertationen zu Datenbanken und Informationssytemen
- Deutsch
- Gesamtverzeichnis AKA Verlag
Bei der Integration von Geodatenbanken ergeben sich besonders hohe Anforderungen an Matching-Verfahren: Zur Identifizierung verschiedener Repräsentationen des gleichen Realweltobjekts müssen sehr große Datenbestände berücksichtigt werden. Sie stammen meist aus heterogenen Quellen und beinhalten komplexe Objekte.
Das in dieser Dissertation entwickelte SimMatching-Verfahren basiert auf Ähnlichkeiten zwischen räumlichen Objekten und lässt sich durch flexible Kombinationen geometrischer, semantischer und topologischer Ähnlichkeitsmaße an vielfältige Eingabedaten anpassen. Der Greedy-Algorithmus basiert auf abgegrenzten Bausteinen und einer klaren algorithmischen Struktur. Zusammen mit dem Einsatz von Blocking-Techniken zur Reduzierung der Match-Kandidaten wird so eine hohe Effizienz erreicht. Der wohldosierte Einsatz graphbasierter Kriterien und die Bildung von Aggregationen zum Ausgleich unterschiedlicher Modellierungsregeln steigern die Ergebnisqualität. Eine lineare Laufzeitkomplexität ermöglicht die Verarbeitung sehr großer Datenbestände. Die Skalierbarkeit wird durch ein Partitionierungsverfahren und die parallele Bearbeitung disjunkter Partitionen unterstützt.
Im Vergleich mit existierenden Verfahren zur räumlichen Datenintegration kann das SimMatching-Verfahren durch sehr niedrige Laufzeiten und eine konstant hohe Ergebnisqualität überzeugen.