Forschung

Qualitätsfortpflanzung mittels künstlicher neuronaler Netze

Ziel dieser Forschungstätigkeiten ist die Fortpflanzung von Datenqualität in Datenverarbeitungsprozessen (DV-Prozessen).

Ziel dieser Forschungstätigkeiten ist die Fortpflanzung von Datenqualität in Datenverarbeitungsprozessen (DV-Prozessen). Die Qualität der Eingangs- und Ausgangsdaten eines Prozesses kann anhand von Qualitätsmodellen mit Hilfe geeigneter Parameter umfassend beschrieben werden. Es stellt sich nun das Problem, die Qualität der Ausgangsdaten mit der Qualität der Eingangsdaten in Zusammenhang zu bringen, um z. B. die Qualität der Ergebnisse vorhersagen zu können. Im Allgemeinen ist eine Formulierung eines exakten Zusammenhangs jedoch sehr aufwändig oder unmöglich, daher müssen dazu andere Methoden gefunden werden. Wie sich gezeigt hat, sind künstliche neuronale Netze (KNN) für diese Aufgabe geeignet.

 (c) Abb.1: Beispiel eines Feed-Forward KNN mit 4 Eingangs- und 2 Ausgangsgrößen (© iigs)

Vorgehensweise:

Künstliche neuronale Netze sind Netze aus einzelnen Neuronen, die nach dem biologischen Vorbild Informationen verarbeiten können. Für die Qualitätsfortpflanzung werden hier sogenannte Feed-Forward-Netze eingesetzt, bei denen die Neuronen in Schichten angeordnet sind und die „Fließrichtung“ der Informationen festgelegt ist (vgl. Abbildung). Rückkopplungen zu im Sinne der Fließrichtung vorhergebenden Schichten sind nicht zulässig. Die wesentlichen Vorteile der KNN sind die komplexe, parallele Verarbeitung der Informationen, die Robustheit gegenüber verrauschen oder fehlerhaften Eingangsdaten und die Echtzeitfähigkeit eines trainierten Netzes. Trainiert wird ein Feed-Forward-KNN mit Hilfe geeigneter Trainingsbeispiele. Damit werden in der Lernphase alle Parameter des Netzes ermittelt, und das Netz kann später im trainierten Zustand jegliche Eingangsdaten aus dem Eingangsdatenraum, für den es trainiert wurde, verarbeiten.

Um ein KNN zur Fortpflanzung von Datenqualität einzusetzen, ist zunächst eine geeignete Aufbereitung der Daten erforderlich. Die relevanten (Qualitäts-)Parameter der Trainingsdatenmenge, werden in Eingangs- und Ausgangsvektoren gruppiert und in der Regel zunächst normiert. In der Trainingsphase muss zunächst durch Testen die geeignete Netzkonfiguration ermittelt werden. Je komplexer die Aufgabe und die Anzahl an Qualitätsparametern, so komplexer ist in der Regel auch das Netz zu gestalten. Ist das Netz schließlich ausreichend trainiert, so kann es aus jedem Eingangsvektor im Trainingsdatenraum den unbekannten Ausgangsvektor berechnen.

Ergebnisse:

Erste Untersuchungen an einem einfachen Testbeispiel aus dem geodätischen Umfeld haben bereits die Eignung von KNN zur Fortpflanzung von Datenqualität gezeigt. So konnten beim polaren Anhängen die Standardabweichungen der Neupunkte mit ausreichender Genauigkeit vorhergesagt werden. Ebenso wurde gezeigt, dass mit KNN auch die Verfügbarkeit, Konsistenz und Vollständigkeit von Daten abgebildet werden können.

 (c) Abb. 2: Fehler der prognostizierten Querabweichung von 50 Beispieltrajektorien für verschiedene Netztypen

In einem weiteren realen Beispiel wurden die Daten aus dem Projekt Do-iT herangezogen. Der sehr komplexe Prozess der Berechnung von Trajektorien aus Mobilfunkdaten, bedingt auch komplexe Zusammenhänge zwischen der Eingangsdatenqualität und der Ausgangsdatenqualität. Die Formulierung eines exakten Zusammenhangs ist nicht möglich. Wie die Untersuchungen gezeigt haben, gelingt die Qualitätsfortpflanzung jedoch mit KNN. Aus einer Reihe von Eingangsparametern, wie unter anderem der Dichte der Mobilfunkzellen und des digitalen Straßennetzes, in dem die Fahrzeugtrajektorie berechnet wurde, kann die Querabweichung der Trajektorie mit einer Standardabweichung von ca. 35-45 m bestimmt werden. Dieser Parameter wurde zur Bewertung der berechneten Trajektorien definiert und beschreibt den lotrechten mittleren Abstand der einzelnen Positionen des Teilnehmers von der geschätzten Trajektorie. In der Abbildung 2 sind die Fehler von 50 zufällig gewählten Beispieltrajektorien für verschiedene Netzvarianten aufgetragen. Der Fehler der prognostizierten Querabweichung bewegt sich meist zwischen +/-50m.

Die Einsatzmöglichkeiten der KNN zur Qualitätsfortpflanzung werden am Institut weiter untersucht. Insbesondere die Verwendung von sogenannten dynamischen Netzen zur Beschreibung der Aktualität ist noch zu erforschen. Zur Vertiefung der Erkenntnisse sind darüberhinaus weitere reale Anwendungsbeispiele erforderlich.

Ansprechpartner:

Dieses Bild zeigt Schwieger
Prof. Dr.-Ing. habil.

Volker Schwieger

Institutsleiter

Zum Seitenanfang