Skip to main content
  • 3580 Accesses

Zusammenfassung

Die n-dimensionale Eingangsstruktur eines konnektionistischen Systems zur Klassifizierung von Objekten setzt sich aus verschiedenen Quellen, wie z. B. Signalen von Temperaturmessgeräten, Weggebern, Mikrofonen, Kameras, Spektrometern oder Daten aus anderen Messgeräten zusammen. Die von diesen Sensoren gelieferten Rohdaten sind unterschiedlich strukturiert, weisen eine verschiedene Anzahl von Dimensionen auf und können parametrisiert als verbundene Werte in Paketform oder diskret vorliegen. Die Verteilung dieser Messwerte wird in der Datenvorverarbeitung analysiert. Dabei werden statistische Kennwerte ermittelt, unbrauchbare Werte entfernt und die Kennwerte im Modell M des Trainingsdatensatzes (TDS) gespeichert. Zur Anpassung der Werte an die Eingangsstruktur des Netzes kommen verschiedene Methoden zum Einsatz. Zur Bildung des Eingangsvektors sind einzelne Messwerte, spektrale Komponenten und andere Informationsquellen auch kombinierbar, um robuste charakteristische Objekteigenschaften zu bilden.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 69.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    ,,Ein mit fg bandbegrenztes Signal wird vollständig durch einzelne Signalwerte beschrieben, die im Abstand \(T = \frac {1}{2 f_{g}}\) entnommen werden“, Nyquist-Shannon-Abtasttheorem [10, S. 82].

  2. 2.

    Als Distanzfunktion lassen sich verschiedene Metriken verwenden, beispielsweise die L1-Norm (Manhattan-Distanz) oder die L2-Norm (euklidische Distanz) [4, S. 602].

  3. 3.

    Haar-Wavelet, siehe Anhang E.

  4. 4.

    Die Modellkomplexität wird in Verbindung mit der Wavelet-Transformation optimiert und so eingestellt, dass die in Abschn. 11.1 erörterte Generalisierungsfähigkeit gewährleistet ist. Weiterhin kann ein Objekt durch die Verwendung verschiedener Messkanäle identifiziert werden.

  5. 5.

    Distanzfehlerentwicklung und Anzahl der Dimensionen Abb. 6.11 und Tab. 6.6.

  6. 6.

    Der Nächste-Nachbarn-Bereich der Anzahl K nächster Nachbarn (K-NN) des Trainingsdatensatzes (TDS).

  7. 7.

    Einen Überblick zu den fatalen Auswirkungen von Ausreißern auf die Rechenergebnisse statistischer Art und die Belastung der Schätzer durch Ausreißer bietet [5]. Es wird dort mit einem sogenannten Bruchpunkt erörtert, wie viele Ausreißer ein Datensatz verkraften kann und welche Maßnahmen getroffen werden müssen, um fehlerfreie Datensätze sicherzustellen.

  8. 8.

    Bei der Berechnung der Stichprobenvarianz gilt statt σ das Formelzeichen s.

  9. 9.

    Die in Abschn. 7.5 zur Glättung einer MF eingesetzten kubischen Splines eignen sich weit besser zur Topologieerhaltung als Polynome.

  10. 10.

    Der Hodges-Lehmann-Schätzer ist ein robuster nichtparametrischer Schätzer für symmetrische Verteilungen, z. B. zur Schätzung des Medians von m × n Differenzen der Datenpunkte einer Verteilung [13].

  11. 11.

    Bei der Berechnung der Stichprobenvarianz oder Berechnungen aus Teilen der Grundgesamtheit gilt statt σ das Formelzeichen s.

  12. 12.

    Siehe dazu: Der Bruchpunkt von Schätzern, Universität der Bundeswehr [5].

  13. 13.

    In Abschn. 12.3.4 ist die Füllwertmethode zur Glättung der MF beschrieben.

  14. 14.

    Referenzskala zur Zuordnung der Trainingsdatenpunkte TPi in Abschn. 4.4, 12.2.2, 10.3.2 und Abb. 12.18.

  15. 15.

    In der Literatur wird die Anzahl der erforderlichen Dimensionen anhand der Größe der Eigenwerte entschieden. Dieser Sachverhalt wird in Abschn. 10.7.6 erörtert.

Literatur

  1. Andrews DF (1972) Plots of High-Dimensional Data. Biometrics 28(1):125, https://doi.org/10.2307/2528964

    Article  Google Scholar 

  2. Backhaus K, Erichson B, Plinke W, Weiber R (2005) Multivariate Analysemethoden. 11. Auflage Springer, Berlin, Heidelberg, New York

    MATH  Google Scholar 

  3. Breuer D (2014) Abstandsmaße für die multivariate adaptive Einbettung. Masterarbeit, FernUni Hagen

    Google Scholar 

  4. Bronstein IN, Semendjajew KA, Musiol G, Mühlig H (1999) Taschenbuch der Mathematik, 4th edn. Verlag Harri Deutsch, Frankfurt am Main and Thun

    MATH  Google Scholar 

  5. Caspary W (2017) Der Bruchpunkt von Schätzern-Universität der Bundeswehr. Schriftenreihe des Instituts für Geodäsie der Universität der Bundeswehr 2012(Heft 87):39–46, URL http://www.in-dubio-pro-geo.de/index.php?file=library/entry&ID=Caspary12

  6. Diehl JM, Kohr H (2004) Deskriptive Statistik.13. Auflage, ISBN 3-88074-110-. Verlag Dietmar Klotz, Eschborn

    Google Scholar 

  7. Faloutsos C (1996) Searching Multimedia Databases by Content. Kluwer Academic Publishers, Dordrecht

    Book  Google Scholar 

  8. Gottwald S, Köstner H, Hullwich M (1986) Handbuch der Mathematik. VEB Bibligraphisches Institut, Leipzig

    Google Scholar 

  9. Kriegel HP, Kroger P, Schubert E, Zimek A (2011) Interpreting and Unifying Outlier Scores. In: Liu B, Liu H, Clifton CW, Washio T, Kamath C (eds) Proceedings of the 2011 SIAM International Conference on Data Mining, [Society for Industrial and Applied Mathematics], [Philadelphia, Pennsylvania], pp 13–24, https://doi.org/10.1137/1.9781611972818.2

  10. Mildenberger O (1995) System- und Signaltheorie, 3rd edn. Friedr. Vieweg & Sohn Verlagsgesellschaft GmbH, Braunschweig, Wiesbaden

    Book  Google Scholar 

  11. Patzelt R (1996) Elektrische Meßtechnik. Springer-Verlag, Wien, New York

    Google Scholar 

  12. Pfeifer T, Profos P (2008) Handbuch der industriellen Messtechnik. Oldenbourg Industrieverlag

    Google Scholar 

  13. Rosenkranz GK (2010) A note on the Hodges-Lehmann estimator. Pharmaceutical statistics 9(2):162–167, https://doi.org/10.1002/pst.387

  14. Sartorius G (2009) Multivariate Adaption mit modularisierten künstlichen neuronalen Netzen: Zugl.: Hagen, Fernuniv., Fachbereich Elektrotechnik, Diss., 2009, Fortschritt-Berichte VDI Reihe 10, Informatik/Kommunikation, vol 799, als ms. gedr edn. VDI-Verl., Düsseldorf

    Google Scholar 

  15. Schäfer T, Kloke B, Hastedt T (2010) Multivariate Verfahren: Strukturgleichungsmodelle. URL https://www.tu-chemnitz.de/hsw/psychologie/professuren/method/homepages/ts/methodenlehre/SEM.pdf

  16. Weiber R, Mühlhaus D (2014) Strukturgleichungsmodellierung. Springer Berlin Heidelberg, Berlin, Heidelberg, https://doi.org/10.1007/978-3-642-35012-2

    Book  Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Rights and permissions

Reprints and permissions

Copyright information

© 2019 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature

About this chapter

Check for updates. Verify currency and authenticity via CrossMark

Cite this chapter

Sartorius, G. (2019). Datenvorverarbeitung. In: Erfassen, Verarbeiten und Zuordnen multivariater Messgrößen. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-23576-5_12

Download citation

Publish with us

Policies and ethics