Skip to main content

TFA-gerechte Ausgestaltung des Data-Mining-Prozesses

  • Chapter
Technologiefrühaufklärung mit Data Mining

Part of the book series: Forschungs-/Entwicklungs-/Innovations-Management ((FEIM))

  • 152 Accesses

Zusammenfassung

Um die Überprüfung der Einsatzmöglichkeiten von Data Mining zur Identifikation schwacher Signale im Rahmen der Technologiefrühaufklärung sowohl generell als auch am konkreten Beispiel zu ermöglichen, soll zunächst der bereits vorgestellte Data-Mining-Prozess mit seinen Phasen „Zielformulierung“, „Datenauswahl und -be-reitstellung“, „Datenbereinigung und -aufbereitung“, „Verfahrenswahl und Durchführung der Analyse“ und „Ergebnisaufbereitung“603 derart ausgestaltet werden, dass die TFA-spezifischen Aufgabenstellungen der Identifikationsphase erfüllt und die dabei festgelegten Anforderungen erfüllt werden können.

„Forecasting future events is often like searching for a black cat in an unlit room, that may not even be there.“

Steve Davidson

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 89.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 84.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. Im allgemein gültigen Data-Mining-Prozess (siehe 4.1.3) beinhaltet die letzte Phase die Ergebnisaufbereitung und -Verwertung, davon ausgehend, dass es sich dabei um einen abgeschlossenen Prozess handelt. Im Rahmen der Technologiefrühaufklärung erfolgt die Ergebnisverwertung erst im Rahmen der nachfolgenden TFA-Phasen Analyse und Evaluation. In der hier betrachteten TFA-Identifikationsphase erfolgt daher lediglich die Ergebnisaufbereitung.

    Google Scholar 

  2. „Although a data-mining tool can indeed explore your data and uncover relationships, it still needs to be directed toward a specific goal.“ Small 1997. Siehe dazu auch die Diskussion um eine weite oder enge Abgrenzung des TFA-Beobachtungsbereichs (3.4.1) sowie um Data Mining als „hypothesenfreiem“ Suchen (4.1.2).

    Google Scholar 

  3. Für die folgenden Ausführungen wird zwischen Beobachtungsbereich und Suchraum unterschieden. TFA-Beobachtungsbereich ist dabei der gesamte, für das Unternehmen relevante Teil des Unternehmensumfelds, der den TFA-Aktivitäten zugrunde liegt (siehe auch 3.4.1). Dieser TFA-Beobachtungsbereich kann in verschiedene Segmente strukturiert sein. Mit Suchraum wird der Teil des TFA-Beobachtungsbereichs bezeichnet, in dem ausgehend von einer bestimmten TFA-Frage-Stellung und unter Anwendung einer bestimmten Suchstrategie tatsächlich nach schwachen Signalen gesucht wird. Der Suchraum kann folglich ein, mehrere oder alle Segmente des TFA-Beobachtungsbereichs umfassen.

    Google Scholar 

  4. Die hier aufgeführten Fragestellungen wurden aus der Literatur zum Thema Technologiemanagement sowie eigenen Überlegungen abgeleitet und in verschiedenen Gesprächen mit Praktikern auf ihre Relevanz überprüft und bestätigt.

    Google Scholar 

  5. Unter Killerapplikationen sollen hier Anwendungen verstanden werden, die auf einer bestimmten Technologie basieren und bisherige vergleichbare, aber auf einer anderen Technologie basierenden Anwendungen vom Markt verdrängen (Beispiel: die CD als Nachfolger der Schallplatte).

    Google Scholar 

  6. Strategie soll hier verstanden werden als Muster von Entscheidungen, Ansätzen und Verhaltensweisen, das einer proaktiven Ausrichtung einer Organisation auf zukünftige Bedingungen und Anforderungen dient; vgl. Zahn 1986, S. 19, Zahn 1991, S. 125

    Google Scholar 

  7. Siehe 5.2

    Google Scholar 

  8. Die beiden Ausprägungen „gering“ und „hoch“ entsprechen in verallgemeinerter Form den bereits weiter oben aufgeführten Ausprägungen „spezifisch“ und “breit” (Suchbreite) bzw. „oberflächlich“ und “detailliert” (Suchtiefe).

    Google Scholar 

  9. Zum Begriff des Mega-Trends und den verschiedenen Arten schwacher Signale siehe 3.4.2, insbesondere Abbildung 3–7 sowie die Ausführungen in Fußnote 467.

    Google Scholar 

  10. Siehe Tabelle 5–1

    Google Scholar 

  11. Siehe Tabelle 5–1

    Google Scholar 

  12. Siehe Tabelle 5–1

    Google Scholar 

  13. Siehe 5.4

    Google Scholar 

  14. Siehe 5.2

    Google Scholar 

  15. Siehe 3.4.1

    Google Scholar 

  16. Vgl. Gering 1995, S. 364

    Google Scholar 

  17. Beispiel für ein Klassifikationssystem ist die internationale Patentklassifikation (IPC), deren hierarchische Struktur auf Sektionen, Untersektionen, Klassen, Unterklassen, Hauptgruppen und Untergruppen verweist. Vgl. Wittmann, Greif 1989, S. 350

    Google Scholar 

  18. Vgl. vom Kolke 1996, S. 20ff., DIN 1987, S. 2ff., Scherff 1988, S. 8

    Google Scholar 

  19. Vgl. Gering 1995, S. 366, vom Kolke 1996, S. 8ff. u. 33

    Google Scholar 

  20. Unter einem Thesaurus versteht man einen Schlagwortkatalog mit einem alphabetischen Verzeichnis aller in der Datenbank gebundenen Schlagwörter (Deskriptoren) eines bestimmten Fachgebietes.

    Google Scholar 

  21. Beispiel ermittelt mit Hilfe des Thesaurus zur Datenbank INSPEC beim Datenbankanbieter OVID Technologies Inc. (Stand September 2000).

    Google Scholar 

  22. Für das Beispiel wurde die Datenbank INSPEC verwendet. Als Recherchefelder wurden neben Titel und Abstract die Datenfelder „Classification Codes“ (fest vorgegebenes Klassifizierungssystem der Datenbank), „Subject Headings“ (fest vorgegebene Schlagwortkategorien) und „Key Phrase Identifiers“ (frei wählbare Schlagwörter) herangezogen (Stand September 2000).

    Google Scholar 

  23. Vgl. Nakhaeizadeh et al. 1998, S. 6

    Google Scholar 

  24. Siehe 4.1.2

    Google Scholar 

  25. Beispielsweise werden „Auto“ und „Autos“ von Data-Mining-Tools grundsätzlich als zwei inhaltlich verschiedene Begriffe aufgefasst. Genauso werden bei irrtümlicher Verwendung eines anderen als des zu verwendenden Trennzeichens zwei Begriffe fälschlicherweise als ein Begriff angesehen (z.B. „Auto. Mofa“ als ein Wort anstelle der zwei Begriffe „Auto“ und „Mofa“).

    Google Scholar 

  26. Vgl. Krahl et al. 1998, S. 28. Eine ausführliche Aufstellung und Beschreibung verschiedener Mining- und KDD-Tools findet sich im Internet unter http://www.kdnuggets.com . Vgl. außerdem Krahl et al. 1998, S. 28f., Nakhaeizadeh et al.. 1998, S. 25f.

  27. Siehe 5.2

    Google Scholar 

  28. Vgl. Dietz 1995, S. 67, Rothe 1986, S. 169ff.

    Google Scholar 

  29. Vgl. Dietz 1995, S. 67

    Google Scholar 

  30. Ebenfalls möglich ist der umgekehrte Weg, d.h. veraltete Deskriptoren werden im Rahmen der Datenpflege aus dem Katalog vorgegebener Deskriptoren entfernt. In der Praxis ist dieser Fall allerdings von untergeordneter Bedeutung, d.h. einmal in den Katalog aufgenommene Deskriptoren bleiben i.d.R. dort enthalten.

    Google Scholar 

  31. Siehe die in 5.1 vorgestellten Suchstrategietypen.

    Google Scholar 

  32. Die hier beschriebene Vorgehensweise dient als grobe Orientierung. Eine ausführlichere Darstellung einzelner Fallbeispiele erfolgt in Kapitel 6.

    Google Scholar 

  33. Die Homogenität eines Clusters gibt an, wie ähnlich sich die in diesem Cluster befindenden Objekte sind. Je höher der Homogenitätsgrad, desto einheitlicher ist das Cluster. Der Heterogenitätsgrad gibt dagegen an, wie stark unterschiedliche Cluster voneinander abgegrenzt sind. Je größer der Heterogen itätsgrad, umso verschiedener sind die einzelnen Cluster. Die meisten Data-Mining-Tools bieten Homogenitäts- und Heterogenitätsgrad oder ähnliche Maße an, um die Qualität der erzeugten Cluster zu beurteilen.

    Google Scholar 

  34. Siehe die Ausführungen zur Zipf-Verteilung in 3.4.3.

    Google Scholar 

  35. Unter Operationalisierung wird dabei die „Zuordnung von empirisch erfassbaren, zu beobachtenden oder zu erfragenden Indikatoren zu einem theoretischen Begriff“ verstanden. Atteslander 1995, S. 61

    Google Scholar 

  36. Siehe 3.3.2

    Google Scholar 

  37. Solche Data-Mining-Analysen wurden unter Mitwirkung des Verfassers im Rahmen eines Forschungsprojektes des Lehrstuhls F&E-Management der Universität Stuttgart in Zusammenarbeit mit der T-Nova Innovationsgesellschaft mbH der Deutschen Telekom anhand ausgewählter realer Fragestellungen durchgeführt.

    Google Scholar 

  38. Ein weiteres, damit zusammenhängendes Ziel ist die Formulierung und Überprüfung von Hypothesen; siehe 6.1 und 7.

    Google Scholar 

  39. Siehe die Ausführungen zur Beurteilung der Interessantheit von DaMi-Ergebnissen in 4.1.3. Bei dieser Beurteilung handelt es sich nicht um eine vorgezogene Analyse und Evaluation der Ergebnisse (dies erfolgt erst in den auf die Identifikation folgenden TFA-Phasen). An dieser Stelle wird lediglich versucht, grob abzuschätzen, wie nützlich die gewonnenen Informationen für die untersuchte Fragestellung sind und ob sich eine weitere Analyse und Evaluation lohnt.

    Google Scholar 

  40. Siehe 4.1.3

    Google Scholar 

Download references

Authors

Rights and permissions

Reprints and permissions

Copyright information

© 2003 Deutscher Universitäts-Verlag/GWV Fachverlage GmbH, Wiesbaden

About this chapter

Cite this chapter

Zeller, A. (2003). TFA-gerechte Ausgestaltung des Data-Mining-Prozesses. In: Technologiefrühaufklärung mit Data Mining. Forschungs-/Entwicklungs-/Innovations-Management. Deutscher Universitätsverlag. https://doi.org/10.1007/978-3-322-81586-6_5

Download citation

  • DOI: https://doi.org/10.1007/978-3-322-81586-6_5

  • Publisher Name: Deutscher Universitätsverlag

  • Print ISBN: 978-3-8244-7914-6

  • Online ISBN: 978-3-322-81586-6

  • eBook Packages: Springer Book Archive

Publish with us

Policies and ethics