Multivariate Statistik | Data-Driven-Decision-Making

Multivariate Verfahren
		Die Clusteranalyse wird zur Bündelung von Objekten (Subjekten) verwendet. Ziel ist es, Objekte zu verschiedenen Gruppen (d.h. Clustern) so zusammenzufassen, dass alle Objekte einer Gruppe einander möglichst ähnlich sind, während die Gruppen einander möglichst unähnlich sind.Typische Beispiele für Forschungsfragen, die mit der Clusteranalyse angegangen werden, sind die Definition von Persönlichkeitstypen auf der Basis psychographischer Merkmale oder die Definition von Marktsegmenten auf der Basis nachfragerelevanter Konsumentenmerkmale. Mit einer anschließenden Diskriminanzanalyse kann überprüft werden, inwieweit die Variablen, die für die Clusterbildung verwendet wurden, zu den Unterschieden zwischen den identifizierten Clustern beitragen oder diese erklären.
		Dokument uebersicht_cluster-1.pdf (122.72 KB)
		Die Conjoint-Analyse misst und schätzt die Präferenzen der Konsumenten für Objekte (z. B. Schokoladentrüffel, E-Reader). Wenn wir die Präferenzen der Konsumenten mit Hilfe von ordinalen oder metrischen Skalen erfassen, sprechen wir von der traditionellen Conjoint-Analyse. Wenn wir die Konsumenten bitten, eine Auswahl zu treffen, sprechen wir von einer Choice-Based-Conjoint-Analyse (CBC). Letztendlich möchten wir herausfinden, wie wichtig bestimmte Eigenschaften (z. B. Geschmack, Displaygröße) sind und welche Eigenschaftsausprägungen (z. B. Vanille, 6 Zoll) die Konsumenten bevorzugen.
		Dokument uebersicht_conjoint.pdf (125.02 KB)
		Die Diskriminanzanalyse ist ein multivariates Verfahren zur Analyse von Gruppenunterschieden. Sie ermöglicht es, den Unterschied zwischen zwei oder mehreren Gruppen in Bezug auf eine Vielzahl von Variablen zu untersuchen, um Fragen zu beantworten wie: Unterscheiden sich die betrachteten Gruppen in Bezug auf die Variablen signifikant voneinander? Welche Variablen sind geeignet oder ungeeignet, um zwischen den Gruppen zu unterscheiden?
		Dokument uebersicht_diskriminanz.pdf (123.94 KB)
		Die Faktorenanalyse kommt zum Einsatz, wenn in einem bestimmten Kontext eine große Anzahl metrischer Variablen erhoben wurde und man daran interessiert ist, diese Variablen zu reduzieren oder zu bündeln. In diesem Fall soll untersucht werden, ob eine große Anzahl von Variablen auf wenige zentrale “Faktoren” zurückgeführt werden kann. Auch Positionierungsanalysen sind ein wichtiges Anwendungsgebiet der Faktorenanalyse. In diesem Fall reduzieren wir die subjektiven Bewertungen von Eigenschaften bestimmter Objekte (z.B. Marken, Unternehmen oder Politiker) auf einige zugrundeliegende Bewertungsdimensionen.
		Dokument uebersicht_faktoren.pdf (124.3 KB)
		Mit der Kontingenzanalyse werden Beziehungen zwischen zwei oder mehr nominell skalierten Variablen untersucht. Zum Beispiel kann man die Beziehung zwischen Rauchen (Raucher versus Nichtraucher) und Lungenkrebs (ja, nein) untersuchen. Wir tun dies mit Hilfe einer Kreuztabelle (Kontingenztabelle), die das Auftreten von Kombinationen von Niveaus der nominalen Variablen abbildet. Dokument uebersicht_kontingenz.pdf (122.33 KB)

		Die logistische Regression beantwortet Fragen, die denen der Diskriminanzanalyse ähneln. In diesem Fall wird die Wahrscheinlichkeit der Zugehörigkeit zu einer Gruppe in Abhängigkeit von einer oder mehreren unabhängigen Variablen bestimmt. Wenn die abhängige Variable nur zwei Kategorien hat, wird eine binäre logistische Regression durchgeführt. Hat die abhängige Variable drei oder mehr Kategorien, wird eine multinomiale logistische Regression durchgeführt. Neben der Analyse von Gruppenunterschieden kann die logistische Regression auch zur Vorhersage eines Ereignisses verwendet werden. Dokument uebersicht_logistisch.pdf (122.58 KB)

		Die ANOVA kann angewendet werden, wenn die unabhängigen Variablen nominal und die abhängige Variable metrisch ist. Diese Methode ist besonders wichtig für die Analyse von Experimenten, bei denen die nominalen unabhängigen Variablen experimentelle Varianten darstellen. Dokument uebersicht_faktoren.pdf (124.3 KB)

Bild Bild		Durch die Nichtlineare Regression wird das Anwendungsspektrum der Regressionsanalyse erheblich erweitert. Es lassen sich nahezu beliebige Modellstrukturen schätzen. Anwendungen finden sich z.B. im Rahmen der Werbewirkungsforschung (Abhängigkeit der Werbeerinnerung von der Zahl der Werbekontakte, Abhängigkeit der Absatzmenge von der Höhe des Werbebudgets) oder in der Marktforschung bei der Untersuchung des Wachstums von neuen Produkten. Eine Schätzung der Regressionskoeffizienten ist nur iterativ möglich, wodurch sich nicht nur der Rechenaufwand im Vergleich zur linearen Regression erhöht. Ob die Algorithmen konvergieren, hängt u.a. davon ab, welche Startwerte der Untersucher vorgibt. Es werden somit auch erhöhte Anforderungen an den Untersucher gestellt. Ein deutlicher Nachteil der nichtlinearen Regression ist es, dass keine statistischen Tests zur Prüfung der Güte eines Modells oder der Signifikanz der Parameter zur Verfügung stehen. Es sollte daher, wenn möglich, der linearen Regressionsanalyse der Vorzug gegeben werden.
		Dokument uebersicht_nichtlineare-regression(3).pdf (111.14 KB)
Bild Bild		Bei vielen Problemstellungen sowohl in der Wissenschaft als auch in der Praxis sind Phänomene von Interesse, die sich einer direkten Messbarkeit auf der empirischen Ebene entziehen, weshalb sie auch als hypothetische Konstrukte oder latente Variable bezeichnet werden. Beispiele für solche hypothetischen Konstrukte sind z. B. Autorität, Angst, Emotion, Einstellung, Intelligenz, Kaufabsicht, Loyalität, Macht, Vertrauen oder Zufriedenheit. Mithilfe von Strukturgleichungsmodellen können sachlogisch und theoretisch fundierte Beziehungsstrukturen (Hypothesen) zwischen latenten Variablen einer empirischen Prüfung unterzogen werden. Zu diesem Zweck müssen einerseits für die hypothetischen Größen geeignete Messmodelle formuliert werden, die sich im Fall von sog. reflektiven Messmodellen mit Hilfe der konfirmatorischen Faktorenanalyse überprüfen lassen. Sind zuverlässige Messmodelle gefunden, so können mit deren Hilfe auch die vermuteten Kausalzusammenhänge zwischen den betrachteten hypothetischen Konstrukten, die in dem sog. Strukturmodell abgebildet werden, empirisch überprüft werden. Eine ausführliche Darstellung des vollständigen Prozesses der Strukturgleichungsmodellierung inkl. weiterer Verfahrensvarianten (z. B. Behandlung formativer Messmodelle; Mehrgruppen-Kausalanalyse; Kausalanalyse mit PLS) sowie weitere Beispiele zu Strukturgleichungsmodellen und Web-Links findet der Leser unter www.strukturgleichungsmodellierung.de. Dokument uebersicht_strukturgleichungsmodelle.pdf (120.19 KB)

Bild Bild		Während bei der traditionellen Conjoint-Analyse zwecks Analyse von Nutzenstrukturen die Präferenzen von Probanden bezüglich alternativer Objekte (Stimuli) auf ordinalem Skalenniveau gemessen werden (mittels Ranking- oder Ratingskalen), erfolgt bei der auswahlbasierten Conjoint-Analyse (Choice-Based Conjoint) nur eine Abfrage von Auswahlentscheidungen: Aus einer Menge von Alternativen (Choice Set) muss der Proband nur jeweils die von ihm am meisten präferierte Alternative auswählen, wobei meist auch die Option besteht keine der Alternativen zu wählen. Dies ist für ihn nicht nur einfacher, sondern kommt auch realen Entscheidungssituationen sehr viel näher als das Ranking oder Rating aller Alternativen im Choice Set. Die erhöhte Realitätsnähe wird allerdings mit einem Verlust an Information erkauft, da bei dieser Vorgehensweise die Präferenz nur noch auf nominalem Skalenniveau gemessen wird. Wegen des geringeren Informationsgehalts ist es meist nur möglich, die Teilnutzenwerte aggregiert zu schätzen, während die traditionelle Conjoint-Analyse eine individuell je Probanden erlaubt. Dokument uebersicht_cbc.pdf (118.88 KB)

Bild Bild		Neuronale Netze werden heute in der Praxis in zunehmendem Maße sowohl ergänzend zu den klassischen multivariaten Methoden eingesetzt, als auch in den Fällen, in den die klassischen Methoden versagen. Anwendungsgebiete sind Klassifikationen von Objekten, Prognosen von Zuständen oder Probleme der Gruppenbildung. Insofern bestehen hinsichtlich der Aufgabenstellungen Ähnlichkeiten zur Diskriminanzanalyse und zur Clusteranalyse. Die Methodik neuronaler Netze lehnt sich an biologische Informationsverarbeitungsprozesse im Gehirn an (daher der Name). Neuronale Netze sind in der Lage, selbständig aus Erfahrung Finanzdaten, Verkaufsdaten usw. zu erkennen und eröffnen so eine sehr einfache Form der Datenanalyse. Besonders vorteilhaft lassen sie sich zur Behandlung von schlecht strukturierten Problemstellungen einsetzen. Innerhalb neuronaler Netze werden künstliche Neuronen (Nervenzellen) als Grundelemente der Informationsverarbeitung in Schichten organisiert, wobei jedes Neuron mit denen der nachgelagerten Schicht verbunden ist. Dadurch lassen sich auch hochgradig nicht-lineare und komplexe Zusammenhänge ohne spezifisches Vorwissen über die etwaige Richtung und das Ausmaß der Wirkungsbeziehungen zwischen einer Vielzahl von Variablen modellieren. Zum Erlernen von Strukturen wird das Netz zunächst in einer sog. Trainingsphase mit beobachteten Daten „gefüttert“. Dabei wird unterschieden zwischen Lernprozessen, bei denen die richtigen Ergebnisse bekannt sind und diese durch das Netz reproduziertwerden sollen (überwachtes Lernen), und solchen, bei denen die richtigen Ergebnisse nicht bekannt sind und lediglich ein konsistentes Verarbeitungsmuster erzeugt werden soll (unüberwachtes Lernen). Nach der Trainingsphase ist das Netz konfiguriert und kann für die Analyse neuer Daten eingesetzt werden. Dokument uebersicht_neuronale-netze.pdf (115.71 KB)

Bild Bild		Den Hauptanwendungsbereich der Multidimensionalen Skalierung (MDS) bilden Positionierungsanalysen, d. h. die Positionierung von Objekten im Wahrnehmungsraum von Personen. Sie bildet somit eine Alternative zur faktoriellen Positionierung mit Hilfe der Faktorenanalyse. Im Unterschied zur faktoriellen Positionierung werden bei Anwendung der MDS nicht die subjektiven Beurteilungen von Eigenschaften der untersuchten Objekte erhoben, sondern es werden nur wahrgenommene globale Ähnlichkeiten zwischen den Objekten erfragt. Mittels der MDS werden die diesen Ähnlichkeiten zugrunde liegenden Wahrnehmungsdimensionen abgeleitet. Wie bei der faktoriellen Positionierung lassen sich sodann die Objekte im Raum dieser Dimensionen positionieren und grafisch darstellen. Die MDS findet insbesondere dann Anwendung, wenn der Forscher keine oder nur vage Kenntnisse darüber hat, welche Eigenschaften für die subjektive Beurteilung von Objekten (z. B. Produktmarken, Unternehmen oder Politiker) von Relevanz sind. Zwischen der Multidimensionalen Skalierung und der Conjoint-Analyse besteht sowohl inhaltlich, wie auch methodisch eine enge Beziehung. Beide Verfahren befassen sich mit der Analyse psychischer Sachverhalte und bei beiden Verfahren können auch ordinale Daten analysiert werden, weshalb sie z.T. auch identische Algorithmen verwenden. Ein gewichtiger Unterschied besteht dagegen darin, dass der Forscher bei Anwendung der Conjoint-Analyse bestimmte Merkmale auszuwählen hat. Dokument uebersicht_mds.pdf (140.33 KB)

		Die Korrespondenzanalyse dient, wie auch die Faktorenanalyse und die Multidimensionale Skalierung, zur Visualisierung komplexer Daten. Sie wird daher in der Marktforschung ebenfalls zur Durchführung von Positionierungsanalysen verwendet. Insbesondere kann sie als ein Verfahren der multidimensionalen Skalierung von nominal skalierten Variablen charakterisiert werden. Sie ermöglicht es die Zeilen und Spalten einer zweidimensionalen Kreuztabelle (Kontingenztabelle) grafisch in einem gemeinsamen Raum darzustellen. Für die Korrespondenzanalyse spielt es dabei keine Rolle (im Unterschied zur Faktorenanalyse), welche Elemente in den Zeilen und welche in den Spalten angeordnet werden. Ein besonderer Vorteil der Korrespondenzanalyse liegt darin, dass sie kaum Ansprüche an das Skalenniveau der Daten stellt. Die Daten müssen lediglich nichtnegativ sein. Die Korrespondenzanalyse kann daher auch zur Quantifizierung qualitativer Daten verwendet werden. Da sich qualitative Daten leichter erheben lassen als quantitative Daten, kommt diesem Verfahren eine erhebliche praktische Bedeutung zu. Dokument uebersicht_korrespondenzanalyse.pdf (137.92 KB)

Multivariate Verfahren