Kollinearität

Kollinearität in der Statistik Korrelation zwischen Prädiktorvariablen (oder unabhängigen Variablen), so dass sie eine lineare Beziehung in einem Regressionsmodell ausdrücken. Wenn Prädiktorvariablen im selben Regressionsmodell korreliert sind, können sie den Wert der abhängigen Variablen nicht unabhängig vorhersagen. Mit anderen Worten, sie erklären einen Teil der gleichen Varianz in der abhängigen Variablen, was wiederum ihre statistische Signifikanz verringert.

Kollinearität wird in der Regressionsanalyse zu einem Problem, wenn eine hohe Korrelation oder Assoziation zwischen zwei potenziellen Prädiktorvariablen besteht, wenn der p- Wert (dh die Verringerung des Signifikanzniveaus) einer Prädiktorvariablen dramatisch ansteigt , wenn ein anderer Prädiktor enthalten ist im Regressionsmodell oder wenn ein Inflationsfaktor mit hoher Varianz bestimmt wird. Der Varianzinflationsfaktor liefert ein Maß für den Grad der Kollinearität, so dass ein Varianzinflationsfaktor von 1 oder 2 im Wesentlichen keine Kollinearität zeigt und ein Maß von 20 oder höher extreme Kollinearität zeigt.

Multikollinearität beschreibt eine Situation, in der mehr als zwei Prädiktorvariablen zugeordnet sind, so dass, wenn alle im Modell enthalten sind, eine Abnahme der statistischen Signifikanz beobachtet wird. Ähnlich wie bei der Diagnose der Kollinearität kann die Multikollinearität unter Verwendung von Varianzinflationsfaktoren mit demselben Leitfaden bewertet werden, bei dem Werte über 10 einen hohen Grad an Multikollinearität nahelegen. Im Gegensatz zur Diagnose der Kollinearität ist es jedoch möglicherweise nicht möglich, die Multikollinearität vorherzusagen, bevor ihre Auswirkungen auf das multiple Regressionsmodell beobachtet werden, da zwei der Prädiktorvariablen möglicherweise nur einen geringen Grad an Korrelation oder Assoziation aufweisen.