Multikollinearität ist ein Problem, weil die statistische Signifikanz einer unabhängigen Variablen untergräbt. Unter sonst gleichen Bedingungen ist es umso unwahrscheinlicher, dass dieser Koeffizient statistisch signifikant ist, je größer der Standardfehler eines Regressionskoeffizienten ist.
Woher wissen Sie, ob Multikollinearität ein Problem ist?
Eine Möglichkeit, Multikollinearität zu messen, ist der Varianzinflationsfaktor (VIF), der bewertet, wie stark die Varianz eines geschätzten Regressionskoeffizienten zunimmt, wenn Ihre Prädiktoren korrelieren. … Ein VIF zwischen 5 und 10 weist auf eine hohe Korrelation hin, die problematisch sein kann.
Ist Kollinearität ein Problem für Vorhersagen?
Multikollinearität ist immer noch ein Problem für die Vorhersagekraft. Ihr Modell wird überangepasst und es ist weniger wahrscheinlich, dass es auf Out-of-Sample-Daten generalisiert. Glücklicherweise bleibt Ihr R2 unbeeinflusst und Ihre Koeffizienten sind immer noch unverzerrt.
Warum ist Kollinearität ein Problem bei der Regression?
Multikollinearität verringert die Genauigkeit der geschätzten Koeffizienten, was die statistische Aussagekraft Ihres Regressionsmodells schwächt. Möglicherweise können Sie den p-Werten nicht vertrauen, um unabhängige Variablen zu identifizieren, die statistisch signifikant sind.
Wann sollten Sie Kollinearität ignorieren?
Es erhöht die Standardfehler ihrer Koeffizienten und kann diese Koeffizienten auf verschiedene Weise instabil machen. Aber solange die KollinearitätVariablen nur als Kontrollvariablen verwendet werden und nicht kollinear zu Ihren interessierenden Variablen sind, gibt es kein Problem.